Task 14847926

Name	hadcm3n_zheh_1880_40_008026347_1
Workunit	8181461
Created	29 Jun 2012, 16:21:49 UTC
Sent	29 Jun 2012, 16:21:54 UTC
Report deadline	28 Sep 2012, 23:49:05 UTC
Received	22 Jul 2012, 4:59:17 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1130650
Run time	14 days 12 hours 33 min 38 sec
CPU time	13 days 16 hours 45 min 4 sec
Validate state	Invalid
Credit	11,508.48
Device peak FLOPS	3.10 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 23:18:23 (7460): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:18:24 (7460): No heartbeat from core client for 30 sec - exiting 23:18:26 (7460): No heartbeat from core client for 30 sec - exiting 23:18:27 (7460): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 23:11:11 (7940): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:11:18 (7940): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... 23:10:48 (9736): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:10:53 (9736): No heartbeat from core client for 30 sec - exiting 23:10:54 (9736): No heartbeat from core client for 30 sec - exiting 23:10:55 (9736): No heartbeat from core client for 30 sec - exiting 23:10:56 (9736): No heartbeat from core client for 30 sec - exiting 23:17:34 (7292): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:17:36 (7292): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITHEAD: I/O error tmp/pipe_dummy 2048 23:14:06 (12568): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:14:07 (12568): No heartbeat from core client for 30 sec - exiting 23:14:08 (12568): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Model crashed: P_TH_ADJ : NEGATIVE PRESSURE VALUE CREATED. tmp/pipe_dummy 2048 Model crashed: P_TH_ADJ : NEGATIVE PRESSURE VALUE CREATED. tmp/pipe_dummy 2048 Model crashed: P_TH_ADJ : NEGATIVE PRESSURE VALUE CREATED. tmp/pipe_dummy 2048 Model crashed: P_TH_ADJ : NEGATIVE PRESSURE VALUE CREATED. tmp/pipe_dummy 2048 Model crashed: P_TH_ADJ : NEGATIVE PRESSURE VALUE CREATED. tmp/pipe_dummy 2048 Model crashed: P_TH_ADJ : NEGATIVE PRESSURE VALUE CREATED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
21 Jul 2012 23:40:06	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	959,040	1,217,223	1.2692
21 Jul 2012 13:37:10	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	933,120	1,181,604	1.2663
21 Jul 2012 03:40:20	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	907,200	1,146,066	1.2633
20 Jul 2012 18:35:58	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	881,280	1,113,421	1.2634
19 Jul 2012 21:29:37	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	855,360	1,080,070	1.2627
19 Jul 2012 12:21:58	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	829,440	1,060,935	1.2791
18 Jul 2012 16:34:00	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	803,520	1,027,785	1.2791
17 Jul 2012 20:20:52	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	777,600	994,868	1.2794
17 Jul 2012 09:05:23	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	751,680	961,373	1.2790
16 Jul 2012 13:27:21	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	725,760	928,531	1.2794
15 Jul 2012 17:41:30	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	699,840	910,499	1.3010
15 Jul 2012 04:26:30	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	673,920	877,237	1.3017
14 Jul 2012 19:12:25	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	648,000	843,992	1.3025
14 Jul 2012 09:50:13	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	622,080	810,654	1.3031
14 Jul 2012 00:33:24	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	596,160	777,051	1.3034
13 Jul 2012 15:15:44	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	570,240	743,652	1.3041
12 Jul 2012 15:53:10	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	544,320	710,242	1.3048
11 Jul 2012 20:08:05	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	518,400	677,075	1.3061
11 Jul 2012 10:44:08	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	492,480	643,627	1.3069
10 Jul 2012 15:01:46	1130650	14847926	hadcm3n_zheh_1880_40_008026347_1	466,560	610,622	1.3088