Task 15275419

Name	hadcm3n_z9cb_1880_40_008199007_0
Workunit	8354131
Created	12 Sep 2012, 22:17:47 UTC
Sent	12 Sep 2012, 22:23:13 UTC
Report deadline	13 Dec 2012, 5:50:24 UTC
Received	22 Dec 2012, 22:37:29 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1209365
Run time	11 days 3 hours 26 min 17 sec
CPU time	9 days 22 hours 4 min 27 sec
Validate state	Invalid
Credit	7,776.00
Device peak FLOPS	3.30 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 12:25:04 (4284): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 17:35:25 (4864): No heartbeat from core client for 30 sec - exiting 17:35:26 (4864): No heartbeat from core client for 30 sec - exiting 17:35:27 (4864): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:35:28 (4864): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 12:03:32 (2516): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 18:00:25 (8468): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 07:25:23 (5848): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1228, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1228, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1228, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1228, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1228, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3744, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
20 Dec 2012 19:11:35	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	648,000	846,077	1.3057
19 Dec 2012 21:48:45	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	622,080	811,214	1.3040
18 Dec 2012 21:08:57	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	596,160	775,101	1.3002
18 Dec 2012 02:00:31	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	570,240	740,543	1.2987
14 Dec 2012 22:01:07	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	544,320	705,202	1.2956
14 Dec 2012 16:42:03	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	518,400	670,884	1.2941
06 Dec 2012 16:55:38	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	492,480	637,056	1.2936
29 Nov 2012 19:26:56	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	466,560	601,468	1.2892
28 Nov 2012 18:46:06	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	440,640	566,310	1.2852
16 Nov 2012 18:17:14	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	414,720	535,774	1.2919
12 Nov 2012 20:15:39	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	388,800	503,555	1.2952
10 Nov 2012 21:41:02	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	362,880	470,492	1.2965
09 Nov 2012 19:12:30	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	336,960	438,678	1.3019
03 Nov 2012 23:59:19	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	311,040	406,090	1.3056
24 Oct 2012 19:33:11	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	285,120	372,584	1.3068
12 Oct 2012 01:03:50	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	259,200	339,960	1.3116
11 Oct 2012 15:36:54	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	233,280	307,784	1.3194
04 Oct 2012 22:04:54	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	207,360	275,900	1.3305
03 Oct 2012 04:40:45	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	181,440	243,591	1.3425
02 Oct 2012 18:24:49	1209365	15275419	hadcm3n_z9cb_1880_40_008199007_0	155,520	211,038	1.3570