Task 15596562

Name	hadcm3n_4gph_1940_40_008309471_0
Workunit	8460606
Created	7 Feb 2013, 21:14:15 UTC
Sent	7 Feb 2013, 21:16:13 UTC
Report deadline	10 May 2013, 4:43:24 UTC
Received	6 Mar 2013, 12:41:22 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1258865
Run time	9 days 18 hours 15 min 25 sec
CPU time	9 days 14 hours 2 min 25 sec
Validate state	Invalid
Credit	8,709.12
Device peak FLOPS	4.09 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 23:15:38 (7692): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 07:32:47 (6656): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6080, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6080, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6080, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6080, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6080, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6080, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
04 Mar 2013 21:57:20	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	725,760	803,673	1.1074
04 Mar 2013 13:55:13	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	699,840	774,990	1.1074
04 Mar 2013 05:47:35	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	673,920	746,270	1.1074
03 Mar 2013 21:44:38	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	648,000	717,555	1.1073
03 Mar 2013 13:45:15	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	622,080	688,985	1.1076
03 Mar 2013 05:45:12	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	596,160	660,435	1.1078
02 Mar 2013 21:06:20	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	570,240	631,846	1.1080
02 Mar 2013 12:39:48	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	544,320	603,265	1.1083
02 Mar 2013 03:51:04	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	518,400	574,509	1.1082
01 Mar 2013 19:34:45	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	492,480	545,805	1.1083
01 Mar 2013 11:08:01	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	466,560	517,114	1.1084
01 Mar 2013 03:01:05	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	440,640	488,429	1.1085
28 Feb 2013 19:47:03	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	414,720	459,705	1.1085
28 Feb 2013 10:58:16	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	388,800	430,935	1.1084
28 Feb 2013 02:00:58	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	362,880	402,124	1.1081
27 Feb 2013 18:08:18	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	336,960	373,303	1.1079
27 Feb 2013 09:52:03	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	311,040	344,486	1.1075
27 Feb 2013 01:45:11	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	285,120	315,490	1.1065
26 Feb 2013 17:41:36	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	259,200	286,493	1.1053
25 Feb 2013 09:09:51	1258865	15596562	hadcm3n_4gph_1940_40_008309471_0	233,280	257,706	1.1047