Task 15275990

Name	hadcm3n_zayg_1880_40_008199224_1
Workunit	8354348
Created	12 Sep 2012, 23:39:16 UTC
Sent	12 Sep 2012, 23:43:15 UTC
Report deadline	13 Dec 2012, 7:10:26 UTC
Received	1 Oct 2012, 18:12:05 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1160959
Run time	14 days 12 hours 39 min 16 sec
CPU time	13 days 22 hours 11 min 7 sec
Validate state	Invalid
Credit	10,575.36
Device peak FLOPS	3.30 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 18:38:46 (5464): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 00:55:18 (8820): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 11:01:01 (7788): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:55:09 (5504): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:00:07 (8008): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:14:42 (2288): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:26:14 (2136): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 05:35:50 (9020): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 07:14:23 (8792): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2272, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2272, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2272, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2272, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2272, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2272, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
01 Oct 2012 09:05:27	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	881,280	1,173,937	1.3321
30 Sep 2012 22:23:08	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	855,360	1,140,399	1.3332
30 Sep 2012 10:46:55	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	829,440	1,106,016	1.3334
29 Sep 2012 23:34:40	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	803,520	1,068,508	1.3298
29 Sep 2012 11:41:25	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	777,600	1,031,824	1.3269
29 Sep 2012 00:29:05	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	751,680	997,440	1.3269
28 Sep 2012 15:07:37	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	725,760	962,002	1.3255
28 Sep 2012 04:55:28	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	699,840	929,275	1.3278
27 Sep 2012 19:05:32	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	673,920	895,080	1.3282
27 Sep 2012 08:44:07	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	648,000	858,380	1.3247
26 Sep 2012 22:31:28	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	622,080	824,218	1.3249
26 Sep 2012 12:59:40	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	596,160	791,868	1.3283
26 Sep 2012 02:31:14	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	570,240	758,636	1.3304
25 Sep 2012 18:53:00	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	544,320	727,613	1.3367
25 Sep 2012 07:32:41	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	518,400	694,462	1.3396
24 Sep 2012 19:38:09	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	492,480	659,923	1.3400
24 Sep 2012 10:00:14	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	466,560	625,040	1.3397
24 Sep 2012 00:17:59	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	440,640	589,730	1.3383
23 Sep 2012 06:30:44	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	414,720	554,492	1.3370
22 Sep 2012 19:56:53	1160959	15275990	hadcm3n_zayg_1880_40_008199224_1	388,800	520,566	1.3389