Task 15717537

Name	hadcm3n_z9ij_1920_40_008281642_3
Workunit	8432777
Created	8 Apr 2013, 18:14:29 UTC
Sent	8 Apr 2013, 18:14:35 UTC
Report deadline	9 Jul 2013, 1:41:46 UTC
Received	30 Apr 2013, 17:06:38 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1236068
Run time	19 days 14 hours 56 min 3 sec
CPU time	19 days 5 hours 4 min 19 sec
Validate state	Invalid
Credit	7,464.96
Device peak FLOPS	2.18 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 14:54:14 (3480): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:53:17 (1856): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:52:16 (5768): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:51:13 (5504): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:50:14 (5220): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:49:11 (5392): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 16:48:09 (5288): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:47:07 (2384): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4976, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4976, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4976, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4976, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4976, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4976, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
29 Apr 2013 17:38:16	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	622,080	1,614,954	2.5961
28 Apr 2013 21:23:41	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	596,160	1,541,116	2.5851
27 Apr 2013 23:48:04	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	570,240	1,467,502	2.5735
26 Apr 2013 21:49:09	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	544,320	1,395,702	2.5641
26 Apr 2013 01:50:42	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	518,400	1,326,189	2.5582
25 Apr 2013 05:35:59	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	492,480	1,256,615	2.5516
24 Apr 2013 10:00:32	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	466,560	1,187,140	2.5445
23 Apr 2013 14:45:36	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	440,640	1,118,380	2.5381
22 Apr 2013 18:30:30	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	414,720	1,047,771	2.5265
21 Apr 2013 21:04:03	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	388,800	972,357	2.5009
19 Apr 2013 17:21:46	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	362,880	901,061	2.4831
18 Apr 2013 21:39:44	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	336,960	830,213	2.4638
18 Apr 2013 00:57:34	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	311,040	759,083	2.4405
17 Apr 2013 05:55:58	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	285,120	693,573	2.4326
16 Apr 2013 11:40:42	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	259,200	628,991	2.4267
15 Apr 2013 15:25:22	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	233,280	562,276	2.4103
14 Apr 2013 14:50:33	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	207,360	497,212	2.3978
13 Apr 2013 20:21:21	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	181,440	432,696	2.3848
13 Apr 2013 03:41:47	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	155,520	371,668	2.3898
12 Apr 2013 10:09:45	1236068	15717537	hadcm3n_z9ij_1920_40_008281642_3	129,600	310,633	2.3969