Task 12922225

Name	hadcm3n_o2r7_1940_40_007265368_2
Workunit	7463608
Created	2 Jun 2011, 6:45:34 UTC
Sent	2 Jun 2011, 6:45:36 UTC
Report deadline	1 Sep 2011, 14:12:47 UTC
Received	29 Jun 2011, 12:42:38 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1077037
Run time	22 days 9 hours 8 min 37 sec
CPU time	22 days 0 hours 39 min 51 sec
Validate state	Invalid
Credit	9,953.28
Device peak FLOPS	3.30 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.18</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 06:16:06 (4968): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:16:07 (4968): No heartbeat from core client for 30 sec - exiting 06:16:08 (4968): No heartbeat from core client for 30 sec - exiting 06:16:10 (4968): No heartbeat from core client for 30 sec - exiting 06:16:11 (4968): No heartbeat from core client for 30 sec - exiting 06:16:12 (4968): No heartbeat from core client for 30 sec - exiting 06:16:13 (4968): No heartbeat from core client for 30 sec - exiting 06:16:14 (4968): No heartbeat from core client for 30 sec - exiting 06:16:15 (4968): No heartbeat from core client for 30 sec - exiting 06:16:16 (4968): No heartbeat from core client for 30 sec - exiting 06:16:17 (4968): No heartbeat from core client for 30 sec - exiting 06:16:18 (4968): No heartbeat from core client for 30 sec - exiting 06:16:19 (4968): No heartbeat from core client for 30 sec - exiting forrtl: Access is denied. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2772, iMonCtr=1 Model crash detected, will try to restart... forrtl: Access is denied. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2772, iMonCtr=1 Model crash detected, will try to restart... forrtl: Access is denied. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2772, iMonCtr=1 Model crash detected, will try to restart... forrtl: Access is denied. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2772, iMonCtr=1 Model crash detected, will try to restart... forrtl: Access is denied. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2772, iMonCtr=1 Model crash detected, will try to restart... forrtl: Access is denied. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2772, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Atmos Hold Restart file rename failed on atmos_restart.hold Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
28 Jun 2011 19:25:43	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	829,440	1,849,515	2.2298
28 Jun 2011 02:24:25	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	803,520	1,787,482	2.2246
27 Jun 2011 10:44:34	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	777,600	1,727,932	2.2221
26 Jun 2011 16:01:58	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	751,680	1,664,003	2.2137
25 Jun 2011 22:11:00	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	725,760	1,601,376	2.2065
25 Jun 2011 04:35:52	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	699,840	1,539,127	2.1993
24 Jun 2011 03:23:42	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	673,920	1,473,028	2.1858
23 Jun 2011 10:50:47	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	648,000	1,412,508	2.1798
22 Jun 2011 19:01:30	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	622,080	1,356,914	2.1813
22 Jun 2011 00:07:24	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	596,160	1,294,429	2.1713
21 Jun 2011 05:58:38	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	570,240	1,228,484	2.1543
20 Jun 2011 11:21:12	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	544,320	1,164,820	2.1400
19 Jun 2011 23:10:24	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	518,400	1,101,352	2.1245
19 Jun 2011 23:10:24	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	492,480	1,037,401	2.1065
19 Jun 2011 23:10:24	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	466,560	973,317	2.0862
17 Jun 2011 13:37:29	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	440,640	908,308	2.0613
16 Jun 2011 17:36:34	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	414,720	846,350	2.0408
16 Jun 2011 02:23:43	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	388,800	792,149	2.0374
15 Jun 2011 11:02:35	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	362,880	738,482	2.0351
14 Jun 2011 22:29:42	1077037	12922225	hadcm3n_o2r7_1940_40_007265368_2	336,960	691,765	2.0530