Task 13925561

Name	hadcm3n_y8f1_1940_40_007682707_4
Workunit	7837794
Created	16 Jan 2012, 3:02:15 UTC
Sent	16 Jan 2012, 3:55:44 UTC
Report deadline	16 Apr 2012, 11:22:55 UTC
Received	29 Jan 2012, 0:11:02 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1135833
Run time	10 days 13 hours 23 min 23 sec
CPU time	8 days 8 hours 38 min 42 sec
Validate state	Invalid
Credit	7,776.00
Device peak FLOPS	2.86 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 05:23:47 (884): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 05:23:48 (884): No heartbeat from core client for 30 sec - exiting 05:23:49 (884): No heartbeat from core client for 30 sec - exiting 05:23:50 (884): No heartbeat from core client for 30 sec - exiting 05:23:51 (884): No heartbeat from core client for 30 sec - exiting 05:23:52 (884): No heartbeat from core client for 30 sec - exiting 05:23:53 (884): No heartbeat from core client for 30 sec - exiting 05:23:54 (884): No heartbeat from core client for 30 sec - exiting 05:23:55 (884): No heartbeat from core client for 30 sec - exiting 05:23:56 (884): No heartbeat from core client for 30 sec - exiting 05:23:57 (884): No heartbeat from core client for 30 sec - exiting 04:47:59 (6384): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 04:18:59 (7460): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 04:19:00 (7460): No heartbeat from core client for 30 sec - exiting 04:19:01 (7460): No heartbeat from core client for 30 sec - exiting 04:19:02 (7460): No heartbeat from core client for 30 sec - exiting 04:19:03 (7460): No heartbeat from core client for 30 sec - exiting 04:19:04 (7460): No heartbeat from core client for 30 sec - exiting 04:19:05 (7460): No heartbeat from core client for 30 sec - exiting 04:19:06 (7460): No heartbeat from core client for 30 sec - exiting 04:19:07 (7460): No heartbeat from core client for 30 sec - exiting 04:19:08 (7460): No heartbeat from core client for 30 sec - exiting 04:19:09 (7460): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 05:05:38 (5188): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 05:05:39 (5188): No heartbeat from core client for 30 sec - exiting 05:05:40 (5188): No heartbeat from core client for 30 sec - exiting 05:05:41 (5188): No heartbeat from core client for 30 sec - exiting 05:05:43 (5188): No heartbeat from core client for 30 sec - exiting 05:05:44 (5188): No heartbeat from core client for 30 sec - exiting 05:05:45 (5188): No heartbeat from core client for 30 sec - exiting 05:05:47 (5188): No heartbeat from core client for 30 sec - exiting 05:05:48 (5188): No heartbeat from core client for 30 sec - exiting 05:05:49 (5188): No heartbeat from core client for 30 sec - exiting 05:05:50 (5188): No heartbeat from core client for 30 sec - exiting 05:05:51 (5188): No heartbeat from core client for 30 sec - exiting 05:05:52 (5188): No heartbeat from core client for 30 sec - exiting 05:05:53 (5188): No heartbeat from core client for 30 sec - exiting forrtl: Access is denied. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=9760, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
28 Jan 2012 21:40:30	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	648,000	796,877	1.2297
28 Jan 2012 11:30:34	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	622,080	765,038	1.2298
28 Jan 2012 01:30:57	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	596,160	732,574	1.2288
26 Jan 2012 08:52:00	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	570,240	700,653	1.2287
25 Jan 2012 14:26:54	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	544,320	668,033	1.2273
25 Jan 2012 03:46:03	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	518,400	635,943	1.2267
24 Jan 2012 13:53:54	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	492,480	604,146	1.2267
24 Jan 2012 03:13:08	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	466,560	572,014	1.2260
23 Jan 2012 17:18:22	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	440,640	539,735	1.2249
23 Jan 2012 06:54:48	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	414,720	507,801	1.2244
22 Jan 2012 20:57:16	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	388,800	475,798	1.2238
22 Jan 2012 10:26:29	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	362,880	443,893	1.2233
22 Jan 2012 01:04:31	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	336,960	411,578	1.2214
21 Jan 2012 14:27:01	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	311,040	379,477	1.2200
21 Jan 2012 04:14:30	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	285,120	347,435	1.2186
20 Jan 2012 18:50:37	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	259,200	315,413	1.2169
20 Jan 2012 08:14:41	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	233,280	283,469	1.2151
19 Jan 2012 22:52:29	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	207,360	251,462	1.2127
19 Jan 2012 13:32:55	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	181,440	221,033	1.2182
19 Jan 2012 03:50:30	1135833	13925561	hadcm3n_y8f1_1940_40_007682707_4	155,520	189,184	1.2165