Task 16697992

Name	hadcm3n_8eqp_1980_40_008728524_2
Workunit	8874502
Created	3 Jul 2014, 14:33:12 UTC
Sent	3 Jul 2014, 14:33:17 UTC
Report deadline	2 Oct 2014, 22:00:28 UTC
Received	7 Sep 2014, 7:26:57 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1331384
Run time	8 days 10 hours 59 min 29 sec
CPU time	8 days 3 hours 1 min 21 sec
Validate state	Invalid
Credit	6,842.88
Device peak FLOPS	2.99 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.42</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 01:31:53 (4444): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3160, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3160, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3160, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3160, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3160, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3160, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
07 Sep 2014 00:02:06	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	570,240	692,569	1.2145
06 Sep 2014 15:04:06	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	544,320	662,509	1.2171
06 Sep 2014 08:03:55	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	518,400	636,991	1.2288
06 Sep 2014 00:58:03	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	492,480	611,426	1.2415
30 Jul 2014 03:08:03	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	466,560	582,792	1.2491
26 Jul 2014 16:34:55	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	440,640	550,464	1.2492
26 Jul 2014 06:30:09	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	414,720	518,279	1.2497
25 Jul 2014 11:33:15	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	388,800	486,078	1.2502
21 Jul 2014 09:23:54	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	362,880	453,754	1.2504
20 Jul 2014 23:20:21	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	336,960	421,528	1.2510
20 Jul 2014 14:24:00	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	311,040	389,252	1.2515
20 Jul 2014 05:23:24	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	285,120	357,012	1.2521
19 Jul 2014 20:21:14	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	259,200	324,768	1.2530
19 Jul 2014 10:21:41	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	233,280	292,454	1.2537
19 Jul 2014 01:18:19	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	207,360	260,162	1.2546
18 Jul 2014 15:21:59	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	181,440	228,358	1.2586
18 Jul 2014 06:21:13	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	155,520	195,748	1.2587
17 Jul 2014 21:18:43	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	129,600	163,144	1.2588
17 Jul 2014 11:18:49	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	103,680	130,563	1.2593
06 Jul 2014 18:41:32	1331384	16697992	hadcm3n_8eqp_1980_40_008728524_2	77,760	98,037	1.2608