Task 13367077

Name	hadcm3n_p41o_1940_40_007450518_0
Workunit	7648021
Created	10 Sep 2011, 6:39:51 UTC
Sent	10 Sep 2011, 6:48:48 UTC
Report deadline	10 Dec 2011, 14:15:59 UTC
Received	9 Dec 2011, 20:28:49 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1168291
Run time	25 days 1 hours 40 min 10 sec
CPU time	22 days 14 hours 52 min 23 sec
Validate state	Invalid
Credit	12,441.60
Device peak FLOPS	2.66 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... 20:58:09 (3560): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 19:28:10 (1584): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:49:57 (2540): No heartbeat from core client for 30 sec - exiting 19:49:58 (2540): No heartbeat from core client for 30 sec - exiting 19:49:59 (2540): No heartbeat from core client for 30 sec - exiting 19:50:00 (2540): No heartbeat from core client for 30 sec - exiting 19:50:01 (2540): No heartbeat from core client for 30 sec - exiting 19:50:02 (2540): No heartbeat from core client for 30 sec - exiting 19:50:03 (2540): No heartbeat from core client for 30 sec - exiting 19:50:04 (2540): No heartbeat from core client for 30 sec - exiting 19:50:05 (2540): No heartbeat from core client for 30 sec - exiting 19:50:07 (2540): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:50:08 (2540): No heartbeat from core client for 30 sec - exiting 21:39:59 (3884): No heartbeat from core client for 30 sec - exiting 21:40:00 (3884): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:47:43 (4560): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 19:12:41 (4104): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:53:45 (3208): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:53:46 (3208): No heartbeat from core client for 30 sec - exiting 19:37:28 (4180): No heartbeat from core client for 30 sec - exiting 19:37:29 (4180): No heartbeat from core client for 30 sec - exiting 19:37:31 (4180): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4840, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2616, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 22:34:40 (5512): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:36:12 (5416): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5376, iMonCtr=1 Model crash detected, will try to restart... 19:43:04 (3732): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3124, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 21:25:26 (4952): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:24:29 (5356): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:45:16 (3184): No heartbeat from core client for 30 sec - exiting 19:45:17 (3184): No heartbeat from core client for 30 sec - exiting 19:45:19 (3184): No heartbeat from core client for 30 sec - exiting 19:45:20 (3184): No heartbeat from core client for 30 sec - exiting 19:45:21 (3184): No heartbeat from core client for 30 sec - exiting 19:45:22 (3184): No heartbeat from core client for 30 sec - exiting 19:45:23 (3184): No heartbeat from core client for 30 sec - exiting 19:45:24 (3184): No heartbeat from core client for 30 sec - exiting 19:45:25 (3184): No heartbeat from core client for 30 sec - exiting 19:45:26 (3184): No heartbeat from core client for 30 sec - exiting 19:45:27 (3184): No heartbeat from core client for 30 sec - exiting 19:45:28 (3184): No heartbeat from core client for 30 sec - exiting 19:45:29 (3184): No heartbeat from core client for 30 sec - exiting 19:45:31 (3184): No heartbeat from core client for 30 sec - exiting 19:45:32 (3184): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 19:13:01 (3220): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 00:03:50 (4144): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:12:38 (6012): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
09 Dec 2011 20:32:46	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	1,036,800	1,954,339	1.8850
07 Dec 2011 06:55:28	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	1,010,880	1,913,859	1.8933
02 Dec 2011 04:40:48	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	984,960	1,872,954	1.9016
30 Nov 2011 00:23:59	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	959,040	1,833,427	1.9117
28 Nov 2011 04:39:24	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	933,120	1,793,603	1.9222
27 Nov 2011 16:12:40	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	907,200	1,751,634	1.9308
27 Nov 2011 02:03:42	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	881,280	1,710,419	1.9408
26 Nov 2011 14:05:52	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	855,360	1,669,409	1.9517
26 Nov 2011 02:02:53	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	829,440	1,628,204	1.9630
24 Nov 2011 22:38:03	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	803,520	1,587,222	1.9753
15 Nov 2011 18:32:25	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	777,600	1,541,447	1.9823
15 Nov 2011 18:32:25	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	751,680	1,473,737	1.9606
15 Nov 2011 18:32:25	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	725,760	1,407,535	1.9394
11 Oct 2011 06:39:09	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	699,840	1,353,803	1.9344
10 Oct 2011 03:43:57	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	673,920	1,303,031	1.9335
09 Oct 2011 09:27:21	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	648,000	1,252,726	1.9332
08 Oct 2011 18:17:45	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	622,080	1,203,069	1.9339
08 Oct 2011 02:36:21	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	596,160	1,152,629	1.9334
06 Oct 2011 19:49:51	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	570,240	1,102,461	1.9333
05 Oct 2011 02:18:31	1168291	13367077	hadcm3n_p41o_1940_40_007450518_0	544,320	1,051,508	1.9318