Task 13919083

Name	hadam3p_saf_2f5z_1999_1_007149338_2
Workunit	7334118
Created	14 Jan 2012, 6:42:18 UTC
Sent	14 Jan 2012, 6:42:28 UTC
Report deadline	26 Dec 2012, 12:02:28 UTC
Received	4 Mar 2012, 7:39:29 UTC
Server state	Over
Outcome	Success
Client state	Done
Exit status	0 (0x00000000)
Computer ID	1266922
Run time	5 days 12 hours 27 min 12 sec
CPU time	5 days 0 hours 14 min 35 sec
Validate state	Workunit error - check skipped
Credit	2,244.09
Device peak FLOPS	2.11 GFLOPS
Application version	UK Met Office HadAM3P-HadRM3P Southern Africa v6.09 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <stderr_txt> Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3836, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=2508, selfPID=884, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... C06:17:06 (3800): No heartbeat from core client for 30 sec - exiting 06:17:07 (3800): No heartbeat from core client for 30 sec - exiting 06:17:08 (3800): No heartbeat from core client for 30 sec - exiting 06:17:09 (3800): No heartbeat from core client for 30 sec - exiting 06:17:10 (3800): No heartbeat from core client for 30 sec - exiting 06:17:11 (3800): No heartbeat from core client for 30 sec - exiting 06:17:13 (3800): No heartbeat from core client for 30 sec - exiting 06:17:14 (3800): No heartbeat from core client for 30 sec - exiting 06:17:15 (3800): No heartbeat from core client for 30 sec - exiting 06:17:16 (3800): No heartbeat from core client for 30 sec - exiting 06:17:17 (3800): No heartbeat from core client for 30 sec - exiting 06:17:18 (3800): No heartbeat from core client for 30 sec - exiting 06:17:19 (3800): No heartbeat from core client for 30 sec - exiting 06:17:20 (3800): No heartbeat from core client for 30 sec - exiting 06:17:22 (3800): No heartbeat from core client for 30 sec - exiting 06:17:23 (3800): No heartbeat from core client for 30 sec - exiting 06:17:24 (3800): No heartbeat from core client for 30 sec - exiting 06:17:25 (3800): No heartbeat from core client for 30 sec - exiting 06:17:26 (3800): No heartbeat from core client for 30 sec - exiting 06:17:27 (3800): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5832, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3508, iMonCtr=2 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4212, iMonCtr=2 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3312, selfPID=4024, iMonCtr=1 Model crash detected, will try to restart... Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2316, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=5516, selfPID=6152, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=4896, selfPID=2144, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4784, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5204, iMonCtr=2 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5328, iMonCtr=2 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3268, selfPID=2124, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Leaving CPDN_Main::Monitor... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
04 Mar 2012 07:42:23	1173093	13919083	hadam3p_saf_2f5z_1999_1_007149338_2	138,336	432,115	3.1237
03 Mar 2012 15:21:58	1173093	13919083	hadam3p_saf_2f5z_1999_1_007149338_2	126,816	396,271	3.1248
01 Mar 2012 13:57:58	1173093	13919083	hadam3p_saf_2f5z_1999_1_007149338_2	115,296	360,198	3.1241
26 Feb 2012 05:03:28	1173093	13919083	hadam3p_saf_2f5z_1999_1_007149338_2	103,776	324,108	3.1231
25 Feb 2012 19:16:43	1173093	13919083	hadam3p_saf_2f5z_1999_1_007149338_2	92,256	288,218	3.1241
25 Feb 2012 07:34:13	1173093	13919083	hadam3p_saf_2f5z_1999_1_007149338_2	80,736	253,068	3.1345
22 Feb 2012 09:38:55	1173093	13919083	hadam3p_saf_2f5z_1999_1_007149338_2	69,216	217,948	3.1488
20 Feb 2012 13:35:43	1173093	13919083	hadam3p_saf_2f5z_1999_1_007149338_2	57,696	181,828	3.1515
19 Feb 2012 11:20:55	1173093	13919083	hadam3p_saf_2f5z_1999_1_007149338_2	46,176	145,920	3.1601
19 Feb 2012 00:12:10	1173093	13919083	hadam3p_saf_2f5z_1999_1_007149338_2	34,656	109,623	3.1632
12 Feb 2012 03:37:43	1173093	13919083	hadam3p_saf_2f5z_1999_1_007149338_2	23,136	73,231	3.1652
11 Feb 2012 16:38:21	1173093	13919083	hadam3p_saf_2f5z_1999_1_007149338_2	11,620	36,524	3.1432
21 Jan 2012 12:11:29	1173093	13919083	hadam3p_saf_2f5z_1999_1_007149338_2	11,616	36,045	3.1030