Task 15718680

Name	hadam3p_saf_1hgr_1986_1_006960067_2
Workunit	7163383
Created	9 Apr 2013, 11:36:58 UTC
Sent	9 Apr 2013, 11:37:24 UTC
Report deadline	22 Mar 2014, 16:57:24 UTC
Received	22 Apr 2013, 19:23:06 UTC
Server state	Over
Outcome	Success
Client state	Done
Exit status	0 (0x00000000)
Computer ID	1163640
Run time	7 days 22 hours 9 min 27 sec
CPU time	5 days 9 hours 56 min 56 sec
Validate state	Workunit error - check skipped
Credit	2,244.09
Device peak FLOPS	2.02 GFLOPS
Application version	UK Met Office HadAM3P-HadRM3P Southern Africa v6.09 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <stderr_txt> Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=15332, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=11376, iMonCtr=2 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=6684, selfPID=5040, iMonCtr=1 Model crash detected, will try to restart... Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=12848, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=12856, selfPID=5668, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3600, iMonCtr=2 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=5876, selfPID=5440, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=16364, iMonCtr= 2 del crash detected, will try to restart... Leaving CPDN_Main::Monitor... CPDN Monitor - Quit request from BOINC... Regional Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3524, selfPID=3524, iMonCtr=2 CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=2156, selfPID=23892, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3916, selfPID=1908, iMonCtr=1 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3068, iMonCtr=2 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3428, selfPID=2900, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4728, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=4736, selfPID=3916, iMonCtr=1 Model crash detected, will try to restart... 11:09:30 (5756): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=36208, selfPID=36184, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=36744, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=33084, iMonCtr=2 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6744, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5064, iMonCtr=2 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=4292, selfPID=7220, iMonCtr=1 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... 11:54:11 (3200): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 11:54:33 (3200): No heartbeat from core client for 30 sec - exiting 11:54:58 (3200): No heartbeat from core client for 30 sec - exiting 11:55:02 (3200): No heartbeat from core client for 30 sec - exiting 11:55:04 (3200): No heartbeat from core client for 30 sec - exiting 11:55:07 (3200): No heartbeat from core client for 30 sec - exiting 11:55:08 (3200): No heartbeat from core client for 30 sec - exiting 11:55:10 (3200): No heartbeat from core client for 30 sec - exiting 11:55:12 (3200): No heartbeat from core client for 30 sec - exiting 11:55:13 (3200): No heartbeat from core client for 30 sec - exiting 11:55:14 (3200): No heartbeat from core client for 30 sec - exiting 11:55:16 (3200): No heartbeat from core client for 30 sec - exiting 11:55:17 (3200): No heartbeat from core client for 30 sec - exiting 11:55:19 (3200): No heartbeat from core client for 30 sec - exiting 11:55:20 (3200): No heartbeat from core client for 30 sec - exiting 11:58:42 (26408): No heartbeat from core client for 30 sec - exiting 11:58:43 (26408): No heartbeat from core client for 30 sec - exiting 11:58:44 (26408): No heartbeat from core client for 30 sec - exiting 11:58:45 (26408): No heartbeat from core client for 30 sec - exiting 11:58:46 (26408): No heartbeat from core client for 30 sec - exiting 11:58:47 (26408): No heartbeat from core client for 30 sec - exiting 11:58:48 (26408): No heartbeat from core client for 30 sec - exiting 11:58:49 (26408): No heartbeat from core client for 30 sec - exiting 11:58:50 (26408): No heartbeat from core client for 30 sec - exiting 11:58:51 (26408): No heartbeat from core client for 30 sec - exiting 11:58:53 (26408): No heartbeat from core client for 30 sec - exiting 11:58:54 (26408): No heartbeat from core client for 30 sec - exiting 11:58:55 (26408): No heartbeat from core client for 30 sec - exiting 11:58:56 (26408): No heartbeat from core client for 30 sec - exiting 11:58:57 (26408): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Leaving CPDN_Main::Monitor... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
22 Apr 2013 19:26:53	1163640	15718680	hadam3p_saf_1hgr_1986_1_006960067_2	138,336	467,243	3.3776
21 Apr 2013 16:46:08	1163640	15718680	hadam3p_saf_1hgr_1986_1_006960067_2	126,816	426,767	3.3652
20 Apr 2013 13:55:25	1163640	15718680	hadam3p_saf_1hgr_1986_1_006960067_2	115,296	387,714	3.3628
19 Apr 2013 14:10:28	1163640	15718680	hadam3p_saf_1hgr_1986_1_006960067_2	103,776	349,259	3.3655
18 Apr 2013 11:52:38	1163640	15718680	hadam3p_saf_1hgr_1986_1_006960067_2	92,256	312,366	3.3859
17 Apr 2013 11:07:38	1163640	15718680	hadam3p_saf_1hgr_1986_1_006960067_2	80,736	273,222	3.3841
16 Apr 2013 09:24:53	1163640	15718680	hadam3p_saf_1hgr_1986_1_006960067_2	69,216	235,325	3.3999
15 Apr 2013 08:35:12	1163640	15718680	hadam3p_saf_1hgr_1986_1_006960067_2	57,696	196,455	3.4050
13 Apr 2013 18:05:09	1163640	15718680	hadam3p_saf_1hgr_1986_1_006960067_2	46,176	157,326	3.4071
12 Apr 2013 16:16:05	1163640	15718680	hadam3p_saf_1hgr_1986_1_006960067_2	34,656	117,068	3.3780
11 Apr 2013 14:20:22	1163640	15718680	hadam3p_saf_1hgr_1986_1_006960067_2	23,136	78,388	3.3881
10 Apr 2013 13:45:06	1163640	15718680	hadam3p_saf_1hgr_1986_1_006960067_2	11,616	39,308	3.3840