Task 14784306

Name	hadcm3n_o33x_2020_40_008000185_1
Workunit	8155299
Created	11 Jun 2012, 0:30:39 UTC
Sent	11 Jun 2012, 0:30:56 UTC
Report deadline	10 Sep 2012, 7:58:07 UTC
Received	26 Jul 2012, 17:41:25 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1094300
Run time	10 days 12 hours 46 min 24 sec
CPU time	9 days 0 hours 17 min 52 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.75 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.56</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5832, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5832, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6040, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5620, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5932, iMonCtr=1 Model crash detected, will try to restart... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 21:26:29 (5576): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4572, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3088, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 17:19:05 (2580): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5888, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
26 Jul 2012 17:43:25	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	518,400	778,665	1.5021
24 Jul 2012 16:06:01	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	492,480	739,266	1.5011
22 Jul 2012 14:33:03	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	466,560	699,259	1.4988
21 Jul 2012 16:23:08	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	440,640	659,865	1.4975
19 Jul 2012 17:59:11	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	414,720	620,949	1.4973
17 Jul 2012 16:22:19	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	388,800	581,766	1.4963
16 Jul 2012 21:02:30	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	362,880	541,969	1.4935
13 Jul 2012 18:55:27	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	336,960	504,748	1.4979
11 Jul 2012 19:47:40	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	311,040	467,653	1.5035
09 Jul 2012 20:02:04	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	285,120	428,718	1.5036
09 Jul 2012 05:19:12	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	259,200	386,880	1.4926
08 Jul 2012 10:15:15	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	233,280	348,272	1.4929
07 Jul 2012 19:10:45	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	207,360	304,149	1.4668
06 Jul 2012 20:37:51	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	181,440	263,659	1.4531
03 Jul 2012 20:29:05	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	155,520	225,592	1.4506
02 Jul 2012 17:58:03	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	129,600	189,405	1.4615
02 Jul 2012 17:58:03	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	103,680	151,713	1.4633
29 Jun 2012 21:42:33	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	77,760	114,125	1.4677
28 Jun 2012 17:03:05	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	51,840	76,125	1.4685
26 Jun 2012 18:16:02	1094300	14784306	hadcm3n_o33x_2020_40_008000185_1	25,920	38,449	1.4834