Task 15744347

Name	hadcm3n_u0p7_2020_40_008339463_3
Workunit	8490324
Created	21 Apr 2013, 2:46:19 UTC
Sent	21 Apr 2013, 2:46:36 UTC
Report deadline	21 Jul 2013, 10:13:47 UTC
Received	2 May 2013, 6:55:15 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1167414
Run time	9 days 16 hours 15 min 47 sec
CPU time	8 days 21 hours 37 min 15 sec
Validate state	Invalid
Credit	4,976.64
Device peak FLOPS	1.95 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=26192, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 13:13:40 (5876): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:13:41 (5876): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2076, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2076, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2076, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2076, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2076, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
01 May 2013 20:41:16	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	414,720	798,347	1.9250
01 May 2013 06:38:13	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	388,800	749,498	1.9277
30 Apr 2013 16:51:15	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	362,880	701,110	1.9321
28 Apr 2013 22:39:26	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	336,960	652,495	1.9364
28 Apr 2013 08:36:03	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	311,040	603,847	1.9414
27 Apr 2013 18:43:32	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	285,120	554,667	1.9454
27 Apr 2013 05:01:51	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	259,200	506,755	1.9551
26 Apr 2013 13:45:08	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	233,280	452,863	1.9413
25 Apr 2013 22:29:20	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	207,360	399,175	1.9250
25 Apr 2013 07:11:27	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	181,440	347,399	1.9147
24 Apr 2013 16:15:52	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	155,520	295,545	1.9004
24 Apr 2013 00:57:35	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	129,600	243,177	1.8764
23 Apr 2013 10:24:35	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	103,680	192,359	1.8553
22 Apr 2013 21:09:36	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	77,760	144,939	1.8639
22 Apr 2013 07:43:28	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	51,840	96,901	1.8692
21 Apr 2013 18:11:16	1167414	15744347	hadcm3n_u0p7_2020_40_008339463_3	25,920	49,182	1.8975