Task 13023794

Name	hadcm3n_t3ze_1940_40_007315411_1
Workunit	7512841
Created	28 Jun 2011, 21:18:27 UTC
Sent	29 Jun 2011, 19:34:49 UTC
Report deadline	29 Sep 2011, 3:02:00 UTC
Received	3 Aug 2011, 14:10:45 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1123020
Run time	28 days 0 hours 42 min 49 sec
CPU time	20 days 21 hours 24 min 4 sec
Validate state	Invalid
Credit	9,020.16
Device peak FLOPS	2.60 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Ocean Restart file copy failed on t3zeko.dae2240 Ocean Restart file copy failed on t3zeko.dae43u0 CPDN Monitor - Quit request from BOINC... Ocean Restart file copy failed on t3zeko.dae8170 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Ocean Restart file copy failed on t3zeko.dae9bb0 Ocean Restart file copy failed on t3zeko.dae9bc0 CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Ocean Restart file copy failed on t3zeko.daf16l0 CPDN Monitor - Quit request from BOINC... Atmos Hold Restart file rename failed on atmos_restart.hold Ocean Restart file copy failed on t3zeko.daf3cs0 Atmos Hold Restart file rename failed on atmos_restart.hold Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Ocean Restart file copy failed on t3zeko.daf74g0 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Ocean Restart file copy failed on t3zeko.daf8ao0 Ocean Restart file copy failed on t3zeko.daf9c30 Suspended CPDN Monitor - Suspend request from BOINC... Ocean Restart file copy failed on t3zeko.dag17u0 Ocean Restart file copy failed on t3zeko.dag33g0 Ocean Restart file copy failed on t3zeko.dag33h0 CPDN Monitor - Quit request from BOINC... Ocean Restart file copy failed on t3zeko.dag49c0 Ocean Restart file copy failed on t3zeko.dag4b20 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Ocean Restart file copy failed on t3zeko.dag7190 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 forrtl: There is not enough space on the disk. 05:20:18 (3680): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Ocean Restart file copy failed on t3zeko.dag9480 16:36:14 (4664): Can't acquire lockfile (32) - waiting 35s 16:36:38 (3288): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Ocean Restart file copy failed on t3zeko.dag9b50 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 forrtl: There is not enough space on the disk. 11:27:49 (2076): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
02 Aug 2011 20:18:28	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	751,680	1,764,358	2.3472
01 Aug 2011 22:33:53	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	725,760	1,702,105	2.3453
01 Aug 2011 00:25:54	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	699,840	1,639,390	2.3425
30 Jul 2011 21:48:40	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	673,920	1,660,378	2.4638
29 Jul 2011 18:40:26	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	648,000	1,594,788	2.4611
25 Jul 2011 23:10:45	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	622,080	1,531,736	2.4623
25 Jul 2011 22:29:51	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	596,160	1,468,832	2.4638
25 Jul 2011 21:54:29	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	570,240	1,407,813	2.4688
25 Jul 2011 20:35:44	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	544,320	1,343,696	2.4686
25 Jul 2011 19:20:22	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	518,400	1,275,088	2.4597
25 Jul 2011 19:01:26	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	492,480	1,208,312	2.4535
25 Jul 2011 18:57:56	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	466,560	1,146,879	2.4582
25 Jul 2011 18:13:17	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	440,640	1,085,343	2.4631
25 Jul 2011 17:38:03	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	414,720	1,023,255	2.4673
25 Jul 2011 15:58:51	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	388,800	955,545	2.4577
25 Jul 2011 12:48:21	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	362,880	885,725	2.4408
25 Jul 2011 12:48:21	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	336,960	819,360	2.4316
25 Jul 2011 12:48:21	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	311,040	753,710	2.4232
25 Jul 2011 12:48:21	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	285,120	687,012	2.4096
11 Jul 2011 03:21:16	1123020	13023794	hadcm3n_t3ze_1940_40_007315411_1	259,200	624,374	2.4089