Task 11520222

Name	famous_ug89_1799_200_006653876_1
Workunit	6857248
Created	10 Jun 2010, 14:03:57 UTC
Sent	21 Aug 2010, 17:59:52 UTC
Report deadline	21 Nov 2010, 1:27:03 UTC
Received	4 Sep 2010, 0:35:50 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1095401
Run time	4 days 8 hours 36 min 25 sec
CPU time	2 days 19 hours 30 min 15 sec
Validate state	Invalid
Credit	1,420.64
Device peak FLOPS	2.02 GFLOPS
Application version	UK Met Office FAMOUS v6.11 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 17:18:12 (3200): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:32:21 (3548): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3612, iMonCtr=1 Model crash detected, will try to restart... 10:40:51 (3304): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:18:36 (3476): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 60 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 61 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 15:29:27 (3568): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 60 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 61 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 15:30:44 (2716): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 60 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 61 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 15:34:44 (2148): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 60 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 61 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 15:38:17 (3624): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 60 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 61 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 07:00:00 (3460): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... 09:00:47 (1188): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:19:03 (3284): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... 12:48:53 (4728): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/famous_ug89_1799_200_006653876/dataout/atmos_restart.day after 11 attempts Model crashed: DRLANDF1 : Error in FILE_OPEN. tmp/pipe_dummy cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/famous_ug89_1799_200_006653876/dataout/atmos_restart.day after 11 attempts Model crashed: DRLANDF1 : Error in FILE_OPEN. tmp/pipe_dummy cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/famous_ug89_1799_200_006653876/dataout/atmos_restart.day after 11 attempts Model crashed: DRLANDF1 : Error in FILE_OPEN. tmp/pipe_dummy cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/famous_ug89_1799_200_006653876/dataout/atmos_restart.day after 11 attempts Model crashed: DRLANDF1 : Error in FILE_OPEN. tmp/pipe_dummy cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/famous_ug89_1799_200_006653876/dataout/atmos_restart.day after 11 attempts Model crashed: DRLANDF1 : Error in FILE_OPEN. tmp/pipe_dummy cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/famous_ug89_1799_200_006653876/dataout/atmos_restart.day after 11 attempts Model crashed: DRLANDF1 : Error in FILE_OPEN. tmp/pipe_dummy Sorry, too many model crashes! :-( 12:51:30 (984): called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
04 Sep 2010 01:43:46	1095401	11520222	famous_ug89_1799_200_006653876_1	430,586	239,447	0.5561
04 Sep 2010 01:43:46	1095401	11520222	famous_ug89_1799_200_006653876_1	421,226	234,270	0.5562
26 Aug 2010 00:44:15	1095401	11520222	famous_ug89_1799_200_006653876_1	411,866	229,178	0.5564
25 Aug 2010 21:54:00	1095401	11520222	famous_ug89_1799_200_006653876_1	402,506	223,921	0.5563
25 Aug 2010 19:31:58	1095401	11520222	famous_ug89_1799_200_006653876_1	393,146	218,603	0.5560
25 Aug 2010 17:32:45	1095401	11520222	famous_ug89_1799_200_006653876_1	383,786	213,480	0.5562
25 Aug 2010 15:33:07	1095401	11520222	famous_ug89_1799_200_006653876_1	374,426	208,394	0.5566
25 Aug 2010 13:45:53	1095401	11520222	famous_ug89_1799_200_006653876_1	365,066	203,484	0.5574
25 Aug 2010 12:00:55	1095401	11520222	famous_ug89_1799_200_006653876_1	355,706	198,373	0.5577
25 Aug 2010 10:16:48	1095401	11520222	famous_ug89_1799_200_006653876_1	346,346	193,258	0.5580
25 Aug 2010 07:37:13	1095401	11520222	famous_ug89_1799_200_006653876_1	336,986	187,909	0.5576
25 Aug 2010 05:48:44	1095401	11520222	famous_ug89_1799_200_006653876_1	327,626	182,782	0.5579
25 Aug 2010 03:54:33	1095401	11520222	famous_ug89_1799_200_006653876_1	318,266	177,632	0.5581
25 Aug 2010 02:08:29	1095401	11520222	famous_ug89_1799_200_006653876_1	308,906	172,475	0.5583
25 Aug 2010 01:30:15	1095401	11520222	famous_ug89_1799_200_006653876_1	299,546	167,317	0.5586
24 Aug 2010 21:23:37	1095401	11520222	famous_ug89_1799_200_006653876_1	290,186	161,844	0.5577
24 Aug 2010 19:10:10	1095401	11520222	famous_ug89_1799_200_006653876_1	280,826	156,587	0.5576
24 Aug 2010 17:19:58	1095401	11520222	famous_ug89_1799_200_006653876_1	271,466	151,524	0.5582
24 Aug 2010 15:24:37	1095401	11520222	famous_ug89_1799_200_006653876_1	262,106	146,442	0.5587
24 Aug 2010 13:32:42	1095401	11520222	famous_ug89_1799_200_006653876_1	252,746	141,379	0.5594