Task 16610015

Name	hadcm3n_89u2_1980_40_008722165_2
Workunit	8868143
Created	4 May 2014, 20:40:05 UTC
Sent	4 May 2014, 21:02:25 UTC
Report deadline	4 Aug 2014, 4:29:36 UTC
Received	11 May 2014, 10:45:41 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1442393
Run time	5 days 3 hours 14 min 52 sec
CPU time	5 days 1 hours 13 min 39 sec
Validate state	Invalid
Credit	8,087.04
Device peak FLOPS	4.20 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.42</core_client_version> <![CDATA[ <message> Das Gerät erkennt den Befehl nicht. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... 09:32:15 (7252): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:39:40 (2720): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 09:53:02 (4420): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 09:02:22 (6652): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6672, iMonCtr=1 Model crash detected, will try to restart... 10:37:03 (1088): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 09:48:30 (3448): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 09:00:13 (5992): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3012, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3012, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3012, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3012, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3012, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3012, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
11 May 2014 05:45:49	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	673,920	428,013	0.6351
11 May 2014 00:49:36	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	648,000	409,179	0.6314
10 May 2014 19:48:15	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	622,080	390,128	0.6271
10 May 2014 13:55:16	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	596,160	370,141	0.6209
10 May 2014 09:50:16	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	570,240	354,215	0.6212
10 May 2014 04:27:25	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	544,320	338,265	0.6214
09 May 2014 23:26:15	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	518,400	321,683	0.6205
09 May 2014 19:09:51	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	492,480	305,555	0.6204
09 May 2014 15:07:18	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	466,560	291,883	0.6256
09 May 2014 11:08:49	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	440,640	278,219	0.6314
09 May 2014 07:47:51	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	414,720	264,578	0.6380
08 May 2014 16:10:31	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	388,800	255,839	0.6580
08 May 2014 12:09:33	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	362,880	241,919	0.6667
08 May 2014 07:01:26	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	336,960	228,018	0.6767
08 May 2014 01:45:17	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	311,040	208,065	0.6689
07 May 2014 20:44:05	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	285,120	189,028	0.6630
07 May 2014 16:47:37	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	259,200	173,211	0.6683
07 May 2014 12:44:46	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	233,280	159,326	0.6830
07 May 2014 06:20:50	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	207,360	143,278	0.6910
07 May 2014 01:19:45	1289212	16610015	hadcm3n_89u2_1980_40_008722165_2	181,440	124,493	0.6861