Task 13681009

Name	hadcm3n_yd1f_1940_40_007547303_3
Workunit	7744535
Created	1 Dec 2011, 13:05:56 UTC
Sent	1 Dec 2011, 13:17:35 UTC
Report deadline	1 Mar 2012, 20:44:46 UTC
Received	9 Feb 2012, 15:19:24 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	25 (0x00000019) Unknown error code
Computer ID	1150470
Run time	11 days 15 hours 43 min 5 sec
CPU time	10 days 20 hours 6 min 45 sec
Validate state	Invalid
Credit	10,886.40
Device peak FLOPS	3.79 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.8</core_client_version> <![CDATA[ <message> Das Laufwerk kann einen bestimmten Bereich oder eine bestimmte Spur nicht finden. (0x19) - exit code 25 (0x19) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6376, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1472, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5560, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1428, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5400, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5864, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5216, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5416, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1856, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4180, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7768, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CCPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 11:27:31 (8600): Can't acquire lockfile (32) - waiting 35s 11:27:44 (2240): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 11:27:45 (2240): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5248, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 16:30:35 (1216): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5984, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
09 Feb 2012 10:32:43	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	907,200	935,255	1.0309
07 Feb 2012 13:56:49	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	881,280	900,502	1.0218
04 Feb 2012 10:22:41	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	855,360	865,822	1.0122
01 Feb 2012 17:40:12	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	829,440	831,048	1.0019
30 Jan 2012 12:57:44	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	803,520	796,746	0.9916
27 Jan 2012 13:33:50	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	777,600	762,327	0.9804
25 Jan 2012 18:40:30	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	751,680	727,523	0.9679
24 Jan 2012 16:11:23	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	725,760	692,945	0.9548
21 Jan 2012 18:25:23	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	699,840	658,381	0.9408
18 Jan 2012 18:43:00	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	673,920	623,659	0.9254
15 Jan 2012 15:21:48	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	648,000	588,977	0.9089
10 Jan 2012 14:09:40	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	622,080	561,200	0.9021
06 Jan 2012 16:04:48	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	596,160	538,480	0.9032
06 Jan 2012 10:03:15	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	570,240	515,650	0.9043
04 Jan 2012 14:57:37	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	544,320	492,524	0.9048
03 Jan 2012 16:53:11	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	518,400	469,020	0.9047
02 Jan 2012 17:06:49	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	492,480	445,487	0.9046
02 Jan 2012 13:25:59	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	466,560	421,758	0.9040
30 Dec 2011 13:42:30	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	440,640	397,639	0.9024
27 Dec 2011 15:49:05	1150470	13681009	hadcm3n_yd1f_1940_40_007547303_3	414,720	374,147	0.9022