Uutiset:

Ei uusia uutisia.

Main Menu

Dedi kovot kaputt

Aloittaja weatherc, torstai, 25.04.2013, 15:37

« edellinen - seuraava »

0 Jäsenet ja 1 Vieras katselee tätä aihetta.

weatherc

Joku joka ymmärtää paremmin kun meikäläinen tuon smartctl-softan ulosannista jotain, mitä tuo seuraava kertoo?
Mulle ainakin sen että Reallocated_Sector_Ct, Current_Pending_Sector, ATA Error Count eivät ole ihan kuten pitäisi.....

Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED
WHEN_FAILED RAW_VALUE
 1 Raw_Read_Error_Rate     0x000f   102   089   006    Pre-fail  Always       -  243646751
 3 Spin_Up_Time            0x0003   093   093   000    Pre-fail  Always       -  0
 4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -  17
 5 Reallocated_Sector_Ct   0x0033   095   095   036    Pre-fail  Always       -  7864
 7 Seek_Error_Rate         0x000f   089   060   030    Pre-fail  Always       -   806218850
 9 Power_On_Hours          0x0032   093   093   000    Old_age   Always       -  6290
10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -   0
12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -  17
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -  0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -  0
187 Reported_Uncorrect      0x0032   001   001   000    Old_age   Always       -  4111
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -  4295032833
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -  0
190 Airflow_Temperature_Cel 0x0022   064   060   045    Old_age   Always       -  36 (Min/Max 30/40)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -  0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -  15
193 Load_Cycle_Count        0x0032   098   098   000    Old_age   Always       -   5243
194 Temperature_Celsius     0x0022   036   040   000    Old_age   Always       -  36 (0 20 0 0 0)
197 Current_Pending_Sector  0x0012   097   001   000    Old_age   Always       -  520
198 Offline_Uncorrectable   0x0010   097   001   000    Old_age   Offline      -  520
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -  0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -  98973226375082
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -  91794627828115
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -  151900621027406

SMART Error Log Version: 1
ATA Error Count: 8178 (device log contains only the most recent five errors)

systeemi

Lainaus käyttäjältä: weatherc - torstai, 25.04.2013, 15:37
Joku joka ymmärtää paremmin kun meikäläinen tuon smartctl-softan ulosannista jotain, mitä tuo seuraava kertoo?
Mulle ainakin sen että Reallocated_Sector_Ct, Current_Pending_Sector, ATA Error Count eivät ole ihan kuten pitäisi.....

Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED
WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   102   089   006    Pre-fail  Always       -  243646751
  3 Spin_Up_Time            0x0003   093   093   000    Pre-fail  Always       -  0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -  17
  5 Reallocated_Sector_Ct   0x0033   095   095   036    Pre-fail  Always       -  7864
  7 Seek_Error_Rate         0x000f   089   060   030    Pre-fail  Always       -   806218850
  9 Power_On_Hours          0x0032   093   093   000    Old_age   Always       -  6290
10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -   0
12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -  17
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -  0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -  0
187 Reported_Uncorrect      0x0032   001   001   000    Old_age   Always       -  4111
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -  4295032833
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -  0
190 Airflow_Temperature_Cel 0x0022   064   060   045    Old_age   Always       -  36 (Min/Max 30/40)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -  0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -  15
193 Load_Cycle_Count        0x0032   098   098   000    Old_age   Always       -   5243
194 Temperature_Celsius     0x0022   036   040   000    Old_age   Always       -  36 (0 20 0 0 0)
197 Current_Pending_Sector  0x0012   097   001   000    Old_age   Always       -  520
198 Offline_Uncorrectable   0x0010   097   001   000    Old_age   Offline      -  520
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -  0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -  98973226375082
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -  91794627828115
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -  151900621027406

SMART Error Log Version: 1
ATA Error Count: 8178 (device log contains only the most recent five errors)



En mie tuosta muuta ymmärrä kuin sen että erroria pukkaa aika reippaanlaisesti. Eli olisko niin että kovo on aika pirstaleina. Haut ei onnistu josta timeoutit ja read errorit. Sitten iso ??? perään.
Sääasema Nauska, Kemi

www.kemiweather.fi

weatherc

Kysäsin Hetznerin supportilta ja downtimea pukkaa heti kun lukevat vastauksen jotta voivat tsekata kovot.
Downtimen pituus "20 min" (jos se käynnistyy uudelleen....)

On vaan siinä vaiheessa toinen kerta vuoden sisään kun H:n kovot hajoavat, pirun consument-grade Barracuda-p*kat...

Mulle tuo kertos Googlen avulla että Bad_sectoria on aivan tolkuttomasti....
Nuo haku ja kirjoitus-luvut ovat Googlen mukaan Barracudoissa ihan utopiaa eikä niihin kannattane luottaa...

weatherc

#3
Dead!
Molemmat kovot kaputt.

Ainut pihaus mitä saa on rescue-modessa.

weatherc

Noin, nyt tehty pikkasen uppauksia backup-tilaan.

Nyt on kysymys mitä tehdä noille susille Barracudoille koska tämä on toinen kerta vuoden sisään kun levyt pamahtaa, niin,
- Hetznerillä täysin sudet levyt
- Dedin setuppi ei sovellu consument-grade levylle (mm realtime-ftp:t syö i/o:ta reilusti).


weatherc

Kysäsin ideoita Hetznerin supportilta. Vastaukset olivat kuten arvasin, liki suoraan roskakoriin menevät:
- Vaihtaa kovot "enterprice-luokkaan" => 65€/kk lisämaksua
- Vaihtaa EX6-purkkiin jossa nuo enterprice-kovot + EEC-RAM => hintava
SSD-levy kustantaa aika uskomattomat 30€/kk hetznerillä, 15€ itse levystä mutta se vaatii myös hetin pirun Flexi-packin, 15€.

Jotenkin kyrsii nyt tuo consument-grade-romu siihen malliin että tutkinnassa on Webtropia.de, jossa olisi mm. HP:n purkkeja.

Kunnes olen päättänyt mitä teen ei dedille tapahdu mitään, päätös tulee kyllä vielä tänään, sitä kun ei kuitenkaan ylös saada enään tämän päivä puolella niin parempi nyt ottaa hetken-parin mietintätauko ettei ala kyserimään jälkikäteen...

// Henkka

weatherc

Päivitystä...
3GB/s Barracudojen tilalle tuli tuliterät 6GB/s 7200 pm Toshibat....

Snowi

Mitkäköhän levyt mulla on tuolla Hetznerillä? :)

weatherc

LainaaMitkäköhän levyt mulla on tuolla Hetznerillä?

Voit tarkistaa SSH:lla:
smartctl -a /dev/sda ja smartctl -a /dev/sdb  :)

Dedi..
Cpanel koittaa asentaa itsensä....
Mennee huomiseen että saan sivut linjoille backupeista...


weatherc

Sivut ovat takaisin linjoilla. Tarkistakaa että FTP uppaa OK....

Lyhyitä katkoksia tullee esiintymään vielä, mm. reboottia pukkaa jolla testataan että pulikat käynnistyy myös bootin jälkeen....