Jaahas, merkkituote purnukka HP pysyi hengissä sen 2.5 kk kunnes otti kaffepaussin...
Täältä käsin ei ole mitään yhteyttä siihen ja siten lähti kyssäriä ServerLostin supportille joka toki jopa vastaskin 7 minuutissa...
Kaffepaussi loppus ;D
Pitää kysästä supportilta että mikä oli..
Vika näyttää olevan SMBus/IPMI joka puskee errormessagea syslogiin tasaisen tahtiin kerran minuutissa.
Supportin kanssa keskustelut käynnissä mitä silel pitäisi tehdä...
Jul 15 21:27:11 loft8499 kernel: ACPI Error: SMBus or IPMI write requires Buffer of length 42, found length 20 (20090903/exfield-286)
Jul 15 21:27:11 loft8499 kernel: ACPI Error (psparse-0537): Method parse/execution failed [\_SB_.PMI0._PMM] (Node ffff88040a0dba60), AE_AML_BUFFER_LIMIT
Jul 15 21:27:11 loft8499 kernel: ACPI Exception: AE_AML_BUFFER_LIMIT, Evaluating _PMM (20090903/power_meter-341)
Jul 15 21:28:11 loft8499 kernel: ACPI Error: SMBus or IPMI write requires Buffer of length 42, found length 20 (20090903/exfield-286)
Jul 15 21:28:11 loft8499 kernel: ACPI Error (psparse-0537): Method parse/execution failed [\_SB_.PMI0._PMM] (Node ffff88040a0dba60), AE_AML_BUFFER_LIMIT
Jul 15 21:28:11 loft8499 kernel: ACPI Exception: AE_AML_BUFFER_LIMIT, Evaluating _PMM (20090903/power_meter-341)
Mikähän tämän aihauttaa... ???
No kai se siitä selviää.
Ei hajua mutta ServerLostin..hrmm.. ServerLoftin supportti ehdotti suoraan palvelimen vaihtoa, jonka ajankohtaa en vielä tiedä.
Vaihto tapahtuu siten että koko rauta vaihtuu mutta levyt pysyy samana, guesstimated downtimea kun kyselin niin noin 1h.
Sivujen IP-numeroihin se ei pitäisi vaikuttaa mitenkään koska ovat virtuaalissa Proxmoxissa.
Lienee HP:n ansiota että tälläista ehdotusta tulee näinkin helpolla. Hetznerillä olisi vain voinut uneksia tälläisesta....
SeverLoft vaihtoi purkin noin 03-04 aikaan yöllä uuteen sekä swappasi sisään meitin vanhat levyt.
Muutoin meni kaikki hyvin mutta Apache ei käynnistynyt automaagisesti, siitä 502 Gateway-errorit tuossa aamusella.
Pienenä miinuksena protokollassa heitin supportille etteivät kertoneet etukäteen milloin tuo tapahtuu, mutta muutoin oli supportti kyllä aika mallikasta asiassa. :)
Ja varsinkin se, näin Hetzneriltä tulleena jossa aina oli vakiovastus heitin tuntejä kestävä hardware-check ennen kun edes ehdotettiin mitään vaihtoa yhtään mistään, oli se että heti kun lähetin pätkän syslogia heille tuli ehdotus että koko rauta vaihtoon.
He myös tsekkas MAC-osoitteen jota olisi saanut tehdä itse Hetznerillä.
Nyt alkaa oikeesti palamaan käämit, pysyipä uusi merkki-HP pystyssä kokonaiset 2 päivää....
Ylhäällä taas, kernel-panic syynä. ServerLostin supportti tutkii asiaa.
Tämä ei takuulla jää tähän...
Rebootti 10 minuutin sisään 23:40.
Rebootti tehty.
Lainaus käyttäjältä: weatherc - maanantai, 15.07.2013, 22:31
Vika näyttää olevan SMBus/IPMI joka puskee errormessagea syslogiin tasaisen tahtiin kerran minuutissa.
Supportin kanssa keskustelut käynnissä mitä silel pitäisi tehdä...
Jul 15 21:27:11 loft8499 kernel: ACPI Error: SMBus or IPMI write requires Buffer of length 42, found length 20 (20090903/exfield-286)
Jul 15 21:27:11 loft8499 kernel: ACPI Error (psparse-0537): Method parse/execution failed [\_SB_.PMI0._PMM] (Node ffff88040a0dba60), AE_AML_BUFFER_LIMIT
Jul 15 21:27:11 loft8499 kernel: ACPI Exception: AE_AML_BUFFER_LIMIT, Evaluating _PMM (20090903/power_meter-341)
Jul 15 21:28:11 loft8499 kernel: ACPI Error: SMBus or IPMI write requires Buffer of length 42, found length 20 (20090903/exfield-286)
Jul 15 21:28:11 loft8499 kernel: ACPI Error (psparse-0537): Method parse/execution failed [\_SB_.PMI0._PMM] (Node ffff88040a0dba60), AE_AML_BUFFER_LIMIT
Jul 15 21:28:11 loft8499 kernel: ACPI Exception: AE_AML_BUFFER_LIMIT, Evaluating _PMM (20090903/power_meter-341)
Ei tuu enää :)
Johtuen jostain raudasta piti lisätä pikku pätkä Grubiin koska Proxmox käyttää omaa kerneliä...
Taitaapi taas olla nurin :(
jamo
No niin näyttäisi. Perhana kun selviäsi syy mikä tuon aiheuttaa.
Nyt palo päreet tuon HP:n kanssa sitten lopullisesti, tämä on sen lopullinen niitti.
SeverLostille on lähtenyt viesti asiasta.
Lainaus käyttäjältä: systeemi - sunnuntai, 21.07.2013, 10:39
No niin näyttäisi. Perhana kun selviäsi syy mikä tuon aiheuttaa.
Niin olis. Esim WRF:a (joka aika resurssisyöppö, tosin sen saamat coret pystyy säätämään) sillä ei ole ajettu useaan päivään kertaakaan, vaan ainostaan sivut + GFS ja tutkien karttatiilet. CPU:n käyttötaso on ollut noin 25% keskimäärin.
Keskustellut cpvejr.dk:n kaverin kanssa, joka työkseen ylläpitää palvelimia useassa Euroopan maasa (myös Suomessa) sitten torstain että mikä olisi se paras ja luotettavin ratkaisu.
Muutama juttu tullut ilmi:
- HP ei välttämättä ole hyvä palvelimena, esim Fujitsu olisi paljon parempi jos merkkitavaraa vertaa.
- Lisää RAM:ia
- pieni SSD Enterprise-luokan lättyjen lisäksi esim mysliä varten
- CPU (E3-1240v2) on teholtaan sinsänsä ihan hyvä, saa 8000 pojoo cpubenchmarkissa.
LainaaWe have assigned this issue to the responsible department, which will look into this matter and update you about it as soon as possible.
Sitten siellä oikeassa departmentissa kahvikupit sivuun kiitos :)
Siinä meni SLA:n mukaninen 4 tunnin reagointi-aika umpeen....
10 tuntia eikä pihaustakaan vastaukseksi ServerLostin supportilta (lupaavat 24/7 supportia 4 tunnin reagointiajalla).
Takaisin linjoilla tie kuis monennen yrityksen jälkeen tehdä "hardware reset" hallintapaneelista.
Heh...Olipa oikein selitysten äiti joka tuli kun vihdoinkin tuli vastaus tikettiin 18 tunnin jälkeen, tiketti mukamas väärässä jonossa...Ei hyvää päivää...
Taas mennään, pysyipä linjoilla kokonaiset 50 tuntia...
Hallintapaneelin hardware-reset on akttivoitu...Ootellaan hetkonen että jospa, vastoin kaikkia odotuksia, auttaisi...
Tiedoksi, korvaava purkki on rakenteilla, kestänee päivän pari että päästään siirtämään sivuja sinne...
EDIT: Auttoi tällä kertaa.
Aina vaan paranee, tällä ketaa pysyi psystyssä 35h...
Noh, uus purkki on viittä vaille muuttovalmis ja ensimäiset sivut päässee sinne tänään vielä, cpanelia ja sen softia pitää vielä säätää sekä rebootti jotta näkee että kaikki käynnistyy ok myös bootin yhteydessä (nyttenhän Apache ei käynnisty jostain syystä).
Lainaus käyttäjältä: weatherc - torstai, 25.07.2013, 10:53
Aina vaan paranee, tällä ketaa pysyi psystyssä 35h...
Noh, uus purkki on viittä vaille muuttovalmis ja ensimäiset sivut päässee sinne tänään vielä, cpanelia ja sen softia pitää vielä säätää sekä rebootti jotta näkee että kaikki käynnistyy ok myös bootin yhteydessä (nyttenhän Apache ei käynnisty jostain syystä).
Sinulla taitaa olla pitkä pinna.... ???
LainaaSinulla taitaa olla pitkä pinna....
Ei se niiiin pitkä ole. Tuon HP:n saatikka ServerLostin leikkimistä en katellut kovinkaan pitkään. Sunnuntainen crashi, eli kolmas, oli niiden molempien lopullinen niitti.
Uuden purkin saaminen ja konffaaminen vie vaan sen oman aikansa (muutaman päivän) jona aikana majaillaan väkisinkin vanhalla vielä.
Nordicweather muuttaa parhaillaan :)
Kun lyötiin 1000+ userssia onlineen sanoi homma titituut....
Hetzner oli kuitenkin selvästi tietoinen mahdollisesta ongelmasta koska teki heti muutokset BIOS:iin. Kyseessä on kuitenkin täysin uusi palvein-konfiguraatio joten tällaistahan saattaa tulla eteen ennenkuin saavat oletuskonffauksen toimimaan/testattua laajalla käyytäjämäärällä.
Vastauskin tuli nopeasti toisin kuin ServerLostilla....
Tämä taas johti FTP:n failaamiseen joka taas ketjureaktiona johti kyseisten IP:den bannaamiseen palomuurin toimesta.
Loppupeleissä oli pikku asetus FTP-softassa joka sai sen toimimaan taas. Samalla saatiin kerättyä ajantasaiset IP-numerot sääpurnukoilta white-listalle :)
Rehellisesti sanottuna ei olisi tulikaste tarvinnut tulla ihan näin nopeasti (tämän päivän ukkoset) vaan olisi voinut odottaa pari päivää....
Joka tapauksessa, miten voi näinkin pienet erot raudassa, mitä tuon Serverlostin purkin ja tämän välillä loppujen lopuksi on, tehdä näin suuren eron sihen miten purkki porskutaa?? Tämähän porskuttaa liki tyhjäkäynnillä vaikka 1000+ userssia onlinessä ja yli puolet sivuista jo muuttaneet... :)
Lainaus käyttäjältä: weatherc - perjantai, 26.07.2013, 18:56
Kun lyötiin 1000+ userssia onlineen sanoi homma titituut....
Hetzner oli kuitenkin selvästi tietoinen mahdollisesta ongelmasta koska teki heti muutokset BIOS:iin. Kyseessä on kuitenkin täysin uusi palvein-konfiguraatio joten tällaistahan saattaa tulla eteen ennenkuin saavat oletuskonffauksen toimimaan/testattua laajalla käyytäjämäärällä.
Saivat hyvän referenssin uuteen palveluunsa ;D
jamo
Homma titituut n. 07:58 lähtien
Alkaa meneen aika mielenkiintoiseksi tämä homma nytten...
- Homma toimis OK kunnes 3 viikkoa sitten tapahtui jotain, mutta mitä?
- Rauta voitaneen sulkea pois koska samat kaatumiset tapahtuu myös ServerLostin HP:llä, tämä vaikka suurin osa sivuista muuttanut ja kaikki omat cronit tapettu.
- ServerLostin HP:llä oli käytössä 2 virtuaalia jossa toisessa sivut+cpanel ja toisessa kartassa. Aatos oli että tämä sulkis pois mahdolliset tapaukset että "kartat kaatoi kaikki sivut" ja vastaavat. Ja purkki kaatuu silti.
- Ainut softista mikä lienee päivittynyt HP:n aikana on cpanel joka puskee ne automaagisesti sisään. Enkä ole vielä löytänyt tapaa millä asentaa pari pykälää vanhemman version siitä ja pysyä siinä vaan se puskee sitä uusinta väkisin.
Sitten on tietty että joku/jotain sivuissa/kartoissa aiheuttaa sen. Ongelman löytämistä vaikeuttaa se että esim. /var/log/messages:iin ei jää mitään merkintää koko hommasta vaan se tyssää tyyliin kesken FTP-logirivin josta jatketaan kun purkki käynnistyy uudelleen.
Alkaa kohta olemaan ideat vähissä ja alkaa radikaalit kokeilut koska sehän on saatava vakaaksi kohta keinolla millä hyvänsä.
Ja yksi on että puhdas asennus centosta + cpanelia ilman kartta/video-häkkyröitä. Näin saisi selville sen että aiheuttaako joku niissä tuon. Toisaalta, jos niin olisi ei HP kaatusi enää koska niitähän ei siellä tehdä enää paitsi jos se on itse palikat tai niiden tarvitsemat softat joka aiheuttaa sen....
Lähetetty cpanelille ja hetznerille kyssärit onko mahdollista, ja jos on että miten, asentaa pari pykälää vanhemmat versiot cpanelista ja centoksesta.
Jos muisti ei ihan petä oli vanhalla hetzner-purkilla centos 6.2 ja cpanel 11.36 kun nyt on 6.4 ja 11.38.
Toisaalta, erään toisen projektin tiimoilta on käytössä kartta-häkkyrät + centos 6.4 ja se toimi moitteettomasti.
Alkaa pois-sulkemismetoodilla epäilys osoittamaan enemmän ja enemmän cpanelin 11.38:aan ja että siinä olisi jotain joka tilttaa systeemin kun nuo ennen täysin vakaasti toimineet softat asennettuna.
Voiko jonkun palvelimella olevan sivusto aiheuttaa tämän ongelman? Niin paljon huonoa koodia että tökkäisi siihen?
Lainaus käyttäjältä: systeemi - maanantai, 29.07.2013, 16:22
Voiko jonkun palvelimella olevan sivusto aiheuttaa tämän ongelman? Niin paljon huonoa koodia että tökkäisi siihen?
En sano ettei olis mahdottomuus sekään. Omasta kokemuksesta tiedän että esim. mysql/php:n saa kyykkyyn jopa parilla rivillä väärin koodattua php:tä. Mutta se mikä puhuu tuota hitusen vastaan, ja on myös tässä se pikku kummajainen, on ettei loadit eikä mitkään muutkaan arvot inahdakkaan ennen kaatumista. Yleensähän esim loadit menee katosta läpi ennen kaatumista. Tai edes joku arvo näyttäisi nousua. Mutta ei.
Jos vertaa windowssiin niin on vähän kun blue screeni, se vaan yks kaksi ilmestyy ja sama on tässäkin, yks kaks se kaatuu/menee jumiin.
Jos joku skripti olisi liian raskas, kuten WU-tilasto-skripti joka on erittäin raskas, niin ainakin loadit nousis ensin.
Menee vaan mielenkiintoisemmaksi tämä touhu.
Nyt se pysyy hengissä 3-4 tuntia kerralla, 3 kerta jo tänään menossa...
Niin en osaa sanoa, mutta voisihan tässä jokainen hieman tarkistaa mikä voisi aiheuttaa. Itselläni oli tuolla auringossa sivut jonkin aikaa ja ongelmia ei ollut. Yksi koodi heittää erroria vuorokauden alussa, kun laskurille ei vielä ole dataa. Mutta sekään ei koskaan kaatanut palvelinta tai sivua.
Voisiko FTP-yhteyksien lukumäärässä olla syy?
Normi errori php:ssä ei kaada palvelinta. Silloinhan vain kyseinen skripti failaa ja loppuu siihen, just tyyliin jos joku päivämäärää uppuu tai jotain.
FTP:t ovat yksi joka käynyt mielessä myös. Kun riittävästi yhteyksiä niin ainakin vanhalla dedillä ne oli innokkaasti esillä I/O-topissa. Nytten on disk-troughtput siinä 10 MB/s korvilla joten matalalla sekin. Toisaalta ovat max FTP-yhteyttä per IP rajoitettu joten mikään IP ei pääse sillä lailla lyömään sitä jumiinkaan ja FTP:t ovat koko ajan top:in alapäässä.
Yks idea mitä kohta teen on että pysäytän kaikki omat/sivujen cronit. Kun ollut 24h pystyssä niin palautan ne yks sivusto kerrallas 24h väliajoin (sekä omat osissa). Se ainakin kertoisi että onko joku croni syypää.
Btw. cpanelista pystyy asentamaan 11.36:sen jos haluaa, centos 6.2:sta ei.
Lainaus käyttäjältä: weatherc - maanantai, 29.07.2013, 20:35
Yks idea mitä kohta teen on että pysäytän kaikki omat/sivujen cronit. Kun ollut 24h pystyssä niin palautan ne yks sivusto kerrallas 24h väliajoin (sekä omat osissa). Se ainakin kertoisi että onko joku croni syypää.
Btw. cpanelista pystyy asentamaan 11.36:sen jos haluaa, centos 6.2:sta ei.
Pysäytin omat cronit. Pakkohan tässä on alkaa kokeilemaan kaikki mahdollinen.
Lainattu eräältä foorumilta. Voi niitä palvelimen kaatumiseen olla moniakin syitä.
LainaaAsiakas valitteli kun järjestelmämme palvelin kaatuu aina öisin joskus neljän aikoihin. Ongelmaa selvitettiin ensin ohjelmistopuolella mahdollisimman pitkälle muutaman viikon sessioiden ajan. Eikä ongelmaan tuntunut pääsevän mitenkään käsiksi. Alkoi tuntumaan että itse koneessa ei ole mitään vikaa ja vaikka kone oli vaihdettu toiseen samanlaiseen joka oli asennettu alusta asti uudelleen ei mitään ongelmia löytynyt. Lopuksi koneen virtakaapelin väliin kytkettiin laite joka mittaa jännitettä ja virrankulutusta ympäri vuorokauden ja loggaa tiedot flashille.
Edelleen kone kaatui. Sitten kun aloimme purkamaan dataa tallentimesta havaitsimme mielenkiintoisen ilmiön. Logista puuttui kaikki tiedot noin 7 minuutin ajalta. Kuitenkin samassa virransyötössä olleet muut palvelimet olivat pysyneet pystyssä.
Tilanne ei ottanut selvitäkseen. Päädyimme tulokseen, että mä haluan olla koneen vieressä ja nähdä kun se sammuu. Ei siinä muu sitten auttanut kun ottaa pari termaria kahvia välipalaa ja läppäri ja istua ikävässä humisevassa serverihuoneessa.
Olin juuri nukahtamassa kun huoneen ovi aukeaa. Unen tokkurassa ihmettelin että mitäh? Kuka tänne nyt. Siivooja lapsin sisään. Koska tiloissa ei ollut vapaita töpseleitä otti siivooja lähinnä ovea olevan pistokkeen pois ja kytki pölynimurin siihen... Ei s**tanan s**tana! Hyvä etten tappanut siivoojaa juuri siihen paikkaan...
No se juttu tuli selvitetyksi. En kyllä ymmärrä miksi helvetissä siivoojalla pitää olla palvelintiloihin avaimet. Pitäisi tätä olennaisena tietoturvariskinä. Toisaalta onhan se mukavaa ettei pölyt pyöri nurkissa. Toivottavasti avaa kotelot ja imuroi sisäpuoleltakin.
LainaaPysäytin omat cronit. Pakkohan tässä on alkaa kokeilemaan kaikki mahdollinen.
Totta.
Mä en pysäyttänyt mutta sekä EWN:än että BO-tiilien cronit hidastin 4 minuuttiin. Nyt ainut nopeampi croni on serverstatus-croni.
Koska homma toimis oikein hyvin kunnes about 3 viikkoa sitten tapahtui jotain niin mielestäni tuossa piilenee sypää kunhan sen vaan löytää.
Eli joku muutos jota tehty sinä ajankohtana sen aiheuttanee.
Se *voi* olla cpanel-päivitys, nyt en tiedä milloin se on päivittynyt nykyiseen 11.38-vesioon.
Se voi myös yhtä hyvin olla joku tutka-skripti (FMI,BO), niin shell- kuin php-skripti.
NSD:tä en silleen epäile koska se on toiminut aikasemminkin.
En myöskään yleisesti ottaen epäile kartta-häkkyröitä koska nekin ovat toimineet aikasemmin, joskin se voi olla joku yksittäinen niistä kylläkin. Karttatiili-häkkyrät tosin ovat rajoitettu 2 coreen 8:sta mahdollisesta ja tiilet menevät RAM:iin eikä GFS:ä/YR:ä tehdä dedillä tällä hetkellä.
En ole ainakaan vielä myöskään löytänyt mitään yhdistävää tekijää kaatumisten ajankohdissa, ovat olleet vuorokauden joka puoellla.
4:s kerta tänään kun painellaan reset-namiskaa....
Ja 5:s kerta...
Nyt täytyy kyllä ruvet tekee jotain radikaalia asialle...Siis aamulla...
Ei perkele, 6:s kerta...
Sellainen ajatus tuli mieleen että tässähän oli nyt se SSD-kovo. Ainakin itsellä oli sen kanssa aluksi paljonkin ongelmaa juuri kaatulin vuoksi. Miten ne tuolla palvelin talon päässä seuraavat raudan toimintaa?
LainaaSellainen ajatus tuli mieleen että tässähän oli nyt se SSD-kovo. Ainakin itsellä oli sen kanssa aluksi paljonkin ongelmaa juuri kaatulin vuoksi
HP:llä ei sitä ole ja sekin kaatuilee. En sano ettei se voisi olla se mutta poissulkemis-metoodi puhuu sitä vastaan.
LainaaMiten ne tuolla palvelin talon päässä seuraavat raudan toimintaa?
Eivät mitenkään. Hallintapaneelissa on aika monipuolinenkin monitori jonka saa seuramaan esim. pingiä x minuutin välein ja lähettää mailin siitä haluttuun osoiteeseen.
Homma alkaa olemaan aika selvä kun pysyy pystyssä noin 2 tuntia, vedetään se tyhjäksi ja asennetaan ensin cpanel + sivut.
Se nousee linjoille hetkeksi ennen sitä kun otan backupit muutamista filuista. Cpanelin takaisin-saaminen ei pitäisi kestää kovinkaan kauaan, parisen tuntia (cpanelin asennus kestään reilun tunnin).
12:45: Tilit latatutuu bulk-importtina ServerLostilta..Katkoja sun muita kummajaisia esiintynee koska en ole paljoa säätänyt vielä ja x softien uudelleestartteja tarvittaneen. Tällä hetkellä on perus Centos 6.4 + cpanel.
Sillä mennään ainakin 24h eli FMI- ja BO-tutkat eivät tule toimimaan sinä aikana.
13:12: Taivalkoski onlinessä. Aikas näppärä tuo bulk-importti cpanelissa, se haki listan ServerLostila ja mulle jäi vain valittavaksi että mitkä tilit haetaan ja painaa OK :) Tulevat tilien nimien mukaisessa akkosjärjestyksessä, kestää kotvasen koska dataa on aikas paljon...
14:30: Kaikki sivustot kopioitu ServerLostilta (koska tiesin niiden ainakin toimivan). Seuraavaksi katsotaan jos saatais viime öiset backupit dumpattua sisään....
14:50 Backupit restorattu. Rebootti jotta nähdään että toimiiko vielä senkin jälkeen. Kokemuksesta tiedän että rebootti voi kestää kotvasen...
15:36 CRASH!
Ei ainakaan tullut yhtään helpommaksi löytää syypää nytten, tosin mulla alkaa heräämään epäilys siitä kylläkin....
Tilanne:
- vain sivut paikallaan
- ei esim EWN:än croneja
16:05 JOS mun epäilys osui oikeaan sen pitäisi pysyä pystyssä nytten
JOS epäilykseni oli oikea (2h 22min ylhäällä nytten), eli syypää olisi Sadetutka- ja BO-appsit, niin herääpi kysmys että miksi ne kaatavat palvelimen. Ne ovat kuitenkin loppujen lopuksi 98%:sti staattisia ja vain pohjasivut sekä tutkien aikalema-skriptit ovat php:tä, eivätkä nekään mitään raskaat sellaiset. Ja Nginx:han hoitaa tuon staattisen tavaran osastoa ja se pystyy puskemaan ulos tuhansia kyselyjä sekunnissa.
Sinänsä JOS noin on niin se kyllä täsmäis aika hyvin:
- Toisen projektin tiimoilta kartat + Centos 6.4 toimii varsin mallikkasti
- Appsit, ja varsinkin BO-appsi, tuli linjoille noihin aikoihin
- Google ei löytnyt mitään jota viittaisi siihen että käytössä olevien softat kaataisi palvelimia
Tällä hetkellä ovat FMI- ja BO-tutkat alhaalla kuten myös muut dedillä tehdyt kartat (WRF- ja GFS-kartat toimivat).
Ne palaavat kehiin kun nähdään ensin että purkki pysyy pystyssä (eli aikasintaan huomenna).
Olisi hienoa jos alkaisi selviämään.
Totta.
Ja kohta alan sanomaan että lupaavalta näyttää.
5h justiinsa plakkarissa joka on jo paljon jos verrataan vimeisen kahden päivän pätkiin...
(Oota vaan se kaatuu just kohta kun olen postannut tämän...)
Sade- ja BO-tutkat onlinessä taas, niiden Android-appsit eivät vielä.
EDIT: Sadetutka appsi onlinessä. Vaatii päivityksen joka tulee jakoon jahka Googlen rattaat raksuttavat (eli parin tnnin sisään). Pohjakartta-tiilet tulevat nyt WRF-karttapalvelimelta (joka myöskin Gbit-yhteyden takana) joskin en usko ongelman olleen siinä. Ennen päivitystä näkyy vain sadetutkan tiilet ilman pohjakarttoja.
Juu ei ne kaatumiset vielä loppuneet.
Nyt kaatunut 2 kertaa, mutta noin 40 tunnin välein, eli ollaan edistytty hiukan (tai palattu taakseppäin ihan kuin vain).
Teen kohta niin että seuraavan kaatumisen yhteydessä en painakkaan reset-nappia heti vaan pyydän Hetznerin supporttia katsomaan että onko "ruudulla" jotain virheviestiä joka toisi valoa ongelmaan.
Päivän toinen kaatuminen.
Luovutan kunnes jollain on todella hyvä idea mitä tehdä tuolle härvelille.
Ei pääse yli 48 tunnin ei...Taas alkoi luuri piippailemaan siihen malliin (puskee monitor-mailia pushina luuriin) että resetnappia tarvittiin...
Jotta varmuudella saadan pois-suljettua rauta-ongelma sekä liittyen seuraavaan ketjuun (http://www.webhostingtalk.com/showthread.php?t=1200617&page=9) koskien tuota EX40-purkkia on nyt hardware-testi tilattu ensi yöksi. Tänä aikana on dedi alhaalla. Arvoitu alhaallaolo-aika 10-14 tuntia alkaen klo 21:30 Suomen aikaa.
Jos jotain selviäisi.... ???
Niinpä...
Mulla pieni kutina että voisi olla RAM...Tämä koska bootin viesteistä ei kadonnut ne *BAD*gran_size:-viestit Hetznerin fixillä vaikka piti.
Ei välttämättä että olisivat rikki vaan että meidän ramit olisivat noita "ei-sopivia" tuohon MSI-emoon josta puhutaan tuossa WHT-ketjussa..
Taitaa olla jälleen juntturissa?
Lainaus käyttäjältä: Argonex - maanantai, 05.08.2013, 00:05
Taitaa olla jälleen juntturissa?
aa testit menossa.. jospas selviäis syy moiseen käytökseen. :)
Purkki takaisin onlinessä.
Mitään ei löytynyt testissä. Optimoivat BIOS:a kuitenkin.
Parilla tilillä ei toimi FTP jostain syystä, itse mukaanlukien. Jos laitan wx-purkin onlineen blokkaa palomuuri mut oitis koska FTP ei saa kansiolistausta.
Tutkan videoarkisto on ollut jo jonkin aikaa pois linjoilta.
(http://jyv-weather.info/banner/banner_wd.php?type=banner_big) (http://jyv-weather.info)
http://jyv-weather.info (http://jyv-weather.info)
FTP:t toimii taas ja kaikki (väliaikaset) blokkaukset poistettu. Pirun passivi-FTP:n portit jotka eivät olleet sallitulla listalla. Miksei vaan ilmennyt aikasemmin?
Bootin yhteydessä olevat virheviestit eivät tosin ole kadonneet mihinkään vaikka kuinka pitäisi. Lähetelty logia Hetznerin supporttiin ja siitä johtuen saattaa tulla rebootteja
kernel: *BAD*gran_size: 32M chunk_size: 64M num_reg: 10 lose cover RAM: -2MLainaaTutkan videoarkisto on ollut jo jonkin aikaa pois linjoilta.
Juu. Ei ole uusia videoitakaan tehty sitten muuton koska yritetty ajaa "matalalla profiilila" kunnes tuo vika joka aiheuttaa kaatumiset löytyy...Toisaalta, eipä pahemmin ole ukkosiakaan ollut...
EDIT:
Lainaakernel: *BAD*gran_size: 32M chunk_size: 64M num_reg: 10 lose cover RAM: -2M
Korjattu, ei esiinny enää :)
Loaditkin tippui liki nollaan :P
Video-arkisto polkaistu käyntiin taas (ja korjattu vähän polkuja). Videot tulevat nyt SSD-lätyltä. :)
hmm toplistat ja taulukot on tippunu pois toiminnasta ewn scriptissä :O
Lainaus käyttäjältä: Argonex - torstai, 08.08.2013, 01:03
hmm toplistat ja taulukot on tippunu pois toiminnasta ewn scriptissä :O
Hmm...Sepä mielenkiintoista...Varsinkin kun toimivat europeanweathernetwork:in sivuilla, molemmilla kun sama häkkyrä pohjimillaan on käytössä. Myös itse datafilu näyttää päivittyvän...
Onko mitään havaintoa että milloin ne lakkas toimimasta?
Milloinkohan pääsisin niin pitkälle että saisin jotain tehtyä tuolle samalle sivulle tuhansia rivejä html:ää printtavalle EWN-häkkyrälle? ;D
Tietenkin pitäisi ensin keskiä että mitä ja miten...
Btw. 58 tuntia plakkarissa sitten viime rebootin....
Lainaus käyttäjältä: weatherc - torstai, 08.08.2013, 01:19
Hmm...Sepä mielenkiintoista...Varsinkin kun toimivat europeanweathernetwork:in sivuilla, molemmilla kun sama häkkyrä pohjimillaan on käytössä. Myös itse datafilu näyttää päivittyvän...
Onko mitään havaintoa että milloin ne lakkas toimimasta?
Btw. 58 tuntia plakkarissa sitten viime rebootin....
Nämä on niitä pieniä ihmeellisyyksiä. Itseä tässä matkan varrella ihmettänyt, että miksi osa taulukoista ei pelaa ja nyt tuo ip-kamera mitään ei ole muutettu mutta läpi ei tule. Tai dynsille asti toimii mutta ei pidemmälle.
Tuo 58h vaikuttaa jo lupaavalta.
Niin on juu...
Löysin kyllä syyn tuohon listojen toimimattomuuteen mutta miten sen korjata onkin sitten toinen juttu. Syy on se että puskee js-erroria jollei ole MeteoAlarm-varoituksia. Se miksi ne joskus uupuu onkin sitten oma kysymysmerkki mutta veikkaus on että niiden haku failaa syystä tai toisesta joskus.
6 päivää plakkarissa joten näyttää aika vahvasti että vika vihdoinkin löytys. :)
Nyt en tiedä oliko loppujen lopuksi kaksikin eri vikaa vai oliko ServerLoftin HP:llä sama vika mitä näkyi Hetznerin purkilla.
Mutta Hetznerin purkilla ollut vika ei ollut sivuissa eikä muissakaan omissa häkkyröissä vaan bugi Centoksessa yhdessä BIOS-ongelmaan MSI:n emon ja Kingstonin RAM:en kanssa.
Sen jälkeen kun Hetnzer oli päivittänyt uusimpaan uunituoreeseen BIOS:iin piti vielä grub.conffiin laittaa parit lisäasetukset koska /var/log/messages urputti RAM-ongelmasta bootin yhteydessä. Ja näihin lisäasetuksiin piti vielä löytää ne oikeat arvot jotka ei Hetznerinkään kaverit olleet tainneet löytäneet aluksi.
Käppyrät eivät näköjään ole päivityttyneet 29.7 jälkeen....
Noita käppyröitä kaipaillaan täälläkin ;)
Käppyrät päivittyvät taas :)
Syy oli perin yksinkertainen loppujen lopuksi. Yhtenä toimenpiteenä kun etsiskelin tuota dedin kaatumisen syytä tiputin EWN:än päivitystahdin 4 minuuttiin. Käyrät taas päivittyvät joka 20:s minuutti ja nämä minuutit osui päivitys-minuuttien väliin...hrmm...
Mikäs nyt mahtaa olla vialla? Ei ole toiminut tuossa klo.17:00 jälkeen tänään. Toivottavasti ei mitään isompaa tällä kertaa.
Ei hajua mutta hardware-reset sai sen henkiin taas :)
Hetznerin supportti tarkistaa BIOS:in että on tuorein versio joten tulee lyhyt katko jossain kohtaa, todennäköisesti yön aikana.