Karttapalveluiden sijantitietojen erot

Aloittaja weatherc, perjantai, 25.09.2015, 00:17

« edellinen - seuraava »

0 Jäsenet ja 1 Vieras katselee tätä aihetta.

weatherc

Oma geotietokanta on perustunut Geonamesin kantaan lähinnä koska sillä on iso txt-filu csv-muodossa jonka saa mysql:iin helpolla (tuolla). Esmex. YR käyttää sitä samaa kuten monet muutkin. Pienen siivouksen jälkeen (lähinnä kaiken maailman eritasoliittymiä ja kännymastoja) abouttirallaa Euroopan kattavassa kannasa on noin 1.6 miljoonaa sijantia. Koko maailman kattavassa kannassa sijanteja on vajaat 11 miljoonaa.

Mitä on itseäni häirinnyt on se että esim Pertteli on "väärässä kohtaa". Toki yksittäisen paikan pystyy helposti siirtämään myslissä mutta kun ne "viat" ei lopu siihen. Paikkoja uupuu kokonaan sekä duplikaatteja löytyy järkyttävä määrä. Esim Vantaa-nimisiä paikkoja jotka kaikki referoi tuohon kaupunkiin Kehä III varrella löytyy peräti 4 kpl.

Pikku Googlaus toi vahvitusket asiaan sekä löytyi myös sivu jossa voi verrata eri geopalveluita. Siinä kun hakee muutamaa paikkaa niin käy selvästi ilmi erot. Liitteen kuva Perttelistä. Liila pallero on Geonames, punainen Google ja musta OSM. Eli koordinaatit Googlelta tai OSM:ltä olisivat parhaiten "paikkansa pitävät".

Esim Stackoverflow:ta kun selaili aiheesta on selvä mielipide se että parhaan tuloksen saa kun yhdistää eri palvelut. Da.
Geonamesilla on ylivoimasesti paras (isoin) tiedosto saatavilla pohjaksi. Löysin myös sivuston josta voi ladata OSM-dataa JSON-muodossa sekä sen syöveresitä suora URL-pohjainen API joka toki vaatis sen että haettu alue oli rajattu aika raskaasti.

Muilla geopalveluilla kuten Google, Here jne. on vain API:t yksittäisille hauille joissa on myös päivittäiset/kuukausittaiset hakumäärä-rajat jotka yleensä liikku siinä 2500 hakua/pvä korvilla.

EWN:än geokanta
Kantaa on muokattu seuraavasti:
- Tuore Geonames-kanta joka rajattiin abouttirallaa Eurooppaan "DELETE (longitude > 40 OR longitude < -35), (latitude < 34)" sekä afro-maiden sijannit jotka jäi tuon sisäpuolelle ('SY','MA','TN','LB','JO','PS','IL','DZ'). Tulos: reilut 1.6 M sijantia.
- Lisätty OSM-kanta valitusita maista (Pohjoismaat, UK, Saksa, Benelux) siihen siten että lähellä olevat saman-nimiset paikat jotka jo löytyi Geonamesilta jätettiin pois mutta koordinaatit päivitettiin. Tulos: noin 200000 uutta sijantia.
- Poistettu mm. maakuntiin liittyviä sijanteja sekä yritys poistaa duplikaatteja. Tulos: noin 150000 sijantia katosi.
- Sitä mukaan kun sijantia haetaan esim ennusteeseen sen tiedot tarkistetaan kerran kolmannesta geopalvelusta jolloin hakumäärät pysyvät alle rajojen. Mistä on vielä hitusen hakusessa...

Naruskan Ukka Matinpoika

Enpäs nyt tiedä, liittyykö tämä oma vähäinen tarinani otsikon alla olevaan juttuun. Tuli vain Henkan kirjoitusta lukiessani muistilokeroista, että oma taloni sijaitsi kaikissa karttapalveluissa väärässä paikassa. Ei niin kovin paljoa, mutta muutaman sata metriä kuitenkin.

Asia tuli ilmi, kun omaa navigaattoriani käyttäen olin kerran tulossa kotiin. Navigaattoriin oli merkitty Naruskantie 145 osoite, joka oli aikanaan taloni osoitteena siinä vaiheessa, kun tänne Naruskalle muutin. Navigaattori ilmoitti postiosoitteeni mukaisesti, että olen perillä ja määränpää on oikealla, vaikka tosiasiassa talosta ei ollut näköhavaintoa vielä. Kiekaisun kohdalla oli päinvastoin tien pää, josta pääsi lähtemään ajamaan kohti Venäjän rajaa.

Asia alkoi sen verran loppupelleissä suivauttamaan, että soitin Sallan kuntaan osoitejärjestelmästä vastaavalle virkamiehelle. Kerroin, että osoitteeni ei vastaa taloni paikkaa, joten osoitetta olisi muutettava hiukan eriksi, kun talon siirtäminen väärän osoitteen kohdalle olisi isohko juttu. Ja mahdotonkin, tietty.

Virkamies oivalsi asiani heti. Hän kertoi, että aikanaan osoitejärjestelmää perustettaessa ajeli muutama kunnan palkkalistoilla ollut mies Ladallaan syrjäkyliä. Osoitteiden mittaaminen tapahtui ilmeisesti auton matkamittarilla. No, eihän muuta tietoa virheeseen tarvittu, kun kaikki tietävät autojen nopeus- ja matkamittareiden heittävän todellisuudesta kymmenkunta prosenttia.

Niinpä Sallan kunta hoiti asiani maistraattiin virkatyönään ilman talonomistajan tarvetta tehdä asiassa mitään niin, että talon numerointia muutettiin lähimpään oikeaan parittomaan lukuun, joka oli ja on 147. Se numero osuu edes omalle tontille ja navigaattorin kiekaistessa talo on jo näköpiirissä. Löytää palokunta ja sairasauto perille.

Itse hoidin asiaa Googlen karttapalveluun. Sain Suomessa kiinni mukavan tyttöihmisen, jonka kanssa keskustelin asiasta puhelimessa. Ensin en osannut ilmeisesti selittää asiaani rautalankamallilla, kun tyttö ei meinannut käsittää, mistä on kyse. Sanoin hänelle, että taloni on merkitty sekä oikeaan että väärään paikkaan heidän karttapalveluissaan. Oikeaan paikkaa numerolla 145, mutta väärään paikkaan talon oikeaan numeroon nähden, jonka pitäisi olla 147. Viimein sain tyttären oivaltamaan, mistä on kyse. Ja niin osoitteeni ja Googlen kartalla oleva täppä on nyt oikealla paikallaan.

Kertomaani virhettä on Naruskalla ja muuallakin Sallan kunnan alueella varmaankin paljonlaisesti. Muutama naapuri ilmoitteli asiasta tiedustellessani, että talo ei ole siellä päinkään, mitä navigaattorit ilmoittelevat. No ei tietenkään ole, kun mittarivirhehän isonee Lattaraudalla kauemmaksi tien alkupisteestä ajeltaessa. Ja kartoilta viivotinmittauksella tehdyt mitat eivät varmasti ole aina osuneet kohdilleen, kun kartan ja teiden mutkat on mitattu suoriksi.

Näin täällä Lapin laajoilla erämailla. Anteeksi, jos tämä juttu ei liippaa läheltäkään Henkan ansiokasta kirjoitusta... ;D :o

www.naruska.com

weatherc

Liippaa hyvinkin koska kyse on nimenomaan noiden karttapalveluiden eroista vs todellisuuteen.

EWN:än kannan päivitysajon jälkeen uuppuu edelleen paikkakuntia jotka löytyvät esmex Googlen kartalta. Jos jo noin 50 km säteellä Salosta löytyy useampi niin kuinkahan paljoa niitä on Suomen tasolla? Ennusteeseen sillä ei ole suurta merkitystä koska sen datat ovat noin 10 km ruudukoissa, vaan se on pikemmin visuaalinen probleema ettei ole (ehkä) sitä lähintä paikkaa saatavilla, jos olet Salaisen kylään haluat luonnollisesti ennsteen myös sinne eikä naapuri-kylän ennustetta. Toki, on aina mahdollisuus että se "oikea paikka" nappaisi ennusteessa datan toisesta ruudukon pisteestä kun mitä nyt.

Hakulaatikolla tahikka paikkakunta-kartalla tehty haku nappaa luonnollisesti juuri sen haetun paikan kordinaatit ennusteeseen mutta idea onkin se että pystyisi hakemaan ennusteen puhelimen sijannilla ja sitä kautta "lisäinfona" saada myös sijannin nimen eikä vaan kordinaatit. Tällä hetkellä se hakee lähimmän paikan nimen kannasta kunhan osuma on noin 0.2° säteellä.

Optimaalisin jollei riittävän lähellä olevaa paikkaa jo löydy kannasta olisi että jos jonkun geopalvelun API:n kautta saisi tarvittavat tiedot jolloin ne voisi tarvittaessa lisätä kantaan ettei tarvis hakea toiste saman paikan tiedot. Mutta, mutta...Sehän olisi liian hyvin jos näin pystyisi tekemään...Nimittäin jos otan kannasta uupuvan Salon Salaisen kylän sijannin niin saan infoksi parhamillaan vain "kadunnimi, Salo". Höh, olisin halunut "Salainen, Salo".
Pieni kokeilu useammastakin kohteesta Goolgella, Herellä, Nominatimillä jne. tuottaa kaikki samaa infoa, kaupunginosa/kylä uupuu.

weatherc

Liitteen kuvassa hyvä esimerkki miten nuo paikat saattaa olla eri paikoissa eri datalla.
Klikkaamalla paikkaa "Muita paikkakuntia"-kartasta voi nyt (yrittää) korjata asian sillä se tarkistaa kordinaatit samalla kun haetaan ennuste. Tämän se tekee kerran per paikka. Näin ei API:n käyttörajat pauku sillä tarkistetuksi tulee ne paikat jotka käytössä eikä kaiken maailman kivet keskellä Itämerta (jollei joku hae ennustetta niille) ;)

Pienenä häiriötekijänä on edelleen se että usealle paikalle puuttuu täppä kokonaan. Siihen pitää koittaa keksä joku jekku. Kuten että yllä mainittua karttaa voisi klikata myös täppien ulkopuolella jolloin tarkistettais onko kyseiselle kordinaatille olemassa paikan nimeä jota ei vielä löydy kannasta. Sama toimisi luonnolisesti myös GPS-haulla. Siihen pitää vaan keskiä toinen jekku joka estää sen että samaa kohtaa haetaan useaan kertaan.