Keskustelumuistio beta.laji.fi-seminaarista

27.03.2017 02:41 - Mikko Heikkinen (updated: 27.03.2017 05:45)
Tämä keskustelumuistio ei sisällä esittäjien puheenvuoroja, vaan ainoastaan kohdat, joissa keskusteltiin yleisön kanssa. Seminaarin esitykset myös videoitiin ja ovat katsottavissa Unitubessa.

Lajitietoasiat / Tapani Lahti:

Kysymys: Google-viittauksista: lukumäärä nousee ylemmäs, jahka ihmiset alkavat linkittää sivuihin; beta-sivuihin kovin monet eivät vielä linkitä. Oletettavissa on, että google-ranking nousee heti kun sivut siirtyvät ulos betasta ja alkaa oikea linkitys. (Vasta: hyvä jos näin tapahtuu) Jyrki Muona, Luomus: Ainoa tapa fiksata nimistöongelmat olisi pakottaa ihmiset käyttämään eliöistä oikeita nimiä. Tämä ei tule onnistumaan, ainoa keino on pyrkiä muuttamaan suomenkielisiä nimiä. (Vast: toivon mukaan Lajitietokeskus alkaa jossain vaiheessa koordinoida työtä eliötyöryhmien välillä) Kysymys: miksi rakkolevä on edelleen vanhalla nimellä (uusi nimi rakkohauru) Tapani: tietokantaan kerätään myös vanhoja nimiä, suositeltava nimi on tullut asiantuntijalta. Kun lajitietokeskus toimii, palautekanavan läpi voi lähettää palautetta, joka sitten menee asiantuntijakierrokselle, joka voi reagoida. Markus Piha, Luomus: Suomenkielisten lajien nimiä tekisi välillä mieli vaihtaa, mutta lakiteksteissä ja asetuksissa pyörii tietyt nimet, eikä niitä ole aivan helppoa muuttaa. Tietynlainen konservatiivisuus nimissä on hyväksi. Ennakkokysymys: kun pelkällä nimellä tekee havaintoja, voi vastaukseksi tulla jokin aivan eri taksoni kuin mitä halutaan. Tapani: tieteelliset(kään?) nimet eivät ole yksikäsitteisiä. Taksonitietokannassa voidaan kuitenkin sitoa populaatio tiettyyn MX-koodiin. Taksonitunnisteiden avulla pyritään ratkomaan näitä ongelmia.

Havaintopalvelut, Esko Piirainen

Kysymys: Ovatko kaikki Kastikan tiedot selattavissa laji.fi:n kautta? Vastaus: Ovat (poikkeuksena sensitiiviset lajit), joka yö ne viedään sisään Kysymys: 10-ruututasoinen haku lajista, joka olisi esim. uhanalaisuusarvioinnin kannalta hyvin tärkeää. Tällä hetkellä pitää käyttää hyönteistietokantaa. Päiväperhosseurantaa ei saa helposti mukaan. Suurin hakumäärä hyönteistietokannassa on 5000 kpl: Esko: Uhanalaisuusarvioinnin tarpeet pyritään huomioimaan. Kysymys: Visuaalisesti 10-ruututasolla havainnon Suomen kartalle tarpeen. Esko: Tieto on olemassa, ilmeisesti vain halutaan sama ominaisuus betan puolelle? On toteutettavissa, otetaan toive ylös. Kysymys: Onko havaintolistaus toteutettavissa siten, että lajikohtaisesti voi printata / ladata yli 2000 havaintoa? Esko: 2 000 000 on tiedostolatauksessa raja. Ennakkokysymys: Miten havaintojen laadunvalvonta hoidetaan? Esimerkkinä: rakkolevästä yksi havainto pitkällä sisämaassa, epäillään ettei ole oikein, miten lajitietokeskus kohtaa tämän? Esko: Parhaillaan rakennetaan välinettä tähän. [Annotointijärjestelmän toimintaa kuvaileva kalvo] Leif Schulman, Luomus: kiitoksia & onnitteluja. Laadunvalvonnasta hyvä huomata, että avoin data merkitsee, että laadunvalvonta tapahtuu vasta julkaisemisen jälkeen. Nyt kun tieto julkaistaan heti, datassa tulee aina olemaan hälyä ja aina on käyttäjän vastuulla arvioida käyttämänsä datan laatua. Kysymys: Onko havaintoainestoa mahdollista ladata sellaisessa muodossa, että havainnot näkyisivät EUREF-FIN koordinaatistosta? Tämä helpottaisi aineiston yhteyskäyttöä maanmittauslaitoksen avoimen aineiston kanssa. Esko: Tiedostolatauksessa on mukana YKJ, WGS84 ja EUREF. Kysymys: Linnuilla on komitea, joka käsittelee poikkeavia / uusia havaintoja? Onko muilla lajiryhmillä vastaavaa, ja jos ei ole, pitäisikö tällaisia olla (samoin kuin asiantuntijoita, joille menee tarkistettavaksi). Vieraslajien osalta havaintojen tarkistaminen (uusien lajien osalta) erityisen tärkeää. Esko: vieraslajeja varten on vielä erillinen laadunvarmistus - torjuntatoimi Tapani: Laadunvalvonnan asiantuntijuusroolitusta ei ole vielä mietitty valmiiksi. Nyt kun tekniikka on valmis, voidaan alkaa miettiä, miten tämän roolin pitäisi toimia. Tavoitteena on Lajitietokeskuksen toimittaa dataa GBIF:iin ja tämän pitäisi olla hyvälaatuista. Olisi tarpeen avata keskustelu siitä, millaisia elimiä pitäisi perustaa ja miten ne toimisivat. Automatisointi epätyypillisille havainnoille on mahdollista rakentaa. Jyrki Muona, Luomus: Esim. kuoriaisilla on uhanalaisuutta tarkastelevalla työryhmällä asiantuntija-arvioijia. Kuitenkin epärealistista olettaa, että kaikki lajiryhmät pystyisivät tällaista tekemään. Käyttäjän vastuulla on lopulta aina datan käyttäminen. Kysymys: Onko mahdollista viedä ilkeämielisesti sisään roskadataa? Tapani: Suurten datamäärien lataaminen on aina sovittava erikseen. Mikäli tulevaisuudessa mahdollistetaan, tämä näkökulma on pohdittava erikseen. Kuitenkin datan lataus tapahtuu aina käyttäjätunnuksen kautta, joten poistaminen on varsin yksinkertaista. Aino Juslen, Luomus: Toivon mukaan avoimesti näkyvä data kannustaa edistyneitä harrastajia annotoimaan ja kommentoimaan havaintoja, ja että ryhmien perustaminen ei jää lajitietokeskuksen tehtäväksi. Kysymys: Suurin osa perhoshavainnoista on hyväksyttävä valmiiksi, mutta kriittisen tärkeät havainnot pitäisi pystyä käymään läpi. Pitää olla työkaluja käydä läpi tärkeitä havaintoja, ilman että on tarpeen kahlata läpi 10000 havaintoriviä.

Karttapalvelut / Tom Blom

Esko Piirainen, Luomus: Tähdennetään: Tomin esittelemä kartta on paikkatietostandardin mukaista dataa, edellinen oli itse koodattu visualisaatio. Nyt esiteltyyn näkymään voi siis kytkeä valmiita paikkatieto-ohjelmistoja. Jaakko Kullberg, Luomus: Koko Suomen havaintoja tarkastellessa olisi tarpeen, että optiona olisi nähdä yksinkertaistettu havaintojen levinnäisyys pienessä Suomen kartassa, johon on helppo zoomata (eli esim. tämänhetkinen näkymä näkyisi myös neliönä suuremmassa kartassa, "lähestymiskartassa"). Tom: Jonkinlainen indeksikartta on olemassa Kysymys: käyttöliittymässä on käytetty kolmioita. Onko harkittu, että epätarkat olisivat eri kokoisina ruutuina / laatikoina? Tom: Sijaintitarkkuus on esitettävissä eirlaisilla symboleilla. Kysymys: Onko ajateltu, että eri vuosilukujen mukaisesti olisi eri symboleita? Tom: Tähän suuntaan on kehitelmiä, alustavaa versiota on. Kysymys: Tuleeko aineistolle QGIS-pluginia vai pitääkö tehdä itse? Tom: Pitänee tehdä itse. Tapani Lahti, Luomus: Datan visualisoinnista - data on saatavissa rajapinnan kautta, joten kuka tahansa ohjelmointitaitoinen pystyy toteuttamaan minkälaisen visualisointityökalun tahansa. Lajitietokeskus ei pyri toteuttamaan kaikkia toiveita itse. Tom: Ohjelmointitaitoakaan ei tarvita, paikkatietotyökalujen käyttötaito riittää. Jaakko Kullberg: Syytä muistaa, että punainen ja vihreä on ongelmallisia värejä. Tom: Taustakartalla on muita värejä aika vahvasti edustettuna.

Havaintopalvelu Vihko / Mikko Heikkinen

Kysymys:  Onko havaintojen sijaintitarkkuustieto mukana vain jos havainnon ilmoittaja on sen itse alkuperäisaineistoon lisännyt? Vai tunnistaako järjestelmä esim. koordinaattien "tasalukemista" tarkkuusasteen? Mikko: Havaintojen sijaintitarkkuus on mukana jos käyttäjä on ilmoittanut havainnon esim. pisteenä tai alueena. Kysymys:  Onko tarkoitus, että Lajitietokeskukseen tallennetaan lintujen linjalaskentojen koko raakadata vai laskennalliset parimäärät? Mikko: Parimäärät. Tarkoituksena on pikakirjoitusformaatti, jolla saa raakadatasta puoliautomaattisesti parimäärät. Kysymys: Voiko rajapintojen päälle tehdä mobiilisovelluksen, jolla voi automaattisesti ilmoitella havaintoja sijainnin mukaan: Mikko: Voi, tästä pian lisää Leif: Voiko kustomoituja lomakkeita tallentaa itselleen lomakepohjiksi? Voiko kustomoimansa lomakepohjan tallentaa julkiseen käyttöön? Mikko: kummatkin ominaisuudet ovat suunnitteilla muttei vielä toteutettu. Kysymys: Entä jos alussa valittavaa lajia ei löydy listalta? Mikko: Voi tallentaa, varoittaa tuntemattomasta nimestä. Näytetään havaintohaussa, paitsi jos hakija on erikseen hakenut vain tunnetulla nimellä tallennetut. Esko: Jos lajinimihakuun kirjoittaa tuntemattoman nimen, se hakee ainoastaan sillä tekstillä ilmoitettua havaintoa. Kysymys: Kysymykseni ei koskenut (vain) Vihkoa, vaan yleensä lajitietokeskuksen dataa Mikko: Alkuperäisessä datassa voi olla joko piste ja tarkkuusarvio, tai epätarkka polygoni tai ruutu. Kysymys: Havainnot pitäisi pystyä ilmoittamaan jonkin taksonikonseptin mukaisesti. Mikko: Suunnitteilla on ominaisuus, jonka perusteella voi valita käytetyn taksonomian (esim. vanhan retkeilykasvion) Kysymys: Systeemin pitäisi toimia siten, että laji.fi:stä voisi ladata csv:n, jonka voisi suoraan siirtää muihin järjestelmiin ja takaisin. Mikko: Teknisesti osittain onnistuu, esim ulos lataus. Sisään lataaminenkin on tulossa, mutta tähän liittyy vielä ratkaisemattomia seikkoja. Kari: Sisään lataaminen toimii suoraan lajitietokeskuksen periaatteita vastaan - tavoitteena on, että data syötetään vain yhteen paikkaan, jossa se sitten on primääriaineistona. Tavoiteena on vältellä exceleiden vaihtelu sähköpostitse. Päivi Sirkiä Luomuksen seurantatiimistä kysyy: Tuleeko mahdolliseksi merkitä, että tietystä lajiryhmästä ilmoitettiin kaikki havaitut lajit kyseiseltä paikalta eli täyttää niin sanottu täydellinen lista kyseisestä lajiryhmästä? Toiminnolla saataisiin havaintopäiväkirjoista käyttöön helposti myös se arvokas tieto, että tiettyä lajia EI havaittu tietyllä paikalla tiettyyn aikaan. Siis ilman, että ilmoittaja on näistä lajeista kirjannut lukumäärätiedoksi nolla. Kokemukset maailmalta ovat osoittaneet, että tämä toiminto olisi erittäin hyödyllinen erityisesti sellaisille lajiryhmille, joista ei ole käynnissä korkeatasoista standardoitua seurantaa. Ei ehkä sovellu kaikille lajiryhmille, mutta omaa sydäntä lähellä olisivat ainakin sammakkoeläimet ja matelijat sekä lepakot. Mikko: Tämäkin on työlistalla ja suunniteltu

Rajapinnat / Ville-Matti Riihikoski

Kysymys: Kolmansia osapuoia on, jotka ovat jo tämän päälle tehneet omia järjestelmiään. Mitä tapahtuu kun rajapinta muuttuu? Ville-Matti: Tätä tilannetta pyritään välttämään. Perustamme wiki-sivun, johon kootaan kaikki muutokset rajapinnan stabilisoinnin jälkeen. Rajapinnoissa kulkee mukana versionumero, ja mahdollisuuksien mukaan pyritään pitämään vanhatkin versiot toiminnassa. Kysymys: Jääkö Lajitietokeskukseen jälki kolmansista osapuolista? Voiko epäilyttävään käyttöön puuttua? Erityisesti uhanalaisten tietojen käyttöön liittyen. Ville-Matti: Viranomaispuoli, joka myös käyttää APIa, lokittaa kaikki kyselynsä. Yksilöllisestä access tokenista jää myös merkintä lokeihin. Lisäksi jos henkilö haluaa lähettää dataa, hän tarvitsee henkilökohtaisen person tokenin. Näiden avulla voi tarvittaessa poimia väärinkäytökset massasta. Kysymys: GBIF-tiedonjako - millä tavalla jaamme rajapintojen kautta aktiivisesti tietoa ulkomaailmaan, toimiiko jo nyt joustavasti ja millä tavoin? Ville-Matti: Tulossa on rajapintayhteys GBIF:iin. Tapani, GBIF-vastuuhenkilön roolissa: Tänä keväänä alkaa datanjako GBIF:iin. Joka yö viedään dataa GBIF:iin - tähän saakka ollut 2-3 kk viivettä. Käynnissä on yhteispohjoismainen projekti, joka pyrkii harmonisoimaan taksonomioita ja nopeuttaa datan vientiä GBIF:iin. Kuitenkin ennen kuin lajitietokeskuksen tietovaraston dataa lähetetään GBIF:iin, sille tehdään laadunvalvontaa. Etenkin esim. EU:n seuraama vieraslajidataa pitää tarkistaa ennen jakamista. Kysymys: Toimiiko myös toiseen suuntaan; ts. muiden Suomessa tekemiä havaintoja tulisi meille päin? Tapani: Kyllä - muiden Suomessa tekemiä havaintoja voidaan lukea jahka GBIF-jako alkaa toimia.

Sensitiivinen data ja käyttörajoitukset / Kari Lahti

Kysymys: Voiko perhostutkijain seura asettaa lajille karkeistuksen (syynä ei suojelu vaan esim. alueen asukkaiden häiritsemättömyys)? Jos havainto tulee vihkon kautta, meneekö jokaiselle yksittäiselle henkilölle pyyntö vaiko esim SPS:lle? Kari: Aineiston omistajalla on aina oikeus karkeistaa omat havaintonsa oman harkintansa mukaan. Mitä yksittäiseen henkilöön tulee, Vihko muodostaa yhden oman kokoelmansa, ja sen omistaja on Luomus, joka siis tällä hetkellä päättää havaintojen julkistamisesta toistaiseksi. Päivi Sirkiä, Luomus: Voiko tutkimusaineiston tuottaja (esimerkiksi vapaaehtoinen lintulaskija) ladata omat havaintoeränsä vaikka kyseisellä aineistolla olisi muuten suoja-aika? Kari: Tähän ei ole vastausta vielä. Otamme pöydälle. Kysymys: Pystyykö Vihkossa tallentamaan tietoja lajista, josta pitää lakisääteisesti ilmoittaa myös Eviralle? Lähteekö vihkosta automaattisesti ilmoitus Eviralle? Kari: Pitäisi lähteä, mutta Eviran kanssa ei ole vielä käyty neuvotteluja asiasta. Kysymys: Eli voi tallentaa? Kari: Kyllä voi. Yksittäisiä kansalaisia ei voi estää tekemästä ilmoituksia. Eviran aktiivisuutta tarvitaan tässä kuitenkin, mutta tahto on. Sami Aikio, Luomus: Kun on tehty tietopyyntö sensitiivisestä aineistosta, onko mahdollista ottaa se osa, joka on jo saatu ja jäädä odottamaan, vai raukeaako pyyntö muiden osalta jos ottaa vain osan? Kari: Jos ottaa vain sen mitä toistaiseksi on tallella, pyynnön loppuosa raukeaa. Esko: Tämänhetkisessä toteutuksessa toiminta siis lakkaa kun käyttäjä ottaa sen osan, mitä nyt tarvitsee. Kari: Automaattista hyväksyntää on harkittu (esim. 2 vk ilman vastausta) Kysymys: Siirtyvätkö ilmoitetut tiedot automaattisesti esim. Hertan Eliölajit-tietokantaan? Kari: Lähtökohtaisesti Syke voi hakea ne lajitietokeskuksesta, mutta epäselvää menevätkö ne suoraan Herttaan. Kysymys: Tavoitteena on, että Hertan käyttäjä voi katsoa lajitietokeskuksen dataa nimenomaan Hertasssa. Kari: Siitä, miten data kulkee, oli nimenomaan eilen kokous Syken kanssa. Kysymys: Datan omistuksesta - on olemassa apurahatutkijoita, joilla ei ole tietokantaa, jota käyttää. Yksittäiset tutkijat pitäisi selkeästi ohjeistaa, minne he tallentavat primääridatansa. Tapani: Data-arkisto on tänä vuonna tuleva osa lajitietokeskusta aineistolle, jolla ei ole mitään muuta kotipaikkaa. Kyseessä on tutkimusaineistojen hallintaan liittyvä pitkäaikaissäilytysprojekti, joka aktualisoituu tämän vuoden syksyllä. Jaakko Kullberg: Perhoshavaintojen kanssa on ikuisuusongelmana eri lähteistä tulevat havainnot, jotka ovat itse asiassa sama havainto. Kytketäänkö havainnot jotenkin toisiinsa siten, että ne tunnistetaan samoiksi vai miten tämä on ratkaistu? Tapani: Lähtökohtana havainnolla on tietty taksoni-, aika-, havainnoija- ja aluerajaus. Datan de-duplikointi on yleinen tiedonhallinnallinen ongelma johon ei ole yleispätevää ratkaisua. Joudumme analysoimaan tilanteita, joissa epäillään saman havainnon monistuneen, ja karsimaan havaintoa. Tämä edellyttää käsityötä. Siivoaminen on kuitenkin pienempi ongelma kuin se, että havainto puuttuu kokonaan. Kysymys: Miten lajin ominaisuusdatan käyttö on mietitty? Makroekologian kannalta tämä olisi hyvä saada analyysikelpoisessa muodossa, vaikka se yleensä onkin vapaatekstimuodossa. Jos koodattua tietoa on tarjolla, onko lajitietokeskus valmis ottamaan tämän vastaan? Voiko muista tietokannoista otettua ja koodattua aineistoa tarjota? Kari: Tällä hetkellä kuvaus-/ominaisuusdataa on esim. yliopiston Pinkka-järjestelmästä. Tällä hetkellä tietoa Lajitietokeskuksessa on vähemmän kuin haluttaisiin; se on enimmäksen analogisessa muodossa, eikä käynnissä ole prosessia tiedon saattamiseksi järjestelmään (vaikka tavoite / visio onkin). Se, mitä kaikkea voidaan ottaa sisään on auki, mutta tavoitteena on tehdä kanavat helpoksi. Esko: Lähtökohtaisesti olemme kiinnostuneita kaikesta olemassaolevasta tiedosta: DNA-viivakoodidata on tulossa, lajien välisiä suhteita voi tallentaa, levinneisyyttä eliömaakunnittain (ei havaintodataa vaan sen asiantuntijatulkintaa). Mikä on data, josta nimenomaan puhuttiin? Kysymys: Elinkiertotietoa putkilokasveista - muotoja, kukkimistietoja yms. Leif: Tosiaan kaikki kiinnostaa. Lajitietokeskusta on rakennettu sipulimallilla: aloitetaan ytimeltä, ja lisätään kerroksittain ominaisuuksia ja sisältöjä. Tutkimuskäyttö on käynnistymässä vasta tänä vuonna. Jarmo: Kirjautuessa voinee valita, mitkä tiedot voi näyttää julkisesti ja mitkä ei. Linkittämiseen ja asiantuntijuuteen liittyen, olisi hyvä olla selattavissa asiantuntijoita. Kari: Henkilötietoasiat on hyvin mietitty, Vihkossa voi valita havainnoidessaan salataanko nimi. Esko: Lajeille on tällä hetkellä määritelty 1-3 henkilöä asiantuntijoiksi, mutta nämä eivät ole ainoita laadunvalvojia. Taksonitietokannasta löytyy kyllä tieto lajiasiantuntijoista, ja ne saa API:n kautta. Henkilöistä näytetään julkisesti ainoastaan nimi (ja sekin vain kun hän on sen hyväksynyt). Tapani: Havaintojen laadun valvonnassa on olennaista tietää, kuka havainnon on tehnyt. Tämä on kuitenkin hahmotettava henkilötietolainsäädännön viitekehyksessä. Kysymys: Käyttäjän itse tekemien havaintojen siirtämisestä järjestelmästä toiseen - ideaalimaailmassa kaikki havainnot olisivat laji.fi:n käytettävissä. BL on kuitenkin esim. päättänyt, ettei ole tässä mukana. Jos yksittäinen käyttäjä haluaa omat havaintonsa Tiirasta laji.fi:n käyttöön, onko tällainen omainaisuus tarjolla? Kari: Tällä hetkellä datan tuonti on mahdollista - Excel-tuontiohjeet ovat olemassa. Kaikki tieto mielellään otetaan vastaan. Tällä saralla pyritään vielä tekemään töitä, ja toivottavasti jonain päivänä tieto kulkee rajapintojen kautta. Tapani: Ohjelmointirajapintojen päälle voi tehdä sovelluksen, joka lukee Tiiran formaattia, jota ei voi mitenkään estää; emme välttämättä halua tähän kannustaa. Kysymys: Miten tulevaisuus? Projekti loppuu vuoden päästä, mutta tässähän on versio 1.0. Jatkokehittelyä vaaditaan. Leif: Lajitietokeskus on Luomuksen tärkein strateginen kehittämiskohde yhdessä digitaalisten kokoelmien kanssa, ja tähän on satsattu. Nykyiisissä rahoituksissa on luvattu, että järjestelmän ylläpito jatkuu. Kuitenkin massiiviseen jatkokehittämiseen ei voida sitoutua ilman jatkorahoitusta. Jatkorahaa haetaan, ja otamme tähän mieluusti käyttäjäkunnan tukea. Tulevaisuus on kyllä hämärän peitossa, mutta lajitietokeskus toimintatapana pysyy strategian keskellä. Kysymys: Annotaatioissa, jos joku ensin huomauttaa ja sitten toinen merkitsee sen epäilyttäväksi, havainto ei enää näy hakutuloksissa. Olisi parempi, jos näkyisi hakutuloksissa mutta epäilyttävänä. Esko: Sanottiin, että ei oletuksena näy, mutta tosiasiassa tätä päätöstä ei ole vielä tehty. Tapani: Mikä tahansa havainto voidaan asettaa epäilyttäväksi, mutta käyttäjä voi itse valita, haluaako nähdä nämäkin. Kysymys: Jäähän väärät havainnot nähtäväksi erillisenä kantana? Nämä on tärkeä löytää myöhemmin. Kari: Jää. Kysymys: Otetaan susihavainnot. Jos kuka tahansa saa ilmoittaa susihavaintoja, kanta tulee täyteen vääriä susihavaintoja. Epäilyttävä havainto ei voi näkyä oletuksena. Kari: Kiitoksia. Funtsimme tätä.