Hyvään tieteelliseen käytäntöön kuuluu tutkimuksessa tuotetuista tietoaineistoista huolehtiminen. Jo datanhallintasuunnitelmaa tehdessä on mietittävä mitä aineistolle tulisi tehdä kun sen käsittely on saatu päätökseen ja tutkimuksen tulokset mahdollisesti jo julkaistu. Mitä pitäisi säilyttää ja missä, ja mitä saa tai pitää hävittää? Myös tutkimusorganisaatiolla on tärkeä rooli datanhallinnassa. Miten organisaatio pitää kirjaa syntyvistä aineistoista ja tukee niiden elinkaaren hallintaa? Entä mitä aineistoja tulisi tunnistaa erityisen arvokkaiksi ja valmistella siirrettäväksi pitkäaikaissäilytykseen?
Rahoittajat, kuten Suomen Akatemia, ja monet julkaisijat edellyttävät datan avaamista. Dataa tulee avata vastuullisesti: “Niin avointa kuin mahdollista, niin suljettua kuin välttämätöntä”. Jos itse data ei sovellu avattavaksi esimerkiksi sen arkaluonteisuuden vuoksi, datasta voi avata vain pelkät löydettävyyteen liittyvät kuvailutiedot.
Aineistojen avaaminen vaatii työtä, mutta aineistojen saatavaksi saattaminen palkitsee. Datan (tai kuvailutietojen) avaamisella tutkimuksen näkyvyys kasvaa, mikä voi johtaa esimerkiksi uusiin yhteistyöprojekteihin. Datan ja kuvailutietojen avaaminen lisää myös tutkimuksen läpinäkyvyyttä ja luotettavuutta. Avattu data on siis meriitti sekä tutkijalle että tutkijan kotiorganisaatiolle. Datan tuottaminen on usein kallista ja työlästä. Datan avaaminen mahdollistaa sen, että voit myös itse käyttää tuottamaasi dataa helposti myöhemmin uudelleen. Kun muutkin avaavat dataansa, se on saatavilla myös sinun käyttöösi.
Ennen julkaisua pitää varmistaa, että aineisto on asianmukaisesti järjestetty ja dokumentoitu ja että sillä on riittävät kuvailevat tiedot eli metatiedot. Fairdata-palvelukokonaisuus helpottaa tätä työtä tarjoamalla palveluja ja työkaluja tutkimusdatan tallennukseen ja jakamiseen, tutkimusaineistojen julkaisuun, löytämiseen ja luettelointiin sekä niiden pitkäaikaissäilyttämiseen. Fairdata-palvelut antavat tutkimusaineistoille myös pysyvän tunnisteen viittauksia varten.
Fairdata-palveluja voi käyttää tutkija, TKI-toimija tai esimerkiksi organisaation datatuen edustaja, joka tallentaa ja julkaisee tietoja tutkijoiden puolesta. Seuraavaksi tarkastellaan miten palveluita voi käyttää tutkimusprosessin tukena.
Datan tallentaminen: Tutkimusaineistoon liittyvä data (tiedostot) on säilytettävä muuttumattomassa tilassa ja datan eheydestä on huolehdittava. Usein on myös tarpeen käyttää tutkimusryhmän kesken jaettua tallennustilaa jo ennen kuin data on valmis julkaistavaksi. Fairdata IDA -palvelu on vastaa näihin tarpeisiin.
Tutkimusaineistojen julkaiseminen: Tutkimusdata tulee kuvailla, riippumatta siitä mihin data on tallennettu. Tämä tarkoittaa sitä, että dataan lisätään kuvailevaa tietoa, jotta muut ymmärtävät, mistä datassa on kyse ja miten sitä voidaan käyttää. Joskus on myös tarpeen rajoittaa pääsyä julkaistuun tutkimusaineistoon tai aineistosta voidaan julkaista ainoastaan kuvailutiedot. Tutkimusaineiston voi kuvailla ja siihen pääsyä voi hallinnoida Fairdata Qvain -työkalun avulla.
Tutkimusaineistojen löytäminen ja uudelleenkäyttö: Kun tutkimusaineisto on julkaistu, se tulee olla muiden löydettävissä. Fairdata Etsin -luetteloi tutkimusaineistoja useista lähteistä ja tarjoaa hakuliittymän niiden etsimiseen. Mitä yksityiskohtaisemmin aineisto on kuvailtu, sitä helpompi muiden on löytää se. Fairdata Qvain -työkalulla julkaistu tutkimusaineisto saa pysyvän tunnisteen, joka osoittaa aina samaan tutkimusaineiston versioon Fairdata Etsimessä. Pysyvää tunnistetta tulee käyttää aina tutkimusaineistoon viitattaessa.
Tutkimusainestojen pitkäaikaissäilytys: Tutkimusorganisaatio voi päättää onko tutkimusaineisto erityisen arvokas ja onko sitä syytä pitkäaikaissäilyttää kymmenien tai jopa satojen vuosien ajaksi. Pitkäaikaissäilytyksen tarjoaa Fairdata PAS-palvelu.
Soveltuvatko Fairdata-palvelut aineistoillemme?
Palvelun valintaan vaikuttavat mm. rahoittajakohtaiset ja organisaatiokohtaiset linjaukset ja alakohtaiset käytännöt. Vaihtoehtoihin kuuluvat organisaatiokohtaiset tallennusarkistot, kansainväliset palvelut (esim. Zenodo, EUDAT B2SHARE), tieteenalakohtaiset palvelut (esim. Dryad, Genbank, Tietoarkisto), datatyyppikohtaiset palvelut (esim. ohjelmiston tallennuspalvelut kuten Github), kansalliset palvelut (Fairdata). On olemassa myös tieteellisiä julkaisuja, jotka erikoistuvat tutkimusaineistojen julkaisemiseen (Data Journal), jolloin aineiston dokumentaatio julkaistaan artikkelin muodossa (ks. esim. Brain and Behavior tai Geoscience Data Journal).
IDA ja Etsin on hyväksytty luotettavien tallennusarkistojen Registry of Research Data Repositories -listalle. Palvelut tunnetaan ja tunnistetaan luotettaviksi myös esimerkiksi Suomen Akatemian rahoitushaussa. Jos pohdit, sopivatko Fairdata-palvelut tutkimuksen datanhallintaan, ota avuksi edellä mainitut valintakriteerit. Avainasemassa on myös datan sisältämät henkilötiedot: IDA ei sovellu erityisiä henkilötietoryhmiä sisältävien aineistojen säilyttämiseen.
Kun harkitset vaihtoehtoja, ota huomioon nämä Fairdata-palvelun edut:
- Hyväksymme tutkimusaineistoja kaikilta tieteenaloilta.
- Palvelut ovat maksuttomia suomalaisten korkeakoulujen ja valtion tutkimuslaitosten käyttäjille sekä heidän yhteistyökumppaneilleen.
- Fairdata-palvelut tukevat yhteentoimivan laadukkaan metadatan luomista ja luovat pysyviä tunnisteita (DOI/URN) julkaistuille aineistoille, jotta tutkimusaineistot noudattavat FAIR-periaatteita.
- Palveluissa voi julkaista suuria aineistoja, sillä aineistoille ei ole etukäteen asetettua kokorajoitusta.
- Tutkimusaineiston voi merkitä ”kasvavaksi tutkimusaineistoksi”, mikä tarkoittaa sitä, että voit lisätä aineistoon dataa myös sen jälkeen, kun se on julkaistu. Kun ainesto on julkaistu Etsimeen, sen kuvailutiedoissa kerrotaan selkeästi, että tämä tutkimusaineisto ei ole staattinen, vaan se voi myöhemmin kasvaa. Näin varmistetaan, että kaikki viittaukset kasvavaan tietokokonaisuuteen ovat selkeitä ja päteviä.
- Kun aineisto on tallennettu ja kuvailtu Fairdata-palveluiden avulla, on teknisesti yksinkertaista siirtää se Fairdata PAS-palveluun, jotta aineisto pysyy ymmärrettävänä ja käytettävänä useiden kymmenien ja jopa satojen vuosien ajan.
- Julkaistut tutkimusaineistot näkyvät Fairdata Etsimen lisäksi myös kansallisessa Tiedejatutkimus.fi-portaalissa. Tiedejatutkimus.fi-portaalissa tutkimusaineisto linkitetään muuhun tutkimustietoon, mikä lisää entisestään aineiston näkyvyyttä ja löydettävyyttä.
- Kehitämme palveluja jatkuvasti, muun muassa tukemaan tutkimusorganisaation mahdollisuuksia hallita tallennettuja aineistoja ja niiden kuvailutietoja.
Miltä Fairdata-palvelut näyttävät?
Kaikissa tutkijoiden käyttämissä Fairdata-palveluissa on graafiset käyttöliittymät. Palveluja käytetään verkkoselaimella, esimerkiksi Chromella tai Firefoxilla. Palvelut eivät vaadi ohjelmistojen asentamista. Palveluiden käyttö ei tyypillisesti vaadi syvää teknistä osaamista, ja Fairdata.fi-sivuston käyttöoppaat tarjoavat yksityiskohtaisesti tietoa palvelujen käytöstä ja ominaisuuksista.
Fairdata PAS-palveluun aineistoja ehdotetaan ja hyväksytään tutkimusorganisaation käyttämän hallintaliittymän kautta. Tutkija voi tallentaa ja kuvailla aineistot Fairdata IDA ja Qvain-palveluissa ja tämän jälkeen tutkimusorganisaation edustajat siirtävät valmiin aineiston pitkäaikaissäilytykseen.
IDA
Yllä olevat kuvakaappaukset on otettu Fairdata IDA -palvelusta kirjautumisen jälkeen. Tässä palvelussa voit tallentaa tiedostoja, järjestää ne lopulliseen viimeisteltyyn kansiorakenteeseen ja lopuksi jäädyttää ne. Kun tiedostot on jäädytetty, ne ovat muuttumattomassa lukutilassa ja ne voidaan liittää osaksi tutkimusaineistoja Fairdata Qvain -työkalulla. Käyttöliittymä on hyvin yksinkertainen ja nopea oppia.
IDAssa on tarjolla komentorivityökalut käyttäjille, jotka tallentavat suuria määriä dataa, tai jotka haluavat esimerkiksi siirtää dataa IDAan CSC:n supertietokoneilta.
Qvain
Fairdata Qvain on tutkimusaineistojen kuvailutyökalu. Yllä oleva ensimmäisessä kuvakaappauksessa on sivu, jonka näet, kun kirjaudut sisään Qvain-työkaluun ensimmäistä kertaa. Kun olet kuvaillut tutkimusaineistoja, ne näkyvät tällä sivulla. Täällä voit myös jakaa tutkimusaineistojen kuvailutietojen muokkausoikeuksia muille käyttäjille, jotta voitte yhdessä muokata saman tutkimusaineistojen kuvailutietoja.
Toinen kuvakaappaus on lomakeesta, jonne kuvailtavan tutkimusaineston kuvailutiedot syötetään. Tässä täytät tietoa tutkimusaineistostasi, kuten sen otsikon, tekijät, lisenssin ja käyttöoikeustyypin. Tässä voit myös joko liittää IDAn jäädytetyt tiedostot tutkimusaineistoon, tai kertoa, että tutkimusaineiston tiedostot sijaitsevat jossain muualla, Fairdata-palvelujen ulkopuolella. Sinun tarvitsee vain täyttää kentät, tallentaa ja lopuksi julkaista tutkimusaineisto.
Etsin
Etsin on palvelu, joka näyttää julkaistut tutkimusaineistot. Jokaisella tutkimusaineistolla on oma kuvailusivu, joka näyttää sen kuvailutiedot. Tutkimusaineiston pysyvä tunniste johtaa tälle sivulle. Tutkimusaineiston kuvailusivulla on oma välilehti tiedostojen lataamista varten, jos aineiston tiedostot ovat avoimesti saatavilla.
Etsimessä voit etsiä, tarkastella ja ladata muiden luomia tutkimusaineistoja. Voit tarkastella esimerkiksi vain avoimesti saatavilla olevia tutkimusaineistoja, tai aineistoja, jotka on tuottanut tietty tutkimusorganisaatio.
Kuinka paljon Fairdata-palveluja käytetään?
Fairdata-palvelut ovat olleet aktiivisessa käytössä useita vuosia, ja vanhimmat tutkimusdatat ovat tallennettu Fairdata IDAan vuonna 2012. Nyt, noin kymmenen vuotta myöhemmin, IDAan on tallennettu yli 1 petatavu dataa ja Etsimestä löytyy yli 4 000 julkaistun tutkimusaineiston tiedot! Tällä hetkellä lähes 400 tutkimusprojektia käyttää Fairdata IDA -palvelua datansa säilyttämiseen.
8 suomalaista korkeakoulua ja valtion tutkimuslaitosta on alkanut hyödyntää tutkimusaineistojen pitkäaikaissäilytystä tarjoavaa Fairdata PAS-palvelua. Muilla Fairdata-palveluilla on käyttäjiä kymmenistä suomalaisista korkeakouluista ja valtion tutkimuslaitoksista.
(Aineistojen lukumäärää muokattu 29.9.2022 SMEAR-aineistojen julkaisutavan muutoksen johdosta.)