O-STA

Samo z urejenimi in dostopnimi znanstvenimi podatki bomo prišli do rešitev za boljšo prihodnost

Ljubljana, 13. december 2022 - Raziskovalci Nacionalnega inštituta za biologijo so razvili sistem za upravljanje z raziskovalnimi podatki, imenovan pISAtree. Namen sistema pISA-tree je, da so raziskovalni podatki iz številnih znanstvenih poskusov dobro opisani in razvrščeni tako, da jih lahko razumejo in ponovno uporabijo raziskovalci kjerkoli po svetu. Gre za enostaven, uporabniku prijazen in prilagodljiv sistem s predlogami za projekte iz področja ved o življenju, ki ga že nekaj let izpopolnjujejo in uporabljajo sami za nacionalne raziskovalne projekte, uspešno pa je bil uporabljen tudi v okviru več mednarodnih projektov, kjer so ga uporabljali tudi drugi partnerji. Delovanje sistema so raziskovalci nedavno predstavili v znanstvenem članku, objavljenem v Scientific Data, ki je ena vodilnih mednarodnih znanstvenih revij na področju odprte znanosti.

Zakaj znanstvena skupnost potrebuje takšne sisteme na primeru opiše eden soavtorjev članka, dr. Marko Petek: "Na Oddelku za biotehnologijo in sistemsko biologijo med drugim raziskujemo tudi mehanizme odpornosti rastlin na posledice podnebnih sprememb. To problematiko raziskuje še veliko drugih raziskovalnih skupin po svetu, saj je za stabilno pridelavo hrane ključno, da se kmetijstvo čim hitreje prilagodi na klimatske spremembe. Pristop teh raziskovalnih skupin je v osnovi enak, saj uporabljamo podobne metode. Rastline gojimo, izpostavimo enemu ali kombinaciji več stresnih dejavnikov, kot so škodljivci, vročina, suša ipd. nato pa opazovanja natančno dokumentiramo in analiziramo odziv rastlin. Izvajamo različne meritve, od fizioloških lastnosti organizmov, ki jih merimo s pomočjo senzorjev, kamer in mikroskopov, preko kemijskih in biokemijskih parametrov do analize razlik v genskem zapisu in izražanju genov. Tako ustvarjamo velike količine raznolikih podatkov. S pridobljenimi podatki poskušamo odgovoriti na specifična vprašanja, vendar lahko naši podatki pomagajo odgovoriti tudi na vprašanja, na katera sami ne bi nikoli pomislili. Žal ogromno raziskovalnih podatkov ostane neobjavljenih ali pa so v objavah preslabo opisani, da bi jih strokovnjaki, ki niso sodelovali v projektu, lahko uporabili v svojih analizah."

O pomembnosti urejanja podatkov v znanosti druga soavtorica članka, dr. Maja Zagorščak dodaja: "Dobro upravljanje s podatki ne pripomore le k preprečevanju napak in dolgoročno prihrani čas, ampak omogoča drugim znanstvenikom, da hitreje in ceneje pridejo do izjemnih odkritij. Da podatke lahko ponovno uporabimo, moramo poznati "podatke o podatkih", ki jim strokovno rečemo metapodatki. Sistem pISA-tree nam omogoča, da podatke, takoj, ko jih generiramo, tudi opremimo z metapodatki. Take podatkovne sete lahko potem shranimo v podatkovne baze, kjer so dostopni celemu svetu in jih lahko drugi znanstveniki uporabijo v svojih analizah. Takšno odprto deljenje podatkov je eden temeljnih principov odprte znanosti, kateri je zavezan tudi NIB."

Vodilna avtorica članka in vodja Oddelka za biotehnologijo in sistemsko biologijo, kjer so razvili sistem pISAtree dr. Kristina Gruden poudari: "V naši skupini smo že pred mnogo leti ugotovili, da moramo vzpostaviti sistem, ki bo omogočal beleženje metapodatkov hkratno z izvajanjem poskusov in bo preprečeval nejasnosti in izgubo podatkov ter bo v pomoč tako raziskovalcem, ki v laboratoriju generirajo surove podatke, kot analitikom, ki te podatke obdelujejo na računalnikih. Svoje podatke smo želeli organizirati na preprost, ampak dovolj podroben način, da bo zadostil načelom odprte znanosti. Ker takšnega sistema tisti čas nismo našli, smo ga začeli razvijati sami. Od drugih obstoječih sistemov se pISAtree razlikuje po tem, da so datoteke, ki jih generiramo, razporejene na enoličen način s pomočjo datotečne drevesne strukture, ki je blizu vsem raziskovalcem in zato ne potrebujejo veliko časa, da osvojijo njegov namen in delovanje".

NIB je zavezan k implementaciji odprte znanosti in je opazovalec v EOSC Association (https://eosc.eu/) in član SSOZ (https://odprtaznanost.si/).

Sistem pISAtree je prosto dostopen na naslovu https://github.com/NIB-SI/pISA-tree pod licenco MIT. Znanstveni članek , ki opisuje pISA-tree, je prosto dostopen na naslovu https://doi.org/10.1038/s41597-022-01805-5 pod licenco CC-BY 4.0.

Razvoj sistema je bil financiran s projekti in programi Agencije za raziskovalno dejavnost Republike Slovenije (P4-0165, J4-4165, J4-7636, J4-8228, J4-9302 in Z7-1888), projekta BioPharm.Si (OP20.00363), ki ga je financiralo Ministrstvo za izobraževanje, znanost in šport Republike Slovenije. Finančno podprt je bil tudi s strani Evropskega regionalnega sklada, raziskovalno-inovacijskega programa Evropske unije Obzorje 2020, preko projektov ADAPT (št. pogodbe o dodelitvi sredstev 862858) in EOSC-Life (št. pogodbe o dodelitvi sredstev 824087) ter sheme 'ERACoBioTech' Evropskega raziskovalnega prostora (št. pogodbe o dodelitvi sredstev 722361) preko projektov SUSPHIRE in INDIE, ki ju je financiralo Ministrstvo za izobraževanje, znanost in šport Republike Slovenije.

image

pISAtree logotip

(https://raw.githubusercontent.com/NIB-SI/pISA-tree/projects/PISATREE.png, licenca MIT)

Več informacij: Katja Sinur, katja.sinur@nib.si, tel: 040 320 516.