O-STA

Predstavitev Gigafida 2.0: korpus pisne standardne slovenščine

Center za jezikovne vire in tehnologije Univerze v Ljubljani (CJVT) vabi na predstavitev Gigafida 2.0: korpus pisne standardne slovenščine, ki bo v četrtek, 13. junija 2019, ob 14h v predavalnici 18 na Filozofski fakulteti v Ljubljani.

CJVT je v okviru projekta Nadgradnja korpusov Gigafida, Kres, ccGigafida in ccKres, ki ga je financiralo Ministrstvo za kulturo v letih 2015-2018, pripravil posodobitev referenčnega korpusa Gigafida z novimi besedili, bolj napredno računalniško obdelavo zbranih besedil in izboljšanim uporabniškim vmesnikom.

Program predstavitve:

- Uvod in izjava za javnost (Simon Krek)

- Pot do Gigafide 2.0 (Marko Stabej)

- Gigafida 2.0 - statistike in utemeljitve (Simon Krek)

- Urejanje avtorskih pravic z besedilodajalci (Andraž Repar)

- Kratka demonstracija novega uporabniškega vmesnika (Špela Arhar Holdt)

Rezultat nadgradnje korpusa Gigafida je pripravljen v dveh različicah: Gigafida 2.0 Proto vsebuje vsa besedila iz korpusa Gigafida 1.0 in vsa novozbrana besedila, Gigafida 2.0 pa je še dodatno procesirana, s čimer je zagotovljena boljša reprezentativnost gradiva za raziskave sodobne standardne slovenščine. Gigafida 2.0 Proto tako vsebuje 1,8 milijarde besed, Gigafida 2.0 pa 1,1 milijarde. Besedila so bila izbrana in strojno obdelana z namenom, da bi korpus kot vzorec sodobne standardne slovenščine lahko služil za jezikoslovne in druge humanistične raziskave, izdelavo sodobnih slovarjev, slovnic, učnih gradiv in razvoj jezikovnih tehnologij za slovenščino.

CENTER ZA JEZIKOVNE VIRE IN TEHNOLOGIJE UNIVERZE V LJUBLJANI https://www.cjvt.si/

Center za jezikovne vire in tehnologije (CJVT) deluje v okviru Univerze v Ljubljani. Namen CJVT je omogočiti uspešen razvoj slovenščine v digitalni dobi. Skladno s to vizijo raziskovalci z različnih področij pripravljamo digitalne jezikovne vire ter orodja in pri tem sledimo načelom, da morajo biti vsi izdelki vsebinsko in metodološko sodobni, uporabniku prijazni in odprto dostopni za nadaljnji razvoj.