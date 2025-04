V nadaljevanju preberite:

V luči razvoja novega velikega jezikovnega modela za slovenščino GaMS, ki bo deloval po principu ChatGPT-ja, se tudi pri nas razpira vse burnejša razprava o etičnosti podatkovnega rudarjenja, s katerim si UI avtorska besedila prisvaja brez soglasja avtorja in brez nadomestila.

Barbara Pogačnik, predstavnica Društva slovenskih pisateljev v European Writers Council, poudarja, da je »etični standard tu vprašanje zakonodaje. Slovenski 'izvirni greh' se je zgodil ob razpravi in implementaciji evropske direktive o enotnem digitalnem trgu iz leta 2019. Že tedaj reprezentativna avtorska društva niso bila povabljena v javno razpravo, saj ne predstavljajo gospodarske entitete«.

Pod okriljem Centra za jezikovne vire in tehnologije Univerze v Ljubljani (CJVT UL) je ta hip v razvoju tudi veliki jezikovni model za slovenščino, ki se bo, če se bodo »z NUK in drugimi deležniki dogovorili, da nam omogoči dostop do tovrstnih del,« morebiti učil tudi na avtorsko zaščitenih besedilih, ki jih hrani NUK. Kot poudarja vodja CJVT UL Simon Krek, gre za kolektivno odločitev govorcev in govork slovenščine, »do katere mere želimo, da bo umetna inteligenca znala slovensko oziroma bo poznala slovensko okolje in kulturo«. Glavni namen projekta je »zagotoviti, da bo imel slovenski jezik primerno podporo v digitalnem okolju«, a pod trenutno evropsko zakonodajo jezikovni modeli jezike v digitalno okolje vpeljujejo prav na račun avtoric in avtorjev, katerih dela jih hranijo.