V novi epizodi podkasta Tehnološki velikani smo se osredotočili na strateško vprašanje, ali bo Evropa v obdobju generativne umetne inteligence ostala uporabnik tujih platform ali pa bo zgradila lastne modele, pravila in infrastrukturo. V ospredju pogovora v podkastu je bil evropski projekt LLMs for Europe, v katerem sodelujeta tudi Telekom Slovenije in XLAB v okviru konzorcija Alliance for Language Technologies.

Cilj projekta, o katerem se je Gregor Knafelc pogovarjal z Miranom Nikoličem, specialistom za umetno inteligenco in telekomunikacije pri Telekomu Slovenije, in dr. Danielom Vladušičem, vodjo raziskav pri podjetju XLAB, je razvoj odprtega evropskega velikega jezikovnega modela (LLM), ki bo pokrival vse jezike Evropske unije in bo v celoti skladen z evropsko zakonodajo. Projekt vključuje približno 70 partnerjev iz 20 držav, njegov proračun znaša okoli 40 milijonov evrov, trajal pa bo tri leta. Med slovenskimi partnerji so poleg Telekoma Slovenije in XLAB še Institut Jožef Stefan ter Univerza v Ljubljani.

40 milijonov evrov proračuna za razvoj evropskega velikega jezikovnega modela.

70 partnerjev iz 20 držav sodeluje v projektu pod okriljem konzorcija Alliance for Language Technologies.

Model bo pokrival vse uradne jezike Evropske unije, s posebnim poudarkom na manjših jezikih.

Osredotočen je na ključne sektorje: telekomunikacije, energetika, znanost, turizem in e-uprava.

Razvoj temelji na strogi skladnosti z GDPR in evropsko UI-zakonodajo, z jasno metodologijo zakonite uporabe podatkov.

Projekt je neposreden odgovor na vprašanje digitalne suverenosti. Evropa je danes precej odvisna od ameriških oblačnih storitev in globalnih dobavnih verig strojne opreme, zlasti na področju čipov. LLMs for Europe želi vzpostaviti drugačen model: evropski jezikovni sistem, zgrajen na podatkih, ki so zakonito pridobljeni, preverjeni in obdelani v skladu z evropskimi standardi varstva podatkov.

Evropski modeli naj bi bili odprti in prilagodljivi. FOTO: Marko Feist

»LLMs for Europe ni le razvoj modela, temveč vzpostavljanje temeljev evropske digitalne suverenosti. Če želimo nadzor nad podatki in infrastrukturo, moramo imeti tudi lastne jezikovne modele,« poudarja Nikolič.

Posebnost projekta je dvojni poudarek. Prvič, modeli bodo zasnovani tako, da bodo kakovostno pokrivali tudi manjše jezike, kar je za države z omejenimi jezikovnimi viri strateškega pomena. Drugič, usmerjeni bodo v konkretne industrijske vertikale, kot so telekomunikacije, energetika, znanost, turizem in e-uprava (vsaka vertikala bo imela svoj model). S tem projekt presega splošne pogovorne modele in cilja na praktično uporabo v ključnih sektorjih.

»Ključ projekta je metodologija. Ne gre zgolj za to, da model zgradimo, temveč da ga zgradimo pravilno – s podatki, ki so zakonito pridobljeni, sledljivi in skladni z evropsko regulativo,« dodaja Vladušič.

Pomemben del projekta predstavlja razvoj metodologije, ki zagotavlja skladnost modelov z evropsko regulativo. Skladnost se ne preverja le na koncu razvoja, temveč že pri vhodnih podatkih; pri njihovem izvoru, čiščenju, anonimizaciji in dokumentiranju. Namen je vzpostaviti standardiziran postopek, ki omogoča sledljivost podatkov ter zmanjšuje pravna in varnostna tveganja. V časih, ko so globalni modeli pod drobnogledom zaradi vprašanj avtorskih pravic in zakonitosti uporabe podatkov, je tak pristop ključen, sta pojasnila sogovorca.

Evropski modeli naj bi bili odprti in prilagodljivi. Organizacije, vključno z javno upravo, jih bodo lahko uporabljale kot osnovo ter jih dodatno prilagodile z lastnimi podatki, ne da bi te morale pošiljati zunanjim ponudnikom. To bo zagotavljalo nadzor nad občutljivimi informacijami in manjšo izpostavljenost tveganjem, ki so povezana z uporabo zunanjih platform.

LLMs for Europe ni le tehnološki projekt, temveč del širše evropske strategije. FOTO: Marko Feist

LLMs for Europe se hkrati povezuje z razvojem evropske infrastrukture umetne inteligence. Vzporedno nastajajo superračunalniški centri (HPC), UI-tovarne in mreža robnih podatkovnih centrov, ki bodo omogočali obdelavo podatkov bližje uporabnikom.

Cilj ni posnemanje obstoječih globalnih ponudnikov oblačnih storitev, temveč vzpostaviti evropski ekosistem povezljivih zmogljivosti, kjer si bodo države in podjetja lahko delila računske resurse. Poseben poudarek je na dostopnosti za mala in srednje velika podjetja, ki pogosto nimajo lastnih strokovnjakov za napredno računalništvo.

Ob tem pa razvoj umetne inteligence odpira tudi infrastrukturna vprašanja, zlasti glede porabe električne energije. Superračunalniki in podatkovni centri zahtevajo velike količine energije, zato bo trajnostna energetska strategija pomemben del evropske digitalne prihodnosti.

LLMs for Europe tako ni le tehnološki projekt, temveč del širše evropske strategije. Gre za poskus, da Evropa v dobi generativne umetne inteligence vzpostavi lastne temelje na zakonito pridobljenih podatkih, jasni metodologiji in infrastrukturi, ki ni odvisna od tujih pravil. Jezikovni modeli v tem kontekstu niso zgolj tehnološka novost, temveč postajajo del kritične infrastrukture prihodnje evropske družbe, ugotavljajo govorci.