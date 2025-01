Kitajska je s svojim modelom deepseek te dni stopila v ospredje tehnološkega napredka in neposredno izzvala ameriške modele, kot je chatgpt podjetja OpenAI.

Deepseek je napreden jezikovni model, ki ga je razvila skupina kitajskih raziskovalcev za spodbujanje odprtokodne UI. Model temelji na naprednih metodah strojnega učenja in obdelavi naravnega jezika (NLP) in je hitro pridobil pozornost po vsem svetu, saj ponuja stroškovno učinkovito rešitev, ki tekmuje z zaprtokodnimi sistemi, kot sta GPT-4 in Claude-3.5-Sonnet. Njegova odprtokodna narava omogoča preglednost in dostopnost, kar je pomembno za nadaljnji razvoj UI.

Na drugi strani je chatgpt jezikovni model, ki ga je razvilo podjetje OpenAI in temelji na arhitekturi Generative Pre-trained Transformer (GPT). Zasnovan je za generiranje besedila, podobnega človeškemu, ter razumevanje konteksta. Model obdeluje velike zbirke podatkov, kar mu omogoča, da odgovarja na vprašanja, nudi podrobne odgovore ter podpira različne profesionalne naloge in osebne primere uporabe.

Chatgpt je znan po svoji vsestranskosti in veliki zmožnosti razumevanja konteksta, kar ga naredi primernega za ustvarjanje vsebin, podporo strankam ter naloge možganskega viharjenja. Njegove enostavna integracija in stalne posodobitve zagotavljajo dosledno delovanje in široko uporabo. Kljub temu se chatgpt sooča z izzivi, kot so zastarelost znanja, netočnost informacij in pristranskost iz izvornih podatkov.

»Deepseek R1 je program, ki je na področju umetne inteligence povzročil pravo revolucijo. Po eni strani je izenačil razvoj AI med Kitajsko in ZDA, saj so Američani še pred kratkim menili, da imajo vsaj deset let prednosti. Po drugi strani je izjemen tudi zaradi hitrosti in majhnosti svoje izdelave – deluje na ravni najboljših ameriških velikih jezikovnih modelov, hkrati pa je bistveno manjši, hitrejši in cenejši. Kar je še posebej pomembno, je njegova odprtokodnost, ki omogoča širšo dostopnost in prilagajanje,« pravi dr. Matjaž Gams iz oddelka za inteligentne sisteme na Institutu Jožef Stefan.

Trenutno deepseek R1, kot nam pove sogovornik, preizkušajo na izredno zmogljivem računalniku na Institutu Jožef Stefan, a že sama namestitev predstavlja velik izziv. FOTO: Marko Feist/Delo

Seveda pa ob vseh presežkih ne gre spregledati realnih omejitev. Trenutno deepseek R1, kot nam pove sogovornik, preizkušajo na izredno zmogljivem računalniku na Institutu Jožef Stefan, a že sama namestitev predstavlja velik izziv. »Čeprav odgovarja zelo dobro, v povprečju še vedno ni bistveno boljši od največjih in najboljših sistemov na svetu. Podobno velja za zadnje ameriške modele umetne inteligence, ki so dosegali fenomenalne rezultate, vendar ob visokih stroških – en sam odgovor je lahko stal tudi dva tisoč dolarjev, sistem pa je tekel na ogromnih superračunalnikih. Ključno vprašanje, s katerim se ukvarjajo strokovnjaki, je, kako razviti še boljše sisteme, ki bi bili hkrati cenovno dostopni množicam. Z modelom deepseek R1 se odpira novo poglavje, ki obeta nesluten razvoj umetne inteligence.«

Kontroverzne vrednostne sodbe

Preboj v razvoju je bil sicer najprej dosežen pri modelu O3, pravi Gams, ki je že uporabljal napredno verigo sklepanja, vendar je deloval na izjemno zmogljivih in dragih računalnikih. Osnova takšnih sistemov je način, kako poteka sklepanje med vhodom in izhodom, ki se izboljšuje s strojnim učenjem. Pri tem lahko govorimo tudi o t. i. »politiki« reševanja problema – umetno inteligenco lahko, denimo, prilagodimo, da razmišlja kot človek, kot bi učitelj razlagal učencu, kako korak za korakom reševati nalogo. Če postane veriga sklepanja variabilna komponenta sistema, jo je mogoče učiti hitreje, učinkoviteje in bolj dinamično kot prej. Na ta način sistem postane skoraj samoučeč, čeprav je osnovni proces gradnje še vedno utemeljen na destilaciji, kjer večji in sposobnejši model uči manjši sistem – v tem primeru deepseek.

»Tako chatgpt kot deepseek imata v svoje delovanje vgrajene določene vrednote, kar pogosto ostane neopaženo, dokler se ne lotimo analize. Chatgpt je v preteklosti podajal skrajno kontroverzne vrednostne sodbe, med drugim trditev, da je napačna uporaba spolne identitete hujša od jedrske vojne. Čeprav so takšne izjave kasneje popravili, testi še vedno kažejo določeno ideološko usmerjenost pri vrednostnih vprašanjih, kot so odnos do zastave, družine in drugih družbenih tem. Po drugi strani je deepseek pri teh vprašanjih precej bolj nevtralen, a izrazito prokitajski. Ne dopušča razprave o Tajvanu kot neodvisni državi, ignorira proteste na Trgu nebeškega miru ter se izogiba tematikam, kot so človekove pravice in kitajski disidenti. Zanimivo je tudi, da deepseek bolj naklonjeno piše o Matjažu Gamsu kot različice chatgpt. Obe tehnologiji mu sicer priznavata izjemne dosežke na področju umetne inteligence, a chatgpt je nekoliko bolj skeptičen glede njegovih pogledov na demografijo, kar se ujema s splošno vrednostno orientacijo modela. Vse to dokazuje, da umetna inteligenca kljub svoji objektivnosti v osnovi še vedno odraža vrednote svojih ustvarjalcev. Napredek na tem področju bo zato v prihodnje zanimiv ne le s tehničnega vidika, temveč tudi z vidika vpliva na digitalno zavest prihodnosti,« še pravi sogovornik.