Intervju: Boris Cergol, matematik

»Matematike najbolj motivira iskanje čim bolj preprostih in elegantnih rešitev problemov. Ta princip se odraža tudi v razvoju umetne inteligence.«

Boris Cergol je odličen poznavalec trendov na področju umetne inteligence. V intervjuju je zelo natančno izpostavil ključne izzive, ki jih prinaša umetna inteligenca, ob tem pa se ni izmaknil drznim napovedim, kaj bo ta tehnologija v prihodnosti prinesla človeštvu.

Cergol je sicer matematik, ki je po kratkem postanku v akademskem svetu ugotovil, da ga bolj zanimajo aplikativne raziskave v gospodarstvu. V časih med in po finančni krizi leta 2008 je preučeval finančne trge in razvijal kvantitativne trgovalne strategije, nato pa ustanovil podjetje, ki se je specializiralo za podatkovno znanost, še preden je ta postala popularna. Po letih izkušenj z uvajanjem strojnega učenja v raznolikih panogah se je pridružil podjetju Comtrade System Integration, kjer je prevzel vodenje novoustanovljene poslovne enote za umetno inteligenco.

Umetna inteligenca je z letošnjim letom postala še posebej vroča tema. Vse več je uspešnih primerov uporabe na področju biologije, medicine, znanosti in na drugih področjih človekovega delovanja. Kaj sploh je umetna inteligenca in kateri so njeni glavni tipi?

Umetna inteligenca je že dolgo vroča tema, a zdaj postaja vse bolj prisotna v našem vsakdanjem življenju. Ni več omejena le na strokovnjake v podjetjih in inštitutih, ampak je dostopna praktično vsakomur. Preprosto si jo lahko predstavljamo kot način avtomatizacije reševanja problemov. Njena sodobna oblika je izjemno prilagodljiva in uporabna na skoraj vseh področjih našega dela in zasebnega življenja. Trenutno je v središču pozornosti generativna umetna inteligenca. Ta lahko na podlagi naučenega iz velike količine podatkov ustvarja nove vsebine, ki so podobne izvirnim, a niso njihova kopija. V praksi to pomeni, da lahko podatke v različnih oblikah – besedila, slike ali kombinacije – preoblikujemo v nekaj novega in koristnega. Prej smo poznali predvsem prediktivno umetno inteligenco, ki je za nove podatke napovedovala določene lastnosti, ni pa bila sposobna ustvarjati popolnoma novih vsebin.

Ko govorimo o tipih umetne inteligence, so danes pomembne različne ločnice: odprti in zaprti modeli (glede na dostopnost njihove kode), veliki, računsko zahtevni modeli in manjši, specializirani modeli. Potem so tu še modeli za en tip podatkov (na primer besedila ali slike) in multimodalni modeli. Prav tako lahko ločimo umetno inteligenco glede na njeno vlogo v aplikacijah: pomočnik ali »kopilot«, ki nudi nasvete in informacije, izvajalec, ki samostojno opravlja dodeljene naloge, proaktivni sistem, ki spremlja podatke in samostojno izvaja akcije. Delitev umetne inteligence danes ni več toliko povezana z algoritmi v ozadju, ampak bolj s politično-ekonomskimi dejavniki in načini, kako se ta tehnologija pojavlja v našem življenju.

Eden od načinov oponašanja človeških miselnih procesov je strojno učenje, pri katerem se stroji naučijo izvajati določeno nalogo. Ideje o strojih, ki bi lahko oponašali človeško inteligenco, že stoletja burijo domišljijo znanstvenic in umetnikov. Kako velike spremembe za naša življenja lahko prinesejo ti procesi?

Naš pogled na strojno učenje se je v zadnjem času precej spremenil. V preteklosti je bilo strojno učenje tipično vezano na ozko definirane primere uporabe, ki so zahtevali obsežno pripravo in označevanje podatkov. Danes pa smo priča pomembnemu premiku. Sodobno strojno učenje deluje na ogromnem obsegu nestrukturiranih podatkov, pogosto zbranih iz celotnega svetovnega spleta ali drugih obsežnih virov. Osnovni pristop temelji na napovedovanju naslednjega koščka besedila ali druge vrste podatkov. Ta navidezno preprosta naloga zahteva, da stroj pridobi precej dobro razumevanje podatkov in s tem širšo sliko o svetu. Posledica tega je, da so današnji algoritmi in modeli do neke mere splošni in lahko rešujejo zelo raznovrstne naloge. To v naša življenja prinaša fundamentalne spremembe. Že zdaj obstajajo ljudje, ki jim je uporaba umetne inteligence popolnoma spremenila način dela. Vendar je število teh ljudi zaenkrat še omejeno, kar pa se bo v prihodnosti zagotovo spremenilo.

Zanimivo je, da pri razvoju teh modelov zaenkrat še nismo trčili ob noben pomembnejši mejnik ali nepremostljivo oviro. Res pa je, da količina računske moči in energije, potrebne za učenje teh modelov, že začenja predstavljati določene izzive. Če je bil v preteklosti velik poudarek na samem procesu strojnega učenja, danes postaja bistveno bolj zanimiva dejanska uporaba znanja, ki so se ga modeli naučili. Ker so ti modeli bolj splošni, jih lahko uporabljamo na neprimerno bolj raznolike načine in z njimi rešujemo širši nabor problemov, kot smo to počeli v preteklosti.

Sistemi umetne inteligence so do sedaj počeli  točno določene stvari, za katere so bili načrtno naučeni. Ti modeli so vsaj na videz pridobili določene sposobnosti, ki jim jih nismo sami načrtno priučili. Recimo ChatGPT zna sklepati, pisati pesmi, računati. Bo v prihodnosti vsa umetna inteligenca integrirana v neke vrste splošno umetno inteligenco?

Res je, sistemi umetne inteligence se razvijajo v smeri vse večje splošnosti. Ko sistem postane dovolj kompleksen in ko smo za njegovo učenje uporabili dovolj podatkov in računske moči, se lahko pojavijo nove sposobnosti, ki jih pri manjših modelih nismo opazili in jih morda nismo niti znali predvideti. Verjamem, da bodo temeljni modeli postajali bolj splošni in bodo sposobni še bolj raznolikega nabora sposobnosti. Vendar pa za samo uporabo umetne inteligence popolna splošnost ni vedno najboljša rešitev.

V kratkem času smo prešli od sistemov, ki so bili uporabni le v zelo specifičnih in omejenih situacijah, do obdobja, ko imamo na voljo odprtega, splošnega asistenta, kot je ChatGPT. Vendar se včasih izkaže, da je potrebna določena komunikacija z asistentom, preden lahko natančno opredelimo, kaj v danem primeru potrebujemo. To z vidika uporabniške izkušnje ni vedno optimalno. Pomembno je poudariti, da dober produkt ni nujno splošen. Pravzaprav bi lahko rekli, da večina res dobrih produktov opravlja predvsem eno stvar izjemno dobro in je optimizirana za izvajanje te specifične naloge. Zato moramo, posebej tisti znotraj informacijsko-tehnološke industrije, ki se sama transformira zaradi umetne inteligence, razmisliti o tem, da vseh problemov ne bomo rešili samo s tem, da ljudem ponudimo dostop do »škatle«, ki sicer zna rešiti vse probleme, a uporabniki ne vedo, kako se z njo pogovarjati, ali celo, da lahko reši njihove težave. Pogosto je glavna ovira prav to, da ljudje sploh ne poskusijo uporabiti vseh zmožnosti teh asistentov. To je pogosto omejitev, zaradi katere si v določenih situacijah z njimi ne morejo pomagati. Medtem ko se umetna inteligenca razvija v smeri večje splošnosti, bo torej v prihodnosti verjetno obstajala kombinacija splošnih in specializiranih sistemov, odvisno od konkretnih potreb in uporabniških izkušenj.

Kako hiter razvoj umetne inteligence vpliva na zmožnosti obdelave podatkov in njihovo vključitev v reševanje različnih problemov?

Razmerje med podatki in umetno inteligenco postaja vse bolj kompleksno. V preteklosti je bila umetna inteligenca predvsem podaljšek analize podatkov, kjer je bila ključna skrbna priprava, zbiranje in označevanje podatkov za učenje modelov. Upali smo, da bodo ti modeli nato delali nekaj koristnega. Danes imamo na voljo splošne modele, ki lahko opravljajo številne naloge brez predhodne priprave specifičnih podatkov. To nam omogoča, da jih začnemo uporabljati takoj, tudi za reševanje novih problemov, za katere nimamo pripravljenih vzorcev ali podatkov. Če se na primer soočimo z matematično nalogo, lahko enostavno vprašamo model, da nam pomaga pri reševanju, ne da bi morali zbirati vzorce podobnih nalog. Vendar podatki ostajajo ključnega pomena, le njihova vloga se spreminja. Z naprednimi, fleksibilnimi modeli lahko analiziramo ogromne količine nestrukturiranih podatkov, ki nas obdajajo. Analiziramo lahko na primer vse klice v klicnem centru podjetja, jih transkribiramo in povzamemo, kaj stranke mislijo o določenem produktu. To nam omogoča, da pridobimo globlje razumevanje na podlagi dejanskih podatkov, ne le površinskih vtisov. Ključnega pomena postaja kontekstualizacija modelov. Več konteksta kot damo modelu o našem področju, problemih in pričakovanjih, bolj uporaben postane za nas. Kontekstna okna modelov se stalno povečujejo – eno podjetje je celo napovedalo model s kontekstnim oknom, ekvivalentnim 750 debelim knjigam. To pomeni, da lahko modelu posredujemo ogromno informacij o našem specifičnem kontekstu.

Ampak človeško življenje in situacije na katere naletimo, ni mogoče spraviti v podatke. Kaj pa specifičen kontekst v katerem nastane problem?

Prav to prinaša nov izziv – vzpostavitev procesov za učinkovito zajemanje tega konteksta. Brez ustreznega konteksta se lahko zdi, da modeli ne znajo rešiti naših težav, čeprav bi jih z ustreznimi informacijami verjetno znali. Pogosto se dogaja, da modeli navidezno ne znajo rešiti problema, v resnici pa jim manjka le kontekst, v katerem smo mi ta problem dobili. Tehnološki napredek nam pri tem pomaga. Multimodalni modeli, ki lahko »vidijo« dogajanje na zaslonu, in napredni modeli za pretvorbo govora v besedilo olajšujejo zajemanje in uporabo podatkov. To nam omogoča, da lažje zajamemo kontekst naših interakcij in ga uporabimo za izboljšanje delovanja modelov. V prihodnosti bo torej ključno, da vzpostavimo procese za zajemanje in uporabo nestrukturiranih podatkov, saj bomo s tem izboljševali sposobnost modelov za reševanje naših specifičnih problemov. Hkrati pa bo pomembno, da izkoristimo tehnološke napredke, ki nam olajšujejo ta proces in odpirajo nove možnosti za uporabo umetne inteligence v različnih kontekstih.

Kaj vas kot matematika najbolj navdušuje pri umetni inteligenci?

Obstaja napačna percepcija o matematikih, da radi kompliciramo stvari. V resnici je ravno obratno – matematike najbolj motivira iskanje čim bolj preprostih in elegantnih rešitev problemov. Ta princip se odraža tudi v razvoju umetne inteligence. Način, kako se zdi, da bomo rešili problem replikacije človeške inteligence, je pravzaprav spektakularno preprost. Ni bil potreben nedoumljiv algoritmični preskok, temveč smo morali le počakati in vztrajati, da smo pridobili zadostno računsko moč za učenje velikih modelov. Zanimiv koncept, ki se pojavlja v tem kontekstu, je rekurzija – ideja, s katero se v matematiki pogosto srečujemo. Ta rekurzija se že dogaja v razvoju umetne inteligence. Uporabljamo algoritme in umetno inteligenco, da nam pomagajo izboljševati orodja, s katerimi prihajamo do še zmogljivejših različic teh modelov. To ustvarja nekakšno zanko napredka.

Fascinantno je, da živimo v času, ko smo lahko priča tem rekurzivnim spremembam, ki se odvijajo tako hitro. Praktično lahko v realnem času opazujemo, kako se ti modeli razvijajo in napredujejo. Vendar pa je moj pogled na to morda nekoliko drugačen od pogleda mnogih matematikov. Nekateri se morda počutijo, kot da ti stroji prevzemajo nekaj mističnega – stvari, za katere smo včasih mislili, da zahtevajo briljanten preskok ali neko čarobno iskrico za doseganje novega znanja. Zdaj pa se zdi, da bomo v neki točki to iskro nadomestili z nečim bolj industrializiranim. To sproža zanimiva vprašanja o naravi inteligence in ustvarjalnosti. Ali gre res za industrializacijo nečesa, kar smo nekoč dojemali kot izključno človeško domeno? Ali pa morda odkrivamo, da je inteligenca v svojem bistvu bolj sistematična in »izračunljiva«, kot smo si mislili? Neglede na odgovor je jasno, da smo priča izjemnemu napredku v razvoju umetne inteligence, ki temelji na elegantnih, a močnih principih. Ta napredek nam omogoča ne le reševanje kompleksnih problemov, temveč tudi globlje razumevanje same narave inteligence in ustvarjalnosti.

Se v vseh vejah umetne inteligence pojavljajo etični pomisleki? Lahko umetna inteligenca postane huda grožnja za človeštvo?

Zanimivo je, da se o etiki tako pogosto pogovarjamo v povezavi z umetno inteligenco, pri večini drugih tehnologij pa je ta pogosto povsem pozabljena. Z razočaranjem opažam, da je znaten del najbolj aktivno sodelujočih v teh pogovorih do tehnologije umetne inteligence izrazito pristranski. S fokusiranjem zgolj na hipotetične negativne primere uporabe te tehnologije in ignoriranjem koristi, ki jih lahko prinese, je težko priti do odločitev, ki nas bodo pripeljale do čim boljših izidov v prihodnosti. 

Kar se tiče grožnje za človeštvo, sam sicer verjamem, da bo ta tehnologija spremenila svet – pravzaprav ga že spreminja. Postajala bo vedno bolj zmogljiva in v neki točki bo praktično zagotovo presegla sposobnosti inteligence trenutnih ljudi. A varnostnih mehanizmov, ki nas bodo varovali takrat, skoraj zagotovo ne bomo mogli razviti z obstoječimi orodji in razumevanjem. Zato se mi zdi pomembno, da čim več inteligenc (človeških in umetnih) dela na razvoju modelov, ki so ljudem koristni. Večja kot je raznolikost pristopov, večja je verjetnost, da bomo uspeli doseči pozitivne rezultate. Hkrati pa v takšnem pluralnem okolju tudi zmanjšamo verjetnost, da bi prišlo do pojava, ko bi lahko vodilni akter razvoja modelov le-te uporabil za zamrznitev napredka vse ostalih. 

Na račun umetne inteligence se bo spremenilo veliko stvari in s temi spremembami se bomo spreminjali tudi ljudje. Ta prihodnost je zagotovo zanimiva in morda tudi malo strašljiva, ampak menim, da je človeštvo (in pravzaprav vsa živa bitja) preživelo ravno zaradi radovednosti in želje po izboljševanju. Tej želji se ne moremo odreči in verjamem, da jo bomo vključili tudi v modele, ki jih razvijamo in jih bomo razvijali v prihodnosti.

Pa sploh vemo, kaj regulirati pri umetni inteligenci?

Počasnost postopkov sprejemanja novih kompleksnih regulativ in izjemna hitrost napredka tehnologije umetne inteligence nas skoraj neizogibno pripeljejo do tega, da imamo regulativo, ki je neprilagojena na novo realnost, ki jo ustvarja nova tehnologija. Menim, da je takšna usoda doletela tudi aktualni »AI Act« za regulacijo umetne inteligence v Evropski uniji. Navsezadnje je glavnina osnutka zakona nastajala še v času, ko se o generativni umetni inteligenci še ni kaj dosti govorilo, njena omemba v zakonu pa je bila dodana šele v sklepnih pogajanjih. Ocenjujem, da trenutna prizadevanja za regulacijo umetne inteligence po svetu pogosto izhajajo primarno iz strahu pred neznanim, bolj kot iz želje po reševanju konkretnih obstoječih problemov. Paradoksalno pa takšna regulativa, ker ni prilagojena dejanskim modelom in procesom, niti ne more zagotavljati varnosti pred morebitnimi negativnimi učinki v prihodnosti. V globaliziranem svetu se soočamo z dodatnim izzivom. Brez učinkovitega načina regulacije na globalni ravni, lahko lokalne regulative privedejo le do lokalnih ovir v razvoju, ne pa do celovitih rešitev.

Kako odzivna je Evropa na tem področju v primerjavi z Ameriko in Kitajsko?

Menim, da Evropa na tem področju dela zgodovinsko napako. Ustvarja okolje, ki otežuje razvoj domače tehnologije, ki bi lahko konkurirala ameriški in kitajski. Namesto tega bi morali razmišljati, kako vzpostaviti ekonomsko-tehnološko okolje, ki bo Evropi zagotavljalo določeno mero samozadostnosti na področju umetne inteligence. Če Evropa že ne bo vodilna v razvoju te tehnologije, bi morala vsaj ustvariti pogoje, da bo lahko čim bolj izkoristila ekonomske in druge koristi tehnologij, razvitih drugod. Žal pa se trenutno gibljemo v nasprotno smer – v kratkem lahko pričakujemo vse več primerov, ko bo dostop do določenih storitev in modelov umetne inteligence v Evropski uniji onemogočen, četudi bodo ti na voljo praktično povsod drugod po svetu.

Lahko z umetno inteligenco napovemo, kakšen bo njen napredek? Bomo lahko kmalu napovedovali, kdaj in kako se bo nekaj v prihodnosti zgodilo?

Da, menim, da bomo z umetno inteligenco lahko izboljšali naše napovedi, vključno z napovedmi o njenem lastnem napredku. Ključni razlog za to je izjemna sposobnost umetne inteligence za procesiranje in analizo ogromnih količin podatkov. Pomislimo na današnje algoritme, ki imajo že zelo visoko stopnjo razumevanja kompleksnih besedil, na primer pravnih dokumentov. Ob tem, da postaja cena uporabe teh algoritmov za branje in analizo besedil izjemno nizka, se odpirajo nove možnosti. To nam omogoča, da lahko z UI spremljamo in analiziramo neprimerljivo več informacij in virov kot kadarkoli prej. Konkretno, če pogledamo samo en primer, lahko analiziramo, kako se umetna inteligenca omenja v velikih tehnoloških podjetjih, v netehnoloških korporacijah, v zagonskih podjetjih in celo v skupinah manjših razvijalcev in hekerjev. S tem dobimo širšo sliko, ki jo lahko uporabimo za boljše napovedi o prihodnjem razvoju. Vendar je pomembno omeniti, da smo v preteklosti že bili priča nepričakovanim preskokom v sposobnostih umetne inteligence, ki so popolnoma spremenili naša pričakovanja. Zato menim, da bomo z UI sicer izboljšali kvaliteto napovedi v primerjavi s tem, kar lahko naredijo ljudje, občasnih velikim presenečenjem pa se vendarle ne bomo mogli izogniti. Umetna inteligenca se je sicer že dolgo uporabljala za različne vrste napovedi, toda ključna razlika je zdaj v tem, da lahko obdelamo veliko večje količine podatkov, vključno z nestrukturiranimi podatki, in jih bolje razumemo. Kljub temu pa trenutnim algoritmom morda še vedno manjka sposobnost generiranja scenarijev ali tako imenovanih »first principles« razmišljanja, ki presegajo zgolj ekstrapolacijo obstoječih trendov. Toda treba je priznati, da je ta sposobnost pogosto šibka točka tudi pri človeških analitikih. Zaključil bi, da bo UI nedvomno izboljšala naše sposobnosti napovedovanja, vendar verjetno ne bo odpravila vseh negotovosti pri napovedovanju prihodnosti, zlasti ko gre za revolucionarne spremembe v tehnologiji.

Simon Smole

Back to top button