Kaj je narobe z velikimi jezikovnimi modeli in s čim bi jih morali nadomestiti

Vabimo vas na 14. predavanje iz sklopa »Kolokviji na IJS« v akademskem letu 2022/23, ki bo v četrtek (ne sredo!), 29. junija 2023, ob 13:00 v Veliki predavalnici Instituta »Jožef Stefan« na Jamovi cesti 39 v Ljubljani. Predavanje bo v angleščini. Na voljo bodo kava, pijača in prigrizki.

Veliki jezikovni modeli (LLM, iz angleščine) zagotavljajo prednaučeno osnovo za učenje številnih zanimivih sistemov umetne inteligence. Vendar imajo veliko pomanjkljivosti. Njihovo učenje in posodabljanje je drago, imajo slabo nejezikovno znanje, dajejo napačne in nasprotujoče si izjave, ki so za nameček lahko tudi družbeno in etično neprimerne. V predavanju bom povzel te pomanjkljivosti in trenutna prizadevanja za njihovo reševanje znotraj obstoječega okvira LLM-jev. Nato se bom zavzel za drugačno, bolj modularno arhitekturo, ki razgradi funkcije obstoječih LLM-jev in jim doda več drugih komponent. Verjamem, da lahko ta alternativa odpravi vse pomanjkljivosti LLM-jev. Razmišljal bom o tem, kako bi to modularno arhitekturo lahko zgradili s kombinacijo strojnega učenja in inženiringa.
 
O predavatelju: Thomas G. Dietterich je zaslužni profesor na Fakulteti za elektrotehniko in računalništvo na Državni univerzi Oregon v ZDA. Je eden od pionirjev na področju strojnega učenja ter je avtor več kot 225 recenziranih člankov in dveh knjig. Njegove trenutne raziskovalne teme vključujejo robustno umetno inteligenco, robustne sisteme človek-AI in aplikacije na področju trajnosti.
 
 
Napovednik predavanja najdete tudi na naslovu http://www.ijs.si/ijsw/Koledar_prireditev, posnetke preteklih predavanj pa na Arhiv TV IJS in http://videolectures.net/kolokviji_ijs.

SLAIS © 2015    Prijava