OpenAI je u četvrtak predstavio GPT-5.4, novi osnovni AI model koji kompanija opisuje kao „najmoćniji i najefikasniji frontier model za profesionalni rad“.
Pored standardne verzije, novi model dolazi i u dve specijalizovane varijante: GPT-5.4 Thinking, namenjen naprednom zaključivanju, i GPT-5.4 Pro, optimizovan za maksimalne performanse.
Veći kontekst i bolja efikasnost
API verzija modela donosi kontekstualni prozor do čak 1 milion tokena. To je do sada najveći kontekst koji je OpenAI ponudio u svojim modelima.
Kompanija je istakla i značajno unapređenje efikasnosti. Prema njihovim podacima, GPT-5.4 može da reši iste zadatke sa znatno manjim brojem tokena u odnosu na prethodnu verziju modela.
Rekordni rezultati na testovima
Novi model ostvario je znatno bolje rezultate na više nezavisnih testova.
GPT-5.4 je postigao rekordne rezultate na benchmark testovima za korišćenje računara OSWorld-Verified i WebArena Verified.
Na OpenAI testu GDPval, koji meri sposobnost modela za zadatke iz oblasti znanja i profesionalnog rada, model je ostvario 83% tačnosti, što predstavlja novi rekord.
Napredak u profesionalnim zadacima
Model je takođe zauzeo prvo mesto na APEX-Agents benchmarku, koji je razvila kompanija Mercor. Ovaj test procenjuje profesionalne veštine u oblastima poput prava i finansija.
Prema rečima izvršnog direktora kompanije Brendan Foody, GPT-5.4 pokazuje odlične rezultate u složenim poslovnim zadacima.
„GPT-5.4 je posebno uspešan u izradi kompleksnih projekata kao što su prezentacije, finansijski modeli i pravne analize. Model pruža vrhunske performanse, uz veću brzinu i niže troškove u poređenju sa konkurentskim AI modelima.“
Manje grešaka i halucinacija
OpenAI nastavlja rad na smanjenju tzv. AI halucinacija, odnosno netačnih ili izmišljenih informacija.
Prema podacima kompanije, GPT-5.4 je za 33% manje sklon greškama u pojedinačnim tvrdnjama u odnosu na model GPT-5.2.
Ukupni odgovori modela su 18% ređe sadržali netačne informacije.
Novi sistem za rad sa alatima
U okviru lansiranja predstavljen je i novi sistem za API pod nazivom Tool Search.
Ranije su svi dostupni alati morali biti definisani u sistemskom promptu, što je trošilo veliki broj tokena. Novi sistem omogućava modelu da pretražuje definicije alata samo kada su mu potrebne.
Rezultat su brži i jeftiniji API zahtevi, posebno u sistemima koji koriste veliki broj alata.
Nova bezbednosna evaluacija
OpenAI je predstavio i novu bezbednosnu evaluaciju koja testira chain-of-thought proces modela. To je način na koji AI prikazuje korake razmišljanja prilikom rešavanja složenih zadataka.
Istraživači bezbednosti veštačke inteligencije dugo su upozoravali da bi modeli mogli pogrešno prikazivati svoje razmišljanje. Testiranja su pokazala da se to može dogoditi u određenim situacijama.
Međutim, nova evaluacija pokazuje da je manja verovatnoća da će Thinking verzija GPT-5.4 prikrivati način razmišljanja, što ukazuje da nadzor nad chain-of-thought procesom i dalje ostaje važan bezbednosni mehanizam.


