GPT-4, najnovija verzija chatbot-a za umjetnu inteligenciju (AI), ChatGPT, može položiti srednjoškolske testove i ispite na pravnim fakultetima sa ocjenama u 90. percentilu i ima nove mogućnosti obrade koje nisu bile moguće u prethodnoj verziji.
Brojke iz GPT-4 testnih rezultata podijelio je 14. marta njegov kreator OpenAI otkrivajući da on također može konvertirati slike, audio i video ulaze u tekst pored toga što može kreativnije i pouzdanije rukovati “mnogo nijansiranijim uputstvima”.
„Polaže simulirani pravosudni ispit sa rezultatom oko 10% najboljih koji su polagali test,“ dodao je OpenAI. “Nasuprot tome, rezultat GPT-3.5 je bio oko 10% donjih.”
Brojke pokazuju da je GPT-4 postigao rezultat od 163 u 88. percentilu na LSAT ispitu — test koji studenti moraju položiti u Sjedinjenim Državama da bi bili primljeni na pravni fakultet.
Rezultat GPT4 bi ga stavio u dobru poziciju da bude primljen u 20 najboljih pravnih fakulteta i samo je nekoliko maraka manje od prijavljenih rezultata potrebnih za prijem u prestižne škole kao što su Harvard, Stanford, Princeton ili Yale.
Prethodna verzija ChatGPT-a imala je samo 149 bodova na LSAT-u što ga stavlja u donjih 40%.
GPT-4 je također postigao 298 od 400 na Uniform pravosudnom ispitu — testu koji su polagali nedavno diplomirani studenti prava koji im omogućava da rade kao advokati u bilo kojoj jurisdikciji SAD.
Stara verzija ChatGPT-a imala je probleme u ovom testu, završivši u zadnjih 10% sa rezultatom 213 od 400.
Što se tiče SAT ispita iz čitanja i pisanja zasnovanog na dokazima i SAT ispita iz matematike koje su polagali američki srednjoškolci kako bi izmjerili svoju spremnost za fakultet, GPT-4 je postigao rezultat u 93. odnosno 89. percentilu.
GPT-4 je briljirao i u “tvrdim” naukama, dajući znatno iznad prosječnih procenata u AP biologiji (85-100%), hemiji (71-88%) i fizici 2 (66-84%).
Međutim, njegov AP Calculus rezultat je bio prilično prosječan, rangirajući se u 43. do 59. percentilu.
Još jedna oblast u kojoj je nedostajao GPT-4 su ispiti iz engleske književnosti, objavljivanje rezultata u 8. do 44. percentilu na dva odvojena testa.
OpenAI je rekao da su GPT-4 i GPT-3.5 polagali ove testove sa praktičnih ispita 2022-2023, i da alati za obradu jezika nisu prošli nikakvu posebnu obuku:
“Nismo imali posebnu obuku za ove ispite. Manji broj problema na ispitima model je uočio tokom obuke, ali vjerujemo da su rezultati reprezentativni.”
Rezultati su izazvali strah i u Twitter zajednici.
Povezano: Kako će ChatGPT uticati na Web3 prostor? Odgovori industrije
Nick Almond, osnivač FactoryDAO rekao je njegovih 14,300 pratilaca na Twitteru 14. marta da će GPT4 “uplašiti ljude” i da će “urušiti” globalni obrazovni sistem.
Teorija ocjenjivanja je bila veliki dio mog života nekoliko godina. Razmišljao sam o ovom danu koji će doći prije mnogo godina. U to vrijeme sam doslovno zvučao kao rezident kreteni.
Ali… to zapravo znači da je sve osim budne procjene od ove tačke gotovo.
— drnick ️² (@DrNickA) Mart 14, 2023
Bivši direktor Coinbasea, Conor Grogan, rekao je da je umetnuo živi Ethereum pametni ugovor u GPT-4 i odmah ukazao na nekoliko "sigurnosnih slabosti" i naveo kako se kod može iskoristiti:
Ubacio sam živi Ethereum ugovor u GPT-4.
U trenutku je istakla brojne sigurnosne propuste i ukazala na površine na kojima bi se ugovor mogao iskoristiti. Zatim je potvrdio konkretan način na koji mogu iskoristiti ugovor pic.twitter.com/its5puakUW
— Conor (@jconorgrogan) Mart 14, 2023
Ranije revizije pametnih ugovora na ChatGPT-u otkrile su da je njegova prva verzija također u razumnoj mjeri sposobna uočiti greške u kodu.
Rowan Cheung, osnivač AI biltena “The Rundown” podijelio je video GPT koji prepisuje ručno nacrtanu lažnu web stranicu na komadu papira u kod.
Upravo sam gledao kako GPT-4 pretvara ručno nacrtanu skicu u funkcionalnu web stranicu.
Ovo je ludo. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) Mart 14, 2023
Izvor: https://cointelegraph.com/news/chatgpt-v4-aces-the-bar-sats-and-can-identify-exploits-in-eth-contracts