GPT-4 ir šeit, un šīs ir jaunās funkcijas, kuras jums vajadzētu pārbaudīt.

OpenAI beidzot ir laidis klajā savu ļoti gaidīto GPT atjauninājumu GPT-4. Lielo valodu modelī (LLM) ir dažas jaunas jaudīgas funkcijas un iespējas, kas jau ir šokējušas lietotājus visā pasaulē.

Papildus tam, ka esošais LLM, kas nodrošina OpenAI vīrusu tērzēšanas robotu ChatGPT, GPT-4 ir ievērojami labāks par GPT-3.5, tas var izprot sarežģītākas ievades, ir daudz lielāks rakstzīmju ievades ierobežojums, ir multimodālas iespējas un, kā ziņots, ir drošāk izmantot.

1. GPT-4 var saprast sarežģītākas ievades

Viena no lielākajām GPT-4 jaunajām funkcijām ir tā spēja izprast sarežģītākas un niansētākas uzvednes. Saskaņā ar OpenAI, GPT-4 "uzrāda cilvēka līmeņa veiktspēju dažādos profesionālos un akadēmiskos etalonos."

Tas tika pierādīts, veicot GPT-4 vairākus cilvēka līmeņa eksāmenus un standartizētus testus, piemēram, SAT, BAR un GRE, bez īpašas apmācības. GTP-4 ne tikai saprata un atrisināja šos testus ar salīdzinoši augstu rezultātu visā pasaulē, bet arī katru reizi pārspēja savu priekšgājēju GPT-3.5.

instagram viewer
Attēla kredīts: OpenAI

Spēju saprast niansētākas ievades uzvednes palīdz arī tas, ka GPT-4 ir daudz lielāks vārdu ierobežojums. Jaunais modelis var apstrādāt ievades uzvednes līdz 25 000 vārdu (kontekstam GPT-3.5 bija ierobežots līdz 8000 vārdiem). Tas tieši ietekmēs informāciju, ko lietotāji var iespiest savās uzvednēs, tādējādi sniedzot modelim daudz vairāk informācijas, ar ko strādāt, un radot ilgākus rezultātus.

GPT-4 atbalsta arī vairāk nekā 26 valodas, tostarp tādas mazresursu valodas kā latviešu, velsiešu un svahili. Salīdzinot ar trīs sitienu precizitāti MMLU etalonā, GPT-4 pārspēja GPT-3.5, kā arī citus vadošos LLM, piemēram, PaLM un Chinchilla angļu valodas veiktspējas ziņā 24 valodās.

2. Multimodālās iespējas

Iepriekšējā versija ChatGPT aprobežojās ar tikai teksta uzvednēm. Turpretim viena no GPT-4 jaunākajām funkcijām ir tā multimodālās iespējas. Modelis var pieņemt gan teksta, gan attēlu uzvednes.

Tas nozīmē, ka AI var pieņemt attēlu kā ievadi un interpretēt un saprast to tāpat kā teksta uzvedni. Šī iespēja aptver visu izmēru un veidu attēlus un tekstu, tostarp dokumentus, kas apvieno abus, ar roku zīmētas skices un pat ekrānuzņēmumus.

Tomēr GPT-4 attēlu nolasīšanas iespējas pārsniedz to vienkāršu interpretāciju. OpenAI to demonstrēja savā izstrādātāju straumē (iepriekš), kur viņi nodrošināja GPT-4 ar roku zīmētu joku vietnes maketu. Modelim tika uzdots uzrakstīt HTML un JavaScript kodu, lai maketu pārvērstu par vietni, vienlaikus aizstājot jokus ar faktiskajiem.

GPT-4 ierakstīja kodu, izmantojot maketā norādīto izkārtojumu. Pārbaudot, kods izveidoja darba vietni ar, kā jūs varat uzminēt, patiesiem jokiem. Vai tas nozīmē AI sasniegumi nozīmēs programmēšanas beigas? Ne gluži, bet tā joprojām ir funkcija, kas noderēs, palīdzot programmētājiem.

Lai arī cik daudzsološa šķiet šī funkcija, tā joprojām atrodas izpētes priekšskatījumā un nav publiski pieejama. Turklāt modelis aizņem daudz laika, lai apstrādātu vizuālās ievades, un pats OpenAI norāda, ka ātrākai darbībai var būt nepieciešams darbs un laiks.

3. Lielāka vadāmība

OpenAI arī apgalvo, ka GPT-4 ir augsta vadāmības pakāpe. Tas arī apgrūtināja AI salauzt raksturu, kas nozīmē, ka ir mazāka iespējamība, ka tas neizdosies, ja tas ir ieviests lietotnē, lai atskaņotu noteiktu tēlu.

Izstrādātāji var noteikt sava AI stilu un uzdevumu, aprakstot virzienu "sistēmas" ziņojumā. Šie ziņojumi ļauj API lietotājiem noteiktās robežās ļoti pielāgot lietotāja pieredzi. Tā kā šie ziņojumi ir arī vienkāršākais veids, kā "jailbreak" modeli, viņi arī strādā, lai padarītu tos drošākus. GPT-4 demonstrācija tika ieviesta šajā vietā, liekot lietotājam mēģināt pārtraukt GPT-4 būt par Socratic pasniedzēju un atbildēt uz viņa vaicājumu. Tomēr modele atteicās lauzt raksturu.

4. Drošība

OpenAI pavadīja sešus mēnešus, veidojot GPT-4 drošāk un saskaņotāk. Uzņēmums apgalvo, ka ir par 82% mazāka iespēja atbildēt uz pieprasījumiem par nepiemērotu vai citādi neatļautu saturu, un par 29% lielāka iespēja, ka atbildēt uz sensitīviem pieprasījumiem saskaņā ar OpenAI politikām un par 40% lielāka iespēja sniegt faktiskas atbildes, salīdzinot ar GPT-3.5.

Tas nav ideāls, un jūs joprojām varat sagaidīt, ka tas laiku pa laikam "halucinēs" un var kļūdīties savās prognozēs. Protams, GPT-4 ir labāka uztvere un prognozēšanas spēja, taču jums joprojām nevajadzētu akli uzticēties AI.

5. Veiktspējas uzlabojumi

Papildus modeļa veiktspējas novērtēšanai cilvēku eksāmenos OpenAI novērtēja arī robotu, izmantojot tradicionālos etalonus, kas paredzēti mašīnmācīšanās modeļiem.

Tas apgalvo, ka GPT-4 "ievērojami pārspēj" esošos LLM un "vismodernākos modeļus". Šie etaloni ietver iepriekš minētie MMLU, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval un Drop, kas visi pārbauda individuālās iespējas.

Jūs atradīsit līdzīgus rezultātus, salīdzinot sniegumu akadēmiskās redzes etalonos. Pārbaudēs ietilpst VQAv2, TextVQA, ChartQA, AI2 diagramma (AI2D), DocVQA, Infographic VQA, TVQA un LSMDC, kas visi ir GPT-4 labākie. Tomēr OpenAI ir paziņojis, ka GPT-4 rezultāti šajos testos "pilnībā neatspoguļo tā iespēju apjomu", jo pētnieki turpina atrast jaunas un izaicinošākas lietas, ko modelis var risināt.

Mazs solis GPT-4, Giant Leap AI

Ar lielāku precizitāti, lietošanas drošību un uzlabotām iespējām GPT-4 ir izlaists sabiedrībai, izmantojot ChatGPT+ ikmēneša abonēšanas plānu, kas maksā 20 mēnesī. Turklāt OpenAI ir sadarbojies ar dažādām organizācijām, lai sāktu veidot patērētājiem paredzētus produktus, izmantojot GPT-4. Microsoft Bing, Duolingo, Stripe, Be My Eyes un Khan Academy savos produktos jau ir ieviesušas GPT-4.

GPT-4 var būt pakāpenisks atjauninājums salīdzinājumā ar GPT-3.5, taču kopumā tas ir milzīgs ieguvums AI. Tā kā modelis kļūst pieejamāks gan parastajam lietotājam, gan izstrādātājiem, izmantojot tā API, šķiet, ka tas būs labs piemērs LLM ieviešanai dažādās jomās.