Jūs droši vien esat dzirdējuši par OpenAI GPT, taču tie nav vienīgie LLM šajā blokā.
Key Takeaways
- OpenAI GPT-4 ir vismodernākais un plaši izmantotais lielo valodu modelis ar 1,76 triljoniem parametru un multimodālām iespējām.
- Anthropic's Claude 2 konkurē ar GPT-4 radošās rakstīšanas uzdevumos un saglabā savu spēku, neskatoties uz to, ka tam ir mazāk resursu.
- Lai gan Google PaLM 2 nav GPT-4 slepkava, tas ir spēcīgs valodas modelis ar spēcīgām daudzvalodu un radošām spējām. Falcon-180B ir atvērtā pirmkoda modelis, kas konkurē ar komerciāliem gigantiem un var izturēt līdz kājām ar GPT-3.5.
Ir AI sezona, un tehnoloģiju uzņēmumi laiž klajā lielus valodu modeļus, piemēram, maizi no maizes ceptuves. Jauni modeļi tiek izlaisti ātri, un kļūst pārāk grūti izsekot.
Taču starp jauno izlaidumu uzplūdiem tikai daži modeļi ir pacēlušies uz augšu un pierādījuši sevi kā patiesus sāncenšus plašajā valodu modeļu telpā. Tuvojoties 2023. gada beigām, esam apkopojuši sešus iespaidīgākos lielo valodu modeļus, kas jums jāizmēģina.
1. OpenAI GPT-4
GPT-4 ir līdz šim vismodernākais publiski pieejamais lielo valodu modelis. Izstrādāts OpenAI un izdots 2023. gada martā, GPT-4 ir jaunākā iterācija ģeneratīvo iepriekš apmācītu transformatoru sērijā kas sākās 2018. Ar savām milzīgajām iespējām GPT-4 ir kļuvis par vienu no visplašāk izmantotajiem un populārākajiem lielo valodu modeļiem pasaulē.
Lai gan tas nav oficiāli apstiprināts, avoti lēš, ka GPT-4 var saturēt satriecošus 1,76 triljonus parametru, apmēram desmit reizes vairāk nekā tā priekšgājējs GPT-3.5 un piecas reizes lielāks par Google flagmani PaLM 2. Šis lielais mērogs nodrošina GPT-4 multimodālās iespējas, ļaujot tam apstrādāt gan tekstu, gan attēlus kā ievadi. Rezultātā GPT-4 papildus tekstam var interpretēt un aprakstīt vizuālu informāciju, piemēram, diagrammas un ekrānuzņēmumus. Tā multimodālais raksturs nodrošina cilvēkiem līdzīgāku izpratni par reālās pasaules datiem.
Zinātniskajos etalonos GPT-4 dažādos testos ievērojami pārspēj citus mūsdienu modeļus. Lai gan etaloni vien pilnībā neliecina par modeļa stiprajām pusēm, reālās lietošanas gadījumi ir parādījuši, ka GPT-4 ir izcili prasmīgs praktisku problēmu risināšanā intuitīvi. GPT-4 pašlaik tiek iekasēta maksa 20 USD mēnesī un pieejams, izmantojot ChatGPT Plus plānu.
2. Antropiskais Klods 2
Lai gan tas nav tik populārs kā GPT-4, Claude 2, ko izstrādājis Anthropic AI, var atbilst GPT-4 tehniskajiem kritērijiem un reālajai veiktspējai vairākās jomās. Dažos standartizētos testos, tostarp atsevišķos eksāmenos, Klods 2 pārspēj GPT-4. AI valodas modelim ir arī ievērojami labāks konteksta logs ar aptuveni 100 000 marķieru, salīdzinot ar GPT-4 8k un 32k marķieru modeļiem. Lai gan lielāks konteksta garums ne vienmēr nodrošina labāku veiktspēju, Claude 2 paplašinātā jauda nodrošina nepārprotamas priekšrocības, piemēram, visu 75 000 vārdu grāmatu sagremošanu analīzei.
Kopumā GPT-4 joprojām ir pārāks, taču mūsu iekšējās pārbaudes liecina, ka Claude 2 to pārspēj vairākos radošās rakstīšanas uzdevumos. Klods 2 arī pārspēj GPT-4 programmēšanas un matemātikas prasmēs, pamatojoties uz mūsu vērtējumiem, taču izceļas ar cilvēkiem līdzīgas, radošas atbildes. Kad mēs pamudinājām visus šajā sarakstā iekļautos modeļus uzrakstīt vai pārrakstīt radošu darbu, sešas reizes no desmit, mēs izvēlējāmies Kloda 2 rezultātu, lai tā dabiski izklausītos cilvēkiem līdzīgi rezultāti. Pašlaik Claude 2 ir pieejams bez maksas, izmantojot Claude AI tērzēšanas robotu. Ir arī 20 USD apmaksāts plāns piekļuvei papildu funkcijām.
Neskatoties uz to, ka tam ir mazāks finansiālais atbalsts nekā tādiem milžiem kā OpenAI un Microsoft, Anthropic Claude 2 AI modelis ir labāks par populārajiem GPT modeļiem un Google PaLM sēriju. AI ar mazākiem resursiem Claude 2 ir iespaidīgi konkurētspējīgs. Ja būs spiests likt likmes uz to, kuram esošajam modelim ir vislielākās izredzes tuvākajā nākotnē konkurēt ar GPT, Klods 2 šķiet drošākā likme. Lai gan Claude 2 ir pārspēts finansējuma ziņā, tā uzlabotās iespējas liek domāt, ka tas var sasniegt pat labi finansēti behemoti (lai gan ir vērts atzīmēt, ka Google ir sniedzis vairākus lielus ieguldījumus Antropisks). Modelis pārspēj savu svara kategoriju un ir daudzsološs kā jauns izaicinājums.
3. OpenAI GPT-3.5
Lai gan to aizēno GPT-4 izlaišana, GPT-3.5 un tā 175 miljardu parametru nevajadzētu novērtēt par zemu. Pateicoties iteratīvai precizēšanai un jauninājumiem, kas vērsti uz veiktspēju, precizitāti un drošību, GPT-3.5 ir tālu no sākotnējā GPT-3 modeļa. Lai gan tai trūkst GPT-4 multimodālo iespēju un tas atpaliek konteksta garumā un parametru skaitā, GPT-3.5 joprojām ir ļoti spējīgs, un GPT-4 ir vienīgais modelis, kas spēj pārspēt savu vispusīgo veiktspēju izlēmīgi.
Neskatoties uz to, ka GPT-3.5 ir otrā līmeņa modelis GPT saimē, tas var noturēties un pat pārspēt Google un Meta vadošos modeļus vairākos etalonos. Matemātisko un programmēšanas prasmju paralēlajos testos pret Google PaLM 2 atšķirības nebija krasas, un dažos gadījumos GPT-3.5 pat bija nelielas priekšrocības. Radošāki uzdevumi, piemēram, humors un stāstījuma rakstīšana, GPT-3.5 izlēma virzījās uz priekšu.
Tātad, lai gan GPT-4 iezīmē jaunu pavērsienu mākslīgā intelekta jomā, GPT-3.5 joprojām ir iespaidīgi jaudīgs modelis, kas spēj konkurēt un dažkārt pārspēt pat vismodernākās alternatīvas. Tā nepārtrauktā uzlabošana nodrošina, ka tas paliek aktuāls pat kopā ar spilgtākiem nākamās paaudzes modeļiem.
4. Google PaLM 2
Novērtējot AI modeļa iespējas, pārbaudītā formula ir izlasīt tehnisko ziņojumu un pārbaudiet etalonu rezultātus, bet ņemiet vērā visu, ko esat iemācījušies, un pārbaudiet modeli sevi. Lai cik tas nešķistu pretrunīgi, dažu AI modeļu etalonu rezultāti ne vienmēr atbilst reālajai veiktspējai. Uz papīra Google PaLM 2 bija paredzēts GPT-4 iznīcinātājam, un oficiālie testa rezultāti liecina, ka tas atbilst GPT-4 dažos etalonos. Tomēr ikdienas lietošanā paveras cita aina.
Loģiskajā spriešanā, matemātikā un radošumā PaLM 2 atpaliek no GPT-4. Tas arī atpaliek no Anthropic's Claude daudzos radošās rakstīšanas uzdevumos. Tomēr, lai gan tas neatbilst GPT-4 slepkavas prasībām, Google PaLM 2 joprojām ir spēcīgs valodas modelis pati par sevi, ar milzīgām iespējām. Liela daļa negatīvo noskaņojumu par to rada salīdzinājumi ar tādiem modeļiem kā GPT-4, nevis tieši slikta veiktspēja.
Ar 340 miljardiem parametru PaLM 2 ir viens no pasaules lielākajiem modeļiem. Tas īpaši izceļas ar daudzvalodu uzdevumiem, un tam ir spēcīgas matemātikas un programmēšanas spējas. Lai gan PaLM 2 nav vislabākais, tas ir diezgan efektīvs arī radošos uzdevumos, piemēram, rakstīšanā. Tātad, lai gan etaloni iezīmēja optimistisku ainu, kas pilnībā nepiepildījās, PaLM 2 joprojām demonstrē iespaidīgas AI prasmes, pat ja nepārspēj visus konkurentus.
5. TII Falcon-180B
Ja vien neesat sekojis AI valodu modeļu izlaišanas straujajam tempam, jūs, visticamāk, nekad neesat saskāries ar Falcon-180B. AAE Tehnoloģiju inovāciju institūta izstrādātais 180 miljardu parametrs Falcon-180 ir viens no jaudīgākajiem. atvērtā pirmkoda valodu modeļi, pat ja tiem trūkst GPT modeļu nosaukumu atpazīšanas vai plaši izplatīta Meta Lama 2. Taču nekļūdieties — Falcon-180B var izturēt līdz kājām ar labākajiem savā klasē.
Etalona rezultāti atklāj, ka Falcon-180B pārspēj lielāko daļu atvērtā pirmkoda modeļu un konkurē ar tādiem komerciāliem žognautiem kā PaLM 2 un GPT-3.5. Pārbaudot matemātikas, kodēšanas, argumentācijas un radošās rakstīšanas uzdevumus, tas pat pārspēja GPT-3.5 un PaLM 2. reizes. Ja klasificējam GPT-4, GPT-3.5 un Falcon-180B, mēs vairākos lietošanas gadījumos Falcon-180B novietosim tieši starp GPT-4 un GPT-3.5, ņemot vērā tā stiprās puses.
Lai gan mēs nevaram droši teikt, ka kopējā veiktspēja ir labāka par GPT-3.5, tas liecina par sevi. Lai gan šis modelis ir neskaidrs, tas ir pelnījis uzmanību, jo tas atbilst vai pārsniedz labāk zināmu alternatīvu iespējas. Jūs varat izmēģināt Falcon-180B modeli Apskāva seja (atvērtā koda LLM platforma).
Llama 2, Meta AI 70 miljardu parametru lielais valodas modelis, ir balstīts uz tā priekšgājēju Llama 1. Lai gan Llama 2 ir mazāks par vadošajiem modeļiem, tas ievērojami pārspēj lielāko daļu publiski pieejamo atvērtā pirmkoda LLM etalonu un reālās pasaules lietojuma ziņā. Izņēmums būtu Falcon-180B.
Mēs pārbaudījām Llama 2 pret GPT-4, GPT-3.5, Claude 2 un PaLM 2, lai novērtētu tā iespējas. Nav pārsteidzoši, ka GPT-4 pārspēja Llama 2 gandrīz visos parametros. Tomēr Llama 2 vairākos novērtējumos turējās pretī GPT-3.5 un PaLM 2. Lai gan būtu neprecīzi apgalvot, ka Llama 2 ir pārāka par PaLM 2, Llama 2 atrisināja daudzas problēmas, kas apgrūtināja PaLM 2, tostarp kodēšanas uzdevumus. Klods 2 un GPT-3.5 dažās jomās pārspēja Llama 2, taču bija ievērojami labāki tikai ierobežotā skaitā uzdevumu.
Tātad, nepārsniedzot lielāko patentēto modeļu iespējas, atvērtā koda Llama 2 sitieni pārsniedz savu svara klasi. Atklāti pieejamam modelim tas demonstrē iespaidīgu veiktspēju, atsevišķos novērtējumos konkurējot ar tādiem mākslīgā intelekta milžiem kā PaLM 2. Llama 2 sniedz ieskatu atvērtā pirmkoda valodu modeļu nākotnes potenciālā.
Veiktspējas atšķirība starp AI modeļiem samazinās
Lai gan mākslīgā intelekta ainava attīstās straujā tempā, OpenAI GPT-4 joprojām ir komplekta līderis. Tomēr, lai gan GPT-4 joprojām ir nepārspējams mēroga un veiktspējas ziņā, tādi modeļi kā Claude 2 parāda, ka ar pietiekamu prasmi mazāki modeļi var konkurēt noteiktās jomās. Google PaLM 2, neskatoties uz dažām augstām cerībām, joprojām demonstrē pamatīgas iespējas. Un Falcon-180B pierāda, ka atvērtā pirmkoda iniciatīvas var stāvēt plecu pie pleca ar nozares titāniem, ja tiek piešķirti pietiekami resursi.