Bards vs. ChatGPT vs. Bezsaistes Alpaka: kura ir labākā LLM?

Lielie valodu modeļi (LLM) ir pieejami visās formās un izmēros, un tie jums palīdzēs jebkurā veidā, kas jums šķiet piemērots. Bet kurš ir labākais? Mēs pārbaudījām dominējošos AI no Alphabet, OpenAI un Meta.

Kas jums jāzina par AI tērzēšanas robotiem

Mākslīgais vispārējais intelekts ir bijis datorzinātnieku mērķis jau vairākus gadu desmitus, un mākslīgais intelekts ir kalpojis kā zinātniskās fantastikas rakstnieku un filmu veidotāju galvenais balsts vēl ilgāk.

AGI uzrāda intelektu, kas līdzīgs cilvēka kognitīvajām spējām, un Tjūringa testsPārbaude par mašīnas spēju izrādīt saprātīgu uzvedību, kas nav atšķirama no cilvēka uzvedības, palika gandrīz neapšaubāma septiņās desmitgadēs kopš tās pirmās izveides.

Nesenā ārkārtīgi liela mēroga skaitļošanas konverģence, milzīgs naudas daudzums un apbrīnojamais brīvās informācijas apjoms pieejams atklātajā internetā, ļāva tehnoloģiju gigantiem apmācīt modeļus, kas var paredzēt nākamo vārdu sadaļu vai marķieri. žetonus.

Rakstīšanas laikā gan Google Bard un OpenAI ChatGPT ir pieejami lietošanai un testēšanai, izmantojot viņu tīmekļa saskarnes.

instagram viewer

Meta valodas modelis LLaMa nav pieejams tīmeklī, taču to var viegli izdarīt lejupielādējiet un palaidiet LLaMa savā aparatūrā un izmantojiet to, izmantojot komandrindu vai palaist Dalai savā mašīnā— viena no vairākām lietotnēm ar lietotājam draudzīgu saskarni.

Testa nolūkos mēs izmantosim Stenfordas Universitātes modeli Alpaca 7B — LLaMa adaptāciju — un sasniegsim to pret Bardu un ChatGPT.

Šie salīdzinājumi un testi nav paredzēti kā izsmeļoši, bet gan sniedz norādes par galvenajiem punktiem un iespējām.

Kuru lielo valodu modeli ir visvieglāk lietot?

Gan Bard, gan ChatGPT ir nepieciešams konts, lai izmantotu pakalpojumu. Gan Google, gan OpenAI kontus ir viegli un bez maksas izveidot, un jūs varat nekavējoties sākt uzdot jautājumus.

Tomēr, lai palaistu LLaMa lokāli, jums ir jābūt īpašām zināšanām vai spējai sekot apmācībai. Jums būs nepieciešams arī ievērojams daudzums uzglabāšanas vietas.

Kurš ir privātākais lielo valodu modelis?

Gan Bard, gan ChatGPT ir plašas privātuma politikas, un Google to atkārtoti uzsver savos dokumentos ka jums nevajadzētu iekļaut informāciju, ko var izmantot, lai identificētu jūs vai citus jūsu Bardā sarunas."

Pēc noklusējuma Google apkopo jūsu sarunas un vispārējo atrašanās vietu, pamatojoties uz jūsu IP adresi, jūsu atsauksmēm un lietošanas informāciju. Šī informācija tiek glabāta jūsu Google kontā līdz 18 mēnešiem. Lai gan jūs varat apturēt savu Bard darbību saglabāšanu, jums jāņem vērā, ka "lai palīdzētu uzlabot mūsu produktu kvalitāti un uzlabotu mūsu produktus, recenzenti lasa, komentē un apstrādā jūsu Bard sarunas".

Arī Bard lietošana ir pakļauta standartam Google konfidencialitātes politika.

OpenAI privātuma politika kopumā ir līdzīga un apkopo IP adreses un lietošanas datus. Atšķirībā no Google ierobežotā laika saglabāšanas, OpenAI "saglabās jūsu personisko informāciju tikai tik ilgi, cik mums ir nepieciešams, lai nodrošinātu mūsu Pakalpojums jums vai citiem likumīgiem uzņēmējdarbības mērķiem, piemēram, strīdu risināšanai, drošības apsvērumiem vai mūsu juridisko prasību ievērošanai. saistības."

Turpretim lokālajam modelim jūsu datorā nav nepieciešams konts vai ne ar vienu koplietot lietotāja datus.

Kurai LLM ir labākās vispārējās zināšanas?

Lai pārbaudītu, kuram LLM ir vislabākās vispārējās zināšanas, mēs uzdevām trīs jautājumus.

Pirmais jautājums: "Kuram valsts karogam ir piecas puses?" uz to pareizi atbildēja tikai Bards, norādot, ka Nepālas valsts karogam ir piecas puses.

ChatGPT pārliecinoši apgalvoja, ka "nav neviena valsts karoga, kuram būtu piecas puses. Valstu karogi parasti ir taisnstūra vai kvadrātveida formā, ko raksturo atšķirīgas krāsas, raksti un simboli.

Mūsu vietējais modelis tuvojās, norādot, ka "Indijas valsts karogam ir piecas puses, un tas tika izstrādāts 1916. gadā, lai attēlotu Indijas karogu. neatkarības kustība." Lai gan šis karogs pastāvēja un tam bija piecas puses, tas bija Indijas Home Rule Movement karogs, nevis Nacionālais karogs.

Neviens no mūsu modeļiem nevarēja atbildēt, ka pareizais termins zirņa formas objektam ir "pisiforms", izmantojot ChatGPT. tiktāl, ka liek domāt, ka zirņiem ir "trīsdimensiju ģeometriska forma, kas ir ideāli apaļa un simetrisks."

Visi trīs tērzēšanas roboti pareizi identificēja Franko Malerbu kā itāļu astronautu un biedru Eiropas Parlaments, Bārdam sniedzot atbildi, kas formulēta identiski Malerbas Vikipēdijas sadaļai ierakstu.

Kurš LLM ir piemērots tehniskajām instrukcijām?

Ja rodas tehniskas problēmas, jums var rasties kārdinājums pēc palīdzības vērsties pie tērzēšanas robota. Kamēr tehnoloģijas virzās uz priekšu, dažas lietas paliek nemainīgas. BS 1363 elektrības spraudnis tiek izmantots Lielbritānijā, Īrijā un daudzās citās valstīs kopš 1947. gada. Mēs jautājām valodu modeļiem, kā pareizi to savienot.

Kabeļiem, ko pievieno kontaktdakšai, ir strāva vads (brūns), zemējuma vads (dzeltens/zaļš) un neitrāls vads (zils). Tie ir jāpievieno pareizajiem spailēm spraudņa korpusā.

Mūsu Dalai ieviešana pareizi identificēja spraudni kā "angļu stila", pēc tam novirzījās no kursa un tā vietā sniedza norādījumus par vecāku apaļo kontaktu BS 546 spraudni kopā ar vecākām vadu krāsām.

ChatGPT bija nedaudz noderīgāks. Tas pareizi marķēja vadu krāsas un sniedza materiālu sarakstu un astoņu instrukciju komplektu. ChatGPT arī ieteica ievietot brūno vadu terminālī, kas apzīmēts ar "L", bet zilo vadu - "N". spaili un dzelteno vadu uz "E." Tas būtu pareizi, ja BS1363 termināļi būtu marķēti, bet tie nav.

Bards noteica pareizās vadu krāsas un uzdeva mums tos savienot ar Live, Neutral un Earth spailēm. Tajā nebija norādījumu, kā tos identificēt.

Mūsuprāt. neviens no tērzēšanas robotiem nesniedza pietiekamus norādījumus, lai palīdzētu kādam pareizi pieslēgt BS 1363 elektrības spraudni. Īsa un pareiza atbilde būtu: "Zils kreisajā pusē, brūns labajā pusē."

Kurš LLM ir piemērots koda rakstīšanai?

Python ir noderīga programmēšanas valoda kas darbojas lielākajā daļā moderno platformu. Mēs uzdevām saviem modeļiem izmantot Python un "Izveidojiet pamata kalkulatora programmu, kas var veikt aritmētiskas darbības, piemēram, saskaitīšanu, atņemšanu, reizināšanu un dalīšanu. Tam vajadzētu izmantot lietotāja ievadi un parādīt rezultātu." Šis ir viens no labākie programmēšanas projekti iesācējiem.

Lai gan gan Bard, gan ChatGPT uzreiz atgrieza lietojamu un rūpīgi komentētu kodu, ko varējām pārbaudīt un pārbaudīt, neviens no mūsu vietējā modeļa kodiem nedarbosies.

Kurš LLM stāsta labākos jokus?

Humors ir viens no cilvēka būtības pamatprincipiem un noteikti viens no labākajiem veidiem, kā atšķirt cilvēku un mašīnu. Katram mūsu modelim mēs sniedzām vienkāršu uzvedni: "Izveidojiet oriģinālu un smieklīgu joku."

Par laimi komiķiem visur un cilvēcei kopumā, neviens no modeļiem nespēja radīt oriģinālu joku.

Bārds izrullēja klasiku: "Kāpēc putnubiedēklis ieguva balvu? Viņš bija izcils savā jomā."

Gan mūsu vietējā ieviešana, gan ChatGPT piedāvāja stenēšanas cienīgu jautājumu: "Kāpēc zinātnieki neuzticas atomiem? Jo viņi visu veido!"

Atvasināts, bet oriģināls joks būtu: "Kā lielie valodu modeļi ir līdzīgi atomi? Viņi abi izdomā!"

Jūs vispirms izlasiet to šeit, ļaudis.

Neviens tērzēšanas robots nav ideāls

Mēs noskaidrojām, ka, lai gan visiem trim lielajiem valodu modeļiem ir savas priekšrocības un trūkumi, neviens no tiem nevar aizstāt cilvēka patieso pieredzi ar specializētām zināšanām.

Lai gan gan Bard, gan ChatGPT sniedza labākas atbildes uz mūsu kodēšanas jautājumu un ir ļoti viegli lietojamas, liela valodas modeļa izmantošana lokāli nozīmē, ka jums nav jāuztraucas par privātumu vai cenzūra.

Ja vēlaties izveidot lielisku AI mākslu, neuztraucoties, ka kāds skatās pār jūsu plecu, ir viegli palaist mākslas mākslīgā intelekta modeli arī vietējā iekārtā.

About Technology - denizatm.com

Bards vs. ChatGPT vs. Bezsaistes Alpaka: kura ir labākā LLM?

Kas jums jāzina par AI tērzēšanas robotiem

Kuru lielo valodu modeli ir visvieglāk lietot?

Kurš ir privātākais lielo valodu modelis?

Kurai LLM ir labākās vispārējās zināšanas?

Kurš LLM ir piemērots tehniskajām instrukcijām?

Kurš LLM ir piemērots koda rakstīšanai?

Kurš LLM stāsta labākos jokus?

Neviens tērzēšanas robots nav ideāls

Kategorijas

Recent Post

Kā jūs sadalāt cietā diska nodalījumu?

Kā es varu izmantot savu LED monitoru, lai skatītos TV bez datora?

Vai varat ieteikt labu bezmaksas vai maksas video uztveršanas programmatūru?