Lai gan ChatGPT ir viens no populārākajiem AI tērzēšanas robotiem, tas, iespējams, vairs nav labākais. Claude AI piedāvā dažas GPT pārspējas funkcijas. Bet kas ir labāks?
Kopš izlaišanas 2022. gada novembrī ChatGPT joprojām ir dominējošais spēks AI tērzēšanas robotu telpā. Neskatoties uz vairāku AI uzņēmumu tālejošiem centieniem, neviens īsti nav spējis izveidot tērzēšanas robotu, kas patiesi izaicina ChatGPT vispārējā atbildes kvalitātē. Google Bards? Microsoft Bing AI? Nē nav īsti.
Tomēr Claude AI, tērzēšanas robots, ko izveidojis AI starta uzņēmums Anthropic, parāda tērzēšanas robota īpašības, kas var gāzt ChatGPT. Ievērojams skaits lietotāju jau saka, ka Klods ir labāks risinājums. Bet vai tas tā ir? Apskatīsim abus tērzēšanas robotus.
ChatGPT vs. Klods AI: Veselais saprāts un loģisks spriešana
Strādājot ar AI tērzēšanas robotiem, pastāv intriģējošs kontrasts. No vienas puses, viņi var veikt sarežģītus uzdevumus, kuru risināšanai cilvēki var strādāt vairākas dienas. No otras puses, viņi dažreiz cīnās ar elementārām problēmām, kas prasa tikai mazliet veselā saprāta vai loģisku argumentāciju. Tāpēc mēs pārbaudījām gan ChatGPT, gan Claude AI, lai noskaidrotu, kurš AI tērzēšanas robots ir labāks veselā saprāta un loģiskās domāšanas uzdevumos.
ChatGPT sadalīja problēmu daļās un atrisināja to pirmajā mēģinājumā. Arī Klods AI to izdarīja un arī atrisināja problēmu, taču ar citu pieeju.
Pirmajā uzdevumā abi tērzēšanas roboti spēja atrisināt problēmu. Tātad, mēs pārgājām pie cita veida problēmas. Mēs abiem tērzēšanas robotiem uzdevām atbildēt uz viltīgu jautājumu.
ChatGPT varēja nekavējoties pamanīt viltību — jūs nevarat apglabāt izdzīvojušos, jo viņi nav miruši. No otras puses, Klods mākslīgais intelekts, šķiet, saprata, ka tas ir viltīgs jautājums, taču nespēja pamanīt visparastāko problēmu, ka izdzīvojušos neapglabāt.
Tā vietā tā pārmērīgi analizēja jautājumu un nonāca pie secinājuma, ka "nebūtu izdzīvojušo, ko apglabāt", jo avārija no Marsa uz Zemi būtu nāvējoša. Tā nav atbilde, ko mēs gaidījām, bet, ja paskatās uz lietām no cita leņķa, tajā ir kāda patiesība.
Šajā uzdevumā mēs to nododam ChatGPT, taču nevaram pilnībā izslēgt Kloda AI pieeju. Lai veiktu mūsu pēdējo uzdevumu par šo metriku, mēs abiem tērzēšanas robotiem pajautājām, cik ābolu paliks uz ābeles pēc attiecīgi piecas un 10 dienas, ja mēs sākām ar 10 āboliem, un pieci no tiem tika sagriezti, vēl uz koka. ChatGPT teica, ka joprojām būs atlikuši 10 āboli.
Savukārt Klods AI sniedza veselā saprāta atbildi, atzīstot, ka pieci sagrieztie āboli, visticamāk, sapūt.
Klods AI skaidri to dabūja. Mēs izmēģinājām vēl dažas sarežģītas problēmas, un abiem tērzēšanas robotiem bija diezgan daudz panākumu un neveiksmju, risinot tās. Ņemot vērā mūsu novēroto rezultātu, varētu būt godīgi teikt, ka, lai gan ChatGPT ir priekšrocības, abi tērzēšanas roboti nav pārāk tālu viens no otra veselā saprāta un loģiskās spriešanas spēju ziņā.
ChatGPT vs. Klods AI: matemātikas prasmes
Pat ja jūs nekad neplānojat izmantot ChatGPT vai Claude AI, lai atrisinātu Algebra mājasdarbu, viņu matemātiskajām spējām ir tālejošas sekas. AI tērzēšanas robotiem matemātika ir atslēga reālās pasaules loģikas izpratnei, kļūdainas domāšanas identificēšanai un kļūdu atzīšanai.
Būtībā matemātikas prasme ir mākslīgā intelekta galvenais rādītājs. Tātad starp ChatGPT un Claude AI, kurš tērzēšanas robots ir labāks matemātikā? Mēs abiem tērzēšanas robotiem uzdevām atrisināt sarežģītu matemātikas produktivitātes problēmu. Mēs sākām ar Claude AI, un tērzēšanas robots atrisināja problēmu.
Arī ChatGPT atrisināja problēmu.
Turpinot, mēs lūdzām atrisināt abus tērzēšanas robotus 8/a-1 = 20/3a-1, diezgan vienkārša matemātikas problēma ar pārsteidzoši augstu neveiksmju līmeni starp AI tērzēšanas robotiem. ChatGPT spēja to atrisināt, sniedzot pareizu atbildi uz -3 pirmajā mēģinājumā.
Claude AI neizdevās pirmajā mēģinājumā, bet, kad mēs pamudinājām to atrisināt problēmu soli pa solim (kas liek tam pārdomāt katru loģikas soli), tas spēja to uzlauzt.
Mēs izmēģinājām vēl dažus matemātikas uzdevumus. Lai gan dažos gadījumos abiem tērzēšanas robotiem tas izdevās pirmajā mēģinājumā, vairākos gadījumos Klodam AI vajadzēja otro vai trešo mēģinājumu, lai sniegtu pareizo atbildi. Attiecībā uz matemātikas prasmēm mēs piešķirsim kroni ChatGPT.
ChatGPT vs. Klods AI: radošums
Viens no Kloda AI lielākajiem ažiotāžas veidiem ir tā radošās spējas. Bet vai tas var atbilst ChatGPT radošumam? Vai arī tas varētu pārspēt ChatGPT? Lai pārbaudītu abus tērzēšanas robotus, mēs uzdevām tiem uzrakstīt tekstu repa dziesmai, kas atskaņo.
Mēs izvēlējāmies atskaņu repa testu, jo ar to cīnās daudzi valodu modeļi. Lielākajai daļai modeļu parasti neizdodas pareizi veidot atskaņas, kamēr dziesmu tekstiem nav jēgas. Lai lietas būtu interesantākas, repa dziesma būs par gurķu audzēšanu.
Tāpēc mēs lūdzām gan ChatGPT, gan Klodu AI "uzrakstīt atskaņu repu par gurķu audzēšanu kā lauksaimniekam un no tā kļūt par miljonāru." ChatGPT ieguva pirmo vietu, un, kā gaidīts, tas radīja aizraujošu dziesmu teksti.
Pēc tam mēs padevām to pašu uzvedni Klodam AI, un tas arī deva viņam godīgu iespēju.
Abi dziesmu teksti ir labi, taču šķiet, ka ChatGPT šeit ir priekšrocības. Tam bija labāka atskaņa, un mums bija vajadzīgais rezultāts pirmajā mēģinājumā. Mums bija jāmēģina trīs reizes, pirms Klods AI varēja radīt dziesmu tekstus, kas atskaņu. Mēs to nodosim ChatGPT.
Izmēģinājis vēl dažus radošus uzdevumus, Klods AI šķita izcils ar rakstīšanu saistītos uzdevumos un spēja uzrakstīt dabiskāku saturu, kā to darītu rakstnieks. Lai gan ChatGPT labāk pārvarēja sarežģītākus radošos uzdevumus, tas dažreiz nevarēja atbrīvoties no AI tērzēšanas robota sajūtas ģenerētajā tekstā. Mūsu spriedums? Gan ChatGPT, gan Claude AI paši par sevi ir radoši.
ChatGPT vs. Klods AI: kodēšanas prasmes
Tāpat kā matemātikas prasmes, arī kodēšanas prasmes ir vēl viens ļoti svarīgs rādītājs, lai novērtētu AI tērzēšanas robota spējas. Lai gan lielākā daļa lietotāju, iespējams, nekad kodēšanai izmantojiet tērzēšanas robotu, ir būtiska ietekme uz tērzēšanas robota spēju prasmīgi rakstīt un saprast kodu.
Lai gan tērzēšanas roboti pašlaik ir sarežģīti, tie nebūt nav tādi, kādi tie patiesībā varētu kļūt, ja un kad tie spētu prasmīgi rakstīt kodu. Lai AI tērzēšanas roboti patiešām kļūtu par spēcīgiem AI palīgiem, kas var darīt vairāk, nekā tikai ģenerēt tekstu, tiem ir jāspēj rakstīt kodu, kas pēc pieprasījuma atrisina problēmas. Mēs jau iepriekš apspriedām, cik svarīgas mūsu AI tērzēšanas robotiem ir kodēšanas prasmes ChatGPT koda tulka skaidrotājs.
Tas nozīmē, ka abiem tērzēšanas robotiem tika veikti divi kodēšanas uzdevumi. Mēs lūdzām ChatGPT un Claude AI uzrakstīt funkcionālo kodu uzdevumu saraksta lietotnei. Sākot ar ChatGPT, AI tērzēšanas robots jau pirmajā mēģinājumā spēja nodrošināt funkcionālu uzdevumu saraksta lietotni. Mēs nokopējām, ielīmējām un palaidām to pārlūkprogrammā, un tas darbojās lieliski bez kļūdām. Šeit ir izvade pārlūkprogrammā.
Pārejot uz Claude AI, tērzēšanas robots uzrakstīja skaidri saprotamu kodu. Struktūra un loģika šķita labi. Diemžēl, neskatoties uz atkārtotiem mēģinājumiem, Kloda AI joprojām trūka kritiskas loģikas, lai kods faktiski darbotos pārlūkprogrammā. Šī ir neveiksme.
Pēc tam, kad Claude AI neizdevās pēdējā pārbaudē, mēs izmēģinājām cita veida kodēšanas uzdevumu, kas vairāk bija saistīts ar koda analīzi un mazāk par jauna koda rakstīšanu. Mēs augšupielādējām piecus PHP failus, kas pārstāv visu vietnes aizmuguri, un jautājām gan Claude AI, gan ChatGPT kur mums būtu jārediģē visi augšupielādētie faili, lai nodrošinātu, ka mēs saņemam e-pastu, tiklīdz jauns lietotājs reģistrējas vietnē vietne.
Pārsteidzoši, ka ChatGPT, neskatoties uz šķietami izcilām kodēšanas prasmēm, neizdevās, neskatoties uz atkārtotiem mēģinājumiem. No otras puses, Klods AI spēja prasmīgi analizēt kodu, vienlaikus nosakot īstās vietas, kas bija jārediģē, lai sasniegtu vēlamos rezultātus.
Protams, tas nebija atsevišķs gadījums, mēs to atkārtojām ar vairākiem citiem koda failiem, taču ChatGPT paklupa un apstājās lielākajā daļā gadījumu, kamēr Claude AI turpināja sniegt iespaidīgus rezultātus. Kodēšanas prasmju ziņā uzvarētājs nav gluži vienkāršs.
ChatGPT nepārprotami ievērojami labāk raksta jaunu kodu un var pārvaldīt sarežģītu kodu ar iespaidīgu prasmi. Tomēr Claude AI ievērojami labāk analizē lielas kodu bāzes. Tātad, ja vēlaties rakstīt kodu kādai jaunai idejai, ChatGPT ir rīks, pie kura vērsties. Ja vēlaties analizēt vai izprast koda bāzi ar tūkstošiem rindu vairākos failos, mēs noteikti iesakām Claude AI.
Klods AI ir spēcīgs konkurents blokā
Claude AI pārstāv spēcīgu ChatGPT konkurenci — tādu, kas kādreiz var konkurēt ar ChatGPT un, iespējams, pārspēt to. Ņemot vērā, ka Claude ir salīdzinoši jauns AI modelis, ir apskaužami, ka tas var pārņemt ChatGPT tā, kā tas pašlaik ir. Claude AI parādīšanās un tā piedāvātā kvalitāte pierāda, ka konkurence saasinās.