Pirms vairāk nekā 70 gadiem, kad mākslīgais intelekts tika konceptualizēts, Alans Tjūrings publicēja rakstu, kurā aprakstīts, kā to identificēt. Vēlāk to sauca par Tjūringa testu, un tas ir izmantots gadu desmitiem, lai atšķirtu cilvēku no AI.

Tomēr, ieviešot uzlabotus AI tērzēšanas robotus, piemēram, ChatGPT un Google Bard, kļūst grūtāk noteikt, vai runājat ar AI. Tas rada jautājumu; vai Tjūringa tests ir novecojis? Un, ja tā, kādas ir alternatīvas?

Vai Tjūringa tests ir novecojis?

Attēla kredīts: Jesus Sanz/Shutterstock

Lai noteiktu, vai Tjūringa tests ir novecojis, vispirms tas ir jādara saprast, kā tas darbojas. Lai mākslīgais intelekts izturētu Tjūringa testu, tam ir jāpārliecina cilvēka pratinātājs, ka tas ir cilvēks. Taču ir āķis — AI tiek novērtēts kopā ar cilvēku, un tam ir jāreaģē, izmantojot tekstu.

Padomājiet par to šādi; ja jūs esat pratinātājs un uzdodat jautājumus diviem dalībniekiem tiešsaistē, izmantojot tekstu, bet viens no tiem ir AI modelis — vai jūs viņus atšķirtu pēc piecām minūtēm? Ņemiet vērā, ka Tjūringa testa mērķis nav identificēt AI modeli, pamatojoties uz pareizajām atbildēm, bet gan novērtēt, vai AI spēj domāt vai uzvesties kā cilvēks.

instagram viewer

Problēma ar Tjūringa testa pieeju, kas nosaka tikai cilvēkam līdzīgas atbildes, ir tāda, ka tajā netiek ņemti vērā citi faktori. Piemēram, AI modeļa intelekts vai pratinātāja zināšanas. Turklāt Tjūringa tests attiecas tikai uz tekstu, un kļūst grūtāk identificēt AI, kas ģenerē cilvēka balsi vai dziļi viltoti videoklipi, kas atdarina cilvēka uzvedību.

Tomēr pašreizējie AI modeļi, piemēram, ChatGPT-4 un Google Bard, vēl nav sasnieguši tādu līmeni, lai varētu pastāvīgi izturēt Tjūringa testu. Patiesībā, ja esat iepazinies ar AI, varat vietas AI ģenerēts teksts.

5 labākās Tjūringa testa alternatīvas

Tas ir iespējams, ka nākotnes AI modeļi, piemēram, ChatGPT-5 varētu nokārtot Tjūringa testu. Ja tas notiks, mums būs nepieciešami dažādi testi kopā ar Tjūringa testu, lai noteiktu, vai mēs runājam ar AI vai cilvēku. Šeit ir labākās Tjūringa testa alternatīvas:

1. Markusa tests

Slavenais kognitīvais zinātnieks un AI pētnieks Gerijs Markuss ierosināja alternatīvu Tjūringa testam, kas tika publicēts Ņujorkietis lai noteiktu mākslīgā intelekta kognitīvās spējas. Pārbaude ir vienkārša — jūs vērtējat AI modeli, pamatojoties uz tā spēju skatīties un saprast YouTube videoklipus un TV pārraides bez subtitriem vai teksta. Lai mākslīgais intelekts izturētu Markusa testu, tam, skatoties videoklipus, ir jāsaprot sarkasms, humors, ironija un sižets un tas jāizskaidro kā cilvēkam.

Pašlaik, GPT-4 var aprakstīt attēlus, taču līdz šim nav AI modeļa, kas varētu uztvert videoklipus kā cilvēks. Pašbraucošie transportlīdzekļi ir tuvu, taču tie nav pilnīgi autonomi un tiem ir nepieciešami sensori, jo tie nevar saprast visu savā apkārtējā vidē.

2. Vizuālais Tjūringa tests

Saskaņā ar pētījumu, kas publicēts PNAS, vizuālo Tjūringa testu var izmantot, lai noteiktu, vai jūs runājat ar cilvēku vai AI, izmantojot attēlu anketas. Tas darbojas kā Tjūringa tests, taču tā vietā, lai atbildētu uz jautājumiem, izmantojot tekstus, dalībniekiem tiek rādīti attēli, un viņiem tiek sagaidīts, ka viņi atbildēs uz vienkāršiem jautājumiem, domājot kā cilvēks. Tomēr vizuālais Tjūringa tests atšķiras no CAPTCHA tā kā visas atbildes ir pareizas, taču, lai izturētu testu, AI ir jāapstrādā attēli līdzīgi kā cilvēkam.

Turklāt, ja mākslīgajam intelektam un cilvēkam tiek parādīti vairāki attēli blakus un lūgts identificēt reālistiskus attēlus, cilvēkam būs kognitīvās spējas, lai izturētu pārbaudi. Tas ir tāpēc, ka AI modeļiem ir grūti atšķirt attēlus, kas neizskatās kā uzņemti reālajā pasaulē. Patiesībā tas ir iemesls, kāpēc jūs varat identificēt AI radītos attēlus izmantojot anomālijas, kurām nav jēgas.

3. Lovelace 2.0 tests

Teoriju, ka dators nevar radīt oriģinālas idejas ārpus tā, kam tas bija ieprogrammēts, pirmo reizi konceptualizēja Ada Lavleisa pirms Tjūringa testa. Tomēr Alans Tjūrings iebilda pret šo teoriju, apgalvojot, ka AI joprojām var pārsteigt cilvēkus. Tikai 2001. gadā Lavleisa testa vadlīnijas tika izstrādātas, lai atšķirtu AI no cilvēka, un saskaņā ar kurzveibliotēka noteikumi vēlāk tika pārskatīti 2014. gadā.

Lai mākslīgais intelekts izturētu Lovelace testu, tam ir jāpierāda, ka tas spēj radīt oriģinālas idejas, kas pārsniedz tā apmācību. Pašreizējie AI modeļi, piemēram, GPT-4, nespēj radīt jaunus izgudrojumus, kas pārsniedz mūsu esošās zināšanas. tomēr mākslīgais vispārējais intelekts var sasniegt šīs spējas un nokārtot Lovelace testu.

4. Reversais Tjūringa tests

Kā būtu ar Tjūringa testu, bet tas tiek veikts otrādi? Tā vietā, lai mēģinātu noskaidrot, vai jūs runājat ar cilvēku, mērķis ir apgrieztais Tjūringa tests ir piemānīt AI, liekot viņam noticēt, ka esat AI. Tomēr jums ir nepieciešams arī cits AI modelis, lai atbildētu uz tiem pašiem jautājumiem, izmantojot tekstu.

Piemēram, ja ChatGPT-4 ir jautātājs, varat reģistrēt Google Bard un citu cilvēku kā dalībniekus. Ja mākslīgā intelekta modelis var pareizi identificēt dalībnieku, pamatojoties uz atbildēm, tas ir izturējis pārbaudi.

Reversā Tjūringa testa mīnuss ir tas, ka tas nav uzticams, īpaši ņemot vērā to dažreiz AI nevar atšķirt AI radīto un cilvēka rakstīts saturs.

5. AI klasifikācijas sistēma

Saskaņā ar AI klasifikācijas sistēmu, ko izstrādājusi Kriss Sāds, Tjūringa tests ir tikai viena novērtēšanas metode, lai uzzinātu, vai runājat ar AI. Īsāk sakot, mākslīgā intelekta klasifikācijas sistēma ir balstīta uz daudzveidīga intelekta teoriju, kas prasa, lai cilvēka intelekts atbilstu vismaz astoņiem dažādiem kritērijiem. ietver: muzikālo ritmu, loģiski-matemātisko inteliģenci, vizuālo identifikāciju, emocionālo inteliģenci, pašreflektīvo inteliģenci, eksistenciālās domāšanas spējas un ķermeni kustība.

Tā kā mākslīgais intelekts tiek novērtēts pēc astoņiem dažādiem parametriem, maz ticams, ka cilvēkam tas atbilstu pat tad, ja noteiktos etalonos tas darbojas labāk nekā vidēji. Piemēram, ChatGPT var atrisināt matemātikas uzdevumus, aprakstiet attēlus un sarunājieties dabiskā valodā, piemēram, cilvēku valodā, taču tas neatbilstu citām AI klasifikācijas sistēmā definētajām kategorijām.

Tjūringa tests nav pārliecinošs

Tjūringa tests bija vairāk domāts kā domu eksperiments, nevis pārliecinošs tests, lai atšķirtu cilvēkus no AI. Kad tas sākotnēji tika ierosināts, tas bija galvenais etalons mašīnu inteliģences mērīšanai.

Tomēr, tā kā nesen tika izstrādāti mākslīgā intelekta modeļi ar interaktīvām runas, vizuālajām un dzirdes iespējām, Tjūringa tests ir neefektīvs, jo tas attiecas tikai uz teksta sarunām. Visefektīvākais risinājums būtu ieviest Tjūringa testa alternatīvas, kas vēl vairāk atšķir AI modeļus no cilvēkiem.