Pēc ChatGPT palaišanas 2022. gada novembrī fenomenālais AI tērzēšanas robots ir kļuvis par vienu no uzticamākajiem rakstīšanas rīkiem internetā. Tas ir vienkārši lietojams; aprakstiet, kas jums jāraksta, un ChatGPT to izdrukā ekrānā dažu sekunžu laikā.

Tomēr laikmetā, kad mākslīgā intelekta radītais teksts tiek nodots kā cilvēka rakstīts un tiek izmantots, lai iegūtu negodīgas priekšrocības, AI satura identificēšana ir ļoti svarīga. Bet ChatGPT nevar precīzi noteikt AI saturu, pat savu darbu, bet kāpēc?

Vai ir atšķirība starp AI tekstu un cilvēka rakstīšanu?

Priekšnosacījums, lai ChatGPT varētu pamanīt savu rakstīto vai jebkuru mākslīgā intelekta ģenerētu tekstu, ir jābūt atšķirībai starp to un cilvēka rakstīto tekstu. Tātad, vai ir kāda būtiska atšķirība starp cilvēku rakstītu tekstu un AI radītu saturu? Ja noteikti ir tāds rīks kā ChatGPT, tas ir jāspēj saskatīt.

Mēs uzrakstījām īsu stāstu bez jebkāda AI rīka ievades un pēc tam jautājām ChatGPT, vai stāsts ir AI rakstīts saturs. ChatGPT pārliecinoši atzīmēja to kā AI ģenerētu tekstu.

instagram viewer

Pēc tam mēs lūdzām ChatGPT ģenerēt stāstu, un tajā pašā tērzēšanas pavedienā mēs kopējām un ielīmējām ģenerēto tekstu un jautājām ChatGPT, vai teksts ir AI izveidots. ChatGPT atbilde? Pārliecināts "nē".

ChatGPT abos gadījumos neizdevās identificēt cilvēka rakstītu vai mākslīgā intelekta ģenerētu tekstu. Tātad, kāpēc ChatGPT nevar noteikt savu tekstu? Vai tas nozīmē, ka nav atšķirības starp AI un cilvēka tekstu?

Nu ir. Mēs varētu uzrakstīt veselu grāmatu par atšķirību starp abiem, taču tam nebūs lielas nozīmes. Tātad, ja pastāv atšķirības, kāpēc ChatGPT vai kāds cits AI rīks nespēj identificēt šīs atšķirības un precīzi norādīt AI ģenerētu tekstu no cilvēka rakstīta? Atbilde slēpjas kā darbojas ChatGPT un kā tas ģenerē tekstu.

Kā ChatGPT ģenerē tekstu

Kad jūs lūdzat ChatGPT ģenerēt tekstu, tas mēģina atdarināt cilvēka rakstīšanas procesu. Pirmkārt, ChatGPT modelis — ģeneratīvais iepriekš apmācīts transformators (GPT) — ir apmācīts, izmantojot lielu cilvēku teksta korpusu. Apmācības laikā modelim tika ievadīts viss, sākot no e-pastiem, rakstiem par veselību, tehnoloģijām, vidusskolas esejām un gandrīz jebkuram tekstam, ko varat atrast tiešsaistē. Tātad ChatGPT saprot, kā katrs no šiem tekstu veidiem ir jāraksta.

Ja lūdzat ChatGPT uzrakstīt e-pastu savam priekšniekam, tas zina, kā šāda veida e-pastam vajadzētu izskatīties, jo tas ir apmācīts par līdzīgiem e-pastiem — iespējams, tūkstošiem. Tāpat, ja jūs lūdzat tai uzrakstīt vidusskolas eseju, tas arī zina, kā vajadzētu izklausīties vidusskolas esejai. ChatGPT mēģinās rakstīt visu, ko vēlaties, lai to rakstītu cilvēks.

Bet tur ir āķis. Atšķirībā no tā, kā raksta cilvēki, ChatGPT īsti nesaprot, ko tas raksta tā, kā to darītu cilvēks. Tā vietā tērzēšanas robots mēģina paredzēt, kurš būtu ticamākais nākamais vārds teikumā, līdz tas pabeidz rakstīšanu.

Kā ChatGPT raksta pēc paredzēšanas

Pieņemsim, ka lūdzat ChatGPT uzrakstīt stāstu par izdomātu pilsētu Volkra. Pastāv milzīga iespēja, ka tērzēšanas robots sāks stāstu ar vārdiem "Once upon". Tas ir tāpēc, ka tērzēšanas robots nedomā par to pati, bet mēģina paredzēt, ko cilvēks rakstītu, pamatojoties uz to, ko tas ir iemācījies no tūkstošiem stāstu, kas viņam tika baroti apmācību.

Tātad, domājot, ka cilvēks stāstu sāks ar vārdiem “Reiz”, ChatGPT mēģinās paredzēt nākamo loģisko vārdu, kas ir "a", kam seko "laiks". Tātad jums būtu "Reiz senos laikos...", kam seko nākamais loģiskais vārds un nākamais, līdz stāsts ir pabeigts. ChatGPT pamatā raksta, paredzot, kurš vārds dabiski (vai vismaz ar vislielāko varbūtību) nonāks nākamais teikumā un ievieto to.

Tātad, kad AI rīks mēģina noteikt, vai teksts ir AI ģenerēts, viens no kritērijiem, ko tas mēģina izsvērt, ir teksta paredzamība, jo AI rīki raksta, izmantojot paredzēšanu. Šo paredzamības mērauklu AI valodā sauc par apjukumu. Tagad, kad tiek parādīts teksts, kā arī citi kritēriji, AI rīks, piemēram, ChatGPT, mēģina analizēt tekstu, lai noteiktu, cik paredzama ir vārdu vai teikumu secība tekstā. Lielāka paredzamība vai zema neskaidrība parasti nozīmē, ka teksts, iespējams, ir AI ģenerēts. Mazāka paredzamība vai lielāka neskaidrība parasti nozīmē, ka tekstu, iespējams, rakstījuši cilvēki.

Šie kritēriji kopā ar citiem faktoriem, piemēram, teksta radošuma līmeni, diemžēl nav pietiekami, lai droši noteiktu, vai teksts ir rakstīts ar AI rīku vai nē. Tas ir tāpēc, ka cilvēki var rakstīt ar lielāku atšķirību, kā tas ir teksta piemērā, ko izmantojām demonstrācijai šī raksta sākumā.

AI tērzēšanas roboti, piemēram, ChatGPT, ir paredzēti, lai pēc iespējas vairāk atdarinātu dabisko cilvēka valodu. Tātad, lai gan AI tekstam var būt pamanāmi modeļi, šie modeļi nav tik acīmredzami pat tādam jaudīgam rīkam kā ChatGPT. Tāpēc ChatGPT nevar pamanīt savu rakstīto, kā arī kāpēc AI teksta detektora rīki nedarbojas.

Vai ChatGPT nākotnē atpazīs savu rakstību?

Pašlaik tādi rīki kā ChatGPT nevar noteikt, vai teksts ir rakstīts pats vai kāds cits AI rīks, jo AI ģenerētajā saturā nav skaidra, pamanāma modeļa. Tomēr pastāv liela iespēja, ka tas drīzumā var mainīties. Tā kā tādi uzņēmumi kā ChatGPT cenšas ieviest digitālās ūdenszīmes ChatGPT ģenerētajā saturā, tērzēšanas robota ģenerētajā tekstā būs pamanāmāks raksts.