Vai vēlaties nodrošināt ChatGPT savus pielāgotos datus? Lūk, soli pa solim, kā to izdarīt!

Nodrošinot GPT tehnoloģiju jaudīgā un ērti lietojamā tērzēšanas robotā, ChatGPT ir kļuvis par pasaulē populārāko AI rīku. Daudzi cilvēki izmanto ChatGPT, lai nodrošinātu saistošas ​​sarunas, atbildētu uz jautājumiem, piedāvātu radošus ieteikumus un palīdzētu kodēt un rakstīt. Tomēr ChatGPT ir ierobežots, jo jūs nevarat glabāt savus datus ilgstošai personiskai lietošanai, kā arī tā 2021. gada septembra zināšanu datu robežpunkts.

Kā risinājumu mēs varam izmantot OpenAI API un LangChain, lai nodrošinātu ChatGPT pielāgotus datus un atjauninātu informāciju pēc 2021. gada, lai izveidotu pielāgotu ChatGPT gadījumu.

Kāpēc nodrošināt ChatGPT ar pielāgotiem datiem?

ChatGPT ievadīšana ar pielāgotiem datiem un atjauninātas informācijas sniegšana pēc zināšanu beigu datuma sniedz vairākas priekšrocības salīdzinājumā ar ChatGPT lietošanu kā parasti. Šeit ir daži no tiem:

  • Personalizēta mijiedarbība: Nodrošinot ChatGPT pielāgotus datus, lietotāji var izveidot pielāgotāku pieredzi. Modeli var apmācīt par konkrētām datu kopām, kas attiecas uz atsevišķiem lietotājiem vai organizācijām, tādējādi nodrošinot atbildes, kas pielāgotas viņu unikālajām vajadzībām un vēlmēm.
    instagram viewer
  • Ar domēnu saistītās zināšanas: Pielāgota datu integrācija ļauj ChatGPT specializēties noteiktos domēnos vai nozarēs. To var apmācīt par nozarei specifiskām zināšanām, terminoloģiju un tendencēm, nodrošinot precīzākas un saprotamākas atbildes šajās konkrētajās jomās.
  • Pašreizējā un precīza informācija: Piekļuve atjauninātajai informācijai nodrošina, ka ChatGPT ir informēts par jaunākajiem notikumiem un zināšanām. Tas var sniegt precīzas atbildes, pamatojoties uz neseniem notikumiem, ziņām vai pētījumiem, padarot to par uzticamāku informācijas avotu.

Tagad, kad saprotat, cik svarīgi ir nodrošināt pielāgotus datus ChatGPT, tālāk ir sniegta detalizēta informācija par to, kā to izdarīt vietējā datorā.

1. darbība. Instalējiet un lejupielādējiet programmatūru un iepriekš izveidotu skriptu

Lūdzu, ņemiet vērā, ka tālāk sniegtie norādījumi attiecas uz Windows 10 vai Windows 11 iekārtu.

Lai ChatGPT nodrošinātu pielāgotus datus, no GitHub ir jāinstalē un jālejupielādē jaunākais Python3, Git, Microsoft C++ un ChatGPT izguves skripts. Ja datorā jau ir instalēta kāda programmatūra, pārliecinieties, vai tā ir atjaunināta ar jaunāko versiju, lai izvairītos no žagas procesa laikā.

Sāciet, instalējot:

  • Lejupielādēt:Python3 (bezmaksas)
  • Lejupielādēt:Git (bezmaksas)
  • Lejupielādēt:Microsoft Visual Build Tools (bezmaksas)

Python3 un Microsoft C++ instalēšanas piezīmes

Instalējot Python3, noteikti atzīmējiet Pievienojiet python.exe failu PATH opciju pirms noklikšķināšanas Instalēt tagad. Tas ir svarīgi, jo tas ļauj piekļūt Python jebkurā datora direktorijā.

Instalējot Microsoft C++, vēlēsities instalēt Microsoft Visual Studio veidošanas rīki vispirms. Pēc instalēšanas varat atzīmēt Darbvirsmas izstrāde ar C++ opciju un noklikšķiniet uz Uzstādīt ar visiem izvēles rīkiem, kas tiek automātiski atzīmēti labajā sānjoslā.

Tagad, kad esat instalējis jaunākās Python3, Git un Microsoft C++ versijas, varat lejupielādēt Python skriptu, lai ērti meklētu pielāgotos vietējos datus.

Lejupielādēt: ChatGPT izguves skripts (bezmaksas)

Lai lejupielādētu skriptu, noklikšķiniet uz kods, pēc tam atlasiet Lejupielādēt ZIP. Tam vajadzētu lejupielādēt Python skriptu noklusējuma vai atlasītajā direktorijā.

Pēc lejupielādes mēs varam iestatīt vietējo vidi.

2. darbība: iestatiet vietējo vidi

Lai iestatītu vidi, lejupielādētajā mapē chatgpt-retrieval-main ir jāatver terminālis. Lai to izdarītu, atveriet chatgpt-retrieval-main mapi, ar peles labo pogu noklikšķiniet un atlasiet Atvērt terminālī.

Kad terminālis ir atvērts, kopējiet un ielīmējiet šo komandu:

pip instalēt langchain openai chromadb tiktoken unstructured

Šī komanda izmanto Python pakotņu pārvaldnieku izveidot un pārvaldīt Python virtuālo vidi nepieciešams.

Pēc virtuālās vides izveides mums ir jāiesniedz OpenAI API atslēga, lai piekļūtu viņu pakalpojumiem. Vispirms mums būs jāģenerē API atslēga no OpenAI API atslēgu vietne noklikšķinot uz Izveidojiet jaunu slepeno atslēgu, pievienojot atslēgas nosaukumu un pēc tam nospiežot taustiņu Poga Izveidot slepeno atslēgu.

Jums tiks nodrošināta rakstzīmju virkne. Šī ir jūsu OpenAI API atslēga. Kopējiet to, noklikšķinot uz kopēšanas ikonas API atslēgas malā. Ņemiet vērā, ka šī API atslēga ir jātur noslēpumā. Nekopīgojiet to ar citiem, ja vien jūs patiešām nedomājat, ka viņi to izmantos kopā ar jums.

Kad esat nokopējis, atgriezieties galvenajā mapē chatgpt-retrieval- un atveriet konstantes ar Notepad. Tagad aizstājiet vietturi ar savu API atslēgu. Atcerieties saglabāt failu!

Tagad, kad esat veiksmīgi iestatījis virtuālo vidi un pievienojis OpenAI API atslēgu kā vides mainīgo. Tagad varat nodrošināt savus pielāgotos datus pakalpojumam ChatGPT.

3. darbība. Pielāgotu datu pievienošana

Lai pievienotu pielāgotus datus, ievietojiet visus savus pielāgotos teksta datus datus mapi chatgpt-retrieval-main. Teksta datu formāts var būt PDF, TXT vai DOC formātā.

Kā redzat no iepriekš redzamā ekrānuzņēmuma, esmu pievienojis teksta failu, kurā ir izdomāts personīgais grafiks — rakstu, par kuru rakstīju AMD instinktu paātrinātājiun PDF dokumentu.

4. darbība. ChatGPT vaicājums, izmantojot termināli

Python skripts ļauj vaicāt datus no pielāgotajiem datiem, ko esam pievienojuši datu mapei un internetam. Citiem vārdiem sakot, jums būs piekļuve parastajai ChatGPT aizmugursistēmai un visiem datiem, kas tiek glabāti lokāli datu mapē.

Lai izmantotu skriptu, palaidiet python chatgpt.py skriptu un pēc tam pievienojiet savu jautājumu vai vaicājumu kā argumentu.

pitons chatgpt.py "TAVS JAUTĀJUMS"

Noteikti ievietojiet savus jautājumus pēdiņās.

Lai pārbaudītu, vai esam veiksmīgi ievadījuši ChatGPT savus datus, es uzdošu personisku jautājumu par Personiskais Sched.txt failu.

Tas izdevās! Tas nozīmē, ka ChatGPT varēja lasīt personīgo Sched.txt, kas tika nodrošināts iepriekš. Tagad paskatīsimies, vai esam veiksmīgi padevuši ChatGPT ar informāciju, ko tas nezina zināšanu beigu datuma dēļ.

Kā redzat, tas pareizi aprakstīja AMD Instinct MI250x, kas tika izlaists pēc ChatGPT -3 zināšanu pārtraukšanas datuma.

Pielāgotā tērzēšanas GPT ierobežojumi

Lai gan GPT-3.5 ievadīšana ar pielāgotiem datiem paver vairāk veidu, kā piemērot un izmantot LLM, ir daži trūkumi un ierobežojumi.

Pirmkārt, jums pašam ir jāiesniedz visi dati. Jūs joprojām varat piekļūt visām zināšanām par GPT-3.5 līdz to zināšanu beigu datumam; tomēr jums ir jānorāda visi papildu dati. Tas nozīmē, ka, ja vēlaties, lai jūsu vietējais modelis būtu informēts par noteiktu tēmu internetā, kuru GPT-3.5 vēl nezina, jums būs jādodas uz internetu un pašam jānokasa dati un jāsaglabā tie kā teksts datu mapē chatgpt-retrieval-main.

Vēl viena problēma ir tāda, ka šāda ChatGPT vaicāšana prasa vairāk laika, lai ielādētu, salīdzinot ar tiešu ChatGPT vaicājumu.

Visbeidzot, vienīgais šobrīd pieejamais modelis ir GPT-3.5 Turbo. Tātad, pat ja jums ir piekļuve GPT-4, jūs nevarēsiet to izmantot, lai darbinātu savu pielāgoto ChatGPT gadījumu.

Pielāgots ChatGPT ir lielisks, taču ierobežots

Pielāgotu datu nodrošināšana ChatGPT ir efektīvs veids, kā iegūt vairāk no modeļa. Izmantojot šo metodi, modelim var pievienot jebkurus vēlamos teksta datus un piedāvāt to tāpat kā parasto ChatGPT, lai gan ar dažiem ierobežojumiem. Tomēr nākotnē tas mainīsies, jo kļūs vieglāk integrēt mūsu datus ar LLM, kā arī piekļūt jaunākajam GPT-4 modelim.