ChatGPT veidotājiem ir vēl viens rīks, kura mērķis ir noņemt slodzi no pirkstiem.
Tie paši cilvēki, kas ir aiz ChatGPT, ir izveidojuši vēl vienu uz AI balstītu rīku, kuru varat izmantot jau šodien, lai palielinātu savu produktivitāti. Mēs runājam par Whisper — balss-teksta risinājumu, kas aizēnoja visus līdzīgos risinājumus, kas bija pirms tā.
Jūs varat izmantot Whisper savās programmās vai komandrindā. Un tomēr tas pārspēj pašu mērķi: rakstīt bez tastatūras. Ja jums ir nepieciešams rakstīt, lai to izmantotu, kāpēc to izmantot, lai izvairītos no rakstīšanas? Par laimi, tagad varat izmantot Whisper, izmantojot darbvirsmas GUI. Vēl labāk, tas var arī pārrakstīt jūsu balsi gandrīz reāllaikā. Apskatīsim, kā varat rakstīt ar balsi, izmantojot Whisper Desktop.
Kas ir OpenAI's Whisper?
OpenAI's Whisper ir automātiskā runas atpazīšanas sistēma (saīsināti ASR) vai, vienkārši sakot, ir risinājums runātās valodas pārvēršanai tekstā.
Tomēr atšķirībā no vecākām diktēšanas un transkripcijas sistēmām Whisper ir mākslīgā intelekta risinājums, kas apmācīts vairāk nekā 680 000 stundu runas dažādās valodās. Whisper piedāvā nepārspējamu precizitāti, un, diezgan iespaidīgi, tas ir ne tikai daudzvalodu, bet arī var tulkot starp valodām.
Vēl svarīgāk ir tas, ka tas ir bezmaksas un pieejams kā atvērtais avots. Pateicoties tam, daudzi izstrādātāji ir ievietojuši tā kodu savos projektos vai izveidojuši uz to balstītas lietotnes, piemēram, Whisper Desktop.
Ja vēlaties Whisper "vaniļas" versijai un termināļa daudzpusībai, nevis neveiklām GUI, skatiet mūsu rakstu par kā pārvērst savu balsi tekstā, izmantojot OpenAI Whisper for Windows.
Vai Whisper un Whisper Desktop ir viens un tas pats?
Neskatoties uz tā oficiāli skanošo nosaukumu, Whisper Desktop ir trešās puses Whisper GUI, kas paredzēta ikvienam, kurš labprātāk noklikšķina uz pogām, nevis ieraksta komandas.
Whisper Desktop ir savrups risinājums, kas nav atkarīgs no esošas Whisper instalācijas. Kā bonuss tas izmanto alternatīvu, optimizētu Whisper versiju, tāpēc tai vajadzētu darboties labāk nekā atsevišķajai versijai.
Jūs atrodaties spektra otrā galā un tā vietā, lai meklētu vieglāku veidu, kā izmantot Whisper nekā termināli, jūs meklējat veidus, kā to ieviest savos risinājumos? Priecājies, par OpenAI ir atvērusi piekļuvi ChatGPT un Whisper API.
Lejupielādējiet un instalējiet Whisper Desktop
Lai gan Whisper Desktop ir vieglāk lietojams nekā atsevišķs Whisper, tā instalēšana ir sarežģītāka, nekā vednī atkārtoti noklikšķinot uz Tālāk.
- Apmeklējums Whisper Desktop oficiālā Github lapa. Paskatieties labajā pusē un zem tā noklikšķiniet uz jaunākās versijas Izlaidumi.
- Zem Aktīvi, klikšķis WhisperDesktop.zip un lejupielādējiet to savā datorā.
- Izvelciet lejupielādēto arhīvu mapē un izmantojiet failu pārvaldnieku, lai to apmeklētu. Iekšpusē jūs atradīsiet lietojumprogrammu Whisper Desktop. Veiciet dubultklikšķi uz tā, lai to palaistu.
- Jums ir nepieciešams arī Whisper valodas modelis GCML binārais formāts. Whisper Desktop nodrošinās jums divas saites, lai iegūtu vienu. Izlaidiet otro saiti, lai izveidotu savu modeli, jo tas ir sarežģītāks process. Klikšķiniet uz Apskāva seja lai atvērtu šo lapu noklusējuma pārlūkprogrammā, no kuras varat lejupielādēt lietošanai gatavu failu.
- Whisper Desktop versija, ko izmantojām, rakstot šo rakstu, sniedza saiti uz novecojušu Hugging Face repozitoriju. Ja saskaraties ar to pašu problēmu, ievērojiet saiti uz a jauna vieta. Noklikšķiniet uz tā, lai apmeklētu jauno repozitoriju.
- Noklikšķiniet uz saites, kas aizvedīs uz pieejamo modeļiem.
- Šajā sarakstā noklikšķiniet uz vai nu uz ggml-medium.bin vai ggml-medium.en.bin, atkarībā no tā, vai programmā Whisper vēlaties atbalstu vairākās valodās vai tikai angļu valodā.
- Visbeidzot, jums bija jāsasniedz galamērķis. Ievērojiet rindiņu, kurā teikts, ka šis fails tiek glabāts ar Git LFS un ir pārāk liels, lai to parādītu, taču jūs joprojām varat to lejupielādēt. Klikšķiniet uz lejupielādēt darīt tieši to.
- Kad faila lejupielāde ir pabeigta, izmantojiet savu iecienītāko failu pārvaldnieku (to darīs File Explorer), lai pārvietotu lejupielādēto valodas modeļa failu uz to pašu mapi, kurā atrodas Whisper Desktop.
Transkribēšana, izmantojot Whisper Desktop
Transkribēšana, izmantojot Whisper Desktop, ir vienkārša, taču, lai lietotu lietotni, joprojām var būt nepieciešams viens vai divi klikšķi.
Atkārtoti palaist Whisper Desktop. Vai tajā (joprojām) nav norādīts pareizais ceļš uz jūsu lejupielādēto valodas modeli? Noklikšķiniet uz pogu ar trim punktiem lauka labajā pusē un manuāli atlasiet failu, ko lejupielādējāt no Hugging Face.
Šajā vietā varat izmantot arī blakus esošo nolaižamo izvēlni Modeļa ieviešana lai izvēlētos, vai vēlaties palaist Whisper savā GPU (GPU), gan CPU, gan GPU (Hibrīds), vai tikai CPU (Atsauce).
The Papildu poga noved pie vairāk opciju, kas ietekmē to, kā Whisper darbosies jūsu aparatūrā. Tomēr, tā kā poga skaidri norāda, ka tie ir uzlaboti, mēs iesakām tos pielāgot tikai tad, ja veicat problēmu novēršanu vai zināt, ko darāt. Šeit iestatot nepareizas opciju vērtības, var tikt piemērots sods par veiktspēju vai lietotne var kļūt nelietojama.
Noklikšķiniet uz Labi, lai pārietu uz programmas galveno interfeisu.
Ja jums jau ir savas balss ieraksts, kuru vēlaties pārvērst rakstītā tekstā, noklikšķiniet uz Transkribēt failu un atlasiet to. Tomēr šī raksta tiešraidei mēs izmantosim Whisper Desktop.
Piedāvātās iespējas ir vienkāršas. Jūs varat izvēlēties valodu Whisper izmantos, izvēlieties, ja vēlaties tulkot starp valodām un iespējojiet lietotni Atkļūdošanas konsole.
Lielākā daļa angliski runājošo lietotāju var droši izlaist šīs opcijas un tikai nodrošināt, ka nolaižamajā izvēlnē blakus ir atlasīta pareizā audio ievade. Uztveršanas ierīce.
Pārliecinies Saglabāt teksta failā un Pievienojiet šim failam ir iespējoti, lai Whisper Desktop saglabātu izvadi failā, nepārrakstot tā saturu. Izmantojiet pogu ar trim punktiem pa labi no faila ceļa lauka, lai definētu minēto teksta failu.
Klikšķiniet uz Uzņemt lai sāktu savas runas pārrakstīšanu tekstā.
Whisper Desktop parādīs trīs indikatorus, kad tā nosaka balss darbību, kad tā aktīvi pārraksta un kad process ir apstājies.
Varat turpināt runāt tik ilgi, cik vēlaties, un laiku pa laikam vajadzētu redzēt, ka mirgo divi pirmie indikatori, kamēr lietotne pārvērš jūsu balsi tekstā. Klikšķis Stop kad izdarīts.
Atlasītajam teksta failam ir jāatveras jūsu noklusējuma teksta redaktorā, kurā rakstiskā veidā ir ietverts viss, ko teicāt, līdz noklikšķinājāt Stop.
Jāņem vērā, ka varat arī rīkoties pretēji tam, ko mēs šeit redzējām: pārvērst jebkuru tekstu runā. Tādā veidā jūs varat klausīties jebko tā, it kā tas būtu aplāde, nevis nogurdināt acis, skatoties uz ekrāniem. Lai iegūtu plašāku informāciju par to, skatiet mūsu rakstu par daži no labākajiem bezmaksas tiešsaistes rīkiem teksta pārvēršanas runā lejupielādei kā MP3 audio.
Padomi čukstu rakstīšanai ar balsi
Lai gan Whisper Desktop var būt glābiņš, ļaujot rakstīt ar balsi daudz ātrāk, nekā jūs varētu rakstīt, tas nebūt nav ideāls.
Pārbaudes laikā mēs atklājām, ka tas dažkārt var stostīties, izlaist dažus vārdus vai neizdosies pārrakstīt, līdz jūs manuāli apturēt un restartēt procesu vai iestrēgt ciklā un turpināt pārrakstīt to pašu frāzi atkārtoti.
Mēs uzskatām, ka tie ir īslaicīgi traucējumi, kas tiks novērsti, jo atsevišķajā Whisper nav tādas pašas problēmas.
Neatkarīgi no šīm nelielajām nelīdzenumiem, izmantojot Whisper Desktop, balss pārvēršanai īsziņā vajadzētu būt vienkāršai. Tomēr mūsu pārbaužu laikā mēs atklājām, ka tas var darboties vēl labāk, ja...
- Tā vietā, lai izrunātu tikai divus vai trīs vārdus un pēc tam apstātos, Whisper var jūs labāk saprast, ja turpināsit ilgāk. Mēģiniet dot tai vismaz visu teikumu vienlaikus.
- Tā paša iemesla dēļ izvairieties no atkārtotas transkripcijas procesa sākšanas un apturēšanas.
- Ikreiz, kad saprotat, ka esat pieļāvis kļūdu, ignorējiet to un turpiniet. Valodas modeļa ielāde un izkraušana, šķiet, ir vislaikietilpīgākā procesa daļa, ņemot vērā pašreizējo Whisper stāvokli un mūsu pieejamo aparatūru. Tāpēc ir ātrāk turpināt runāt un pēc tam labot savas kļūdas.
- Tāpat kā ar atsevišķu Whisper versiju, vislabāk ir izmantot pieejamās aparatūras optimālo valodas modeli. Jūs varat izmantot līdz vidējs modeli, ja jūsu GPU ir 8 GB VRAM. Lai iegūtu mazāku VRAM, izvēlieties mazākus modeļus. Izvēlieties tikai nedaudz precīzāku, bet arī daudz prasīgāku liels modeli, ja izmantojat GPU ar 16 GB vai vairāk VRAM.
- Atcerieties, ka jo lielāks ir valodas modelis, jo lēnāks ir transkripcijas process. Neizvēlieties modeli, kas ir lielāks nekā nepieciešams. Jūs, iespējams, atklāsit, ka Whisper Desktop jau lielāko daļu laika var "jūs saprast" ar vidējiem vai mazākiem modeļiem, un katrā rindkopā ir tikai viena vai divas kļūdas.
Vai joprojām rakstāt? Izmantojiet savu balsi ar čukstiem
Neskatoties uz to, ka iestatīšanai ir nepieciešams zināms laiks, kā jūs redzēsit, kad to izmēģināsit, Whisper Desktop darbojas daudz labāk nekā lielākā daļa alternatīvu, ar daudz lielāku precizitāti un lielāku ātrumu.
Pēc tam, kad sākat to lietot, lai rakstītu ar balsi, tastatūra var izskatīties kā seno laiku relikts.