Balss atpazīšanas tehnoloģijai ir bagāta attīstības vēsture, kas noveda pie tā, kāda tā ir šodien. Tas ir mūsdienu dzīves pamatā, dodot mums iespēju veikt uzdevumus, vienkārši runājot ar ierīci. Tātad, kā šī pārsteidzošā tehnoloģija ir attīstījusies gadu gaitā? Paskatīsimies.

1952: Odrijas sistēma

Pirmais solis balss atpazīšanā tika veikts 1950. gadu sākumā. Bell Laboratories 1952. gadā izstrādāja pirmo mašīnu, kas varēja saprast cilvēka balsi, un tā tika nosaukta par Odrijas sistēmu. Vārds Odrija bija sava veida frāzes automātiskās ciparu atpazīšanas saīsinājums. Lai gan tas bija nozīmīgs jauninājums, tam bija daži būtiski ierobežojumi.

Visspilgtāk Odrija varēja atpazīt tikai ciparus 0–9, bez vārdiem. Odrija sniegtu atsauksmes, kad runātājs teica skaitli, iededzinot 1 no 10 spuldzēm, katra no tām atbilst ciparam.

Attēlu kredīts: metamorworks/Shutterstock.com

Lai gan Odrija varēja saprast ciparus ar 90% precizitāti, tā bija ierobežota ar noteiktu balss veidu. Tāpēc vienīgā persona, kas to patiešām izmantotu, bija HK Deiviss, viens no izstrādātājiem. Kad tika izrunāts skaitlis, runātājam bija jāgaida vismaz 300 milisekundes, lai pateiktu nākamo.

instagram viewer

Tam bija ne tikai ierobežota funkcionalitāte, bet arī lietderība. Mašīnai, kas varēja saprast tikai ciparus, nebija lielas nozīmes. Viens no iespējamiem lietojumiem bija tālruņa numuru sastādīšana, taču bija daudz ātrāk un vieglāk numurus sastādīt ar rokām. Lai gan Odrijai nebija graciozas pastāvēšanas, tā joprojām ir lielisks pagrieziena punkts cilvēka sasniegumos.

Saistīts: Kā lietot rakstīšanu ar balsi programmā Microsoft Word

1962: IBM apavu kaste

Desmit gadus pēc Odrijas IBM izmēģināja spēkus balss atpazīšanas sistēmas izstrādē. 1962. gada pasaules izstādē IBM demonstrēja balss atpazīšanas sistēmu ar nosaukumu Showbox. Tāpat kā Odrijai, tās galvenais uzdevums bija saprast ciparus 0–9, bet varēja saprast arī sešus vārdus: plus, mīnus, nepatiess, kopējais, starpsumma un izslēgts.

Shoebox bija matemātikas mašīna, kas spēja veikt vienkāršas aritmētiskās problēmas. Runājot par atsauksmēm, kurpju vietā Shoebox varēja izdrukāt rezultātus uz papīra. Tas padarīja to noderīgu kā kalkulatoru, lai gan runātājam joprojām vajadzētu pārtraukt starp katru ciparu/vārdu.

1971: IBM automātiskā zvanu identifikācija

Pēc Audrey un Shoebox citas laboratorijas visā pasaulē izstrādāja balss atpazīšanas tehnoloģiju. Tomēr tas pacēlās tikai septiņdesmitajos gados, kad 1971. gadā IBM laida tirgū pirmo šāda veida izgudrojumu. To sauca par automātisko zvanu identifikācijas sistēmu. Tā bija pirmā balss atpazīšanas sistēma, kas tika izmantota pa telefonu sistēmu.

Inženieri piezvanīs un tiks savienoti ar datoru Rālijā, Ziemeļkarolīnā. Zvanītājs tad izrunās vienu no 5000 vārdu krājuma vārdiem un kā atbildi saņems "mutisku" atbildi.

Saistīts: Kā lietot balss diktēšanu Mac datoros

1976: Harpy

Astoņdesmito gadu sākumā ASV Aizsardzības departaments interesējās par balss atpazīšanu. DARPA (Defense Advanced Research Projects Agency) 1971. gadā izstrādāja runas izpratnes izpētes (SUR) programmu. Šī programma nodrošināja finansējumu vairākiem uzņēmumiem un universitātēm, lai palīdzētu pētniecībai un attīstībai balss atpazīšanai.

1976. gadā SUR dēļ Kārnegija Melona universitāte izstrādāja Harpijas sistēmu. Tas bija liels lēciens balss atpazīšanas tehnoloģijā. Sistēmas līdz tam spēja saprast vārdus un ciparus, bet Harpijs bija unikāls ar to, ka varēja saprast pilnus teikumus.

Tajā bija tikai aptuveni 1011 vārdu krājums, kas, saskaņā ar publikāciju B. Lowerre un R. Reddy, kas pielīdzināts vairāk nekā triljoniem dažādu iespējamo teikumu. Pēc tam publikācijā norādīts, ka Hārpijs vārdus varēja saprast ar 93,77% precizitāti.

Astoņdesmitie gadi bija izšķirošs laiks balss atpazīšanas tehnoloģijai, jo šī ir desmitgade, kad balss atpazīšanas tehnoloģija, jo šī bija desmitgade, kad mēs iepazīstinājām ar Slēpto Markova metodi (HMM). Galvenais HMM dzinējspēks ir varbūtība.

Ikreiz, kad sistēma reģistrē fonēmu (mazāko runas elementu), pastāv noteikta varbūtība, kāda būs nākamā. HMM izmanto šīs varbūtības, lai noteiktu, kura fonēma, visticamāk, būs nākamā un veidos visticamākos vārdus. Lielākā daļa balss atpazīšanas sistēmu mūsdienās joprojām izmanto HMM, lai saprastu runu.

Deviņdesmitie gadi: balss atpazīšana sasniedz patērētāju tirgu

Kopš balss atpazīšanas tehnoloģijas izveides tas ir bijis ceļš, lai atrastu telpu patērētāju tirgū. Pagājušā gadsimta astoņdesmitajos gados IBM demonstrēja datora prototipu, kas varēja veikt runas teksta diktēšanu. Tomēr tikai deviņdesmito gadu sākumā cilvēki sāka redzēt šādas lietojumprogrammas savās mājās.

1990. gadā Dragon Systems iepazīstināja ar pirmo runas teksta diktēšanas programmatūru. To sauca par Dragon Dictate, un sākotnēji tas tika izlaists operētājsistēmai Windows. Šī programma 9 000 ASV dolāru apmērā bija revolucionāra, lai masas iepazīstinātu ar balss atpazīšanas tehnoloģiju, taču bija viens trūkums. Izmantotā programmatūra diskrēta diktēšana, tas nozīmē, ka lietotājam ir jāapstājas starp katru vārdu, lai programma tos varētu uzņemt.

1996. gadā IBM atkal sniedza ieguldījumu nozarē ar Medspeak. Šī bija arī runas teksta diktēšanas programma, taču tā necieta no diskrētas diktācijas, kā to darīja Dragon Dictate. Tā vietā šī programma varētu diktēt nepārtrauktu runu, kas padarīja to par saistošāku produktu.

Saistīts: Kā lietot Google palīgu ar austiņām

2010: meitene vārdā Siri

Visā 2000. gadā balss atpazīšanas tehnoloģijas popularitāte strauji pieauga. Tas tika ieviests vairāk programmatūrā un aparatūrā nekā jebkad agrāk, un viens būtisks solis balss atpazīšanas attīstībā bija Siri, digitālais palīgs. 2010. gadā uzņēmums ar nosaukumu Siri ieviesa virtuālo palīgu kā iOS lietotni.

Tajā laikā Siri bija iespaidīga programmatūra, kas varēja diktēt runātāja teikto un sniegt izglītotu un asprātīgu atbildi. Šī programma bija tik iespaidīga, ka tajā pašā gadā Apple iegādājās uzņēmumu un nedaudz pārskatīja Siri, virzot to uz mūsdienās pazīstamo digitālo asistentu.

Tieši caur Apple Siri ieguva savu ikonisko balsi (Sjūzena Beneta balss) un daudzas jaunas funkcijas. Tas izmanto dabiskās valodas apstrāde lai kontrolētu lielāko daļu sistēmas funkciju.

2010. gadi: lielie 4 digitālie palīgi

Pašlaik balss atpazīšanā un papildu programmatūrā dominē četri lieli digitālie palīgi.

  • Siri ir pieejams gandrīz visos Apple produktos: iPhone, iPod, iPad un Mac datoru grupā.
  • Google palīgs ir pieejams lielākajā daļā 3 miljardu + Android ierīču. Turklāt lietotāji var izmantot komandas daudzos Google pakalpojumos, piemēram, Google sākumlapa.
  • Amazon Alexa nav daudz īpašas platformas, kur tā dzīvo, taču tas joprojām ir ievērojams palīgs. To var lejupielādēt un izmantot Android ierīcēs, Apple ierīcēs. un pat izvēlieties Lenovo klēpjdatorus
  • Biksbijs ir jaunākais ieraksts digitālo palīgu sarakstā. Tas ir Samsung pašmāju digitālais asistents, un tas ir pieejams uzņēmuma tālruņos un planšetdatoros.

Izrunāta vēsture

Kopš Odrijas laikiem balss atpazīšana ir gājusi garu ceļu. Tas ir guvis lielus ieguvumus vairākās jomās; piemēram, saskaņā ar Clear Bridge Mobile, medicīnas joma guva labumu no balss darbināmiem tērzēšanas robotiem pandēmijas laikā 2020. Balss atpazīšana ir viena no mūsu mūsdienu laikmeta visnoderīgākajām tehnoloģijām, sākot tikai ar spēju saprast skaitļus un beidzot ar dažādu pilnu teikumu variāciju izpratni.

KopīgotČivinātE -pasts
Kā darbojas balss atpazīšana?

Mēs visu laiku izmantojam balss atpazīšanu, bet kā tā darbojas?

Lasīt Tālāk

Saistītās tēmas
  • Izskaidrota tehnoloģija
  • Siri
  • Google palīgs
  • Alexa
  • Biksbijs
  • Balss komandas
Par autoru
Artūrs Brauns (31 raksts publicēts)

Artūrs ir tehnoloģiju žurnālists un mūziķis, kas dzīvo Amerikā. Viņš šajā nozarē darbojas gandrīz desmit gadus, rakstot tiešsaistes publikācijām, piemēram, Android Headlines. Viņam ir dziļas zināšanas par Android un ChromeOS. Līdztekus informatīvo rakstu rakstīšanai viņš arī prot ziņot par tehnoloģiju jaunumiem.

Vairāk no Artura Brauna

Abonējiet mūsu biļetenu

Pievienojieties mūsu informatīvajam izdevumam, lai iegūtu tehniskus padomus, pārskatus, bezmaksas e -grāmatas un ekskluzīvus piedāvājumus!

Noklikšķiniet šeit, lai abonētu