Reklāma
Nesen es strādāju pie stāsta, kurā iesaistījās kāda persona, kura veica tālruņa zvanu, kurš tika ierakstīts. Šī persona vēlāk atteicās atzīt, ka viņi kādreiz vispār bija zvanījuši.
Ar tālruņa zvana ierakstīto balsi un personas klipu, kas noliedz apsūdzību, es ķēros pie darba, lai mēģinātu atrast veidu, kā pierādīt, ka balsis bija vienādas.
Es atzīstu, ka esmu mazliet apsēsts ar balss tehnoloģijām. Tāpēc es to gaidīju Google Voice Kā izmantot Google Voice emuāru veidošanai pa tālruni Lasīt vairāk kļūt pilnveidotai ar balss atpazīšanas tehnoloģiju, un tāpēc es mīlu datora balss vadības lietotnes kā Tazti Iespējojiet runas-teksta un balss vadību, Windows iestatot runas pazīšanuRunas atpazīšana joprojām ir jaudīgāka nekā Cortana. Tas virza runu teksta un balss vadībā. Šis raksts parādīs, ko var veikt runas pazīšana, kā to iestatīt, apmācīt un izmantot. Lasīt vairāk . Tomēr, runājot par balsu digitālu salīdzināšanu, es biju ar zaudējumiem. Jūs, iespējams, esat redzējis tās spiegu filmas, kurās dators var automātiski identificēt zināma noziedznieka balsi tikai ar balss drukāšanu.
Godīgi sakot, kad es atklāju Sonogram Visible Speech, es sapratu, ka faktiski ir spektrogrammas balss tehnoloģija ir pašlaik dzīvotspējīgs veids, kā stabili identificēt cilvēku tikai pēc viņa balss.
Izpratne par spektrogrammu
Ja jūs zināt par ķīmiskajiem izotopiem, tad jūs zināt, ka ar izotopiem ķīmiķi var identificēt savienojumi, izdalot pamatelementus un izmantojot sadalījumu, lai identificētu jebkuru sastāvdaļu maisījums. Tādā pašā veidā audio spektrogramma sadala audio skaņu pamata frekvencēs. Cilvēka balss interesanta ir tā, ka neviens nerunā vienā frekvencē. Jūsu mute, deguna kanāli un balss kastes struktūra nosaka frekvenču sajaukumu, kas veido jūsu nedaudz unikālo balsi.
Sonogram Visible Speech ir bezmaksas spektrogrammas lietojumprogramma, kas uzņems video vai audio failus un sabojāsies uz leju audio celiņu visā spektrā - visās tā frekvencēs visā trase. Pabeigta spektrogramma izskatās šādi attēlā.
Kā redzat, apakšējais celiņš izskatās kā pamata skaņas vilnis, kāds būtu redzams programmā, piemēram Audacity 3 pārliecības padomi ierakstīto interviju uzlabošanaiSkaidrs audio ir būtisks jebkurai Podcast apraidei vai ierakstam, kuru vēlaties publicēt. Uzlabojiet audio kvalitāti, izmantojot Audacity, veicot trīs vienkāršas darbības. Lasīt vairāk , tomēr vidējā rūts parāda visus skaņas faila segmentus visā frekvences izkārtojumā. Pārsteidzošā lieta par šo programmatūru ir tā, ka ir arī daudzas citas viļņu formas, kuras varat izmantot, lai pārbaudītu skaņas failu. Tie ir īpaši pieredzējušiem lietotājiem.
Lai konfigurētu, kā tiek parādīta katra no šīm viļņu formām, dodieties uz izvēlni “Opcijas” un atlasiet “Vispārīgi” Pielāgošana. ” Šeit jūs varat definēt, kā logaritmiskie grafiki aprēķina izvadi un visu pieejamo vispārējo displeja iestatījumu diagrammas.
Ja skaņa ir diezgan klusa vai analizējamā balss ir čuksts, ieteicams apsvērt logaritmiskā frekvences displeja izmantošanu. Jūs to iespējojat izvēlnē “Opcijas” un atlasāt “Logaritmiskā frekvence”. Tas nedaudz “palielinās” nozīmīgos frekvences apgabalus spektrogrammā.
Tas patiešām var palīdzēt noteikt skaidrus frekvences modeļus, kas identificē kādu no viņu balss skaņas. Ja esat pilnībā apmaldījies un nezināt, kur sākt, noklikšķinot uz “Palīdzība” un pārejot uz “Tiešsaistes palīdzība”, tiks atvērta ļoti labi uzrakstītā Sonogram tiešsaistes palīdzības rokasgrāmata. Šī ir lieliska vieta, kur sākt, ja esat iesācējs spektrogrammas audio analīzē.
Eksperiments ar spektrogrammām, izmantojot spoku medības
Šīs programmatūras skaistums ir tāds, ka tā ir piemērota daudziem dažādiem lietojumiem. Viens no artefaktiem, kas bieži parādās spoku medībās, ir mana personīgā interese “Elektroniskas balss parādība” - kad acīmredzami parādīšanās vai spoks tiek parādīts audio ieraksti. Šie ieraksti ir izkaisīti visā tīmeklī, tāpēc es nolēmu nedaudz noņemt spoku mednieku vietnes un veikt spektrogrammas analīzi.
Spektrogramma rāda, ka balss frekvences parasti ir zemas, taču, lai iegūtu labāku priekšstatu par ierakstītajām balsīm, jums ir jāatver papildu viļņu formas. Autokorelācijas skats aprēķina “piķi” laika posmā, kurā novietojat peli.
“Spoku” vidējā skaņas frekvence ir aptuveni 129,0 Hz. Ritiniet līdz ieraksta beigām, kur dzirdat izmeklētāja balsi, aprēķināto skaņas signālu frekvence ir aptuveni 208,0 Hz (tas ir jēga, jo tā ir sievietes balss un izklausās spoku ieraksts) vīrietis.)
Atverot ātrās Furjē displeju, balss tiek atklāta vēl detalizētāk. Šī diagramma ātri sadala primārās frekvences un parāda tās krāsu kodā.
Šajā gadījumā frekvenču sadalījums tiek sadalīts atsevišķi, un dažās kombinācijās ir arī dažas augstas, bet arī labs skaits zemu frekvenču. Tomēr telpā esošais izmeklētājs skaidri runā balsī, kas ir sagrupēta frekvencē vairāk uz diapazona augstāko punktu, kā parādīts šeit.
Šī ātrā analīze pierādīja, ka abas balsis ir diezgan atšķirīgas, taču tas ir tikai pamata piemērs šīs jaudīgās programmatūras iespējām. Būtībā jebkura situācija, kad skaņas viļņa frekvenču sadalījums var palīdzēt - šī ir programmatūra jums. To ir viegli iemācīties, ātri uzstādīt un konfigurēt, un tas darbojas tikpat labi vai labāk nekā jebkura apmaksātā spektrogrammas programmatūra tirgū.
Vai jums ir kādi projekti, kuros varētu izmantot spektrogrammu? Vai esat kādreiz izmēģinājuši Sonogram Visible Speech? Dalieties ar savu ieskatu komentāru sadaļā zemāk.
Ryanam ir bakalaura grāds elektrotehnikā. Viņš ir strādājis 13 gadus automatizācijas inženierijā, 5 gadus IT jomā un tagad ir Apps Engineer. Bijušais MakeUseOf galvenais redaktors, viņš uzstājās nacionālajās datu vizualizācijas konferencēs un tiek demonstrēts nacionālajā televīzijā un radio.