Google vietnē GitHub ir izlaidis savu Lyra audio kodeku beta avota kodu, padarot neticami kvalitatīvu zemas bitu pārraides ātruma audio apstrādi pieejamu visiem izstrādātājiem. Kodeks ir visnoderīgākais iegultās un joslas platuma ierobežotās situācijās, kad ir jāsaglabā pēc iespējas vairāk datu.

Līra: Gandrīz nekas nekad neizklausījās tik labi

Audio kodeks darbojas pēc principa nodrošināt dabiski skanīgāko runu ar zemāko iespējamo datu pārraides ātrumu. Tas izdodas izveidot gandrīz drausmīgus audio reproducēšanas līmeņus ar tik mazu bitu pārraides ātrumu kā 3 kbps. Google jau reāllaikā izmanto Lyra saspiešanu jau savā lietotnē Duo, lai gan jūs neapvainotu par to, ka pat nenojaušat atšķirību no parastā joslas platuma audio.

Lai parādītu, cik daudz labāka ir Līra nekā citi kodeki, Google sniedz piemērus, izmantojot a emuāra ziņa mašīnmācīšanās vadīta saspiešanas kodeka salīdzināšana ar citām 3 un 6 kbps alternatīvām.

Tā ir nakts un dienas atšķirība, un, dodot izstrādātājiem pasauli par šiem rīkiem, tas būs nozīmīgs virzītājspēks sakaru kvalitātes uzlabošanā, ja joslas platums ir mazs. Tas ir arī lielisks motivators izstrādātājiem, kuri vēlas izveidot jaunas lietotnes jaunajos tirgos, ko Google noteikti aptvers šī gada laikā

instagram viewer
bezmaksas virtuālā Google I / O tiešsaistes konference.

Beta avota kods pašlaik ir veidots, ņemot vērā 64 bitu Arm ierīces, lai gan piemēri darbosies arī 64 bitu x86 Linux sistēmās. Pirmkods tiek nodrošināts pilnībā dokumentēts, lai gan tas ir beta versijā, un GitHub lapa sniedz instalēšanas instrukcijas un to, kā izveidot Lyra uz Linux 64 bitu mērķiem.

Lai iegūtu Lyra beta avota kodu, dodieties uz Lyra GitHub lapa.

Kā darbojas Līra?

Kaut arī faktiskais process, ko Līra izmanto, ir neticami sarežģīta mašīnmācīšanās modeļu kombinācija, uz kuras apmācīts tūkstošiem stundu runas datu un esošās audio kodeku tehnoloģijas optimizācijas, teorija ir diezgan vienkārši.

Ik pēc 40 ms funkcijas tiek pārņemtas no runas un tiek saspiestas līdz 3 kbps. Šīs funkcijas atspoguļo runas enerģijas punktus visā frekvences spektrā, kas ir vistuvāk cilvēka dzirdes runas reakcijai - lietas, kas mums jāatzīst un jāsaprot, kad kāds runā.

Galvenā daļa, kas padara Līru īpašu, ir tas, kā tā izmanto šo informāciju:

Tomēr tradicionālie parametru kodeki, kas no runas kritiskajiem parametriem vienkārši iegūst, kas pēc tam var būt izmanto signāla atjaunošanai uztveršanas galā, zemu bitu pārraides ātruma sasniegšanai, bet bieži izklausās robotiski un nedabiski. Šie trūkumi ir noveduši pie jaunās paaudzes augstas kvalitātes audio ģeneratīvo modeļu izstrādes radīja revolūciju šajā jomā, spējot ne tikai atšķirt signālus, bet arī radīt pilnīgi jaunus vieniem.

Pēc pārraides Lyra atjauno viļņu formu, aizpildot to, kas trūkst, izmantojot šo procesu, vienlaikus kaut kā ne pārāk sarežģīti skaitļošanas ziņā.

No vienas puses, tas ir tehnoloģisks brīnums, kas darbosies gandrīz visur. No otras puses, es joprojām neesmu simtprocentīgi pārliecināts, ka tā nav burvestība.

E-pasts
10 Google Duo funkcijas, kuras jums patiešām vajadzētu izmantot

Google Duo ir viena no labākajām videozvanu lietotnēm. Tam ir daudz funkciju, un šeit ir tie, kurus mēs domājam, ka jums patiešām vajadzētu izmantot.

Lasiet Tālāk

Saistītās tēmas
  • Tehniskās ziņas
  • Google
  • Android
  • Mašīnmācība
Par autoru
Īans Baklijs (Publicēti 209 raksti)

Īans Baklijs ir ārštata žurnālists, mūziķis, izpildītājs un video producents, kurš dzīvo Berlīnē, Vācijā. Kad viņš neraksta vai nav uz skatuves, viņš tiecas ar DIY elektroniku vai kodu, cerot kļūt par traku zinātnieku.

Vairāk no Iana Baklija

Abonējiet mūsu biļetenu

Pievienojieties mūsu informatīvajam izdevumam par tehniskiem padomiem, atsauksmēm, bezmaksas e-grāmatām un ekskluzīviem piedāvājumiem!

Vēl viens solis !!!

Lūdzu, apstipriniet savu e-pasta adresi e-pastā, kuru tikko nosūtījām.

.