Kad cilvēks skatās uz ainu vai attēlu, viņš to saprot - kādi objekti tajā atrodas un kas notiek, ja notiek darbība. Savukārt dators apstrādā tikai digitālos datus, kas apraksta katra pikseļa krāsu vērtību. Cilvēkam picas atpazīšana uz pārblīvēta galda ir bez piepūles. Bet vēl nesen datori nevarēja veikt to pašu uzdevumu.

Datora redze jeb CV ļauj datoram spēt atlasīt svarīgu informāciju no vizuālajiem ievadiem un sniegt precīzas prognozes un ieteikumus, pamatojoties uz šo informāciju.

Kā darbojas datorvīzija?

Pirms datora redzēšanas, lai izveidotu programmu, kas atpazītu konkrētu attēlu, cilvēkam vairākas stundas būtu jāveic manuāls kāju darbs. Pirmkārt, būtu jāsalīdzina līdzīgu attēlu datu bāze.

Pēc tam šie attēli būtu manuāli jāanalizē, jāmēra un jāpieskaita pie attiecīgiem datiem ka pētnieks domāja, ka varētu identificēt attiecīgo objektu (piemēram, krāsu, mērījumus un forma). Tikai tad programmatūru varēja izmantot, lai veiktu prognozes.

No otras puses, datorredze automatizē visu šo procesu, izmantojot mašīnmācīšanās pieeju, kas pazīstama kā dziļa mācīšanās.

instagram viewer
Dziļi mācoties tiek izmantots daudzslāņu neironu tīkls ar simtiem potenciālo slāņu. Attēlu gadījumā tas parasti ir konvolucionāls neironu tīkls (CNN).

Detalizēti izskaidrojot, kā darbojas dziļi mācīšanās un neironu tīkli, tas tālu pārsniedz šī raksta darbības jomu. Būtībā liels datu daudzums tiek ievadīts neironu tīklā. Neironu tīkls atkārtoti analizē datus, līdz tas var veidot precīzas prognozes par tiem.

CNN gadījumā, ko izmanto datora redzes uzdevumam, neironu tīkls datus veic, veicot vairākas darbības. Pirmkārt, tas sakļauj attēlu vairākos gabalos (atsevišķi pikseļi vai pikseļu grupas, kas iepriekš ir iezīmētas).

Pēc tam tiek prognozēts, kas atrodas dažādos attēla gabalos (piemēram, cietās malas vai konkrēti objekti). Tas atkārtoti pārbauda šo pareģojumu precizitāti un katru reizi nedaudz maina algoritma daļas, līdz tas kļūst ļoti precīzs.

Datori tagad ir tik jaudīgi, ka var analizēt attēlu daudz ātrāk nekā cilvēka smadzenes, it īpaši pēc tam, kad viņi ir iemācījušies atpazīt noteiktus modeļus. Tādā veidā ir viegli saprast, kā dziļa mācību algoritms varētu pārspēt cilvēka spējas.

Kādi ir redzes veidi datorā?

Datorvīzija ietver attēlu analīzi un izpratni, kā arī attiecīgu pareģojumu vai lēmumu izstrādi par attēliem. Ir dažādi uzdevumi, kurus datoru redzējums izmantos šo mērķu sasniegšanai. Daži no tiem ietver:

  • Attēlu klasifikācija: Tiek atpazīts attēla tips. Piemēram, vai tā ir personas seja, ainava vai objekts. Šāda veida uzdevumu var izmantot, lai ātri identificētu un klasificētu attēlus. Viens no šiem mērķiem ir nepiemērota satura automātiska atpazīšana un bloķēšana sociālajos tīklos.
  • Objekta atpazīšana: Līdzīgi attēlu klasifikācijai, objektu atpazīšana var identificēt konkrētu objektu ainā - piemēram, picu uz pārblīvēta galda.
  • Malas noteikšana: Datora redzes izplatīta izmantošana un parasti objektu noteikšanas pirmais solis ir attēla cieto malu identificēšana.
  • Objekta identifikācija: Tas ir objekta vai attēla atsevišķu piemēru atpazīšana, piemēram, konkrētas personas identificēšana, pirkstu nospiedumi vai transportlīdzeklis.
  • Objekta noteikšana: Atklāšana ir konkrētas pazīmes identificēšana attēlā, piemēram, kaula lūzums rentgenogrammā.
  • Objekta segmentēšana: Ar to tiek identificēti attēla pikseļi, kas pieder attiecīgajam objektam.
  • Objekta izsekošana: Video secībā, kad objekts ir atpazīts, to var viegli izsekot visā videoklipā.
  • Attēlu atjaunošana: Aizmiglošanu, trokšņus un citus attēla artefaktus var noņemt, precīzi nosakot, kur attēlā atrodas objekts pret fonu.

Datora redzes piemēri

Mākslīgais intelekts ir jau izmantots vairākās nozarēs ar satriecošu efektu, kas attiecas uz datora redzi. Šeit ir daži šodien jau izmantotie CV piemēri.

Sejas atpazīšana

Sejas atpazīšana ir viens no galvenajiem veidiem, kā mūsdienās tiek izmantota datorredze. Salīdzinot ar zināmu seju datu bāzēm, datorredzes algoritmi var ļoti precīzi identificēt atsevišķus cilvēkus.

  • Sociālie mediji analizē attēlus un automātiski atzīmē lietotājus, ka tiem ir laba attēlu izvēle.
  • Klēpjdatori, tālruņi un drošības ierīces var identificēt cilvēkus, lai atļautu piekļuvi.
  • Likumsargi izmanto sejas atpazīšanu videonovērošanas sistēmās, lai identificētu aizdomās turamos.

Medicīna

Datora redze pašlaik tiek izmantota veselības aprūpē, lai nodrošinātu ātrāku un precīzāku diagnozi, nekā eksperti var noteikt. Daudzas lietojumprogrammas ietver rentgena, CT vai MRI attēlu analīzi noteiktiem apstākļiem, ieskaitot neiroloģiskas slimības, audzējus un kaulu lūzumus vai lūzumus.

Pašpiedziņas automašīnas

Autonomiem transportlīdzekļiem ir jāsaprot apkārtne braukt droši. Tas nozīmē ceļu, joslu, satiksmes signālu, citu transportlīdzekļu, gājēju un citu atpazīšanu. Visos šajos uzdevumos tiek izmantotas datora redzes sistēmas reāllaikā, lai izvairītos no sadursmēm un droši brauktu.

Datora redze ir izaicinoša

Pašreizējās datorvīzijas lietojumprogrammas jau sāk mainīt mūsu darbības veidu dažādās nozarēs. No spēja atklāt bojātu vai salauztu aprīkojumu un precīzi diagnosticēt vēzi, datora redze spēj uzlabot sistēmas un glābt dzīvības.

Bet tas nav bez problēmām. Datora redze joprojām ir tālu no cilvēka redzes. Mums ir tūkstošiem gadu ilga evolūcija, kas ļauj reāllaikā atpazīt un saprast gandrīz visu, kas notiek mums apkārt. Bet mums nav ne jausmas, kā cilvēku smadzenes veic šos uzdevumus.

Dziļa mācīšanās ir milzīgs solis pareizajā virzienā, taču tas joprojām prasa pārsteidzošu darbu izveidot sistēmu, kas var veikt uzdevumu, kuru cilvēki var paveikt ļoti viegli, piemēram, identificēt automašīnu uz ceļa. Tas ir tāpēc, ka datori ļoti efektīvi veic ierobežotus uzdevumus. Datora izstrāde, kas var saprast vizuālās pasaules kopējo sarežģītību, ir pavisam cita bumbas spēle.

Tā kā tiek veikti vairāk pētījumu gan par AI lietojumprogrammām, gan par cilvēku bioloģiju, tuvākajā nākotnē, visticamāk, redzēsim datora redzamības iespējamo izmantojumu eksploziju.

E-pasts
Kas ir mašīnmācīšanās algoritmi? Lūk, kā viņi strādā

Mašīnmācīšanās algoritmi ir paredzēti, lai atvieglotu dzīvi un uzlabotu sistēmas, taču tie var kļūt nepareizi ar sliktām sekām.

Lasiet Tālāk

Saistītās tēmas
  • Tehnoloģija izskaidrota
  • Programmēšana
  • Mākslīgais intelekts
  • Neironu tīkli
Par autoru
Džeiks Harfīlds (Publicēti 16 raksti)

Džeiks Harfīlds ir ārštata rakstnieks, kurš dzīvo Pērtā, Austrālijā. Kad viņš neraksta, viņš parasti ir laukā, fotografējot vietējos savvaļas dzīvniekus. Jūs varat viņu apmeklēt www.jakeharfield.com

Vairāk no Džeika Harfīlda

Abonējiet mūsu biļetenu

Pievienojieties mūsu informatīvajam izdevumam par tehniskiem padomiem, atsauksmēm, bezmaksas e-grāmatām un ekskluzīviem piedāvājumiem!

Vēl viens solis !!!

Lūdzu, apstipriniet savu e-pasta adresi e-pastā, kuru tikko nosūtījām.

.