Mašīnmācība mūsdienās ir kļuvusi par diskusiju centru mākslīgajā intelektā. Tas skar visas jomas, ieskaitot inženierzinātnes, medicīnu, uzņēmējdarbību, sociālās zinātnes un citas.
Izmantojot vairākas šodien pieejamās mašīnmācīšanās bibliotēkas, cita starpā mašīnmācīšanās ar Python, C ++, Java, Julia un R ir vienkāršāka. Šeit ir dažas populāras mašīnmācīšanās bibliotēkas, ar kurām varat sākt, ja vēlaties iesaistīties šajā daudzsološajā karjeras ceļā.
1. Keras
Keras ir daļa no TensorFlow plašajām mašīnmācīšanās utilītprogrammām. Bet tas atšķiras ar to, ka tā ir augstāka līmeņa API, kas tiek piegādāta kopā ar TensorFlow. Turklāt tas ir cilvēkiem draudzīgāks un rakstīts ar Python. Tātad tas ir vairāk īstenojams, jo piedāvā kodolīgu dokumentāciju, kuru ir viegli sašaurināt mašīnmācīšanās iesācējiem.
Tomēr Keras piedāvā plašu mašīnmācīšanās funkciju klāstu, kas ir ideāli piemērots gan strukturētu datu, gan neapstrādātu datu nesēju apmācībai. Tomēr bibliotēka aptver teksta un attēlu algoritmus, lai apmācītu un pārbaudītu jūsu datu kopu.
Keras unikālā iezīme ir tā, ka tā ļauj jums koncentrēties uz bibliotēku, jo tā nodrošina visu jūsu projektam nepieciešamo vienā gabalā. Tātad jums diez vai vajadzēs sazaroties, lai aizņemtos komunālos pakalpojumus no citām bibliotēkām. Hiperparametru regulēšana, funkciju izvēle, bagātīgi datu priekšapstrādes slāņi un datu tīrīšana ir dažas no tās iespaidīgi iebūvētajām funkcijām.
Izmantojot Keras, jūs varat lasīt attēlus un tekstus tieši no sadalītajām mapēm vecāku direktorijā un iegūt no tiem marķētu datu kopu. Un, ja jūsu dati ir lieli un neatrodas jūsu ierīces atmiņā, Keras piedāvā augstas veiktspējas datu kopas objekta iespēju. Jūs vienmēr varat pāriet uz to.
Saistīts: Kā uzlabot savas Python un AI prasmes, izmantojot Python mašīnmācības bibliotēkas
Turklāt tas piedāvā dažādas grafiskās apstrādes vienības (GPU) lielas datu kopas apstrādei. Tātad tas ļauj vienlaikus veikt CPU aprēķinus kopā ar GPU apstrādi asinhroni.
2. TensorFlow
Google ieviesa 2015. gadā, TensorFlow ir vairāk ietvars nekā bibliotēka. Tā ir atvērtā pirmkoda bibliotēka, kas veidota ar C ++, un tā darbojas, izsekojot datu plūsmas diagrammas.
TensorFlow ir ļoti universāls un plašs, piedāvājot daudz citu iebūvētu vienotu bibliotēku mašīnmācīšanās aprēķinu veikšanai. Būtībā TensorFlow piedāvā mērogojamu platformu tādu mašīnmācīšanās koncepciju veidošanai kā mākslīgie neironu tīkli (ANN), dziļi neironu tīkli un dziļa mācīšanās.
Saistīts: Kas ir TensorFlow Lite un kā tas ir dziļās mācīšanās ietvars?
Tensorflow papildus Python atbalsta arī Java, C ++, Julia, Rust, Ruby un JavaScript. Lai gan TensorFlow lietošana ar citām programmēšanas valodām, kas nav Python, var piedāvāt vienkāršu projektu integrāciju, tās kodolu izmantošana kopā ar Python ir vieglāka, jo tā pilnībā atbalsta TensorFlow ieviešanu.
Turklāt, izstrādājot konveijerus citās valodās, var rasties API versiju saderības problēmas, ja vēlāk ir jāmaina versijas. Lai gan TensorFlow dokumenti ir visaptveroši, atšķirībā no Keras, tie var būt pārāk daudzveidīgi, lai iesācēji to saprastu. Tomēr tam ir stabils sabiedrības atbalsts, un jūs arī atradīsit daudzus atvērtā koda TensorFlow piemēri tur ārā.
TensorFlow priekšrocība salīdzinājumā ar Keras ir tā, ka jūs varat izmantot TensorFlow tieši bez Keras. Protams, jūs nevarat teikt to pašu par Kerasu, jo tā ir sazarota TensorFlow klase.
3. Mliba dzirkstele
Šeit ir kaut kas diezgan ērts no Apache Spark. Izlaists un padarīts par atvērtā pirmkoda 2010. gadā, Mliba dzirkstele izmanto iteratīvus aprēķinus, lai palaistu mašīnmācīšanās algoritmus. Tā iteratīvā rakstura dēļ Mlib var izmantot Hadoop vai vietējos datu avotus un darbplūsmas. Turklāt tas spēj īsā laikā palaist sarežģītu loģiku.
Galu galā tā joprojām ir viena no ātrākajām mašīnmācīšanās bibliotēkām. Tas vada plašu mašīnmācīšanās algoritmu klāstu, ieskaitot regresijas, klasterizācijas, klasifikācijas un ieteikumu modeļus. Tas izceļas arī datu priekšapstrādes un modeļu ieguves ziņā.
Saistīts: Kas ir mašīnmācīšanās algoritmi? Lūk, kā viņi strādā
Bibliotēka ir dinamiska un piedāvā stabilu API, kas ir savienojama ar Scala, Python, R un Java. Mlib Spark ir paša Spark iegulšana, tāpēc tā tiek uzlabota ar katru Spark laidienu.
Mlib Spark ir paskaidrojoša dokumentācija, tāpēc iesācējs to var viegli paņemt. Bet neliels mīnuss ir tas, ka tas tiek integrēts tikai ar dažām programmēšanas valodām, tāpēc šī problēma var rasties, ja neesat pazīstams ar valodām, kuras tā pašlaik atbalsta.
4. mlpaka
mlpaka tika izlaists 2008. gadā un tika izstrādāts ar C ++, izmantojot lineārās algebras bibliotēku ar nosaukumu Armadillo. Tāpat kā Mlib Spark, tas ļauj izmantot lielāko daļu pieejamo mašīnmācīšanās algoritmu un koncepciju tieši savai datu kopai, izmantojot kodolīgas un lasāmas koda rindiņas.
Papildus tam, ka tā ir pieejama tādās programmēšanas valodās kā Python, C ++, Go un Julia, tā atbalsta arī CLI izpildi, kas ļauj palaist kodu un saņemt tūlītējas atbildes. Lai gan tas atbalsta saistīšanu ar šīm citām valodām, mlpack palaišana lielās datu kopās, kurām nepieciešams sarežģīts aprēķins, var nebūt lieliska ideja, ja to lieto kopā ar citu programmēšanas valodu. Tādējādi mērogojamība ar citām valodām, izņemot C ++, bieži ir problēma ar mlpack.
Ja esat mašīnmācīšanās iesācējs un esat informēts par C ++, jūs joprojām varat to izmēģināt. Dokumentācijā ir viegli izpildāmas rokasgrāmatas un piemēri, kas pieejami dažādām programmēšanas valodām. Tā kā mlpack izmanto C ++ jēdzienu aprēķinus, tas izmanto zema līmeņa kodu, lai ātri izpildītu sarežģītus un vienkāršus mašīnmācīšanās uzdevumus.
5. Pytorch
Izstrādāts Facebook Pytorch un oficiāli to izlaida 2016. Pytorch ir plaši pazīstama ar savu plašo pielietojumu datoru redzējumā, dziļu mācīšanos un dabiskās valodas apstrādi, un tā ir atvērtā pirmkoda bibliotēka, kas veidota no Torch sistēmas.
Tāpat kā Keras un Tensorflow, Pytorch atbalsta datu kopu CPU apstrādi. Un, ja jūsu datu kopa ir liela, tajā ir GPU procesors, lai apstrādātu jūsu aprēķinus. Turklāt tas ir balstīts uz tenzoru.
Papildus Python bibliotēka atbalsta saistīšanu gan C ++, gan Java. Pytorch papildus citiem komunālajiem pakalpojumiem piedāvā papildu bibliotēkas, tostarp lāpu redzējums, lāpas teksts, torchaudio, un TorchServe.
Šīs bibliotēkas ir daļa no Pytorch mašīnmācīšanās funkcijām, un jūs tās satiksit, rakstot savus Pytorch modeļus. Izmantojot detalizētu un visaptverošu dokumentāciju, kas balstīta uz apmācībām, Pytorch ir viegli saprotams, ja vien esat iepazinies ar mašīnmācīšanās koncepcijām.
Pytorch arī ļauj pārveidot datu kopas mašīnām draudzīgā formātā. Tā ir arī ideāla bibliotēka datu priekšapstrādei. Izmantojot Pytorch, vienmēr ir iespējama funkciju ieguve, datu tīrīšana, datu sadalīšana un hiperparametru iestatīšana.
6. Scikit-Learn
Aizraujoši veidota ar Python, scikit-mācīties, ko sauc arī par iemācīties, tika publiski izlaists 2010. Tomēr bibliotēka piedāvā plašu mašīnmācīšanās lietojumprogrammu klāstu, tostarp piedāvāto un nepiedāvāto datu kopu modelēšanu.
Scikit-learning piedāvā pazīstamus uzraudzītus algoritmus, tostarp lineāros un loģistikas regresijas modeļus, atbalsta vektoru mašīna (SVM), Naive Bayes, Lēmumu koki, Tuvākie kaimiņi, cita starpā, tieši no kaste. Tas ir arī bagātīgs neuzraudzītu mācību metožu avots, piemēram, klasterizācija, Gausa modelis kopā ar neironu tīkla modeļiem un citi.
Būtībā scikit-learning atbalsta gan uzraudzītus, gan neuzraudzītus modeļus. Tas ir lielisks sākumpunkts, ja jūs vēl neesat iesācējs Python vai mašīnmācībā kopumā, jo tas ir pilnībā balstīts uz Python. Un, ja jūs tikko sākat ar mašīnmācīšanos vai datu zinātni, iespējams, vēlēsities sākt ar uzraudzītajām scikit-learning mācīšanās funkcijām.
Kopumā tā ir draudzīgāka iesācējiem nekā citas sarakstā iekļautās bibliotēkas. Atšķirībā no citām iepriekš minētajām bibliotēkām, augstas veiktspējas matemātisko aprēķinu veikšanai scikit-learning ir lielā mērā atkarīgs no Numpy un Scipy. Tas arī izmanto Matplotlib, lai prezentētu pārliecinošas stāstu stāstīšanas vizualizācijas.
7. Theano
Ja meklējat bibliotēku, kas palīdzēs sarežģītas problēmas sadalīt elastīgos algoritmos, tad Theano varētu būt tas, ko tu vēlies. Theano, ko 2007. gadā izveidoja Yoshua Bengio Monreālā, Kanādā, ir spēcīga bibliotēka mazu un augstas veiktspējas aprēķinu veikšanai.
Tāpat kā Scikit-Learn, Theano ir atkarīgs no Numpy, lai veiktu skaitliskos aprēķinus. Bibliotēka atbalsta GPU aprēķinus, kā arī ģenerē zema līmeņa C kodu. Tas paātrina matemātiskos novērtējumus, izmantojot Theano, neatkarīgi no to lieluma. Turklāt tā dziļās mācīšanās modeļi darbojas ar tenzoriem.
Izmantojot Theano, jūs varat pārvērst savu datu kopu lasāmos peldošos, bināros vai veselos skaitļos neatkarīgi no tā sākotnējā datu veida. Tomēr jūs, iespējams, nesaņemat pietiekamu sabiedrības atbalstu. Tas ir tāpēc, ka Theano nav tik populārs kā citas iepriekš minētās bibliotēkas. Tas nepadara to mazāk draudzīgu iesācējiem.
Pamācība dokumentos ir viegli saprotama. Tā spēja vienkāršot sarežģītus masīvus un optimizēt bezgalīgus aprēķinus padara to ideāli piemērotu pielāgojamu mašīnmācīšanās modeļu izveidošanai.
Kuru bibliotēku jums vajadzētu izmantot nākamajā mašīnmācīšanās projektā?
Lai gan mēs esam minējuši dažas no visplašāk izmantotajām mašīnmācīšanās bibliotēkām, nākam klajā ar labākais var būt grūts, jo tie visi kalpo ļoti līdzīgiem mērķiem un tikai dažās atšķirībās Iespējas.
Protams, ja sākat ar iesācējiem draudzīgāku bibliotēku, piemēram, Scikit-Learn vai Keras, ir noderīgi, ja jūs vienkārši ielaujaties šajā jomā. Turklāt, mērķtiecīgi izvēloties bibliotēku projektam, jūs varēsit sašaurināt sarežģītību attīstības plānā. Tomēr ir lietderīgi iepazīties ar mašīnmācīšanās pamatiem, izmantojot kursus un apmācības.
Mašīnmācīšanās algoritmi ir paredzēti, lai atvieglotu dzīvi un uzlabotu sistēmas, taču tie var noiet greizi ar sliktām sekām.
Lasīt Tālāk
- Programmēšana
- Mašīnmācīšanās
- Programmēšana

Idowu aizraujas ar jebko gudru tehnoloģiju un produktivitāti. Brīvajā laikā viņš spēlējas ar kodēšanu un pārslēdzas uz šaha galdu, kad viņam ir garlaicīgi, taču viņam arī patīk laiku pa laikam atrauties no rutīnas. Viņa aizraušanās parādīt cilvēkiem ceļu apkārt mūsdienu tehnoloģijām motivē viņu rakstīt vairāk.
Abonējiet mūsu biļetenu
Pievienojieties mūsu informatīvajam izdevumam, lai iegūtu tehniskus padomus, pārskatus, bezmaksas e -grāmatas un ekskluzīvus piedāvājumus!
Noklikšķiniet šeit, lai abonētu