Vai atceraties laikus, kad izmantojāt fizisku globusu vai skenējāt lielu, smagu grāmatu, lai atrastu dažādu reģionu un valstu nosaukumus? Pateicoties tehnoloģiju attīstībai, jo īpaši internetam, visa šī informācija tagad ir pieejama, noklikšķinot uz pogas.

Bet ko darīt, ja vēlaties spert soli tālāk un atrast svarīgus datus par valsti, piemēram, tās galvaspilsētu, ģeogrāfiskās koordinātas vai valūtu? Nemeklējiet tālāk par Python apbrīnojamo valsts informācijas moduli, kas var paveikt darbu dažu sekunžu laikā.

Kas ir CountryInfo modulis?

Porimols Chandro izstrādāja Informācija par valsti modulis. Tam ir funkcijas, lai iegūtu valsts galvaspilsētu, ģeogrāfiskās koordinātas, laika joslu, apgabalu, iedzīvotāju skaitu un daudz ko citu.

Lai instalētu šo moduli, atveriet savu termināli un izpildiet:

pip uzstādīt valsts informācija

Jūs varat arī iegūstiet jebkuras valsts vai reģiona reāllaika laika datus un izmantojiet to kopā ar informāciju un uzlabojiet savu datu kopu.

Kā lietot moduļa funkcijas

Varat iegūt informāciju, izmantojot dažādas funkcijas Valsts informācija moduli šādi.

1. Valsts alternatīvo vārdu vai rakstības iegūšana

Varat iegūt alternatīvos valsts nosaukumus vai rakstības veidus, piemēram:

no valsts informācija imports Valsts informācija
vārds = 'Indija'
valsts = Valsts informācija (nosaukums)
dati1 = country.alt_spellings()
drukāt(dati1)

Sāciet, importējot Valsts informācija klase no valsts informācija modulis. Pēc tam varat izveidot CountryInfo gadījumu, nosūtot tai virkni, kurā ir valsts nosaukums.

Izveidotajā CountryInfo objektā varat izsaukt dažādas API metodes. Piemēram, alt_spellings() atgriež valsts alternatīvo nosaukumu sarakstu.

Python fragments valsts alternatīvo nosaukumu iegūšanai rada šādu izvadi:

2. Galvaspilsētas un tās ģeogrāfisko koordinātu iegūšana

Tu vari izmantot kapitāls () lai iegūtu jebkuras valsts galvaspilsētu. Tas atgriež virkni, kas apzīmē galvaspilsētas nosaukumu:

dati2 = valsts.kapitāls()
drukāt(dati2)

Šis Python fragments rada šādu izvadi:

Izmantojiet API metodi captial_latlng() lai iegūtu valsts galvaspilsētas ģeogrāfiskās koordinātas. Šī metode atgriež sarakstu, kurā ir divi elementi, katrs ar peldošā komata skaitli:

dati3 = valsts.kapitāls_latlng()
drukāt(dati3)

Python fragments, lai iegūtu valsts platuma un platuma grādus, rada šādu izvadi:

3. Valsts teritorijas, tās provinču un apkārtējo pierobežas valstu iegūšana

Varat izmantot API metodi, apgabals () lai iegūtu jebkuras valsts platību kvadrātkilometros. Ieviesiet kodu šādi:

dati4 = valsts.apgabals()
drukāt(dati4)

Python fragments valsts apgabala iegūšanai rada šādu izvadi:

Varat iegūt valsts provinču sarakstu, izmantojot provinces (). Katrs saraksta elements ir virkne, kas apzīmē provinci. Ieviesiet kodu šādi:

dati5 = valsts.provinces()
drukāt(dati5)

Python fragments valsts provinču iegūšanai rada šādu izvadi:

Jūs varat iegūt robežvalstu nosaukumus, izmantojot API metodi, robežas (). Katrs saraksta elements ir valsts kods ISO-3 formātā, trīs rakstzīmju lielo burtu virkne. Ieviesiet kodu šādi:

dati6 = country.borders()
drukāt(dati6)

Python fragments pierobežas valstu nosaukuma iegūšanai rada šādu izvadi:

4. Valsts zvanu kodu iegūšana

Varat iegūt valsts starptautiskos zvanu kodus, izmantojot zvana_kodi(). Tas atgriež virkņu sarakstu, katrā no kurām ir ciparu tālruņa prefikss, kas jums nepieciešams, lai zvanītu uz citu valsti:

dati7 = country.calling_codes()
drukāt(dati7)

Python fragments valsts izsaukuma kodu iegūšanai rada šādu izvadi:

5. Valūtas, iedzīvotāju un laika joslu iegūšana

Iegūstiet valsts oficiālo valūtas formātu, izmantojot API metodi, valūtas (). Šī metode atgriež citu virkņu sarakstu:

dati8 = valsts.valūtas()
drukāt(dati8)

Python fragments valsts valūtas iegūšanai rada šādu izvadi:

Iegūstiet aptuveno cilvēku skaitu, kas dzīvo valstī, izmantojot populācija(). Šī metode atgriež int. Izmantojiet to šādi:

dati9 = valsts.iedzīvotāji()
drukāt(dati9)

Python fragments valsts iedzīvotāju skaita iegūšanai rada šādu izvadi:

Valstij var būt viena vai vairākas laika joslas atkarībā no tās lieluma. Varat iegūt dažādas valsts laika joslas, izmantojot laika zonas() API metode kā:

dati10 = country.timezones()
drukāt(dati10)

Python fragments dažādu valsts laika joslu iegūšanai rada šādu izvadi:

6. Valsts reģiona un apakšreģiona iegūšana

Iegūstiet vispārējo reģionu vai kontinentu, kuram pieder valsts, izmantojot novads() API metode. Ieviesiet kodu šādi:

dati11 = valsts.reģions()
drukāt(dati11)

Python fragments valsts reģiona iegūšanai rada šādu izvadi:

Tāpat varat izmantot konkrētāku reģionu, kuram pieder valsts apakšreģions () kā:

dati12 = valsts.apakšreģions()
drukāt(dati12)

Python fragments valsts apakšreģiona iegūšanai rada šādu izvadi:

7. Valsts Wikipedia URL iegūšana

Vikipēdija ir viens no labākajiem informācijas avotiem internetā. Varat ienest valsts Wikipedia lapu, izmantojot API metodi, wiki (). Ieviesiet kodu šādi:

dati13 = country.wiki()
drukāt(dati13)

Python fragments valsts Wikipedia lapas iegūšanai rada šādu izvadi:

8. Augstākā līmeņa domēna iegūšana valstij

ccTLD ir valsts koda augstākā līmeņa domēna nosaukums, kas norāda valsti vai vietnes ģeogrāfisko apgabalu. Parasti tas ir divus burtus garš, piemēram, .in Indijai un .ca par Kanādu. Varat iegūt augstākā līmeņa domēnu valstij, kas izmanto tld() kā:

dati14 = country.tld()
drukāt(dati14)

Python fragments valsts augstākā līmeņa domēna iegūšanai rada šādu izvadi:

9. Iegūstiet visu pieejamo informāciju par valsti

Varat iegūt visu pieejamo informāciju par valsti, izmantojot API metodi, info(). Tas atgriež atslēgas/nosaukuma vērtību vārdnīcu, kuru varat atkārtot, izmantojot for cilpu:

dati15 = country.info()
priekštaustiņu, vērtībuiekšādati15.preces():
drukāt (atslēga, ":", vērtība)

Python fragments visas pieejamās informācijas iegūšanai par valsti rada šādu izvadi:

10. Informācijas iegūšana par visām valstīm un datu kopas izveide

CountryInfo modulis nodrošina API metodi, ko sauc viss () kas atgriež vārdnīcu, kurā ir visa informācija par visām pasaules valstīm:

no valsts informācija imports Valsts informācija
imports pandas pd
valsts = Valsts informācija()
dati = valsts.visi()

Lai manipulētu ar šiem datiem, varat izmantot moduli Pandas. The Pandas modulis nodrošina daudzas komandas darbam ar DataFrames, tostarp viens datu saglabāšanai CSV formātā:

df = pd. DataFrame (dati)
df.to_csv("Country_Data_Fetcher.csv")

Datu ienešana no vietnēm

Lai gan šis parocīgais Python modulis nodrošina visu būtisko informāciju par jebkuru valsti, tīru datu iegūšana nav viegls uzdevums. Zināšanas par tīmekļa nokopšanu palīdzēs iegūt datus no jebkuras tīmekļa vietnes internetā. Pēc tam varat analizēt un izmantot šos datus savās lietojumprogrammās.

Python ir jaudīgs modulis ar nosaukumu BeautifulSoup, ko varat instalēt, lai veiktu tīmekļa skrāpēšanu un ietaupītu darba stundas.