Pandas ir atvērtā koda Python bibliotēka, ko galvenokārt izmanto datu apstrādei un analīzei. Tas ir izveidots, izmantojot NumPy bibliotēku, un nodrošina augstas veiktspējas, viegli lietojamas datu struktūras un datu analīzes rīkus Python programmēšanas valodai.

Šajā rakstā jūs uzzināsit, kā veikt 6 pamatdarbības, izmantojot Pandas.

Pandas piemēru izmantošana

Šajā rakstā sniegtos piemērus varat palaist, izmantojot skaitļošanas piezīmju grāmatiņas, piemēram Jupyter piezīmju grāmatiņa, Google Colabutt. Varat arī palaist piemērus, ievadot kodu tieši Python tulkā interaktīvajā režīmā.

Ja vēlaties apskatīt visu šajā rakstā izmantoto avota kodu, varat piekļūt Python Notebook failam no šī GitHub repozitorijs.

1. Kā importēt Pandas kā pd un izdrukāt versijas numuru

Jums ir jāizmanto imports atslēgvārds, lai importētu jebkuru Python bibliotēku. Pandas parasti tiek importētas saskaņā ar pd aizstājvārds. Izmantojot šo pieeju, varat atsaukties uz Pandas paketi kā pd tā vietā pandas.

importēt pandas kā pd
drukāt (pd.__version__)
instagram viewer

Izvade:

1.2.4

2. Kā izveidot sēriju Pandas

Pandas sērija ir viendimensionāls masīvs, kurā ir jebkura veida dati. Tas ir kā tabulas kolonna. Varat izveidot sēriju, izmantojot numpy masīvus, numpy funkcijas, sarakstus, vārdnīcas, skalārās vērtības utt.

Sērijas vērtības ir marķētas ar to indeksa numuru. Pēc noklusējuma pirmajai vērtībai ir indekss 0, otrajai vērtībai ir indekss 1 un tā tālāk. Lai nosauktu savas etiķetes, jums ir jāizmanto rādītājs arguments.

Kā izveidot tukšu sēriju

s = pd. Sērija (dtype='float64')
s

Izvade:

Sērija ([], dtype: float64)

Iepriekš minētajā piemērā tukša sērija ar peldēt tiek izveidots datu tips.

Kā izveidot sēriju, izmantojot NumPy masīvu

importēt pandas kā pd
importēt numpy kā np
d = np.masīvs([1, 2, 3, 4, 5])
s = pd. Sērija (d)
s

Izvade:

0 1
1 2
2 3
3 4
4 5
dtype: int32

Saistīts: NumPy operācijas iesācējiem

Kā izveidot sēriju, izmantojot sarakstu

d = [1, 2, 3, 4, 5]
s = pd. Sērija (d)
s

Izvade:

0 1
1 2
2 3
3 4
4 5
dtype: int64

Kā izveidot sēriju ar indeksu

Lai izveidotu sēriju ar indeksu, jums ir jāizmanto rādītājs arguments. Indeksu skaitam jābūt vienādam ar sērijas elementu skaitu.

d = [1, 2, 3, 4, 5]
s = pd. Sērija (d, indekss=["viens", "divi", "trīs", "četri", "pieci"])
s

Izvade:

viens 1
divi 2
trīs 3
četri 4
pieci 5
dtype: int64

Kā izveidot sēriju, izmantojot vārdnīcu

Vārdnīcas atslēgas kļūst par sērijas etiķetēm.

d = {"viens": 1,
"divi": 2,
"trīs": 3,
"četri": 4,
"pieci": 5}
s = pd. Sērija (d)
s

Izvade:

viens 1
divi 2
trīs 3
četri 4
pieci 5
dtype: int64

Kā izveidot sēriju, izmantojot skalāro vērtību

Ja vēlaties izveidot sēriju, izmantojot skalāro vērtību, jums ir jānorāda rādītājs arguments.

s = pd. Sērija (1, indekss = ["a", "b", "c", "d"])
s

Izvade:

a 1
b 1
c 1
d 1
dtype: int64

3. Kā izveidot datu rāmi programmā Pandas

DataFrame ir divdimensiju datu struktūra, kurā dati ir izlīdzināti rindu un kolonnu veidā. DataFrame var izveidot, izmantojot vārdnīcas, sarakstus, vārdnīcu sarakstu, numpy masīvus utt. Reālajā pasaulē DataFrames tiek izveidoti, izmantojot esošu krātuvi, piemēram, CSV failus, Excel failus, SQL datu bāzes utt.

DataFrame objekts atbalsta vairākus atribūtus un metodes. Ja vēlaties uzzināt vairāk par tiem, varat iepazīties ar oficiālo dokumentāciju pandas datu rāmis.

Kā izveidot tukšu datu rāmi

df = pd. DataFrame()
drukāt (df)

Izvade:

Tukšs DataFrame
Kolonnas: []
Rādītājs: []

Kā izveidot DataFrame, izmantojot sarakstu

listObj = ["MUO", "tehnoloģija", "vienkāršota"]
df = pd. DataFrame (listObj)
drukāt (df)

Izvade:

 0
0 MUO
1 tehnoloģija
2 vienkāršoti

Kā izveidot DataFrame, izmantojot vārdnīcu ndarray/Lists

batmanData = {'Filmas nosaukums': ['Betmens sākas', 'Tumšais bruņinieks', 'Tumšais bruņinieks pieaug'],
'Izlaiduma gads': [2005, 2008, 2012]}
df = pd. DataFrame (BatmanData)
drukāt (df)

Izvade:

 Filmas nosaukums Izlaiduma gads
0 Betmens sāk 2005. gads
1 Tumšais bruņinieks 2008
2 The Dark Knight Rises 2012

Kā izveidot DataFrame, izmantojot sarakstu sarakstu

dati = [['Alekss', 601], ['Bobs', 602], ['Katalīna', 603]]
df = pd. DataFrame (dati, kolonnas = ['Nosaukums', 'Ruļa Nr.'])
drukāt (df)

Izvade:

 Nosaukums Roll Nr.
0 Alekss 601
1 Bobs 602
2 Cataline 603

Kā izveidot DataFrame, izmantojot vārdnīcu sarakstu

data = [{'Vārds': 'Alekss', 'Ruļa Nr.': 601},
{'Nosaukums': 'Bobs', 'Ruļa Nr.': 602},
{'Nosaukums': 'Katalīna', 'Ruļa Nr.': 603}]
df = pd. DataFrame (dati)
drukāt (df)

Izvade:

 Nosaukums Roll Nr.
0 Alekss 601
1 Bobs 602
2 Cataline 603

Saistīts: Kā pārvērst sarakstu vārdnīcā Python

Kā izveidot datu rāmi, izmantojot zip() funkciju

Izmantojiet zip() funkciju sarakstu sapludināšanai Python.

Vārds = ['Alekss', "Bobs", "Katalīna"]
RollNo = [601, 602, 603]
listOfTuples = saraksts (zip (Name, RollNo))
df = pd. DataFrame (listOfTuples, columns = ['Nosaukums', "Rules numurs"])
drukāt (df)

Izvade:

 Nosaukums Roll Nr.
0 Alekss 601
1 Bobs 602
2 Cataline 603

4. Kā lasīt CSV datus programmā Pandas

"Komatatdalīto vērtību" (CSV) fails ir norobežots teksta fails, kurā vērtību atdalīšanai izmanto komatu. Varat lasīt CSV failu, izmantojot lasīt_csv() metode pandās. Ja vēlaties izdrukāt visu DataFrame, izmantojiet to_string() metodi.

Šajā un nākamajos piemēros šis CSV fails tiks izmantoti operāciju veikšanai.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukāt (df.to_string())

Izvade:

5. Kā analizēt datu rāmjus, izmantojot head(), tail() un info() metodes

Kā skatīt datus, izmantojot head() metodi

The galva () metode ir viens no labākajiem veidiem, kā iegūt ātru DataFrame pārskatu. Šī metode atgriež galveni un norādīto rindu skaitu, sākot no augšas.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
druka (df.head (10))

Izvade:

Ja nenorādīsit rindu skaitu, tiks atgrieztas pirmās 5 rindas.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukāt (df.head())

Izvade:

Kā skatīt datus, izmantojot asti() metodi

The aste () metode atgriež galveni un norādīto rindu skaitu, sākot no apakšas.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukāt (df.tail (10))

Izvade:

Ja nenorādīsit rindu skaitu, tiks atgrieztas pēdējās 5 rindas.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukāt (df.tail())

Izvade:

Kā iegūt informāciju par datiem

The info() metodes atgriež īsu DataFrame kopsavilkumu, tostarp indeksu dtype un kolonnas dtypes, vērtības, kas nav nulles, un atmiņas lietojumu.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukāt (df.info())

Izvade:

6. Kā lasīt JSON datus programmā Pandas

JSON (avaScrib Oobjekts Notation) ir viegls datu apmaiņas formāts. Varat lasīt JSON failu, izmantojot lasīt_json() metode pandās. Ja vēlaties izdrukāt visu DataFrame, izmantojiet to_string() metodi.

Zemāk esošajā piemērā šis JSON fails tiek izmantots operāciju veikšanai.

Saistīts: Kas ir JSON? Laju pārskats

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
drukāt (df.to_string())

Izvade:

Atsvaidziniet savas Python zināšanas, izmantojot iebūvētās funkcijas un metodes

Funkcijas palīdz saīsināt kodu un uzlabot tā efektivitāti. Funkcijas un metodes, piemēram samazināt (), sadalīt (), uzskaitīt (), eval(), raunds()utt. var padarīt jūsu kodu stabilu un viegli saprotamu. Vienmēr ir labi zināt par iebūvētajām funkcijām un metodēm, jo ​​tās var lielā mērā vienkāršot programmēšanas uzdevumus.

DalītiesČivinātE-pasts
20 Python funkcijas, kas jums jāzina

Python standarta bibliotēkā ir daudzas funkcijas, kas palīdz veikt programmēšanas uzdevumus. Uzziniet par visnoderīgāko un izveidojiet stabilāku kodu.

Lasiet Tālāk

Saistītās tēmas
  • Programmēšana
  • Python
  • Web izstrāde
  • Programmēšana
  • Datu analīze
Par autoru
Juvrajs Čandra (Publicēti 69 raksti)

Yuvraj ir datorzinātņu bakalaura students Deli Universitātē, Indijā. Viņš aizraujas ar Full Stack tīmekļa izstrādi. Kad viņš neraksta, viņš pēta dažādu tehnoloģiju dziļumu.

Vairāk no Yuvraj Chandra

Abonējiet mūsu biļetenu

Pievienojieties mūsu biļetenam, lai saņemtu tehniskos padomus, pārskatus, bezmaksas e-grāmatas un ekskluzīvus piedāvājumus!

Noklikšķiniet šeit, lai abonētu