Pandas ir atvērtā koda Python bibliotēka, ko galvenokārt izmanto datu apstrādei un analīzei. Tas ir izveidots, izmantojot NumPy bibliotēku, un nodrošina augstas veiktspējas, viegli lietojamas datu struktūras un datu analīzes rīkus Python programmēšanas valodai.
Šajā rakstā jūs uzzināsit, kā veikt 6 pamatdarbības, izmantojot Pandas.
Pandas piemēru izmantošana
Šajā rakstā sniegtos piemērus varat palaist, izmantojot skaitļošanas piezīmju grāmatiņas, piemēram Jupyter piezīmju grāmatiņa, Google Colabutt. Varat arī palaist piemērus, ievadot kodu tieši Python tulkā interaktīvajā režīmā.
Ja vēlaties apskatīt visu šajā rakstā izmantoto avota kodu, varat piekļūt Python Notebook failam no šī GitHub repozitorijs.
1. Kā importēt Pandas kā pd un izdrukāt versijas numuru
Jums ir jāizmanto imports atslēgvārds, lai importētu jebkuru Python bibliotēku. Pandas parasti tiek importētas saskaņā ar pd aizstājvārds. Izmantojot šo pieeju, varat atsaukties uz Pandas paketi kā pd tā vietā pandas.
importēt pandas kā pd
drukāt (pd.__version__)
Izvade:
1.2.4
2. Kā izveidot sēriju Pandas
Pandas sērija ir viendimensionāls masīvs, kurā ir jebkura veida dati. Tas ir kā tabulas kolonna. Varat izveidot sēriju, izmantojot numpy masīvus, numpy funkcijas, sarakstus, vārdnīcas, skalārās vērtības utt.
Sērijas vērtības ir marķētas ar to indeksa numuru. Pēc noklusējuma pirmajai vērtībai ir indekss 0, otrajai vērtībai ir indekss 1 un tā tālāk. Lai nosauktu savas etiķetes, jums ir jāizmanto rādītājs arguments.
Kā izveidot tukšu sēriju
s = pd. Sērija (dtype='float64')
s
Izvade:
Sērija ([], dtype: float64)
Iepriekš minētajā piemērā tukša sērija ar peldēt tiek izveidots datu tips.
Kā izveidot sēriju, izmantojot NumPy masīvu
importēt pandas kā pd
importēt numpy kā np
d = np.masīvs([1, 2, 3, 4, 5])
s = pd. Sērija (d)
s
Izvade:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Saistīts: NumPy operācijas iesācējiem
Kā izveidot sēriju, izmantojot sarakstu
d = [1, 2, 3, 4, 5]
s = pd. Sērija (d)
s
Izvade:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Kā izveidot sēriju ar indeksu
Lai izveidotu sēriju ar indeksu, jums ir jāizmanto rādītājs arguments. Indeksu skaitam jābūt vienādam ar sērijas elementu skaitu.
d = [1, 2, 3, 4, 5]
s = pd. Sērija (d, indekss=["viens", "divi", "trīs", "četri", "pieci"])
s
Izvade:
viens 1
divi 2
trīs 3
četri 4
pieci 5
dtype: int64
Kā izveidot sēriju, izmantojot vārdnīcu
Vārdnīcas atslēgas kļūst par sērijas etiķetēm.
d = {"viens": 1,
"divi": 2,
"trīs": 3,
"četri": 4,
"pieci": 5}
s = pd. Sērija (d)
s
Izvade:
viens 1
divi 2
trīs 3
četri 4
pieci 5
dtype: int64
Kā izveidot sēriju, izmantojot skalāro vērtību
Ja vēlaties izveidot sēriju, izmantojot skalāro vērtību, jums ir jānorāda rādītājs arguments.
s = pd. Sērija (1, indekss = ["a", "b", "c", "d"])
s
Izvade:
a 1
b 1
c 1
d 1
dtype: int64
3. Kā izveidot datu rāmi programmā Pandas
DataFrame ir divdimensiju datu struktūra, kurā dati ir izlīdzināti rindu un kolonnu veidā. DataFrame var izveidot, izmantojot vārdnīcas, sarakstus, vārdnīcu sarakstu, numpy masīvus utt. Reālajā pasaulē DataFrames tiek izveidoti, izmantojot esošu krātuvi, piemēram, CSV failus, Excel failus, SQL datu bāzes utt.
DataFrame objekts atbalsta vairākus atribūtus un metodes. Ja vēlaties uzzināt vairāk par tiem, varat iepazīties ar oficiālo dokumentāciju pandas datu rāmis.
Kā izveidot tukšu datu rāmi
df = pd. DataFrame()
drukāt (df)
Izvade:
Tukšs DataFrame
Kolonnas: []
Rādītājs: []
Kā izveidot DataFrame, izmantojot sarakstu
listObj = ["MUO", "tehnoloģija", "vienkāršota"]
df = pd. DataFrame (listObj)
drukāt (df)
Izvade:
0
0 MUO
1 tehnoloģija
2 vienkāršoti
Kā izveidot DataFrame, izmantojot vārdnīcu ndarray/Lists
batmanData = {'Filmas nosaukums': ['Betmens sākas', 'Tumšais bruņinieks', 'Tumšais bruņinieks pieaug'],
'Izlaiduma gads': [2005, 2008, 2012]}
df = pd. DataFrame (BatmanData)
drukāt (df)
Izvade:
Filmas nosaukums Izlaiduma gads
0 Betmens sāk 2005. gads
1 Tumšais bruņinieks 2008
2 The Dark Knight Rises 2012
Kā izveidot DataFrame, izmantojot sarakstu sarakstu
dati = [['Alekss', 601], ['Bobs', 602], ['Katalīna', 603]]
df = pd. DataFrame (dati, kolonnas = ['Nosaukums', 'Ruļa Nr.'])
drukāt (df)
Izvade:
Nosaukums Roll Nr.
0 Alekss 601
1 Bobs 602
2 Cataline 603
Kā izveidot DataFrame, izmantojot vārdnīcu sarakstu
data = [{'Vārds': 'Alekss', 'Ruļa Nr.': 601},
{'Nosaukums': 'Bobs', 'Ruļa Nr.': 602},
{'Nosaukums': 'Katalīna', 'Ruļa Nr.': 603}]
df = pd. DataFrame (dati)
drukāt (df)
Izvade:
Nosaukums Roll Nr.
0 Alekss 601
1 Bobs 602
2 Cataline 603
Saistīts: Kā pārvērst sarakstu vārdnīcā Python
Kā izveidot datu rāmi, izmantojot zip() funkciju
Izmantojiet zip() funkciju sarakstu sapludināšanai Python.
Vārds = ['Alekss', "Bobs", "Katalīna"]
RollNo = [601, 602, 603]
listOfTuples = saraksts (zip (Name, RollNo))
df = pd. DataFrame (listOfTuples, columns = ['Nosaukums', "Rules numurs"])
drukāt (df)
Izvade:
Nosaukums Roll Nr.
0 Alekss 601
1 Bobs 602
2 Cataline 603
4. Kā lasīt CSV datus programmā Pandas
"Komatatdalīto vērtību" (CSV) fails ir norobežots teksta fails, kurā vērtību atdalīšanai izmanto komatu. Varat lasīt CSV failu, izmantojot lasīt_csv() metode pandās. Ja vēlaties izdrukāt visu DataFrame, izmantojiet to_string() metodi.
Šajā un nākamajos piemēros šis CSV fails tiks izmantoti operāciju veikšanai.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukāt (df.to_string())
Izvade:
5. Kā analizēt datu rāmjus, izmantojot head(), tail() un info() metodes
Kā skatīt datus, izmantojot head() metodi
The galva () metode ir viens no labākajiem veidiem, kā iegūt ātru DataFrame pārskatu. Šī metode atgriež galveni un norādīto rindu skaitu, sākot no augšas.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
druka (df.head (10))
Izvade:
Ja nenorādīsit rindu skaitu, tiks atgrieztas pirmās 5 rindas.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukāt (df.head())
Izvade:
Kā skatīt datus, izmantojot asti() metodi
The aste () metode atgriež galveni un norādīto rindu skaitu, sākot no apakšas.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukāt (df.tail (10))
Izvade:
Ja nenorādīsit rindu skaitu, tiks atgrieztas pēdējās 5 rindas.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukāt (df.tail())
Izvade:
Kā iegūt informāciju par datiem
The info() metodes atgriež īsu DataFrame kopsavilkumu, tostarp indeksu dtype un kolonnas dtypes, vērtības, kas nav nulles, un atmiņas lietojumu.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukāt (df.info())
Izvade:
6. Kā lasīt JSON datus programmā Pandas
JSON (DžavaScrib Oobjekts Notation) ir viegls datu apmaiņas formāts. Varat lasīt JSON failu, izmantojot lasīt_json() metode pandās. Ja vēlaties izdrukāt visu DataFrame, izmantojiet to_string() metodi.
Zemāk esošajā piemērā šis JSON fails tiek izmantots operāciju veikšanai.
Saistīts: Kas ir JSON? Laju pārskats
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
drukāt (df.to_string())
Izvade:
Atsvaidziniet savas Python zināšanas, izmantojot iebūvētās funkcijas un metodes
Funkcijas palīdz saīsināt kodu un uzlabot tā efektivitāti. Funkcijas un metodes, piemēram samazināt (), sadalīt (), uzskaitīt (), eval(), raunds()utt. var padarīt jūsu kodu stabilu un viegli saprotamu. Vienmēr ir labi zināt par iebūvētajām funkcijām un metodēm, jo tās var lielā mērā vienkāršot programmēšanas uzdevumus.
Python standarta bibliotēkā ir daudzas funkcijas, kas palīdz veikt programmēšanas uzdevumus. Uzziniet par visnoderīgāko un izveidojiet stabilāku kodu.
Lasiet Tālāk
- Programmēšana
- Python
- Web izstrāde
- Programmēšana
- Datu analīze
Yuvraj ir datorzinātņu bakalaura students Deli Universitātē, Indijā. Viņš aizraujas ar Full Stack tīmekļa izstrādi. Kad viņš neraksta, viņš pēta dažādu tehnoloģiju dziļumu.
Abonējiet mūsu biļetenu
Pievienojieties mūsu biļetenam, lai saņemtu tehniskos padomus, pārskatus, bezmaksas e-grāmatas un ekskluzīvus piedāvājumus!
Noklikšķiniet šeit, lai abonētu