Python kā valoda ir nepārspējami vērtīga, it īpaši, ja vēlaties strādāt ar strukturētiem datiem. Tā kā cilvēki Excel failos glabā daudz datu, ir obligāti jāapvieno vairāki faili, lai ietaupītu laiku un pūles.

Python ļauj izdarīt tieši to; neatkarīgi no tā, cik Excel failu vēlaties apvienot, varat to izdarīt samērā viegli. Ņemot vērā bibliotēku un trešo pušu resursu klāstu, varat importēt un izmantot Python daudzpusīgos rīkus, lai noteiktu cenu.

Šajā rokasgrāmatā jums būs jāinstalē un jāizmanto Pandas bibliotēkas, lai importētu datus programmā Python pirms to konsolidēšanas.

Instalējiet Pandas bibliotēkas programmā Python

Pandas ir trešās puses bibliotēka, kuru varat instalēt programmā Python. Dažos IDE jau ir instalētas Pandas.

Ja jūs izmantojat an IDE versija Varat būt drošs, ka to var instalēt tieši programmā Python.

Lūk, kā instalēt Pandas:

pip instalēt pandas

Ja izmantojat Jupyter Notebook, varat instalēt Pandas tieši ar PIP komanda. Lielākoties, ja esat instalējis Jupyter ar Anaconda, pastāv liela iespēja, ka Pandas jau būs pieejamas tiešai lietošanai.

instagram viewer

Ja nevarat izsaukt Pandas, varat izmantot iepriekš minēto komandu, lai tās tieši instalētu.

Excel failu apvienošana ar Python

Pirmkārt, jums vēlamajā vietā ir jāizveido mape ar visiem Excel failiem. Kad mape ir gatava, varat sākt rakstīt kodu, lai importētu bibliotēkas.

Šajā kodā tiks izmantoti divi mainīgie:

  1. Pandas: Pandas bibliotēka nodrošina datu rāmjus Excel failu glabāšanai.
  2. OS: Bibliotēka ir noderīga datu nolasīšanai no ierīces mapes

Lai importētu šīs bibliotēkas, izmantojiet šīs komandas:

Importēt Pandas kā pd
Importēt OS
  • Importēt: Python sintakse, ko izmanto, lai importētu bibliotēkas Python
  • Pandas: Bibliotēkas nosaukums
  • pd: Bibliotēkai piešķirts aizstājvārds
  • OS: Bibliotēka, lai piekļūtu sistēmas mapei

Kad esat importējis bibliotēkas, izveidojiet divus mainīgos, lai saglabātu ievades un izvades faila ceļu. Ievades faila ceļš ir nepieciešams, lai piekļūtu failu mapei. Izvades faila ceļš ir nepieciešams, jo apvienotais fails tiks eksportēts tur.

Ja izmantojat Python, noteikti nomainiet atpakaļvērsto slīpsvītru uz uz priekšu (\ uz /)

input_file_path = "C:/Lietotāji/gaurav/OneDrive/Desktop/Excel faili/"
output_file_path = "C:/Lietotāji/gaurav/OneDrive/Desktop/"

Pievienojiet / beigās arī, lai pabeigtu celiņus.

Mapes faili ir pieejami sarakstā. Izveidojiet sarakstu, lai saglabātu visas ievades mapes failu atsauces, izmantojot listdir funkcija no OS bibliotēka.

Ja neesat pārliecināts par bibliotēkā pieejamajām funkcijām, varat izmantot rež funkcija ar bibliotēkas nosaukumu. Piemēram, lai pārbaudītu precīzu funkcijas listdir versiju, varat izmantot komandu šādi:

dir (OS)

Izvade sastāvēs no visām saistītajām funkcijām, kas pieejamas OS bibliotēkā. Listdir funkcija ir viena no daudzajām funkcijām, kas pieejamas šajā bibliotēkā.

Izveidojiet jaunu mainīgo, lai saglabātu ievades failus no mapes.

excel_file_list = os.listdir (input_file_path)

Izdrukājiet šo mainīgo, lai redzētu mapē saglabāto failu nosaukumus. Kad izmantojat drukāšanas funkciju, tiek parādīti visi mapē saglabātie faili.

drukāt (excel_failu_saraksts)

Pēc tam jums jāpievieno jauns datu rāmis, lai saglabātu katru Excel failu. Iedomājieties datu rāmi kā konteineru datu glabāšanai. Šeit ir komanda datu rāmja izveidei.

df = pd. DataFrame()
  • df: Mainīgais, lai saglabātu DataFrame vērtību
  • pd: Pseidonīms Pandas bibliotēka
  • DataFrame: Noklusējuma sintakse datu rāmja pievienošanai

Ievades mapei ir trīs .xlsx failus šajā piemērā. Failu nosaukumi ir:

Fails1_excel.xlsx
Fails2_excel.xlsx
Fails3_excel.xlsx

Lai atvērtu katru failu no šīs mapes, jums ir jāpalaiž cilpa. Cilpa darbosies katram failam iepriekš izveidotajā sarakstā.

Lūk, kā to izdarīt:

excel_file sarakstā excel_file_list:

Pēc tam ir jāpārbauda failu paplašinājumi, jo kods atvērs tikai XLSX failus. Lai pārbaudītu šos failus, varat izmantot Ja paziņojums, apgalvojums.

Izmantojiet beidzas ar funkcija šim nolūkam:

excel_file sarakstā excel_file_list:

ja excel_files.endswith(.xlsx"):

  • excel_files: Saraksts ar visām faila vērtībām
  • beidzas ar: Funkcija, lai pārbaudītu failu paplašinājumus
  • (.xlsx"): Šī virknes vērtība var mainīties atkarībā no tā, ko vēlaties meklēt

Tagad, kad esat identificējis Excel failus, varat izveidot jaunu datu rāmi, lai lasītu un saglabātu failus atsevišķi.

excel_file sarakstā excel_file_list:

ja excel_files.endswith(.xlsx"):

df1 = pd.read_excel (ievades_faila_ceļš+excel_faili)

  • df1: Jauns datu rāmis
  • pd: Pandas bibliotēka
  • read_excel: Funkcija Excel failu lasīšanai Pandas bibliotēkā
  • input_file_path: Mapes ceļš, kurā tiek glabāti faili
  • excel_files: Jebkurš mainīgais, kas tiek izmantots for cilpā

Lai sāktu pievienot failus, jums ir jāizmanto pievienot funkcija.

excel_file sarakstā excel_file_list:

ja excel_files.endswith(.xlsx"):

df1 = pd.read_excel (ievades_faila_ceļš+excel_faili)
df = df.append (df1)

Visbeidzot, tagad, kad konsolidēto datu rāmis ir gatavs, varat to eksportēt uz izvades vietu. Šajā gadījumā jūs eksportējat datu rāmi uz XLSX failu.

df.to_excel (output_file_path+"Consolidated_file.xlsx")
  • df: Eksportējamais datu rāmis
  • to_excel: Datu eksportēšanai izmantotā komanda
  • output_file_path: Izvades glabāšanas ceļš definēts
  • Consolidated_file.xlsx: Konsolidētā faila nosaukums

Tagad apskatīsim galīgo kodu:

#Pandas tiek izmantots kā datu rāmis, lai apstrādātu Excel failus
importēt pandas kā pd
importa os

# mainiet slīpsvītru no “\” uz “/”, ja izmantojat Windows ierīces

input_file_path = "C:/Lietotāji/gaurav/OneDrive/Desktop/Excel faili/"
output_file_path = "C:/Lietotāji/gaurav/OneDrive/Desktop/"

#izveidojiet sarakstu, lai saglabātu visas ievades mapes failu atsauces, izmantojot OS bibliotēkas funkciju listdir.
#Lai skatītu bibliotēkas saturu (piemēram, funkciju listdir, bibliotēkas nosaukumam varat izmantot funkciju dir).
#Izmantojiet dir (bibliotēkas_nosaukums), lai uzskaitītu saturu

excel_file_list = os.listdir (input_file_path)

#izdrukājiet visus mapē saglabātos failus pēc saraksta definēšanas
excel_file_list

#Kad katrs fails ir atvērts, izmantojiet pievienošanas funkciju, lai sāktu vairākos failos saglabāto datu konsolidāciju

#izveidojiet jaunu, tukšu datu rāmi, lai apstrādātu Excel failu importēšanu
df = pd. DataFrame()

#Palaidiet for cilpu, lai pārlūkotu katru saraksta failu
excel_file sarakstā excel_file_list:
#pārbaudiet tikai .xlsx sufiksu failus
ja excel_files.endswith(.xlsx"):
#izveidojiet jaunu datu rāmi, lai lasītu/atvērtu katru Excel failu no iepriekš izveidotā failu saraksta
df1 = pd.read_excel (ievades_faila_ceļš+excel_faili)
#pievienot katru failu oriģinālajā tukšajā datu rāmī
df = df.append (df1)

#pārsūtiet galīgo izvadi uz Excel (xlsx) failu izvades ceļā
df.to_excel (output_file_path+"Consolidated_file.xlsx")

Python izmantošana, lai apvienotu vairākas Excel darbgrāmatas

Python's Pandas ir lielisks rīks gan iesācējiem, gan pieredzējušiem lietotājiem. Bibliotēku plaši izmanto izstrādātāji, kuri vēlas apgūt Python.

Pat ja esat iesācējs, jūs varat gūt milzīgu labumu, apgūstot Pandas nianses un to, kā Python tiek izmantota bibliotēka.

6 Pandas operācijas iesācējiem

Apgūstiet Pandas, veicot šīs iesācēju darbības.

Lasiet Tālāk

DalītiesČivinātE-pasts
Saistītās tēmas
  • Programmēšana
  • Python
  • Microsoft Excel
  • Izklājlapa
Par autoru
Gaurav Siyal (Publicēti 59 raksti)

Gauravam Sijalam ir divu gadu rakstīšanas pieredze, rakstot virknei digitālā mārketinga firmu un programmatūras dzīves cikla dokumentus.

Vairāk no Gaurav Siyal

Abonējiet mūsu biļetenu

Pievienojieties mūsu informatīvajam izdevumam, lai saņemtu tehniskos padomus, pārskatus, bezmaksas e-grāmatas un ekskluzīvus piedāvājumus!

Noklikšķiniet šeit, lai abonētu