Audiogrāmatas iegūst arvien lielāku popularitāti salīdzinājumā ar tradicionālajām e-grāmatām. Tie ir ērtāki, jo varat tos klausīties jebkurā laikā un vietā.

Varat pārvērst e-grāmatas PDF failu audiogrāmatā, izmantojot vienkāršu Python skriptu. Izmantojot dažas vienkāršas bibliotēkas, varat izstrādāt projektu, kas nolasīs PDF failu un saglabās audiogrāmatu kā jaunu failu.

Nepieciešamo pakotņu instalēšana

Jums ir jāinstalē PyPDF3, pyttsx3, un pdf santehniķis paketes, lai sāktu. Šīs pakotnes var instalēt, izmantojot pip pakotņu pārvaldnieku. Pārliecinieties, ka jums jau ir instalēta pip jūsu sistēmā. Lai instalētu pakotnes, komandu uzvednē palaidiet šo komandu:

pip uzstādīt PyPDF3 pyttsx3 pdf santehniķis
  • Jūs varat izmantot PyPDF3 bibliotēka, lai lasītu un rediģētu PDF failus programmā Python.
  • The pyttsx3 bibliotēka nodrošina teksta pārvēršanu runā.
  • pdf santehniķis ir bibliotēka, kas ļauj izvilkt tekstu un tabulas no PDF failiem.

Šajā projektā izmantotais kods ir pieejams a GitHub repozitorijs un to varat izmantot bez maksas saskaņā ar MIT licenci.

instagram viewer

PDF faila konvertēšana audiogrāmatā, izmantojot Python

Kad esat instalējis iepriekš minētās pakotnes, varat tās importēt savā python failā:

imports PyPDF3
imports pyttsx3
imports pdf santehniķis

Jums jānorāda konvertējamā PDF faila nosaukums un atrašanās vieta. Vienkāršības labad varat izmantot jebkuru PDF faila paraugu. Kopējiet to tajā pašā direktorijā, kurā atrodas jūsu skripts, un saglabājiet tā nosaukumu mainīgajā; ja to sauc Lorem.pdf, piemēram:

fails = 'Lorem.pdf'

Pēc tam izveidojiet faila objektu PDF failam un PDF lasītāja objektu:

grāmata = atvērt (fails, 'rb')
pdfReader = PyPDF3.PdfFileReader (grāmata)

Vēlāk jūs pārlūkosit visas PDF faila lapas. Lai uzzinātu kopējo lappušu skaitu, izmantojiet lappušu skaits īpašums:

lapas = pdfReader.numPages

Tagad esat gatavs izvilkt tekstu no PDF faila:

finalTeksts = ""

ar pdfplumber.open(failu) pdf:
i diapazonā (0, lapas):
lapa = pdf.lapas[i]
teksts = page.extract_text()
finalText += teksts

Izmantojiet for cilpu, lai atkārtotu visas lapas un izvilktu tekstu no PDF. Varat izmantot pdfplumber pakotni, lai atvērtu pdf failu un ekstrakts_teksts metode teksta izgūšanai no lapas.

Ja pilns teksts ir saglabāts mainīgajā, varat to apstrādāt tālāk atkarībā no jūsu prasībām. Ja vēlaties pārvērst tekstu audio formātā un saglabāt to jaunā failā, izmantojiet šādu kodu:

dzinējs = pyttsx3.init()
engine.save_to_file (finalText, 'lorem.mp3')
dzinējs. RunUnPagaidiet()

Kad jūs palaist šo Python kodu, tas savā direktorijā izveidos audiogrāmatas failu.

Ja nevēlaties saglabāt audiogrāmatu un, piemēram, vēlaties nolasīt PDF failu, tā vietā varat izmantot šādu kodu:

dzinējs = pyttsx3.init()
dzinējs.saki(galīgaisTeksts)
dzinējs. RunUnPagaidiet()

Palaižot šo skriptu, tas atkārtos PDF failu.

Projektu izstrāde, izmantojot Python

Python ir pazīstams ar savu daudzpusību. Izmantojot Python, varat viegli izveidot projektus ar praktiskiem lietojumiem.

Ja vēlaties sasmērēt savas rokas ar Python kodu, varat sākt, izstrādājot mini projektus. Dažas labas sākuma idejas ir viktorīnas lietotne, tērzēšanas robots, čūskas spēle, URL saīsinātājs, tīmekļa skrāpis vai vienību pārveidotājs.