U današnjem svijetu manipulacija i analiza podataka postali su ključni dio raznih industrija. Jedan takav zadatak koji se često pojavljuje je pretvaranje riječi u brojeve u skupovima podataka. Ovaj članak govori o tome kako se Pythonova moćna biblioteka, pandas, može koristiti za učinkovito obavljanje ovog zadatka. Istražit ćemo korake, kôd i koncepte uključene u rješavanje ovog problema, osiguravajući da shvatite proces i da ga možete jednostavno implementirati.
Za početak, shvatimo problem koji želimo riješiti. Zamislite da imate skup podataka sa stupcem koji sadrži brojeve napisane riječima, kao što su "jedan", "dva", "tri" i tako dalje. Naš je cilj pretvoriti ove brojeve riječi u njihove cijele brojeve koristeći Python i pandas.
Korak 1: Uvoz potrebnih biblioteka
Da bismo izvršili ovaj zadatak, prvo moramo uvesti potrebne biblioteke. U ovom slučaju koristit ćemo biblioteku pandas za rukovanje i manipuliranje podacima, a inflect za pretvaranje riječi u brojeve.
import pandas as pd import inflect
knjižnica pandi
pandas je knjižnica otvorenog koda za manipulaciju i analizu podataka koja pruža podatkovne strukture i funkcije potrebne za rukovanje strukturiranim podacima. Izgrađen je na temelju programskog jezika Python i igra značajnu ulogu u pretprocesiranju, čišćenju i analizi podataka. Neke od njegovih glavnih podatkovnih struktura uključuju Series, DataFrame i Index, koje pomažu u radu s različitim vrstama podataka i operacijama.
inflect knjižnica
inflect je Python biblioteka koja pomaže u računanju množine i jednine imenica, rednih brojeva i pretvaranju brojeva u riječi ili riječi u brojeve. U ovom ćemo se članku usredotočiti na njegovu sposobnost pretvaranja riječi u brojeve. Da biste koristili inflect, morat ćete ga instalirati pomoću sljedeće naredbe:
!pip install inflect
Korak 2: Stvaranje pandas DataFramea
Sada kada smo uvezli potrebne biblioteke, stvorimo pandas DataFrame sa stupcem koji sadrži brojeve kao riječi. Ovo će poslužiti kao naš uzorak skupa podataka u svrhu ilustracije.
data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']} df = pd.DataFrame(data) print(df)
Korak 3: Pretvaranje riječi u brojeve
Zatim ćemo upotrijebiti biblioteku inflect za pretvaranje brojeva u riječima u njihove cjelobrojne ekvivalente. Napravit ćemo funkciju pod nazivom 'convert_word_to_number' koja uzima riječ kao ulaz i vraća odgovarajući broj.
def convert_word_to_number(word): p = inflect.engine() try: return p.singular_noun(word) except: return None df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number) print(df)
U ovom isječku koda definiramo funkciju koja koristi inflect mehanizam za pretvaranje riječi u brojeve. Zatim koristimo metodu pandas apply() da primijenimo ovu funkciju na svaki element stupca 'Numbers_in_words' u DataFrameu.
Ukratko, vidjeli smo kako se Python, pandas i inflect mogu koristiti za pretvaranje riječi u brojeve u skupu podataka. Pandas služi kao osnovni alat za manipulaciju podacima, dok knjižnica inflect pomaže u operacijama koje uključuju riječi i brojeve. Slijedeći ove korake, možete jednostavno pretvoriti brojeve riječi u cijele brojeve u svojim skupovima podataka te dalje analizirati i manipulirati svojim podacima. Sretno kodiranje!