Riješeno: kako pronaći srednji medij i način

Pronalaženje srednje vrijednosti, medijana i moda u Pythonu: Opsežan vodič za analizu podataka

Analiza podataka bitan je dio razumijevanja i tumačenja skupova podataka. Jedan temeljni aspekt analize podataka je izračun srednje vrijednosti, medijana i načina podataka. Ove tri mjere predstavljaju središnje tendencije i korisne su u identificiranju trendova i obrazaca u podacima. U ovom ćemo članku istražiti koncepte srednje vrijednosti, medijana i modusa te kako ih izračunati pomoću Pythona. Također ćemo raspravljati o raznim bibliotekama i funkcijama uključenim u rješavanje sličnih problema.

**Prosjek** je prosječna vrijednost skupa podataka, izračunata dijeljenjem zbroja vrijednosti s brojem vrijednosti u skupu podataka. **Medijan** je srednja vrijednost skupa podataka kada je poredan uzlaznim ili silaznim redoslijedom. Ako skup podataka ima neparan broj vrijednosti, medijan je vrijednost koja se nalazi točno u sredini, dok je za paran broj vrijednosti medijan prosjek dviju srednjih vrijednosti. **Način** se odnosi na vrijednost(i) koje se najčešće pojavljuju u skupu podataka.

Da bismo izračunali ove mjere, napisat ćemo Python program koji uzima popis brojeva kao ulaz i vraća srednju vrijednost, medijan i način. Slijedimo pristup korak po korak za implementaciju ovog rješenja.

# Step 1: Define a function to calculate the mean
def calculate_mean(numbers):
    return sum(numbers) / len(numbers)

# Step 2: Define a function to calculate the median
def calculate_median(numbers):
    sorted_numbers = sorted(numbers)
    length = len(numbers)
    mid_index = length // 2

    if length % 2 == 0:
        median = (sorted_numbers[mid_index - 1] + sorted_numbers[mid_index]) / 2
    else:
        median = sorted_numbers[mid_index]

    return median

# Step 3: Define a function to calculate the mode
def calculate_mode(numbers):
    from collections import Counter
    count = Counter(numbers)
    mode = count.most_common(1)[0][0]
    return mode

# Step 4: Implement the main function
def main():
    numbers = [int(x) for x in input("Enter numbers separated by spaces: ").split()]
    mean = calculate_mean(numbers)
    median = calculate_median(numbers)
    mode = calculate_mode(numbers)

    print("Mean:", mean)
    print("Median:", median)
    print("Mode:", mode)

if __name__ == "__main__":
    main()

Gornji kod sastoji se od četiri koraka. Prvo definiramo funkciju za izračunavanje srednje vrijednosti popisa brojeva. U drugom koraku definiramo drugu funkciju za izračunavanje medijana. Ova funkcija sortira ulazni popis i pronalazi srednju vrijednost na temelju duljine popisa. U trećem koraku stvaramo funkciju za izračunavanje načina pomoću klase Brojač iz modula zbirki. Posljednji korak sastoji se od definiranja glavne funkcije, koja uzima korisnički unos, poziva prethodno definirane funkcije i ispisuje srednju vrijednost, medijan i mod ulaznih podataka.

Python biblioteke za statistiku i analizu podataka

Python nudi više knjižnica koji pomažu u statističkoj analizi i manipulaciji podacima. Neke od popularnih knjižnica uključuju:

  • numpy – Snažna biblioteka za numeričke izračune, manipulaciju nizovima i linearnu algebru.
  • pande – Fleksibilna biblioteka koja pruža mogućnosti manipulacije podacima i analize pomoću DataFrame struktura.
  • SciPy – Knjižnica koja se bavi znanstvenim računalstvom, uključujući optimizaciju, integraciju, interpolaciju i još mnogo toga.

Korištenje programa Numpy i Pandas za izračunavanje srednje vrijednosti, medijana i moda

Uz osnovnu implementaciju Pythona, možemo koristiti biblioteke Numpy i Pandas za učinkovito izračunavanje srednje vrijednosti, medijana i moda.

Ispod je primjer kako koristiti Numpy i Pandas za izračunavanje ovih središnjih tendencija za skup podataka:

import numpy as np
import pandas as pd

data = [4, 2, 7, 3, 9, 1, 6, 5, 8]

# Using Numpy
mean_numpy = np.mean(data)
median_numpy = np.median(data)

# Using Pandas
data_series = pd.Series(data)
mode_pandas = data_series.mode().tolist()

print("Mean (Numpy):", mean_numpy)
print("Median (Numpy):", median_numpy)
print("Mode (Pandas):", mode_pandas)

U gornjem primjeru koristimo Numpyjeve funkcije `mean()` i `median()` za izračunavanje srednje vrijednosti odnosno medijana. Za način rada pretvaramo naše podatke u seriju Pandas i koristimo funkciju `mode()` koja vraća popis načina.

Ovaj članak pruža sveobuhvatno razumijevanje koncepata srednje vrijednosti, medijana i modusa te kako ih izračunati korištenjem osnovnih Python i popularnih Python biblioteka. Koristeći ove pristupe, analitičari podataka mogu učinkovito analizirati i tumačiti skupove podataka kako bi izvukli smislene zaključke i identificirali trendove u podacima.

Povezani postovi:

Ostavite komentar