Ogni serie di dati numerici ha un valore medio che rappresenta il peso del suo valore di matrice. Ci sono molti tipi diversi di media! Oggi vi presenteremo 3 dei valori medi più popolari: Media, Mediana e Modo.

Esempio di valori di tendenza centrale nel grafico

Media, Mediana e Modo sono valori medi o tendenza centrale di una serie di dati numerici. Prima di immergerci profondamente in ogni termine, diamo un’occhiata all’esempio seguente:

Osservazione dei prezzi della pizza a NY e LA

La prima misura che studieremo è la media conosciuta anche come media. La media può essere calcolata sommando tutti i punti dati e dividendo per il numero di punti dati.

Formula media

Applica all’osservazione di N.Y. la media dei prezzi della pizza a NY è:

Trovare la media dei prezzi della pizza a NY

Nota: La media è la misura più comune di tendenza centrale, ma ha un enorme svantaggio perché è facilmente influenzata da outlier – quale valore è significativamente maggiore di altri valori nella serie di dati.

Mediana

La mediana è il valore medio di un insieme di dati ordinati; si trova ordinando tutti i punti di dati e scegliendo quello nel mezzo (o se ci sono due numeri centrali, prendendo la media di questi due numeri). Troviamo la mediana del nostro insieme di dati.

Trovare la mediana dei prezzi della pizza a NY e a Los Angeles

Come potete vedere, abbiamo un totale di 11 osservazioni per NY quindi la posizione centrale è al sesto indice che può essere calcolato come (11+1)/2=6. Quindi la mediana dei prezzi della pizza a NY è $6.00

Che dire di LA? Abbiamo 10 osservazioni a Los Angeles quindi la posizione media è tra il 5° e il 6° posto che può essere calcolato come (10+1)/2=5.5. Quindi la mediana dei prezzi della pizza a LA è 5,50$

Nota: la mediana non è influenzata dai valori anomali (66,00$)

Modalità

La modalità è il numero più frequente – cioè il numero che ricorre il maggior numero di volte.

Trovare il modo dei prezzi della pizza a NY e a LA

Per l’insieme di dati di NY, si può vedere che $3.00 appare due volte ed è il più frequente. Quindi la modalità dei prezzi della pizza a NY è $3.00

Per l’insieme di dati di LA, si può vedere che nessun numero appare due volte (o più). Allora possiamo dire che nessun modo di prezzi della pizza in LA.

Generalmente ci sono 2 o 3 modi sono abbastanza frequentemente. Puoi sceglierne una a seconda dello scopo del tuo lavoro.

Quale misura è la migliore?

Non esiste la migliore, ma usarne solo una è sicuramente la peggiore!

Questi valori di misura della tendenza centrale dovrebbero essere usati insieme piuttosto che indipendentemente. Dipende da particolari scenari, alcuni dei valori di misurazione sono più significativi di altri, ma usarli insieme è meglio che singolarmente.

Trovare Media, Mediana e Modo in Microsoft Excel e Python

Excel è il software più popolare e facile da usare per lavorare con i dati forniti da Microsoft nel loro pacchetto Office. In Excel, ci sono 3 formule per trovare Media, Mediana e Modo:

Formule di Media, Mediana e Modo in Excel

Nota: your_data_set è l’intervallo del tuo set di dati, dovrebbe essere un array di 1 dimensione.

Python è più potente e flessibile di Excel. Ma è un linguaggio di programmazione, quindi è necessario installare un IDE per compilare il codice. Consigliamo vivamente di usare Spyder per farlo.

Prima di tutto, devi importare la libreria di statistiche

…dopo di che, puoi chiamare la libreria statistics usando il suo nome breve stats. Avete bisogno di creare un array che contenga i dati di NY e LA come da riga 2 e 9. Poi puoi trovare Media, Mediana e Modo usando le funzioni predefinite di statistics:

Controlliamo le finestre di esplorazione delle variabili in Spyder:

Finestre di esplorazione delle variabili in Spyder

Si può scoprire che la media, la mediana e il modo per la serie di dati di NY sono 11, 6 e 3 che sono esattamente gli stessi dei valori ottenuti dal calcolo manuale e da Excel. È lo stesso per la media e la mediana dell’insieme di dati di Los Angeles, tranne che per la modalità di Los Angeles. Perché? Stampiamo il valore di mode_la

print(mode_la)

Perché non esiste una modalità per i prezzi della pizza a LA. Come abbiamo detto prima, tutti i valori dell’insieme di dati per LA non appaiono due volte o più grandi. Quindi possiamo dire “non c’è una modalità per l’insieme di dati di LA”.

Conclusione:

  • Medio: il valore medio.
  • Mediano: il valore medio di un insieme di dati ordinati.
  • Modalità: il valore più appariscente di un insieme di dati.
  • Non esiste una misura migliore (tra Media, Mediana e Modalità), ma usarne solo una è sicuramente la peggiore!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.