Formula media Applica all’osservazione di N.Y. la media dei prezzi della pizza a NY è:
Trovare la media dei prezzi della pizza a NY
Nota: La media è la misura più comune di tendenza centrale, ma ha un enorme svantaggio perché è facilmente influenzata da outlier – quale valore è significativamente maggiore di altri valori nella serie di dati.
Mediana
La mediana è il valore medio di un insieme di dati ordinati; si trova ordinando tutti i punti di dati e scegliendo quello nel mezzo (o se ci sono due numeri centrali, prendendo la media di questi due numeri). Troviamo la mediana del nostro insieme di dati.
Trovare la mediana dei prezzi della pizza a NY e a Los Angeles
Come potete vedere, abbiamo un totale di 11 osservazioni per NY quindi la posizione centrale è al sesto indice che può essere calcolato come (11+1)/2=6. Quindi la mediana dei prezzi della pizza a NY è $6.00
Che dire di LA? Abbiamo 10 osservazioni a Los Angeles quindi la posizione media è tra il 5° e il 6° posto che può essere calcolato come (10+1)/2=5.5. Quindi la mediana dei prezzi della pizza a LA è 5,50$
Nota: la mediana non è influenzata dai valori anomali (66,00$)
Modalità
La modalità è il numero più frequente – cioè il numero che ricorre il maggior numero di volte.
Trovare il modo dei prezzi della pizza a NY e a LA
Per l’insieme di dati di NY, si può vedere che $3.00 appare due volte ed è il più frequente. Quindi la modalità dei prezzi della pizza a NY è $3.00
Per l’insieme di dati di LA, si può vedere che nessun numero appare due volte (o più). Allora possiamo dire che nessun modo di prezzi della pizza in LA.
Generalmente ci sono 2 o 3 modi sono abbastanza frequentemente. Puoi sceglierne una a seconda dello scopo del tuo lavoro.
Quale misura è la migliore?
Non esiste la migliore, ma usarne solo una è sicuramente la peggiore!
Questi valori di misura della tendenza centrale dovrebbero essere usati insieme piuttosto che indipendentemente. Dipende da particolari scenari, alcuni dei valori di misurazione sono più significativi di altri, ma usarli insieme è meglio che singolarmente.
Trovare Media, Mediana e Modo in Microsoft Excel e Python
Excel è il software più popolare e facile da usare per lavorare con i dati forniti da Microsoft nel loro pacchetto Office. In Excel, ci sono 3 formule per trovare Media, Mediana e Modo:
Formule di Media, Mediana e Modo in Excel
Nota: your_data_set
è l’intervallo del tuo set di dati, dovrebbe essere un array di 1 dimensione.
Python è più potente e flessibile di Excel. Ma è un linguaggio di programmazione, quindi è necessario installare un IDE per compilare il codice. Consigliamo vivamente di usare Spyder per farlo.
Prima di tutto, devi importare la libreria di statistiche
…dopo di che, puoi chiamare la libreria statistics
usando il suo nome breve stats
. Avete bisogno di creare un array che contenga i dati di NY e LA come da riga 2 e 9. Poi puoi trovare Media, Mediana e Modo usando le funzioni predefinite di statistics
:
Controlliamo le finestre di esplorazione delle variabili in Spyder:
Finestre di esplorazione delle variabili in Spyder
Si può scoprire che la media, la mediana e il modo per la serie di dati di NY sono 11, 6 e 3 che sono esattamente gli stessi dei valori ottenuti dal calcolo manuale e da Excel. È lo stesso per la media e la mediana dell’insieme di dati di Los Angeles, tranne che per la modalità di Los Angeles. Perché? Stampiamo il valore di mode_la
print(mode_la
)
Perché non esiste una modalità per i prezzi della pizza a LA. Come abbiamo detto prima, tutti i valori dell’insieme di dati per LA non appaiono due volte o più grandi. Quindi possiamo dire “non c’è una modalità per l’insieme di dati di LA”.
Conclusione:
Medio: il valore medio.
Mediano: il valore medio di un insieme di dati ordinati.
Modalità: il valore più appariscente di un insieme di dati.
Non esiste una misura migliore (tra Media, Mediana e Modalità), ma usarne solo una è sicuramente la peggiore!