Alla numeriska datamängder har ett medelvärde som representerar vikten av dess gruppvärde. Det finns många olika typer av medelvärden! Idag ska vi presentera 3 av de mest populära medelvärdena: Vi kommer att presentera tre nya medelvärden: medelvärde, median och läge.

Exempel på värden för central tendens i grafen

Medelvärde, median och läge är medelvärden eller central tendens för en numerisk datamängd. Innan vi går in på djupet i varje begrepp tar vi en titt på nedanstående exempel:

Observation av pizzapriserna i New York och Los Angeles

Det första måttet som vi kommer att studera är medelvärdet, även känt som genomsnittet. Medelvärdet kan beräknas genom att addera alla datapunkter och dividera med antalet datapunkter.

Medelvärdesformeln

Använd den på N.Y. Observation, medelvärdet för pizza priserna i NY är:

Finnande av medelvärdet för pizza priserna i NY

Note: Medelvärdet är det vanligaste måttet på central tendens, men det har en stor nackdel eftersom det lätt påverkas av outliers – vilket värde som är betydligt större än andra värden i datamängden.

Median

Median är det mittersta värdet i en sorterad datamängd; det hittas genom att ordna alla datapunkter och plocka ut den i mitten (eller om det finns två mittersta tal, ta medelvärdet av dessa två tal). Låt oss hitta medianen för vår datamängd.

Finnande av medianen för pizzapriserna i NY och LA

Som du kan se har vi totalt 11 observationer för NY så den mittersta positionen är på index 6 vilket kan beräknas som (11+1)/2=6. Så medianen för pizzapriserna i NY är $6.00

Hur är det med LA? Vi har 10 observationer i LA så mittenpositionen ligger mellan 5:e och 6:e vilket kan beräknas som (10+1)/2=5,5. Så medianen av pizzapriserna i LA är $5,50

Anmärkningar: Medianen påverkas inte av outliers ($66,00)

Mode

Mode är det mest frekventa talet – det vill säga det tal som förekommer flest gånger.

Finnande av Mode för pizzapriser i NY och LA

För datamängden för NY kan du se att 3,00 dollar dyker upp två gånger och att det har det största utseendet. Då är Mode of pizza prices in NY $3.00

För datamängden i LA kan du se att inget nummer dyker upp två gånger (eller mer). Då kan vi säga att det inte finns något mode för pizzapriserna i LA.

I allmänhet finns det 2 eller 3 modes som förekommer ganska ofta. Du kan välja en av dem beroende på syftet med ditt arbete.

Vilket mått är bäst?

Det finns inget bästa, men det är definitivt sämst att använda endast ett mått!

De här mätvärdena för central tendens bör användas tillsammans snarare än oberoende av varandra. Beroende på särskilda scenarier är vissa av mätvärdena mer meningsfulla än andra, men att använda dem tillsammans är bättre än enskilt.

Finnande av medelvärde, median och läge i Microsoft Excel och Python

Excel är den populäraste programvaran och lätt att använda för att arbeta med data som tillhandahålls av Microsoft i deras Office-paket. I Excel finns det tre formler för att hitta medelvärde, median och läge:

Medelvärde, median och lägeformler i Excel

Anmärkningar: your_data_set är intervallet för din datauppsättning, bör vara en 1-dimensionell array.

Python är mer kraftfull och flexibel än Excel. Men det är ett programmeringsspråk, så du måste installera ett IDE för att kompilera din kod. Vi rekommenderar starkt att du använder Spyder för att göra det.

Först måste du importera statistikbiblioteket

…efter det kan du anropa statistics biblioteket genom att använda dess korta namn som stats. Du måste skapa en array som innehåller datamängder för NY och LA enligt rad 2 och 9. Sedan kan du hitta medelvärde, median och läge med hjälp av statistics fördefinierade funktioner:

Låt oss kontrollera fönstren Variable explorer i Spyder:

Fönster för utforskare av variabler i Spyder

Du kan se att medelvärdet, medianen och läget för NY-datamängden är 11, 6 och 3, vilket är exakt samma som de värden som vi fick från manuell beräkning och Excel. Det är samma sak för medelvärde, median och median för LA-datamängden, med undantag för läge för LA. Varför? Låt oss skriva ut värdet för mode_la

print(mode_la)

För att det inte finns något mode för pizzapriser i LA. Som vi nämnde tidigare förekommer inte alla värden i datamängden för LA två gånger eller mer. Så vi kan säga att det inte finns något mode för LA:

Slutsats:

  • Medelvärde: medelvärdet.
  • Medianvärde: det mellersta värdet i en sorterad datamängd.
  • Mode: det mest förekommande värdet i datamängden.
  • Det finns inget bästa mått (bland medelvärde, median och mode), men det är definitivt sämst att använda endast ett mått!

Lämna ett svar

Din e-postadress kommer inte publiceras.