Elke numerieke gegevensverzameling heeft een gemiddelde waarde die het gewicht van de matrixwaarde weergeeft. Er zijn veel verschillende soorten gemiddelden! Vandaag stellen we u 3 van de populairste gemiddelden voor: Gemiddelde, Mediaan en Modus.
Middelde, Mediaan en Modus zijn gemiddelde waarden of centrale tendens van een numerieke gegevensreeks. Alvorens diep in elke term te duiken, bekijken we eerst onderstaand voorbeeld:
De eerste maat die we zullen bestuderen is het gemiddelde, ook bekend als gemiddelde. Het gemiddelde kan worden berekend door alle datapunten op te tellen en te delen door het aantal datapunten.
Toepassing op de N.Y. waarneming, is het gemiddelde van de pizzaprijzen in NY:
Noot: Het gemiddelde is de meest gebruikelijke maatstaf voor de centrale tendens, maar heeft een enorm nadeel omdat het gemakkelijk wordt beïnvloed door uitschieters – welke waarde significant groter is dan andere waarden in de gegevensreeks.
Middel
Middel is de middelste waarde van een gesorteerde gegevensverzameling; gevonden door alle gegevenspunten te ordenen en het middelste eruit te pikken (of als er twee middelste getallen zijn, het gemiddelde van die twee getallen te nemen). Laten we de mediaan van onze gegevensverzameling vinden.
Zoals u kunt zien, hebben we in totaal 11 waarnemingen voor NY, dus de middelste positie bevindt zich op index 6, die kan worden berekend als (11+1)/2=6. Dus de mediaan van de pizzaprijzen in NY is $6,00
Hoe zit het met LA? We hebben 10 waarnemingen in LA, dus de middelste positie is tussen de 5e en 6e, die kan worden berekend als (10+1)/2=5,5. De mediaan van de pizzaprijzen in LA is dus $5,50
Note: de mediaan wordt niet beïnvloed door uitschieters ($66,00)
Mode
Mode is het meest frequente getal – dat wil zeggen, het getal dat het grootste aantal keren voorkomt.
Voor de gegevensverzameling van NY kunt u zien dat $3,00 twee keer voorkomt en het meest voorkomt. Dan is de modus van de pizzaprijzen in NY $3,00
Voor de gegevensverzameling van LA ziet u dat geen enkel getal twee keer (of meer) voorkomt. Dan kunnen we zeggen dat er geen modus van pizzaprijzen in LA is.
Over het algemeen zijn er 2 of 3 modi die vrij vaak voorkomen.
Welke maatstaf is de beste?
Er is geen beste, maar er slechts één gebruiken is zeker het slechtst!
Deze maatstaven van centrale tendens moeten eerder samen dan onafhankelijk van elkaar worden gebruikt. Afhankelijk van specifieke scenario’s, sommige van de meetwaarden is meer zin dan anderen, maar gebruik ze samen is beter dan individueel.
Vinden van Mean, Median, en Mode in Microsoft Excel en Python
Excel is de meest populaire software en gemakkelijk te gebruiken om te werken met gegevens die door Microsoft in hun Office-pakket. In Excel zijn er 3 formules om Mean, Median en Mode te vinden:
Note: your_data_set
is het bereik van uw gegevensverzameling, moet een 1-dimensionale matrix zijn.
Python is krachtiger en flexibeler dan Excel. Maar het is een programmeertaal, dus u moet een IDE installeren om uw code te compileren. We raden u ten zeerste aan om hiervoor Spyder te gebruiken.
Eerst moet u de statistiekenbibliotheek