Elke numerieke gegevensverzameling heeft een gemiddelde waarde die het gewicht van de matrixwaarde weergeeft. Er zijn veel verschillende soorten gemiddelden! Vandaag stellen we u 3 van de populairste gemiddelden voor: Gemiddelde, Mediaan en Modus.

Voorbeeld van waarden voor centrale tendens in grafiek

Middelde, Mediaan en Modus zijn gemiddelde waarden of centrale tendens van een numerieke gegevensreeks. Alvorens diep in elke term te duiken, bekijken we eerst onderstaand voorbeeld:

Observatie van pizzaprijzen in NY en LA

De eerste maat die we zullen bestuderen is het gemiddelde, ook bekend als gemiddelde. Het gemiddelde kan worden berekend door alle datapunten op te tellen en te delen door het aantal datapunten.

Gemiddelde formule

Toepassing op de N.Y. waarneming, is het gemiddelde van de pizzaprijzen in NY:

Vinden van het gemiddelde van de pizzaprijzen in NY

Noot: Het gemiddelde is de meest gebruikelijke maatstaf voor de centrale tendens, maar heeft een enorm nadeel omdat het gemakkelijk wordt beïnvloed door uitschieters – welke waarde significant groter is dan andere waarden in de gegevensreeks.

Middel

Middel is de middelste waarde van een gesorteerde gegevensverzameling; gevonden door alle gegevenspunten te ordenen en het middelste eruit te pikken (of als er twee middelste getallen zijn, het gemiddelde van die twee getallen te nemen). Laten we de mediaan van onze gegevensverzameling vinden.

Vinden van de mediaan van de pizzaprijzen in NY en LA

Zoals u kunt zien, hebben we in totaal 11 waarnemingen voor NY, dus de middelste positie bevindt zich op index 6, die kan worden berekend als (11+1)/2=6. Dus de mediaan van de pizzaprijzen in NY is $6,00

Hoe zit het met LA? We hebben 10 waarnemingen in LA, dus de middelste positie is tussen de 5e en 6e, die kan worden berekend als (10+1)/2=5,5. De mediaan van de pizzaprijzen in LA is dus $5,50

Note: de mediaan wordt niet beïnvloed door uitschieters ($66,00)

Mode

Mode is het meest frequente getal – dat wil zeggen, het getal dat het grootste aantal keren voorkomt.

Vinden van de modus van pizzaprijzen in NY en LA

Voor de gegevensverzameling van NY kunt u zien dat $3,00 twee keer voorkomt en het meest voorkomt. Dan is de modus van de pizzaprijzen in NY $3,00

Voor de gegevensverzameling van LA ziet u dat geen enkel getal twee keer (of meer) voorkomt. Dan kunnen we zeggen dat er geen modus van pizzaprijzen in LA is.

Over het algemeen zijn er 2 of 3 modi die vrij vaak voorkomen.

Welke maatstaf is de beste?

Er is geen beste, maar er slechts één gebruiken is zeker het slechtst!

Deze maatstaven van centrale tendens moeten eerder samen dan onafhankelijk van elkaar worden gebruikt. Afhankelijk van specifieke scenario’s, sommige van de meetwaarden is meer zin dan anderen, maar gebruik ze samen is beter dan individueel.

Vinden van Mean, Median, en Mode in Microsoft Excel en Python

Excel is de meest populaire software en gemakkelijk te gebruiken om te werken met gegevens die door Microsoft in hun Office-pakket. In Excel zijn er 3 formules om Mean, Median en Mode te vinden:

Mean, Median en Mode formules in Excel

Note: your_data_set is het bereik van uw gegevensverzameling, moet een 1-dimensionale matrix zijn.

Python is krachtiger en flexibeler dan Excel. Maar het is een programmeertaal, dus u moet een IDE installeren om uw code te compileren. We raden u ten zeerste aan om hiervoor Spyder te gebruiken.

Eerst moet u de statistiekenbibliotheek

importeren…daarna kunt u de bibliotheek statistics oproepen met de korte naam stats. U moet een array maken die gegevens bevat voor NY en LA zoals in regel 2 en 9. Vervolgens kunt u het gemiddelde, de mediaan en de modus vinden met behulp van de vooraf gedefinieerde functies statistics:

Laten we eens kijken in het venster Variabele verkenner in Spyder:

Variabele verkennervensters in Spyder

U kunt zien dat het gemiddelde, de mediaan en de modus voor NY-gegevens 11, 6 en 3 zijn, wat precies overeenkomt met de waarden die we hebben verkregen uit handmatige berekeningen en Excel. Hetzelfde geldt voor Mean, en Median voor LA data set, behalve Mode voor LA. Waarom? Laten we de waarde van mode_la

print(mode_la)

Omdat er geen modus is voor pizzaprijzen in LA. Zoals we al eerder zeiden, komen alle waarden van de dataset voor LA niet twee keer of hoger voor. We kunnen dus zeggen “er is geen modus voor de gegevensverzameling voor LA”.

Conclusie:

  • Middel: de gemiddelde waarde.
  • Middel: de middelste waarde van een gesorteerde gegevensverzameling.
  • Modus: de meest voorkomende waarde van een gegevensverzameling.
  • Er is geen beste maatstaf (tussen Gemiddelde, Mediaan, en Modus), maar er slechts één gebruiken is zeker het slechtst.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.