Mittelwert der Pizzapreise in NY finden Anmerkung: Der Mittelwert ist das gebräuchlichste Maß für die zentrale Tendenz, hat aber einen großen Nachteil, weil er leicht von Ausreißern beeinflusst wird – welcher Wert ist deutlich größer als andere Werte im Datensatz.
Median
Der Median ist der mittlere Wert eines sortierten Datensatzes; er wird ermittelt, indem man alle Datenpunkte ordnet und den in der Mitte liegenden heraussucht (oder, wenn es zwei mittlere Zahlen gibt, den Mittelwert dieser beiden Zahlen nimmt). Finden wir den Median unseres Datensatzes.
Finden des Medians der Pizzapreise in NY und LA
Wie Sie sehen können, haben wir insgesamt 11 Beobachtungen für NY, so dass die mittlere Position beim Index 6 liegt, was als (11+1)/2=6 berechnet werden kann. Der Median der Pizzapreise in NY ist also $6.00
Was ist mit LA? Wir haben 10 Beobachtungen in LA, so dass die mittlere Position zwischen 5 und 6 liegt, was sich als (10+1)/2=5,5 berechnen lässt. Der Median der Pizzapreise in LA liegt also bei 5,50 $
Anmerkung: Der Median wird nicht von Ausreißern beeinflusst (66,00 $)
Modus
Modus ist die häufigste Zahl – das heißt, die Zahl, die am häufigsten vorkommt.
Modus der Pizzapreise in NY und LA finden
Für den Datensatz von NY kann man sehen, dass $3.00 zweimal erscheint und am häufigsten vorkommt. Dann ist der Modus der Pizzapreise in NY $3.00
Für den Datensatz von LA kann man sehen, dass keine Zahl zweimal (oder öfter) erscheint. Dann können wir sagen, dass es keinen Modus der Pizzapreise in LA gibt.
Im Allgemeinen gibt es 2 oder 3 Modi, die recht häufig vorkommen. Sie können eine von ihnen auswählen, je nach dem Zweck Ihrer Arbeit.
Welches Maß ist das beste?
Es gibt kein bestes, aber die Verwendung von nur einem ist definitiv das schlechteste!
Diese Messwerte der zentralen Tendenz sollten zusammen und nicht unabhängig voneinander verwendet werden. Abhängig von bestimmten Szenarien sind einige der Messwerte aussagekräftiger als andere, aber sie zusammen zu verwenden ist besser als einzeln.
Mittelwert, Median und Modus in Microsoft Excel und Python finden
Excel ist die beliebteste Software und einfach zu verwenden, um mit Daten zu arbeiten, die von Microsoft in ihrem Office-Paket bereitgestellt werden. In Excel gibt es 3 Formeln, um Mittelwert, Median und Modus zu finden:
Mittelwert, Median und Modus Formeln in Excel
Hinweis: your_data_set
ist der Bereich deines Datensatzes, sollte 1 dimension array sein.
Python ist leistungsfähiger und flexibler als Excel. Aber es ist eine Programmiersprache, so dass Sie eine IDE installieren müssen, um Ihren Code zu kompilieren. Wir empfehlen Ihnen, Spyder zu verwenden.
Zuerst müssen Sie die Statistikbibliothek
importieren…danach können Sie die statistics
Bibliothek unter ihrem Kurznamen stats
aufrufen. Sie müssen ein Array erstellen, das den Datensatz für NY und LA gemäß Zeile 2 und 9 enthält. Dann können Sie Mittelwert, Median und Modus mit Hilfe von statistics
vordefinierten Funktionen finden:
Lassen Sie uns die Variablen-Explorer-Fenster in Spyder überprüfen:
Variablenexplorer-Fenster in Spyder Sie können herausfinden, dass der Mittelwert, der Median und der Modus für den NY-Datensatz 11, 6 und 3 sind, was genau mit den Werten übereinstimmt, die wir aus der manuellen Berechnung und Excel erhalten haben. Das Gleiche gilt für Mittelwert und Median des LA-Datensatzes mit Ausnahme des Modus für LA. Und warum? Lassen Sie uns den Wert von mode_la
print(mode_la
)
ausdrucken, weil es keinen Modus für die Pizzapreise in LA gibt. Wie wir bereits erwähnt haben, kommen alle Werte des Datensatzes für LA nicht zweimal oder häufiger vor. Wir können also sagen: „Es gibt keinen Modus für den LA-Datensatz“.
Schlussfolgerung:
Mittelwert: der Durchschnittswert.
Median: der mittlere Wert eines sortierten Datensatzes.
Modus: der am häufigsten auftretende Wert eines Datensatzes.
Es gibt kein bestes Maß (zwischen Mittelwert, Median und Modus), aber nur eines zu verwenden ist definitiv das schlechteste!