Jeder numerische Datensatz hat einen Durchschnittswert, der die Gewichtung seines Array-Wertes darstellt. Es gibt viele verschiedene Arten von Durchschnittswerten! Heute werden wir Ihnen 3 der beliebtesten Durchschnittswerte vorstellen: Mittelwert, Median und Modus.

Beispiel für Werte der zentralen Tendenz im Diagramm

Mittelwert, Median und Modus sind Durchschnittswerte oder zentrale Tendenz eines numerischen Datensatzes. Bevor wir in die einzelnen Begriffe eintauchen, werfen wir einen Blick auf das folgende Beispiel:

Beobachtung der Pizzapreise in NY und LA

Das erste Maß, das wir untersuchen werden, ist der Mittelwert, auch bekannt als Durchschnitt. Der Mittelwert kann berechnet werden, indem alle Datenpunkte addiert und durch die Anzahl der Datenpunkte geteilt werden.

Mittelwertformel

Angewandt auf die N.Y. Beobachtung ist der Mittelwert der Pizzapreise in NY:

Mittelwert der Pizzapreise in NY finden

Anmerkung: Der Mittelwert ist das gebräuchlichste Maß für die zentrale Tendenz, hat aber einen großen Nachteil, weil er leicht von Ausreißern beeinflusst wird – welcher Wert ist deutlich größer als andere Werte im Datensatz.

Median

Der Median ist der mittlere Wert eines sortierten Datensatzes; er wird ermittelt, indem man alle Datenpunkte ordnet und den in der Mitte liegenden heraussucht (oder, wenn es zwei mittlere Zahlen gibt, den Mittelwert dieser beiden Zahlen nimmt). Finden wir den Median unseres Datensatzes.

Finden des Medians der Pizzapreise in NY und LA

Wie Sie sehen können, haben wir insgesamt 11 Beobachtungen für NY, so dass die mittlere Position beim Index 6 liegt, was als (11+1)/2=6 berechnet werden kann. Der Median der Pizzapreise in NY ist also $6.00

Was ist mit LA? Wir haben 10 Beobachtungen in LA, so dass die mittlere Position zwischen 5 und 6 liegt, was sich als (10+1)/2=5,5 berechnen lässt. Der Median der Pizzapreise in LA liegt also bei 5,50 $

Anmerkung: Der Median wird nicht von Ausreißern beeinflusst (66,00 $)

Modus

Modus ist die häufigste Zahl – das heißt, die Zahl, die am häufigsten vorkommt.

Modus der Pizzapreise in NY und LA finden

Für den Datensatz von NY kann man sehen, dass $3.00 zweimal erscheint und am häufigsten vorkommt. Dann ist der Modus der Pizzapreise in NY $3.00

Für den Datensatz von LA kann man sehen, dass keine Zahl zweimal (oder öfter) erscheint. Dann können wir sagen, dass es keinen Modus der Pizzapreise in LA gibt.

Im Allgemeinen gibt es 2 oder 3 Modi, die recht häufig vorkommen. Sie können eine von ihnen auswählen, je nach dem Zweck Ihrer Arbeit.

Welches Maß ist das beste?

Es gibt kein bestes, aber die Verwendung von nur einem ist definitiv das schlechteste!

Diese Messwerte der zentralen Tendenz sollten zusammen und nicht unabhängig voneinander verwendet werden. Abhängig von bestimmten Szenarien sind einige der Messwerte aussagekräftiger als andere, aber sie zusammen zu verwenden ist besser als einzeln.

Mittelwert, Median und Modus in Microsoft Excel und Python finden

Excel ist die beliebteste Software und einfach zu verwenden, um mit Daten zu arbeiten, die von Microsoft in ihrem Office-Paket bereitgestellt werden. In Excel gibt es 3 Formeln, um Mittelwert, Median und Modus zu finden:

Mittelwert, Median und Modus Formeln in Excel

Hinweis: your_data_set ist der Bereich deines Datensatzes, sollte 1 dimension array sein.

Python ist leistungsfähiger und flexibler als Excel. Aber es ist eine Programmiersprache, so dass Sie eine IDE installieren müssen, um Ihren Code zu kompilieren. Wir empfehlen Ihnen, Spyder zu verwenden.

Zuerst müssen Sie die Statistikbibliothek

importieren…danach können Sie die statisticsBibliothek unter ihrem Kurznamen stats aufrufen. Sie müssen ein Array erstellen, das den Datensatz für NY und LA gemäß Zeile 2 und 9 enthält. Dann können Sie Mittelwert, Median und Modus mit Hilfe von statistics vordefinierten Funktionen finden:

Lassen Sie uns die Variablen-Explorer-Fenster in Spyder überprüfen:

Variablenexplorer-Fenster in Spyder

Sie können herausfinden, dass der Mittelwert, der Median und der Modus für den NY-Datensatz 11, 6 und 3 sind, was genau mit den Werten übereinstimmt, die wir aus der manuellen Berechnung und Excel erhalten haben. Das Gleiche gilt für Mittelwert und Median des LA-Datensatzes mit Ausnahme des Modus für LA. Und warum? Lassen Sie uns den Wert von mode_la

print(mode_la)

ausdrucken, weil es keinen Modus für die Pizzapreise in LA gibt. Wie wir bereits erwähnt haben, kommen alle Werte des Datensatzes für LA nicht zweimal oder häufiger vor. Wir können also sagen: „Es gibt keinen Modus für den LA-Datensatz“.

Schlussfolgerung:

  • Mittelwert: der Durchschnittswert.
  • Median: der mittlere Wert eines sortierten Datensatzes.
  • Modus: der am häufigsten auftretende Wert eines Datensatzes.
  • Es gibt kein bestes Maß (zwischen Mittelwert, Median und Modus), aber nur eines zu verwenden ist definitiv das schlechteste!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.