Todo conjunto de datos numéricos tiene un valor medio que representa el peso de su valor de conjunto. ¡Hay muchos tipos diferentes de promedios! Hoy te presentaremos 3 de los valores promedio más populares: Media, Mediana y Moda.

Ejemplo de valores de tendencia central en gráfico

Media, Mediana y Moda son valores medios o de tendencia central de un conjunto de datos numéricos. Antes de profundizar en cada término, veamos el siguiente ejemplo:

Observación de los precios de las pizzas en NY y LA

La primera medida que estudiaremos es la media también conocida como promedio. La media se puede calcular sumando todos los puntos de datos y dividiendo por el número de puntos de datos.

Fórmula de la media

Aplicando a la observación de NY. observación, la Media de los precios de la pizza en NY es:

Hallar la Media de los precios de la pizza en NY

Nota: La media es la medida más común de tendencia central, pero tiene un enorme inconveniente porque se ve fácilmente afectada por los valores atípicos: qué valor es significativamente mayor que otros valores del conjunto de datos.

Mediana

La mediana es el valor medio de un conjunto de datos ordenados; se encuentra ordenando todos los puntos de datos y eligiendo el que está en el medio (o si hay dos números medios, tomando la media de esos dos números). Como se puede ver, tenemos un total de 11 observaciones para Nueva York, por lo que la posición media está en el índice 6, que se puede calcular como (11+1)/2=6. Por lo tanto, la mediana de los precios de la pizza en Nueva York se encuentra en el índice 6. Así que la mediana de los precios de las pizzas en NY es de $6.00

¿Qué pasa con LA? Tenemos 10 observaciones en LA por lo que la posición media está entre el 5º y el 6º que se puede calcular como (10+1)/2=5,5. Así que la mediana de los precios de las pizzas en LA es de 5,50 dólares

Nota: la mediana no se ve afectada por los valores atípicos (66,00 dólares)

Modo

El modo es el número más frecuente – es decir, el número que ocurre el mayor número de veces.

Encontrar el Modo de los precios de las pizzas en NY y LA

Para el conjunto de datos de NY, se puede ver que $3.00 aparece dos veces y es el que más aparece. Entonces la moda de los precios de las pizzas en NY es $3.00

Para el conjunto de datos de LA, se puede ver que ningún número aparece dos veces (o más). Entonces podemos decir que no hay modo de los precios de la pizza en LA.

Generalmente hay 2 o 3 modos son bastante frecuentes. Usted puede elegir uno de ellos depende en el propósito de su trabajo.

¿Qué medida es la mejor?

No hay mejor, pero el uso de sólo uno es definitivamente peor!

Estos valores de medición de la tendencia central se debe utilizar en conjunto y no de forma independiente. Dependiendo de los escenarios particulares, algunos de los valores de medición son más significativos que otros, pero usarlos juntos es mejor que individualmente.

Encontrar la media, la mediana y la moda en Microsoft Excel y Python

Excel es el software más popular y fácil de usar para trabajar con los datos proporcionados por Microsoft en su paquete de Office. En Excel, hay 3 fórmulas para encontrar la media, la mediana y la moda:

Fórmulas de la media, la mediana y la moda en Excel

Nota: your_data_set es el rango de tu conjunto de datos, debe ser un array de 1 dimensión.

Python es más potente y flexible que Excel. Pero es un lenguaje de programación, por lo que necesita instalar un IDE para compilar su código. Recomendamos encarecidamente utilizar Spyder para hacerlo.

Primero, necesita importar la biblioteca de estadísticas

…después de eso, puede llamar a la biblioteca statistics utilizando su nombre corto como stats. Necesitas crear un array que contenga un conjunto de datos para NY y LA como en la línea 2 y 9. A continuación, puede encontrar la media, la mediana y la moda utilizando las funciones predefinidas de statistics:

Veamos las ventanas del explorador de variables en Spyder:

Ventanas del explorador de variables en Spyder

Puede ver que la media, la mediana y la moda del conjunto de datos de NY son 11, 6 y 3, que coinciden exactamente con los valores que obtuvimos del cálculo manual y de Excel. Lo mismo ocurre con la media y la mediana del conjunto de datos de LA, excepto la moda de LA. ¿Por qué? Imprimamos el valor de mode_la

print(mode_la)

Porque no hay modo para los precios de la pizza en LA. Como hemos mencionado antes, todos los valores del conjunto de datos para LA no aparecen dos veces o más. Así que podemos decir que «no hay moda para el conjunto de datos de LA».

Conclusión:

  • Media: el valor medio.
  • Mediana: el valor medio de un conjunto de datos ordenados.
  • Modo: el valor más aparente del conjunto de datos.
  • No existe la mejor medida (entre la Media, la Mediana y el Modo), pero utilizar sólo una es definitivamente lo peor.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.