1- Medidas de tendencia central
¿Qué debo recordar?
Cada vez que se observa un fenómeno cuantitativo, nos interesa saber si los datos recolectados se aglutinan en torno a ciertos valores representativos que son propios de fenómeno estudiado. Por ejemplo, si pensamos en la Edad de los jugadores profesionales de fútbol, la experiencia nos dice que sus edades varían entre los 17 y 35 años, siendo raro, pero no imposible, encontrar jugadores con más de 35 años o menores de 17 años, además sabemos que la gran mayoría de estos jugadores tienen entre 23 y 30 años. Ahora la pregunta general, dada una colección de datos, ¿es posible saber en torno a qué valores se ubican dichos datos? La respuesta la entrega las medidas de tendencia central.
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: media aritmética, mediana y moda.
1.1- Media Aritmética o Promedio: Es la medida de tendencia central más conocida y utilizada. La media aritmética es la suma de todos los datos dividida entre el número total de datos. Se representa por la letra griega , cuando se trata del promedio del universo o población y por cuando se trata del promedio de una muestra.
¿Cómo calcular la media aritmética?
Observemos los distintos casos, que se muestran a continuación.
a- Media Aritmética para datos no agrupados:
Fórmula:
Donde:
conjunto de datos de una muestra.
Número total de datos de una muestra.
Ejemplo:
Las calificaciones de un estudiante escolar en Matemáticas durante un semestre son 5, 6, 3, 5 y 7, ¿cuál es su calificación promedio?
Solución: En el ejemplo anterior, nos pide calcular el promedio de notas, es decir la media aritmética. Para esto, ordenamos primero los datos de menor a mayor, para después hacer el cálculo correspondiente.
Datos: 3, 5, 5, 6 y 7.
n = 5
Calculamos el promedio:
b- Media Aritmética para datos agrupados
Fórmula:
Para datos agrupados en una tabla de frecuencias.
Donde:
Conjunto de datos de una muestra.
Frecuencia Absoluta, que representa el número de veces que el dato se repite.
Número total de datos de una muestra. En este caso, es la suma de las frecuencias absolutas.
Ejemplo:
Se ha anotado el número de hermanos que tiene un grupo de amigos. Los datos obtenidos son los siguientes:
Hermanos: 1, 1, 1, 1, 2, 2, 2, 3, 3, 4
Construyendo la tabla de frecuencia:
N.º de Hermanos |
1 |
2 |
3 |
4 |
N.º de veces |
4 |
3 |
2 |
1 |
Con los datos anteriores, calcule la media aritmética.
Solución:
Sumando la frecuencia absoluta, el número total de datos de esta muestra es . Entonces, utilizando la fórmula anterior, se tiene que:
¿Qué pasa cuando los datos están agrupados en intervalos?
Cuando los valores de la variable son muchos, conviene agrupar los datos en intervalos o clases para así realizar un mejor análisis e interpretación de ellos.
Ejemplo:
En la escuela de Tim hay 25 profesores. Cada profesor viaja a la escuela cada mañana en su propio coche. La distribución de los tiempos de conducción (en minutos) desde su casa a la escuela para los profesores se muestra en la siguiente tabla:
Tiempo de conducción (minutos) |
Número de profesores |
[0,10) |
3 |
[10,20) |
10 |
[20,30) |
6 |
[30,40) |
4 |
[40,50) |
2 |
Los tiempos de conducción se dan para los 25 profesores, por lo que los datos son para una población. Calcula la media para los tiempos de conducción.
Solución: Para calcular la media aritmética, a través de una tabla de frecuencia, seguiremos algunos pasos:
Paso 1: Calcular la marca de clase en cada intervalo. Recordemos que la marca de clase es el punto medio entre los límites del intervalo. Se representa por
con i =1, 2, 3, …,n
– Intervalo 1:
– Intervalo 2:
– Intervalo 3:
– Intervalo 4:
– Intervalo 5:
Paso 2: Multiplicar la marca de clase con su respectiva frecuencia absoluta.
Paso 3: Sumar lo calculado en el paso anterior.
Paso 4: Por último, dividir el resultado anterior por el total de la frecuencia absoluta, en este caso, por la cantidad total de profesores. El resultado final de la división corresponde a la media aritmética.
Por lo tanto, la media aritmética para datos agrupados en intervalo se calcula mediante la fórmula:
1.2- Mediana: Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.Aquel valor, divide la muestra en dos partes iguales. Se representa por M_e y se puede hallar sólo para variables cuantitativas.
Cálculo de la mediana:
a- Mediana para datos no agrupados
Al igual que la media aritmética, lo primero que se debe hacer es ordenar los datos de menor a mayor. Sin embargo, a la hora de calcular el valor de la mediana, se debe tener en cuenta dos condiciones:
1. Si la cantidad de datos es un número impar, la mediana es el valor central y ocupa la posición de . Por ejemplo, si se tienen los siguientes datos de 9 valores: 2, 3, 4, 4, 5, 5, 5, 6, 6 y nos piden calcular la mediana, podemos notar que el valor central es 5 y ocupa la posición .
2. Si la cantidad de datos es un número par, la mediana es la media entre los dos valores centrales y ocupan las posiciones y . Por ejemplo, si se tienen los siguientes datos de 6 valores: 7, 8, 9, 10, 11, 12 y queremos calcular la mediana, entonces identificamos en qué posiciones se encuentran estos dos valores: y .
Luego, el valor que está en la posición 3 es 9 y el que está en la posición 4 es 10. Calculando la media entre estos dos valores, obtenemos el valor de la mediana.
b- Mediana para datos agrupados
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. Es decir, tenemos que buscar el intervalo en el que se encuentre .
Luego, calculamos la mediana según la siguiente fórmula:
Donde:
Es el límite inferior de la clase donde se encuentra la mediana.
Es la semisuma de las frecuencias absolutas.
Es la frecuencia acumulada anterior a la clase mediana.
Es la frecuencia absoluta del intervalo mediano.
Es la amplitud de los intervalos.
Ahora veamos un ejemplo:
En la siguiente tabla se muestran las edades de un grupo de personas.
Edad |
Marca de clase
|
Frecuencia Absoluta |
Frecuencia Acumulada |
[0 – 10) |
5 |
3 |
3 |
[10 – 20) |
15 |
6 |
9 |
[20 – 30) |
25 |
7 |
16 |
[30 – 40) |
35 |
12 |
28 |
[40 – 50) |
45 |
3 |
31 |
|
N = 31 |
|
Lo primero que debemos hacer para poder calcular la mediana es identificar la clase mediana. Para esto tenemos que buscar el intervalo en el que se encuentre
.
En este caso
.
Ahora debemos buscar el intervalo donde la frecuencia acumulada contenga el valor obtenido (15,5). En este caso, el intervalo que contiene ese valor es [20 – 30), pues 16 es mayor a 15,5.
Luego, reemplazamos los datos en la fórmula anterior:
Recuerda:
Es el límite inferior de la clase donde se encuentra la mediana, en este caso el límite inferior es 20.
Es la semisuma de las frecuencias absolutas, en este caso es 15,5.
Es la frecuencia acumulada anterior a la clase mediana, en este caso es 9.
Es la frecuencia absoluta del intervalo mediano, en este caso es 7.
Es la amplitud de los intervalos, se calcula restando el extremo superior menos el inferior del intervalo, en este caso es:
1.3- Moda:
La moda de un conjunto de datos, es el dato que más veces se repite, es decir, aquel que tiene mayor frecuencia absoluta. Se denota por M_o. En caso de existir dos valores de la variable que tengan la mayor frecuencia absoluta, habría dos modas. Si no se repite ningún valor, no existe moda.
Ejemplo 1: Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5.
Ejemplo 2: Hallar la moda de la distribución: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9.
Ejemplo 3: Hallar la moda de la distribución: 2, 2, 3, 3, 6, 6, 9, 9.
Como todas las puntuaciones del grupo tienen la misma frecuencia, no hay moda.
Como se pudo ver en los ejemplos anteriores, los valores de la moda corresponden a datos no agrupados. A continuación, veremos el cálculo de la moda para datos agrupados.
1.4- Moda para datos agrupados
Caso 1: Cuando todos los intervalos tienen la misma amplitud.
Fórmula:
Donde:
es el límite inferior de la clase modal.
es la frecuencia absoluta de la clase modal.
es la frecuencia absoluta inmediatamente inferior a la clase modal.
es la frecuencia absoluta inmediatamente posterior a la clase modal.
es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:
Ejemplo: Utilicemos el ejemplo visto en la mediana para datos agrupados. Podemos notar que la amplitud de los intervalos es la misma.
Edad |
Marca de clase
|
Frecuencia Absoluta |