MEDIDAS DE DISPERSIÓN
Parámetros estadísticos que indican cómo se alejan los datos respecto de la media aritmética. Sirven como indicador de la variabilidad de los datos. Las medidas de dispersión más utilizadas son el rango, la desviación estándar y la varianza.
TIPOS
Desviación estándar
La desviación estándar mide el grado de disersión de los datos con respecto a la media, se denota como s para una muestra o como σ para la población. Se define como la raíz cuadrada de la varianza según la expresión:
Mientras menor sea la desviación estándar, los datos son más homogéneos, es decir existe menor dispersión, el incremento de los valores de la desviación estándar indica una mayor variabilidad de los datos.
Varianza
Es otro parámetro utilizado para medir la dispersión de los valores de una variable respecto a la media. Corresponde a la media aritmética de los cuadrados de las desviaciones respecto a la media. Su expresión matemática es:
donde Xi es el dato i-ésimo y es la media de los N datos.
FÓRMULAS PARA DATOS AGRUPADOS Y NO AGRUPADOS
Moda
La moda, Mo, es el valor que tiene mayor frecuencia absoluta.
1º Todos los intervalos tienen la misma amplitud.
Li-1 es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:
Mediana
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.
1 Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.
2 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.
Mediana para datos agrupados
es la semisuma de las frecuencias absolutas.
Li-1 es el límite inferior de la clase donde se encuentra .
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
Media aritmética
La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.
Cuartiles
Los cuartiles son los tres valores de la variable dividen a un conjunto de datos ordenados en cuatro partes iguales.
Cálculo de los cuartiles
1 Ordenamos los datos de menor a mayor.
2 Buscamos el lugar que ocupa cada cuartil mediante la expresión .
Cálculo de los cuartiles para datos agrupados
En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas.
Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Cálculo de deciles
Ordenamos los datos de menor a mayor.
Buscamos la puntuación, en la serie, o la clase, en la tabla de las frecuencias acumuladas, donde se encuentra , .
Percentiles
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Cálculo de percentiles
Ordenamos los datos de menor a mayor.
Buscamos la puntuación, en la serie, o la clase, en la tabla de las frecuencias acumuladas, donde se encuentra ,.
Desviación media
La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.
Desviación media para datos agrupados
Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
Varianza para datos agrupados
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Varianza para datos agrupados
Desviación típica
La desviación típica es la raíz cuadrada de la varianza.
Desviación típica para datos agrupados
Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Desviación típica para datos agrupados
Coeficiente de variación
El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.
Coeficiente de variación en tanto por ciento
Distribuciones bidimensionales
Covarianza
Coeficiente de correlación lineal
Recta de regresión de Y sobre X
Recta de regresión de X sobre Y
¿Qué significan ambas medidas?
DATOS NO AGRUPADOS
Datos no agrupados es el conjunto de observaciones que se presentan en su forma original tal y como fueron recolectados, para obtener información directamente de ellos. Los datos no agrupados es un conjunto de información si ningún orden que no nos establece relación clara con lo que se pretende desarrollar a lo largo de un problema, esto se soluciona mediante una tabulación que nos conduce a una tabla de frecuencias.
DATOS AGRUPADOS
Son aquellos datos que pertenecen a un tamaño de muestra mayor a 20 o mas elementos, por lo que para ser analizados requieren ser agrupados en clases a partir de ciertas caracteristicas
Fuentes de consulta:
https://www.monografias.com/docs/Datos-agrupados-y-no-agrupados-PKLDL3YBY
http://www.cch-sur.unam.mx/guias/matematicas/estadist1_2012.pdf