Para que sirve la varianza

  • por
Para que sirve la varianza

Significado de la varianza en matemáticas

La desviación estándar se expresa en las mismas unidades que la media, mientras que la varianza se expresa en unidades al cuadrado, pero para observar una distribución, se puede utilizar cualquiera de las dos siempre que se tenga claro qué se está utilizando. Por ejemplo, una distribución Normal con media = 10 y sd = 3 es exactamente lo mismo que una distribución Normal con media = 10 y varianza = 9.

No necesitas las dos. Cada una tiene propósitos diferentes. La SD suele ser más útil para describir la variabilidad de los datos, mientras que la varianza suele ser mucho más útil matemáticamente. Por ejemplo, la suma de distribuciones no correlacionadas (variables aleatorias) también tiene una varianza que es la suma de las varianzas de esas distribuciones. Esto no sería cierto para la DS. Por otro lado, la DS tiene la comodidad de estar expresada en unidades de la variable original.

La varianza de un conjunto de datos mide la dispersión matemática de los datos respecto a la media. Sin embargo, aunque este valor es teóricamente correcto, es difícil de aplicar en el mundo real porque los valores utilizados para calcularlo se elevaron al cuadrado. La desviación estándar, como raíz cuadrada de la varianza, da un valor que está en las mismas unidades que los valores originales, lo que hace que sea mucho más fácil trabajar con ella y más fácil de interpretar junto con el concepto de la curva normal.

Fórmula de la media y la varianza

El término varianza se refiere a una medida estadística de la dispersión entre los números de un conjunto de datos. Más concretamente, la varianza mide la distancia de cada número del conjunto con respecto a la media y, por tanto, con respecto a todos los demás números del conjunto. La varianza se suele representar con este símbolo: σ2. La utilizan tanto los analistas como los operadores para determinar la volatilidad y la seguridad del mercado. La raíz cuadrada de la varianza es la desviación estándar (σ), que ayuda a determinar la consistencia de los rendimientos de una inversión a lo largo de un periodo de tiempo.

En estadística, la varianza mide la variabilidad respecto a la media o promedio. Se calcula tomando las diferencias entre cada número del conjunto de datos y la media, elevando al cuadrado las diferencias para que sean positivas y, por último, dividiendo la suma de los cuadrados por el número de valores del conjunto de datos.

\Inicio: &\año de la varianza \sigma^2 =\frac{ \sum_{i=1}^n{{a la izquierda(x_i – \bar{x}{a la derecha)^2} donde: x_i=i^ésima… \punto de datos… y la barra… x… = media de todos los puntos de datos… y n… = número de puntos de datos… fin…

Desviación estándar

Los cuartiles son útiles, pero también son algo limitados porque no tienen en cuenta todas las puntuaciones de nuestro grupo de datos. Para obtener una idea más representativa de la dispersión, debemos tener en cuenta los valores reales de cada puntuación en un conjunto de datos. La desviación absoluta, la varianza y la desviación típica son esas medidas.

La desviación absoluta y la desviación media absoluta muestran la cantidad de desviación (variación) que se produce en torno a la puntuación media. Para hallar la variabilidad total en nuestro grupo de datos, simplemente sumamos la desviación de cada puntuación respecto a la media. La desviación media de una puntuación puede calcularse entonces dividiendo este total por el número de puntuaciones. La forma de calcular la desviación de una puntuación respecto a la media depende de la estadística que elijamos, ya sea la desviación absoluta, la varianza o la desviación estándar.

Quizá la forma más sencilla de calcular la desviación de una puntuación respecto a la media sea tomar cada puntuación y restarle la puntuación media. Por ejemplo, la puntuación media del grupo de 100 alumnos que hemos utilizado antes era de 58,75 sobre 100. Por lo tanto, si tomamos un estudiante que obtuvo una puntuación de 60 sobre 100, la desviación de una puntuación respecto a la media es 60 – 58,75 = 1,25. Es importante señalar que las puntuaciones por encima de la media tienen desviaciones positivas (como se ha demostrado anteriormente), mientras que las puntuaciones por debajo de la media tendrán desviaciones negativas.

Qué es la varianza en estadística

Como las unidades de la varianza son mucho mayores que las de un valor típico de un conjunto de datos, es más difícil interpretar el número de la varianza de forma intuitiva. Por eso se suele preferir la desviación estándar como medida principal de la variabilidad.

Con las muestras, utilizamos n – 1 en la fórmula porque utilizar n nos daría una estimación sesgada que subestima sistemáticamente la variabilidad. La varianza de la muestra tendería a ser menor que la varianza real de la población.

Es importante señalar que hacer lo mismo con las fórmulas de desviación estándar no conduce a estimaciones completamente insesgadas. Como la raíz cuadrada no es una operación lineal, como la suma o la resta, la insesgadez de la fórmula de la varianza de la muestra no se traslada a la fórmula de la desviación estándar de la muestra.

Es importante tener en cuenta la varianza antes de realizar pruebas paramétricas. Estas pruebas requieren varianzas iguales o similares, también llamadas homogeneidad de la varianza u homocedasticidad, cuando se comparan diferentes muestras.

Las pruebas estadísticas como las pruebas de varianza o el análisis de varianza (ANOVA) utilizan la varianza de las muestras para evaluar las diferencias de los grupos. Utilizan las varianzas de las muestras para evaluar si las poblaciones de las que proceden difieren entre sí.