Primero hay que entender la palabra homescedasticity o homoscedasticidad. Por ello ver tema homoscedaticity en el foro Temas generales de Six Sigma.
Pulse aquí para tema de Homoscedasticity
Existen una gran cantidad de herramientas estadísticas para visualizar la homoscedasticidad de grupos de datos. Como se trata de visualizar las varianzas de los grupos una primera herramientas es
1- el Box Plot, donde la alta dispersión de los datos se observan en el tamaño de la caja y la longitud de los whiskers o bigotes como se suele llamar en español. Cuidado allí, no se trata de observar la posición relativa entrendos Boxes (cajas) ya que no se esta hablando de variación entre grupos. Estamos mas interesados para homoscedasticidad en la variación dentro de los grupos . En el ejemplo siguiente los grupos 1 y 2 no permitirán verificar la homoscedasticidad y a simple vista la dispersión interna de cada uno permite señalar que son muy heteroscedasticos; y si además eran de tamaño de muestras diferentes, es posible que un ANOVA hubiera resultado invalido.
2- Segunda herramienta si la distribución de la data es normal sería la prueba de Barlett, o la prueba de Levene si la data es no paramétrica o simplemente se dispone de pocas muestras. Las dos pruebas de hipótesis son pruebas de igualdad estadística de varianza. Un p- Value mayor al nivel de significancia α ( POR lo general 0.05) implicaría la aceptación de la hipótesis nula que las varianzas entre los grupos son iguales y por lo tanto se verificaría la homoscedasticidad de los grupos.
Sin embargo la prueba directa para homoscedasticity es la prueba Fmax de Hartley.
El estadístico calculado Fmax = Varianza max
Varianza min
Y Fmax calculado < Fmax critical
Varianza es el cuadrado de la desviación estándar,
Fmax critical es dado en la tabla de Hartley para
un nivel de significancia α,
un número de grupos k
y número de observaciones n
Suponemos que se quiere analizar tres grupos de 30 mediciones de ph de una sustancia química fabricada por tres turnos diferentes. Antes de correr la prueba ANOVA en este caso, calculamos las desviaciones estándares
σ1 = 1.589
σ2 = 1.276
σ3 = 0.245
calculamos las Varianzas
α1^2 = 2.525
σ2^2 = 1.628
σ3^2 = 0.06
Por lo tanto
Fmax = 2.525/0.06 = 42.08
Fmax critical en la tabla para k=3 y n-1=29 es de 2.11 (2.07 + 2.46-2.07/10)
Como Fmax > critical Fmax se concluye que no hay homoscedasticidad entre los grupos. Por lo tanto ANOVA no es la prueba a realizar ya que la condición de igualdad de varianza esta violada y la data es heteroscedastica
Homoscedasticity es un concepto simple con un nombre complejo, pero es de gran importancia en análisis de Varianza y regresión linear. En cuanto a este último hay 4 condiciones fundamentales para justificar la regresión. Estas son
1- linealidad y aditividad de la relación entre variables dependientes e independientes
2- independencia serial de los errores (residuales)
3- normalidad de la distribución de los errores (residuales)
4- homoscedasticidad, varianza constante, de los errores
Trataremos este tema mas adelante ofreciendo soluciones cuando una o más de las 4 condiciones no se cumplen
Pulse aquí para tema de Homoscedasticity
Existen una gran cantidad de herramientas estadísticas para visualizar la homoscedasticidad de grupos de datos. Como se trata de visualizar las varianzas de los grupos una primera herramientas es
1- el Box Plot, donde la alta dispersión de los datos se observan en el tamaño de la caja y la longitud de los whiskers o bigotes como se suele llamar en español. Cuidado allí, no se trata de observar la posición relativa entrendos Boxes (cajas) ya que no se esta hablando de variación entre grupos. Estamos mas interesados para homoscedasticidad en la variación dentro de los grupos . En el ejemplo siguiente los grupos 1 y 2 no permitirán verificar la homoscedasticidad y a simple vista la dispersión interna de cada uno permite señalar que son muy heteroscedasticos; y si además eran de tamaño de muestras diferentes, es posible que un ANOVA hubiera resultado invalido.
2- Segunda herramienta si la distribución de la data es normal sería la prueba de Barlett, o la prueba de Levene si la data es no paramétrica o simplemente se dispone de pocas muestras. Las dos pruebas de hipótesis son pruebas de igualdad estadística de varianza. Un p- Value mayor al nivel de significancia α ( POR lo general 0.05) implicaría la aceptación de la hipótesis nula que las varianzas entre los grupos son iguales y por lo tanto se verificaría la homoscedasticidad de los grupos.
Sin embargo la prueba directa para homoscedasticity es la prueba Fmax de Hartley.
El estadístico calculado Fmax = Varianza max
Varianza min
Y Fmax calculado < Fmax critical
Varianza es el cuadrado de la desviación estándar,
Fmax critical es dado en la tabla de Hartley para
un nivel de significancia α,
un número de grupos k
y número de observaciones n
Suponemos que se quiere analizar tres grupos de 30 mediciones de ph de una sustancia química fabricada por tres turnos diferentes. Antes de correr la prueba ANOVA en este caso, calculamos las desviaciones estándares
σ1 = 1.589
σ2 = 1.276
σ3 = 0.245
calculamos las Varianzas
α1^2 = 2.525
σ2^2 = 1.628
σ3^2 = 0.06
Por lo tanto
Fmax = 2.525/0.06 = 42.08
Fmax critical en la tabla para k=3 y n-1=29 es de 2.11 (2.07 + 2.46-2.07/10)
Como Fmax > critical Fmax se concluye que no hay homoscedasticidad entre los grupos. Por lo tanto ANOVA no es la prueba a realizar ya que la condición de igualdad de varianza esta violada y la data es heteroscedastica
Homoscedasticity es un concepto simple con un nombre complejo, pero es de gran importancia en análisis de Varianza y regresión linear. En cuanto a este último hay 4 condiciones fundamentales para justificar la regresión. Estas son
1- linealidad y aditividad de la relación entre variables dependientes e independientes
2- independencia serial de los errores (residuales)
3- normalidad de la distribución de los errores (residuales)
4- homoscedasticidad, varianza constante, de los errores
Trataremos este tema mas adelante ofreciendo soluciones cuando una o más de las 4 condiciones no se cumplen
Sáb Ago 05, 2023 2:41 pm por Admin
» Integración SMED y YAMAZUMI
Sáb Mayo 27, 2023 4:28 pm por wsterlin
» OEE (paradas menores) y Takt time
Lun Oct 10, 2022 1:49 pm por wsterlin
» Six Sigma concepts into Lean 8 Wastes
Dom Jul 10, 2022 7:33 pm por Admin
» Términos estadísticos
Miér Jul 06, 2022 8:54 pm por Admin
» Analítica de riesgo
Lun Jun 13, 2022 3:37 pm por Admin
» Cómo funciona en la práctica los cálculos de un Kanban?
Dom Jun 12, 2022 12:32 pm por Admin
» Statistics Based Kaizen
Lun Mar 14, 2022 9:01 am por Admin
» 9 key to Productivity Improvement
Lun Dic 13, 2021 4:04 pm por Admin
» What is Lean Six Sigma?
Dom Nov 28, 2021 10:39 pm por Admin