Diseno de un factor

10
DISEÑO Y ANÁLISIS DE EXPERIMENTOS DE UN FACTOR Supóngase que un ingeniero civil está investigando el efecto de métodos de curado en la resistencia a la compresión media del concreto. El experimento consistiría en elaborar varios especímenes de prueba del concreto empleando cada uno de los métodos de curado propuestos y luego probar la resistencia a la compresión de cada espécimen. Los datos de este experimento se utilizarían para determinar que método de curado debe utilizarse para brindar la resistencia a la compresión máxima. Si sólo hay dos métodos de curado de interés, el experimento podría realizarse utilizando los métodos de prueba de hipótesis ya conocidos. En este caso el experimento tendría un solo factor de interés, los métodos de curado con dos niveles del factor. Muchos experimentos de un solo factor requieren más de dos niveles del factor que se considerará. Por ejemplo, el ingeniero civil puede tener cinco métodos de curado diferentes que investigar. En esta unidaad presentaremos el análisis de varianza para tratar con más de dos niveles de un solo factor.

Transcript of Diseno de un factor

DISEÑO Y ANÁLISIS DE EXPERIMENTOS DE UN FACTORSupóngase que un ingeniero civil está investigando el efecto de métodos de curado en la resistencia a la compresión media del concreto. El experimento consistiría en elaborar varios especímenes de prueba del concreto empleando cada uno de los métodos de curado propuestos y luego probar la resistencia a la compresión de cada espécimen. Los datos de este experimento se utilizarían para determinar que método de curado debe utilizarse para brindar la resistencia a la compresión máxima.Si sólo hay dos métodos de curado de interés, el experimento podría realizarse utilizando los métodos de prueba de hipótesis ya conocidos.En este caso el experimento tendría un solo factor de interés, los métodos de curado con dos niveles del factor. Muchos experimentos de un solo factor requieren más de dos niveles del factor que se considerará. Por ejemplo, el ingeniero civil puede tener cinco métodos de curado diferentes que investigar. En esta unidaad presentaremos el análisis de varianza para tratar con más de dos niveles de un solo factor.

EXPERIMENTO DE UN SOLO FACTOR COMPLETAMENTE ALEATORIO

Un fabricante de papel que se emplea para bolsas de comestibles, se interesa en mejorar la resistencia la tensión del producto. Ingeniería de productos considera que la resistencia a la tensión es una función de la concentración de madera dura en la pulpa, y que el intervalo de concentraciones de madera dura de interés práctico está entre 5 y 20 por ciento. Uno de los ingenieros responsables del estudio decide investigar cuatro niveles de la concentración de madera dura: 5, 10, 15 y 20 por ciento. Decide también elaborar seis especímenes de prueba en cada nivel de concentración, utilizando una planta piloto. Los 24 especímenes se prueban en un probador de tensión de laboratorio, en orden aleatorio. Las observaciones se muestran a continuación:Concentrac

ión de madera dura

Observaciones.Totales Promedios

.1 2 3 4 5 6

5 7 8 15 11 9 10 60 10.0010 12 17 13 18 19 15 94 15.67

15 14 18 19 17 16 18 102 17.0020 19 25 22 23 18 20 127 21.17

383 15.96

ANÁLISIS DE VARIANZA.Supóngase que tenemos diferentes niveles a de un solo factor (tratamientos) que deseamos comparar. La respuesta observada para cada uno de los a tratamientos es una variable aleatoria.Los datos aparecerán como en la tabla. Un dato en dicha tabla, por ejemplo Yij representa la observación j-esima tomada bajo el tratamiento i. En un principio consideramos el caso en el que hay un número igual de observaciones, n, en cada tratamiento.Tratamien

toObservaciones. Totales Promedio

1 Y11 Y12 Y13 Y1n Y1•

2 Y21 Y22 Y23 Y2n Y2•

a Ya1 Ya2 Ya3 Yan Ya•Notese: Y1• Implica la suma de todas las columnas de la línea 1

Y•1 implica la suma de todas las filas de la columna 1

Podemos describir las observaciones en la tabla por medio de un modelo estadístico lineal.

𝒀 𝒊𝒋=𝝁+𝝉 𝒊+𝝐𝒊𝒋 { 𝒊=𝟏,𝟐,… 𝒂𝒋=𝟏,𝟐,.. 𝒏donde yij es la observación ij-ésima, µ es un

parámetro común para todos los tratamientos, llamado media general, i es un parámetro asociado con el tratamiento i-ésimo denominado efecto de tratamiento i-ésimo, y ij, es un componente del error aleatorioEl modelo anterior recibe el nombre de análisis de varianza de clasificación unidireccional, debido a que sólo se investiga un factor. Además, requeriremos que las observaciones se tomen en orden aleatorio de manera que el ambiente en el que se usan los tratamientos (llamados a menudo unidades experimentales) sea lo más uniforme posible. Lo anterior se denomina diseño experimental completamente aleatorio.

El modelo también puede escribirse como:

𝒀 𝒊𝒋=𝝁 𝒊+𝜺 𝒊𝒋{ 𝒊=𝟏,𝟐,…. 𝒂𝒋=𝟏,𝟐,….𝒏Donde µi =µ+i es la media del i-ésimo tratamiento.

En esta forma se observa que cada tratamiento define una población que tiene una media global µ más un efecto i que se debe al tratamiento. Se supondrá que ij está distribuido de manera normal con media cero y varianza 2 . Por consiguiente cada tratamiento puede considerarse como una población normal con media µi y varianza 2 Esta ecuación es el modelo fundamental para un experimento de un factor. Por otra parte, puesto que se requiere que las observaciones se tomen en orden aleatorio y que el ambiente en el que los tratamientos se utilizan sea lo más uniforme posible, este tipo de diseño se denomina: diseño experimental completamente aleatorizado.Se analizará el modelo de efectos fijos, es decir, los tratamientos se eligen por el experimentador. Y para esto se utilizará el análisis de varianza.

NOTACIÓN Y SIMBOLOGÍA.En el modelo de efectos fijos, los efectos de los tratamientos i usualmente se definen como desviaciones de la media global µ de modo que:

∑𝒊=𝟏

𝒂

𝝉 𝒊=𝟎

𝒀 𝒊•=∑𝒋=𝟏

𝒏

𝒀 𝒊𝒋

Total de observaciones bajo el i-ésimo tratamiento.

Y•• = El gran total de todas las observaciones

𝒀 ••=𝒀••

𝑵Media de todas la observaciones. Donde N = an número total de observaciones

𝒀 𝒊•=𝒀 𝒊•

𝒏Media del tratamiento i

𝒀 ••=∑𝒊=𝟏

𝒂

∑𝒋=𝟏

𝒏

𝒀 𝒊𝒋

El interés recae en probar la igualdad de las medias µ1, µ,…. µn de los a tratamientos esto equivale a la prueba de hipótesis:𝑯 𝟎:𝝉𝟏=𝝉𝟐=⋯=𝝉 𝒂=𝟎𝑯 𝟏:𝝉 𝒊≠𝟎 𝒂𝒍 𝒎𝒆𝒏𝒐𝒔 𝒑𝒂𝒓𝒂𝒖𝒏𝒂 𝒊

Si la hipótesis nula es verdadera , el cambio en los niveles del factor no tiene efecto sobre la respuesta promedio.

El análisis de varianza se basa en la variabilidad total de los datos, llamada suma total de cuadrados:

𝑺𝑺𝑻=∑𝒊=𝟏

𝒂

∑𝒋=𝟏

𝒏

(𝒀 𝒊𝒋−𝒀 •• )𝟐SST Se puede dividir en: la suma de cuadrados de diferencias entre las medias de los tratamientos y la media total, esta parte es llamada SStratamientos y representa las diferencias entre los tratamientos.La otra parte sería las diferencias entre las observaciones dentro de un tratamiento con respecto a la media del mismo tratamiento, lo llamaremos SSE Suma de cuadrados del error.

𝑺𝑺𝑻=𝑺𝑺 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔+𝑺𝑺𝑬

Fórmulas para las sumas de cuadrados con muestras del mismo tamaño

𝑺𝑺𝑻=∑𝒊=𝟏

𝒂

∑𝒋=𝟏

𝒏

𝒀 𝒊𝒋 𝟐−𝒀 𝟐

••

𝑵

𝑺𝑺 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔=∑𝒊=𝟏

𝒂 𝒀 𝟐 𝒊•

𝒏−𝒀 𝟐••

𝑵

𝑺𝑺𝑬=𝑺𝑺𝑻−𝑺𝑺 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔

Fórmulas para las sumas de cuadrados con tamaños de muestras ni

𝑺𝑺𝑻=∑𝒊=𝟏

𝒂

∑𝒋=𝟏

𝒏

𝒀 𝒊𝒋 𝟐−𝒀 𝟐

••

𝑵

𝑺𝑺 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔=∑𝒊=𝟏

𝒂 𝒀 𝟐 𝒊•

𝒏 𝒊−𝒀 𝟐••

𝑵

𝑺𝑺𝑬=𝑺𝑺𝑻−𝑺𝑺 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔

Media de cuadrados para tratamientos: 𝑴𝑺 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔=

𝑺𝑺 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔

𝒂−𝟏Error cuadrático medio: 𝑴𝑺𝑬=

𝑺𝑺𝑬

𝒂( 𝒏−𝟏)

𝑭 𝟎=𝑴𝑺 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔

𝑴𝑺𝑬

Tiene una distribución F con a-1 (numerador) y a(n-1) (denominador), grados de libertad.

Al hacer la prueba de hipótesis si F0 >Fa-1,a(n-1) (en tabla), entonces se rechaza H0Ejemplo:Un fabricante de papel que se emplea para bolsas de comestibles, se interesa en mejorar la resistencia la tensión del producto. Ingeniería de productos considera que la resistencia a la tensión es una función de la concentración de madera dura en la pulpa, y que el intervalo de concentraciones de madera dura de interés práctico está entre 5 y 20 por ciento. Uno de los ingenieros responsables del estudio decide investigar cuatro niveles de la concentración de madera dura: 5, 10, 15 y 20 por ciento. Decide también elaborar seis especímenes de prueba en cada nivel de concentración, utilizando una planta piloto. Los 24 especímenes se prueban en un probador de tensión de laboratorio, en orden aleatorio. Las observaciones se muestran a continuación:

Concentración de madera dura

Observaciones.

Totales Promedios.

1 2 3 4 5 6

5 7 8 15 11 9 10 60 10.00

10 12 17 13 18 19 15 94 15.6715 14 18 19 17 16 18 102 17.0020 19 25 22 23 18 20 127 21.17

383 15.96Las hipótesis son: H0 : 1 = 2 = 3 = 4 =0 H1 : i ≠ 0 al menos

para una i Tabla para el análisis de varianza ANOVA.

Fuente de Variación

Grados de libertad

Suma de cuadrados.

Media de cuadrados.

F0

Tratamientos

a-1 SStratamientos MStratamientos

Error a(n-1) SSE MSE

Total an-1 (N-1) SST

CÁLCULOS.

𝑺𝑺𝑻=∑𝒊=𝟏

𝒂

∑𝒋=𝟏

𝒏

𝒀 𝒊𝒋 𝟐−𝒀 𝟐

••

𝑵=𝟓𝟏𝟐.𝟗𝟔 𝑺𝑺 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔=∑

𝒊=𝟏

𝒂 𝒀 𝟐 𝒊•

𝒏−𝒀 𝟐••

𝑵=𝟑𝟖𝟐.𝟕𝟗

= 512.96 - 382.79 = 130.17

=127.60 𝑴𝑺𝑬=𝑺𝑺𝑬

𝒂( 𝒏−𝟏)=𝟔.𝟓𝟏

𝑭 𝟎=𝑴𝑺 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔

𝑴𝑺𝑬=𝟏𝟗.𝟔𝟎 En tabla FT = Fa-1,a(n-1) =4.94

Fuente de variación

grados libertad

suma cuadrados

media cuadrad. F0 F(tabla)

Tratamientos 3 382.7917 127.5972 19.60521 4.938193Error 20 130.1667 6.508333   Total 23 512.9583     Conclusión: dado F0 > F(tabla) Rechazar H0, Si hay diferencia en los tratamientos.

Ejercicio en Excel