Post on 12-Jan-2023
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
1
ESTATÍSTICA EXPERIMENTAL
Professor Nagib Yassin
Rio Verde 2012
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
2
Ementa Introdução. Princípios básicos da experimentação. Comparações múltiplas. Experimentos inteiramente casualizados. Experimentos em blocos casualizados. Experimentos em quadrados latinos. Experimentos Fatoriais. Experimentos em parcelas subdivididas. Experimentos em faixas. Reticulados Quadrados. Regressão na análise da variância. Teste de qui-quadrado. Análise de Covariância. Análise de variância multidimensional. Superfícies de resposta. Testes não-paramétricos.
Objetivos
Reconhecer o significado dos métodos estatísticos, aplicando-os em problemas
específicos da área
Conteúdo
Cap. 1 Testes de Hipóteses
Cap. 2 Contrastes
Cap. 3 Introdução à Experimentação
Cap. 4 Delineamento Inteiramente Casualizado
Cap. 5 Procedimentos para Comparações Múltiplas
Cap. 6 Delineamento em Blocos Casualizados
Cap. 7 Delineamento em Quadrado Latino
Cap. 8 Experimentos Fatoriais
Cap. 9 Experimentos em Parcelas Subdivididas
Cap.10 – Regressão
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
3
ESTRATÉGIAS DE AVALIAÇÃO
O sistema de avaliação constará de três provas, com pesos iguais. As datas das provas estão apresentadas no planejamento da disciplina em anexo.
O assunto pertinente as 1a, 2
a e 3
a provas, será divulgado em sala de aula na semana
que a prova ocorrerá.
O estudante que perdeu a 1a ou a 2
a ou a 3
a prova, por qualquer motivo que seja
(viagem de caráter particular, atestado médico, participação em congressos, etc.), poderá fazer a Prova Substitutiva, sendo esta única cujo valor será 100%. Esta prova substitutiva abordará todo o assunto do semestre. Não é necessário apresentar justificativa para fazer a prova substitutiva. A data da prova substitutiva também se encontra no planejamento em anexo. O estudante deve também levar o seu conjunto de tabelas, pois as mesmas são de uso individual. Estas tabelas não devem conter nenhuma informação adicional. A existência de tais informações adicionais implica o uso de cola, estando o estudante sujeito A penalidades. Os alunos que não obtiverem média final para aprovação, poderão realizar a prova final, cujo assunto é toda a matéria lecionada durante o período letivo. Divulgação das Notas de Provas As notas da 1ª e 2ª provas serão divulgadas no máximo, até 3 semanas após a
realização de cada uma delas. Já as provas 3a e substitutiva terão as notas divulgadas
até 3 dias após a realização da prova substitutiva. Revisão de Prova O Professor marcará um período ÚNICO de revisão para cada uma das provas. O estudante deve respeitar este período de revisão, pois não serão abertas exceções para que o estudante faça a revisão de suas provas fora do período de revisão estabelecido.
A média de aproveitamento (MA) será obtida, calculando:
( ) ( )+ += 8 3 NP 3 NT 2(MEP)
MA
Sendo:
(NP) Nota de uma única prova
(NT) Nota referente a um trabalho mensal
(MEP) Nota referente a 2 listas menais de exercícios.
Trabalhos
Obs:
As notas de NT e de MEP não darão direito ao aluno requerer 2a chamada
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
4
A freqüência comporá o sistema de avaliação – (5% a menos para cada falta e/ou
capítulo)
METODOLOGIA
O conteúdo programático será desenvolvido através de aulas expositivas dialogadas,
além da participação efetiva do aluno na construção e resolução de exercícios. Trabalhos
em grupo na classe e extra classe, solucionando problemas práticos ou envolvendo parte
teórica de tópicos do conteúdo programático.
Bibliografia AQUINO, L. H. Técnica experimental com animais. Escola Superior de Agricultura de Lavras, Lavras, MG, 1992. 385p BANZATTO, D.A. e KRONKA, S.N. Experimentação Agrícola. FUNEP, Jaboticabal, 1989. CAMPOS, H.. Estatística Aplicada à Experimentação com Cana-de-açúcar. FEALQ, Piracicaba, l984. FERREIRA, P. V. Estatística Experimental Aplicada à Agronomia. Maceió: EDUFAL, 1991 GOMES, F.P. Curso de Estatística Experimental. 11a ed., Livraria Nobel, São Paulo, 1985. RODRIGUES, M. I., IEMMA, A. F. Planejamento de Experimentos e Otimização de Processos, 1ºed. –Campinas –SP, Casa do Pão Editora, 2005
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
5
ÍNDICE C A P Í T U L O 1 9
TESTES DE HIPÓTESES 9
1.1.Testes de hipóteses para média populacional 13
1.2 Testes de hipótese para a razão de duas variâncias 15
13 Testes de hipóteses para a diferença entre médias populacionais 16
1.4. Testes de hipóteses para diferença entre proporções 23
1.5 Teste do qui-quadrado de independência 24
Exercícios 27
34 C A P Í T U L O 2
ESTATÍSTICA EXPERIMENTAL 34
2.1 Introdução 34
2.1.1 Objetivo 34
2.1.2 A necessidade da estatística 34
2.2. Conceitos importantes em experimentação 36
2.2.1 Etapas da pesquisa científica 37
2.3 Escolha dos fatores e seus respectivos níveis 38
2.3.1 Escolha da Unidade Experimental 38
2.3.2 Escolha das Variáveis a Serem Medidas 38
2.3.3 Regras Segundo as quais os Tratamentos são Atribuídos as Unidades Experimentais 39
2.4 Princípios básicos da experimentação 50
2.4.1 Princípio da repetição 40
2.4.2 Princípio da casualização 41
2.4.3 Princípio do controle local 43
2.5 Número de repetições 44
2.6 Bordaduras 44
Exercícios 46
52 C A P Í T U L O 3
TESTES DE SIGNIFICÂNCIA 52
3.1. Introdução 52
3.2. Contrastes 53
3.2.1. Introdução 53
3.2.2. Definições 53
3.2.3. Medidas de dispersão associadas a contrastes 54
3.2.4. Contrastes Ortogonais 55
3.3. Métodos para obtenção de grupos de contrastes mutuamente ortogonais Obtenção por Meio de Sistema de Equações Lineares 57
Exercícios 59
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
6
3.4 Teste F para a análise de variância 64
3.4.1. Regra de decisão 66
3.5 Análise de variância (ANAVA) 68
3.5.1 Quadro da análise de variância do DIC 69
3.6. Teste t de Student 69
3.6.1. Regra de decisão 71
74 C A P Í T U L O 4
DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) 74
4.1 Introdução 74
4.2 Análise de variância (ANAVA) 75
4.3 Modelo matemático do DIC com efeitos de tratamentos fixos 75
4.4 Suposição associada ao modelo 76
4.5 Hipóteses estatísticas 76
4.6 Partição da soma de quadrados 76
4.7 Quadrados médios 78
4.8 Estatística e região crítica do teste 78
4.9 Quadro da análise de variância (ANAVA) 79
4.10 Detalhe computacional 80
4.11 Estimadoresde mínimos quadrados 84
4.12 Coeficiente de determinação (R2) e de variação (CV). 86
4.13 Checando as violaçãoes das suposições da ANAVA. 87
4.14. Experimentos Inteiramente Casualizados com parcela perdida 88
4.15 Vantagens e desvantagens do DIC. 89
4.16 Resumo 90
Exercícios 91
95 C A P Í T U L O 5
TESTES DE COMPARAÇÕES MÚLTIPLAS 95
5.1 Introdução 95
5.2. Alguns Procedimentos Para Comparações Múltiplas 97
5.5.2.1.Teste de Tukey 97
5.2.2. Teste de Duncan 98
5.2.3. Teste t de Student 100
5.2.4. Teste de Scheffé 101
5.3. Vantagens e Desvantagens dos Procedimentos Para Comparações Múltiplas 102
Exercícios 103
106 C A P Í T U L O 6
DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC) 106
6.1 Introdução 106
6.2 Vantagens e devantagens de um DBC 107
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
7
6.3 Organização do dados no DBC 108
6.4 Modelo matemático do DBC 108
6.5. Suposições do modelo 109
6.6. Hipótese estatística 109
6.7 Partição da soma de quadrados 109
6.8 Quadrados médios 111
6.9 Estatística e região crítica do teste 112
6.10 Quadro da análise de variância (ANAVA) 112
6.11 Detalhes computacionais 113
6.12. O problema da perda de parcela 115
6.13 Análise de variância de medidas repetidas 118
Exercícios 120
126 C A P Í T U L O 7
DELINEAMENTO EM QUADRADO LATINO (DQL) 126
7.1 Introduão 126
7.2 Modelo Matemático. Hipóteses 126
7.3 Objetivo do Controle em 2 Direções 127
7.4 Caracterização do Quadrado Latino 127
7.5 Partição da soma de quadrados 128
7.6. Quadrados médios 129
7.7 Eestatística e região crítica do teste 129
7.8 Quadro da análise de variância (ANAVA) 130
7.9 Detalhes computacionais 130
7.10 Como contornar o problema de pequeno número de graus de liberdade para o resíduo ? 134
7.11 Casualização dos tratamentos 137
7.12. Exemplos em que as unidades experimentais são animais ou pessoas 138
Exercícios 141
144 C A P Í T U L O 8
EXPERIMENTOS FATORAIS 144
8.1 Introdução 144
8.2. Tipos de efeitos avaliados em um experimento fatorial 144
8.2.1. Efeito simples de um fator 144
8.2.2. Efeito principal de um fator 145
8.5 Efeito de interação entre os dosi fatores 145
8.3. Quadro de tabulação de dados 147
8.4 Modelo matemático de um experimento fatorial 148
8.5. Análise de Variância 149
8.5.1 Interação não-significativa 150
8.5.2 Interação significativa 157
8.6. Vantagens e desvantagens de um experimento fatorial 166
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
8
Exercícios 167
C A P Í T U L O 9 172
EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS 172
9.1 Introdução 172
9.2 Vantagem e desvantagem de um experimento em parcelas subdividas 174
9.3. Análise de variância (ANAVA) 174
9.4 Modelo matemático e suposições 174
9.5 Hpótese estatística 175
9.6 Somas de quadrados 176
9.7 Comparações múltiplas entre mádias de tratamentos 177
Exercícios 187
191 C A P Í T U L O 10
Regressão na análise de variância 191
10.1 Introdução 191
10.2. Escolha do modelo para equacionar o fenômeno em estudo 191
10.3. Método para obter a equação estimada 192
10.3.1. Modelo linear de 1º grau 192
10.3.2. Modelo linear de 2º grau 194
10.4. Análise de variância da regressão 194
10.4.1. Apenas um único valor observado para cada nível da variável independente 195
10.4.2. Mais de um valor observado para cada nível da variável independente 196
10.5. Coeficiente de determinação (R2) 198
Exercícios 199
Tabelas 205
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
9
C A P Í T U L O 1 TESTES DE HIPÓTESES
Na teoria de decisão estatística, os testes de hipóteses assumem uma importância
fundamental, já que estes permitem nos dizer, por exemplo, se duas populações são de
fato iguais ou diferentes, utilizando para isso amostras destas populações. Desta forma, a
tomada de decisão de um gestor, deve estar baseada na análise de dados a partir de um
teste de hipótese.
Então, você pode definir as hipóteses a serem testadas, retirar as amostras das populações a serem estudadas, calcular as estatísticas delas e, por fim, determinar o grau de aceitação de hipóteses baseadas na teoria de decisão, ou seja, se uma
determinada hipótese será validada ou não.
Para você decidir se uma hipótese é verdadeira ou falsa, ou seja, se ela deve ser aceita
ou rejeitada, considerando uma determinada amostra, precisamos seguir uma série de
passos. Os passos são mostrados a seguir.
1) Definir a hipótese de igualdade (H0) e a hipótese alternativa (H1) para tentar rejeitar
H0 (possíveis erros associados à tomada de decisão).
2) Definir o nível de significância (α).
3) Definir a distribuição amostral a ser utilizada.
4) Definir os limites da região de rejeição e aceitação.
5) Calcular a estatística da distribuição escolhida a partir dos valores amostrais obtidos e
tomar a decisão.
Você deve tomar a decisão baseada na seguinte regra: se o valor da estatística da
distribuição calculado estiver na região de rejeição, rejeitar, então, a hipótese nula, senão
a decisão será que a hipótese nula não poderá ser rejeitada ao nível de ignificância
determinada.
Diversos conceitos serão apresentados ao longo do detalhamento dos passos a serem
seguidos na formulação de um teste de hipótese.
Detalhamento dos passos na formulação de um teste de hipótese: 1) Formular as
hipóteses (H0 e H1).
Primeiramente, vamos estabelecer as hipóteses nula e alternativa.
Para exemplificar, se deve considerar um teste de hipótese para uma média. Então, a
hipótese de igualdade é chamada de hipótese de nulidade ou Ho. Suponha que você
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
10
queira testar a hipótese de que o tempo médio de ligações é igual a 50 segundos. Então,
esta hipótese será simbolizada da maneira apresentada a seguir:
Ho: µ = 50 (hipótese de nulidade)
Esta hipótese, na maioria dos casos, será de igualdade.
Se você rejeitar esta hipótese, vai aceitar, neste caso, outra hipótese, que chamamos de
hipótese alternativa. Este tipo de hipótese é simbolizada por H1 ou Ha. As hipóteses
alternativas mais comuns são as apresentadas a seguir a partir do nosso exemplo:
H1: µ > 50 (teste unilateral ou unicaudal à direita)
O tempo médio de ligação é superior a 50 segundos
H1: µ < 50 (teste unilateral ou unicaudal à esquerda)
O tempo médio de ligação é inferior a 50 segundos
H1: µ ≠ 50 (teste bilateral ou bicaudal)
O tempo médio de ligação pode ser superior ou inferior a 50 segundos.
Surge uma dúvida. Qual hipótese alternativa será utilizada? A resposta é bem simples. A hipótese alternativa será definida por você, em função do tipo de decisão que deseje
tomar.
Veja o seguinte exemplo: você inspeciona uma amostra de uma grande remessa,
encontrando-se 8% defeituosa. O fornecedor garante que não haverá mais de 6% de
peças defeituosas em cada remessa. O que devemos responder, com auxílio dos testes
de significância, é se a afirmação do fornecedor é verdadeira.
As hipóteses que serão formuladas são:
H0: p = 0,06;
H1: p > 0,06.
É importante ressaltar que o sinal de igual para a hipótese Ho corresponde a um sinal de
menor ou igual (neste exemplo), pois o teste é unilateral à direita (p1 > 0,06). Portanto,
sempre que o teste for unilateral, deve ser feita esta consideração.
2) Definir o nível de significância.
O nível de significância de um teste é dado pela probabilidade de se cometer erro do tipo
I (ocorre quando você rejeita a hipótese H0 e esta hipótese é verdadeira). Com o
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
11
valor desta probabilidade fixada, você pode determinar o chamado valor crítico, que
separa a chamada região de rejeição da hipótese Ho da região de aceitação da hipótese
H0.
Na Figura abaixo, as áreas escuras correspondem à significância do teste, ou seja, à
probabilidade de se cometer o chamado erro tipo I (rejeitar H0 quando ela é verdadeira).
Esta probabilidade é chamada de α, e geralmente os valores mais utilizados são 0,01 e
0,05. O complementar do nível de significância é chamado de nível de confiança e é dado
por 1 - α.
α
Unilateral à direita H0: µ = 50 H0: µ > 50
Unilateral à esquerda H0: µ = 50 H0: µ < 50
Bilateral H0: µ = 50 H0: µ # 50
αααα/2 αααα/2
α
α
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
12
3) Definir a distribuição amostral a ser utilizada.
A estatística a ser utilizada no teste, você definira em função da distribuição amostral a
qual os dados seguem. Se você fizer um teste de hipótese para uma média ou diferença
entre médias, utilize a distribuição de Z ou t de Student. Outro exemplo é se você quiser
comparar a variância de duas populações, então deverá trabalhar com a distribuição F,
ou seja, da razão de duas variâncias. Note que o conhecimento das distribuições
amostrais vistas na Unidade 3 é muito importante.
4) Definir os limites da região de rejeição.
Os limites entre as regiões de rejeição e aceitação da hipótese Ho, você definirá em
função do tipo de hipótese H1, do valor de (nível de significância) e da distribuição
amostral utilizada. Considerando um teste bilateral, você terá a região de aceitação (não-
rejeição)
com uma probabilidade de 1- α e uma região de rejeição com probabilidade α ( α/2 + α/2).
5) Tomar a decisão.
Para tomar a decisão, você deve calcular a estimativa do teste estatístico que será
utilizado para rejeitar ou não a hipótese Ho. A estrutura deste cálculo para a média de
forma generalista é dada por:
Valor obtido da
distribuição
amostral
(tabela)
Valor obtido da
distribuição
amostral
(tabela)
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
13
Estatística da distribuição = ( )Estimativa patâmetro
Erro padrão da estimativa
−
Podemos exemplificar pela distribuição de Z, que será:
( )Calc
X µZ
σ
n
−=
Se o valor da estatística estiver na região crítica (de rejeição), rejeitar Ho; caso contrário,
aceitar H0. O esquema abaixo mostra bem a situação de decisão.
1.1.Teste de hipótese para média populacional
Quando você retira uma amostra de uma população e calcula a média desta amostra, é possível
verificar se a afirmação sobre a média populacional é verdadeira. Para tanto, basta verificar se a
estatística do teste estará na região de aceitação ou de rejeição da hipótese Ho. Aqui você tem três
situações distintas:
1ª) se o desvio-padrão da população é conhecido ou a amostra é considerada grande (n >30), a
distribuição amostral a ser utilizada será da Normal ou Z e a estatística-teste que será utilizado:
Estatística do teste Variavilidade das médias
H0 é aceita
H0 é rejeitada H0 é rejeitada
Região crítica Região crítica
Região de rejeição Região de rejeição Região de aceitação
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
14
x µz
σ
n
−=
Onde x: média amostral; µ: média populacional; σ: desviopadrão populacional e n:
tamanho da amostra.
2ª) agora, se você não conhecer o desvio-padrão populacional e a amostra for pequena (
), então, a distribuição amostral a ser utilizada será a t de Student, e a estatísticateste
será:
x µt
s
n
−=
Uma observação importante: quando trabalhamos com amostras grandes, ou seja, n > 30, a distribuição de Z e t de Student apresentam comportamentos próximos e valores da estatística próximos também.
Veja uma situação utilizando o teste de hipótese para uma média usando Z. Registros dos últimos
anos de funcionários de uma determinada empresa atestam que sua média num teste de QI foi 115,
com um desvio-padrão de 20. Para saber se uma nova equipe de funcionários é
típica desta empresa, retirou-se uma amostra aleatória de 50 funcionários rios desta nova equipe,
encontrando-se média de 118. Com uma significância de 5%, teste a hipótese de que esta nova
equipe apresente a mesma característica dos funcionários da empresa, com relação ao QI.
Resolução
H0: µ = 115
H1: µ # 115
Estatística a ser utilizada →→→→ Z X µ
Z ,σ
n
− −= = =
01 1 8 1 1 5 1 0 62 0
5 0
Conclusão: como o valor da estatística calculado está na região de aceitação, então
deve-se aceitar H0 como verdadeiro
Exercício 1: um fabricante afirma que seus pneus radiais suportam em média uma
quilometragem com mais de 40.000 km. Para testar essa afirmação, um comprador
selecionou uma amostra de 49 pneus.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
15
Os testes nessa amostra forneceram uma média de 43.000 km. Sabe-se que a
quilometragem de todos os pneus tem desvio-padrão de 6.500 km. Se o comprador testar
essa afirmação ao nível de significância de 5%, qual será sua conclusão?
Veja agora uma situação aplicando o teste t de Student.
O tempo médio gasto para profissionais da área de Ciências Contábeis realizarem um determinado
procedimento tem sido de 50 minutos. Um novo procedimento está sendo implementado. Neste
novo procedimento, retirou-se uma amostra de 12 pessoas, com um tempo
médio de 42 minutos e um desvio-padrão de 11,9 minutos. Teste a hipótese de que a média
populacional no novo procedimento é menor do que 50.
H0: µ = 115
H1: µ < 115
Estatística a ser utilizada →→→→ t
X µt ,
σ ,
n
− −= = = −
04 2 5 0 2 5 31 1 9
1 2
Conclusão: como o valor da estatística calculado está na região de rejeição, então deve-
se rejeitar H0 como verdadeiro
1.2 Testes de hipóteses para a razão de duas variâncias.
Este teste de hipótese é utilizado para saber se duas variâncias populacionais são
estatisticamente iguais ou se uma é maior do que a outra. Então, utilizando a distribuição
F, poderemos formular o teste de hipótese da razão entre duas variâncias e chegar à
conclusão baseados apenas nas estimativas calculadas a partir das amostras. As
hipóteses H0 e H1 serão:
1
H : σ =σ
H : σ σ>
2 20 1 2
2 21 2
Como está se utilizando um teste unilateral à direita (questões didáticas), então, no cálculo da estatística de F, teremos a maior variância dividida pela menor variância.
A maior variância amostral encontrada será chamada de S
21 (proveniente de uma
amostra de tamanho n1), e a menor variância amostral será chamada S22 (proveniente de
amostra de tamanho n2).
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
16
Vamos supor que tivéssemos duas amostras provenientes de duas populações.
Desejamos saber se as variâncias das populações são estatisticamente iguais ou uma é
maior do que a outra. Considere uma significância de 2,5%. Os resultados amostrais são
apresentados a seguir:
S21= 0,5184 com n1 = 14
S22= 0,2025 com n2 = 21
A estatística será dada por:
Então, a variável de teste do teste F será:
s
σF
s
σ
=
21212222
Como em H0, estou considerando que as variâncias populacionais são iguais, então, na
expressão acima as duas variâncias populacionais vão se cancelar. No nosso exemplo,
teremos:
s ,F ,
,s= = =
2122
0 5 1 8 4 2 5 60 2 0 2 5
O valor tabelado (crítico) da distribuição de F será obtido na tabela da distribuição com
uma significância de 2,5%. Considerando como graus de liberdade iguais a 13 (n1 – 1)
para o numerador (v1) e 20 (n2 – 1) para o denominador (v2), chegaremos ao seguinte
resultado: valor tabelado igual a 2,637.
O valor calculado da estatística foi menor do que o tabelado, então, ele caiu na região de
aceitação de H0. Assim, aceitamos H0 e consideramos que a variância da população 1 é
estatisticamente igual à variância da população 2, ou seja, não ocorre uma diferença
entre elas.
Este teste servirá de base na escolha do próximo teste (diferença entre médias para
amostras independentes), ou seja, escolher o tipo de teste a ser utilizado.
1.3. Testes de hipóteses para a diferença entre médias populacionais
Quando queremos comparar a média de duas populações, retiramos amostras das duas,
e estas amostras podem apresentar tamanhos diferentes. Vamos considerar as situações
de amostras independentes (as populações não apresentam nenhuma relação entre si) e
amostras dependentes (uma população sofre uma intervenção e avalia-se antes e depois
da intervenção para saber se esta resultou em algum efeito).
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
17
1ª situação: amostras independentes e grandes (n>30).
2ª situação: amostras independentes e pequenas, mas que apresentam variâncias
populacionais estatisticamente iguais.
3ª situação: amostras independentes e pequenas, mas que apresentam variâncias
populacionais estatisticamente desiguais.
4ª situação: amostras dependentes.
Agora você vai estudar cada uma destas situações. Lembre-se que as considerações
anteriores em relação aos passos para formulação dos testes de hipóteses permanecem
as mesmas.
A grande diferença que você vai ver ocorre só na determinação das hipóteses a serem
testadas. A hipótese H0será:
H0: µ1 – µ1 = d0
Onde: µ1: média da população 1 e µ2: média da população 2.
Já do corresponde a uma diferença qualquer que você deseje testar.
Geralmente, quando queremos saber se as médias das duas populações são
estatisticamente iguais, utilizamos o valor de do igual a zero.
As hipóteses alternativas seguem a mesma linha de raciocínio.
Abaixo temos um quadro que nos auxiliará a visualizar estas considerações.
H0 H1
µ1 – µ2 = d0 µ1 – µ2 < d0
µ1 – µ2 > d0
µ1 – µ2 ≠ d0
É importante ressaltar que, se as hipóteses alternativas forem unilaterais, o sinal da
hipótese Ho será menor ou igual, maior ou igual, dependendo da hipótese alternativa,
apesar de utilizarmos a notação de igual (conforme comentado anteriormente).
Todas as outras considerações em relação aos testes de hipótese permanecem as
mesmas. Vamos, então, procurar entender cada situação para os testes de hipóteses
para diferença entre médias.
1ª situação: amostras independentes e grandes (n>30).
Como estamos trabalhando aqui com amostras grandes, ou quando se conhecem os
desvios-padrão populacionais, devemos trabalhar com a distribuição amostral de Z
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
18
(raciocínio semelhante ao utilizado no teste de hipótese para uma média). Portanto, a
estatística do teste será dada por:
( ) ( )X X µ µZ
σ σ
n n
− − −=
+
1 2 1 2
2 21 2
1 2
Sendo
X 1: média da amostral 1;
X 2: média da amostral 2;
µ1: média da população 1; µ2: média da população 2;
σ21 : variância da população 1;
σ22 : variância da população 2;
n1: tamanho da amostra 1; n2 tamanho da amostra 2.
OBS: se trabalharmos com amostras grandes poderemos substituir as variâncias populacionais pelas variâncias amostrais. Vamos, então, ver como podemos aplicar o teste de hipótese para a diferença entre
médias nesta situação.
Foram retiradas amostras de aparelhos usados de duas marcas, e os resultados são
apresentados na tabela a seguir. Verifique se as duas marcas têm uma mesma
durabilidade ou se são diferentes, com uma significância de 0,05.
Marcas A B
Média 1.160 1.140
Desvio-padrão 90 80
tamanho amostra 100 100
Reolução
A B
A B
H :µ µ
H :µ µ
− =
− ≠
0
0
00
α = 0,05
Estatística a ser utilizada →→→→ Z
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
19
( ) ( ) ( ) ( ) ( )X X µ µ . .Z ,
σ σ
n n
− − − − −= = =
++
1 2 1 2
2 2 2 21 2
1 2
1 1 6 0 1 1 4 0 01 9 6
9 0 8 01 0 0 1 0 0
Conclusão: como o valor da estatística calculado está na região de aceitação, então
deve-se aceitar H0 como verdadeiro
2ª situação: amostras independentes e pequenas, mas que apresentam variâncias
populacionais estatisticamente iguais.
Como as amostras com que estamos trabalhando são pequenas, e as variâncias
populacionais, desconhecidas, então, você deve trabalhar com a distribuição t de
Student.
Aqui consideraremos que as variâncias populacionais são estatisticamente iguais, pois
esta situação influenciará nos cálculos e, conseqüentemente, no processo decisório. Para
saber se as variâncias podem ser consideradas iguais, deve-se fazer um teste da razão
de duas variâncias (teste F) mostrado anteriormente.
A estatística do teste será dada por:
( ) ( )
p
X X µ µt
Sn n
− − −=
+
1 2 1 2
1 2
1 1
Aqui aparece um termo novo (Sp). Ele corresponde ao desvio padrão ponderado pelos
graus de liberdade, ou seja, calculamos um novo desvio-padrão, no qual o fator de
ponderação corresponde ao grau de liberdade de cada amostra. Veja a seguir:
( ) ( )p
n s n sS
n n
− + −=
+ −
2 21 1 2 2
1 2
1 12
Para você encontrar o valor tabelado que limita as regiões de aceitação e rejeição na
tabela t de Student (revise na Unidade 3), o número de graus de liberdade (v) será dado
por:
v n n= + −1 22
Vamos agora resolver um exemplo.
Um treinamento na área contábil de um grupo empresarial é ministrado a 12 profissionais
pelo método convencional. Um segundo grupo de dez profissionais recebeu o mesmo
treinamento por um método programado. Os resultados de notas dos dois métodos são
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
20
apresentados na tabela a seguir. Determine se há diferença entre os dois métodos
considerando uma significância de 0,01.
Método Convencional Programado
Média 85 81
Desvio-padrão 4 5
OBS: no teste F, não foram encontradas diferenças entre as variâncias populacionais. Resolução
c p
c p
H :µ µ
H :µ µ
− =
− ≠
0
0
00
Estatística a ser utilizada →→→→ t
( ) ( ) ( ) ( )A B A B
p
A B
X X µ µt ,
S ,n n
− − − − −= = =
+ +
8 5 8 1 02 0 7
1 1 1 14 4 7 81 2 1 0
V = 22 – 2 = 20 gl
α ,t t ,= =2 0 0 0 52 8 4 5
Conclusão: como o valor da estatística calculado está na região de aceitação, então
deve-se aceitar H0 como verdadeiro
Exercício 2: duas técnicas de venda são aplicadas em dois grupos de vendedores. A
técnica A foi aplicada em um grupo de 12 vendedores, resultando em um número de
vendas efetivadas em média de 76 e uma variância de 50. Já a técnica B foi aplicada em
um grupo de 15 vendedores, resultando em um número de vendas efetivadas em
média de 68 e uma variância de 75. Considerando as variâncias estatisticamente iguais,
e com uma significância de 0,05, verifique se as médias são estatisticamente iguais.
3ª situação: amostras independentes e pequenas, mas que apresentam variâncias
populacionais estatisticamente desiguais. A diferença desta situação para a anterior é
que você considera que as populações apresentam variâncias estatisticamente
desiguais. Também utilizare mos a estatística do teste a partir da distribuição t de
Student. A estatística do teste será dada por:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
21
( ) ( )A B A BX X µ µt
s s
n n
− − −=
+
2 21 2
1 2
Outra diferença esta no cálculo do número de graus de liberdade, pois nesta situação
utilizaremos uma aproximação que é dada pela expressão a seguir:
s s
n nv gl
s s
n n
n n
+
= = +
− −
22 21 2
1 22 22 2
1 2
1 2
1 21 1
Se este valor calculado apresentar valores decimais, deve ser feito o arredondamento
para um número inteiro. Vamos a um exemplo.
Para estudar o efeito da certificação ambiental no valor de empresas, consideraram-se
amostras de empresas da mesma área, com e sem certificação ambiental. Obtiveram-se
os seguintes resultados. Após ter sido testado, verificou-se que as populações
apresentam variâncias desiguais. Teste a hipótese de que os dois padrões de empresas
apresentam médias de valor diferentes.
Método Com certificação ambiental Sem certificação ambiental
Média 24 13,3
Desvio-padrão 1,7 2,7
N 8 21
Resolução
c p
c p
H :µ µ
H :µ µ
− =
− ≠
0
0
00
Estatística a ser utilizada →→→→ t
( ) ( ) ( ) ( )A B A B
p
A B
X X µ µ ,t ,
S ,n n
− − − − −= = =
+ +
2 4 1 3 3 02 0 7
1 1 1 14 4 7 81 2 1 0
V = 22 – 2 = 20 gl
α ,t t ,= =2 0 0 0 52 8 4 5
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
22
4ª situação: amostras dependentes.
Relembrando, amostras dependentes ocorrem quando se faz uma intervenção e se
deseja saber se os resultados antes da intervenção são iguais aos resultados depois da
intervenção.
Um ponto importante nesta situação é que são calculadas primeiramente as diferenças
de antes e depois. Esta diferença é chamada de di. Então, você pode ver que:
di = valor antes - valor depois
Com base nestas diferenças (di) você vai calcular a média (D) e o desvio- padrão destas
diferenças (SD)
n
i
i
d
Dn
==∑1
n
ini
iD
d
dn
Sn
=
=
−
=−
∑∑
2
121
11
Veja que estas fórmulas são iguais às de cálculo da média e desvio-padrão apresentados
na Unidade 1. Neste caso, no lugar da variável x, são utilizados os valores de di
(diferenças).
Com estes valores, a estatística teste será dada por:
D
D dt
S
n
−=
0
O valor de n corresponde ao número de diferenças calculadas, e o grau de liberdade para
ser olhado na tabela t de Student será dado por n - 1.
Em um estudo, procurou-se investigar a não-eficácia de uma propaganda na percepção
de clientes. O Quadro a seguir dá os resultados de pessoas selecionadas anteriormente.
No nível de 5% de significância, teste a afirmação de que as percepções sensoriais são
inferiores após a propaganda, ou seja, a propaganda não é eficaz. (Os valores se referem
a antes e depois da propaganda; medidas em uma escala de zero a doze.)
Pessoa A B C D f G H I
Antes 6,6 6,5 9,0 10,3 11,3 8,1 6,3 11,6
Depois 6,8 2,4 7,4 8,5 8,1 6,1 3,4 2,0
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
23
Resolução
D
D
H :µ
H :µ
=
<
0
0
00
αααα = 0,05 Estatística a ser utilizada →→→→ t
d
D
α ,
D µ ,t ,
S ,
n
t t ,
− −= = =
= =0 0 5
2 9 1 1 4 0 2 7 13 0 3 68
1 8 9 5
Conclusão: como o valor da estatística calculado está na região de rejeição, então deve-
se rejeitar H0 como verdadeiro
1.4. Testes de hipóteses para diferença entre proporções
Em diversas situações, o que nos interessa é saber se a proporção de sucessos (evento
de interesse) em duas populações apresenta a mesma proporção ou não. Neste caso, os
dados seguem uma distribuição de Bernoulli (vista na Unidade 2) com média p e
variância pq. Portanto, a expressão da estatística-teste (no caso utilizaremos a
distribuição de Z) será dada por:
( ) ( )( ) ( )( )
ˆ ˆp p p pz
ˆ ˆˆ ˆ p qp q
n n
− − −=
1 2 1 2
2 21 1
1 2
Nesta expressão, você tem:
p 1 e p 2correspondem à proporção de sucesso nas amostras 1 e 2, respectivamente.
p1 e p2 correspondem à proporção de sucesso nas populações 1 e 2, respectivamente.
Você deve se lembrar que a proporção de fracasso (q) é dada por um, menos a
proporção de sucesso.
Vejamos, então, como aplicar o teste da diferença de proporções.
Uma questão de teste é considerada boa, se permitir discriminar entre estudantes
preparados e estudantes não preparados. A primeira questão de um teste foi respondida
corretamente por 62, dentre 80 alunos preparados, e por 23, dentre 50 alunos não
preparados. Com um nível de 5% de significância, teste a afirmação de que esta questão
foi respondida corretamente por uma proporção maior de estudantes
preparados.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
24
H :p p
H :p p
− =
> =
0 1 2
1 1 2
00
Estatística a ser utilizada →→→→ Z
( ) ( )( ) ( )( )
( ) ( )( )( ) ( )( )
ˆ ˆp p p p , ,z ,
, , , ,ˆ ˆˆ ˆ p qp q
n n
− − − − −= = =
++
1 2 1 2
2 21 1
1 2
0 7 7 5 0 4 6 03 7 3
0 7 7 5 0 2 2 5 0 4 6 0 5 48 0 5 0
α ,Z Z ,= =0 0 51 6 5
Conclusão: como o valor da estatística calculado está na região de rejeição, então deve-
se rejeitar H0 como verdadeiro
1.5. Teste do qui-quadrado de independência
O teste do qui-quadrado de independência está associado a duas variáveis qualitativas,
ou seja, uma análise bidimensional (visto na Unidade 2). Você se lembra que as tabelas
de contingência permitem verificar a relação de dependência entre as duas variáveis
analisadas.
Neste caso, procura-se calcular a freqüência de ocorrência das características dos
eventos a serem estudados. Por exemplo, podemos estudar a relação entre o sexo de
pessoas (masculino e feminino) e o grau de aceitação do governo (ruim, médio e bom).
Então, você vaiobter, por exemplo, o número de pessoas (freqüência) que são do sexo
feminino e que acham o governo bom. Todos os cruzamentos das duas variáveis são
calculados.
Vamos apresentar a você, como exemplo, os possíveis resultados da situação
apresentada anteriormente (dados simulados).
Sexo Função
Ruim Médio Bom Total
Masculono 157 27 74 258
Feminino 206 0 10 276
Total 363 27 84 474
Podemos, então, querer determinar o grau de associação entre essas duas variáveis, ou
seja, se o grau de aceitação do governo depende do sexo ou existe uma relação de
dependência.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
25
As hipóteses a serem testadas são:
H0: variável linha independe da variável coluna
H1: variável linha está associada com a variável coluna
A estatística de qui-quadrado será dada por meio da seguinte expressão:
( )i i
i
ko e
c
i e
f fχ
f=
−=∑
2
2
1
Onde o valor k corresponde ao número de classes (freqüências encontradas). Você pode
verificar que f0 corresponde à freqüência observada, ou seja, o valor encontrado na
tabela de contingência.
Já fe corresponde à freqüência esperada caso as variáveis não tenham nenhuma relação
de dependência, ou seja, as duas variáveis sejam independentes. Em função desta
definição, a freqüência esperada (fe) será obtida por:
( )( )e
total linha total colunaf
total geral=
Neste caso, os graus de liberdade (v), para que possamos olhar a tabela de qui-
quadrado, são dados por:
v = (h-1) (k-1) nas tabelas com h linhas e k colunas Então, para cada célula da tabela de
contingências, você vai calcular a diferença entre fe e. fo. Esta diferença é elevada ao
quadrado para evitar que as diferenças positivas e negativas se anulem. A divisão
pela freqüência esperada é feita para obter diferenças em termos relativos.
Para entendermos melhor o teste de qui-quadrado do tipo independência, vamos
trabalhar com a seguinte situação: para testar se determinada droga era capaz de inibir a
absorção de álcool pelo organismo humano, realizou-se um experimento com a
participação de 60 voluntários (homens saudáveis, idade entre 25 e 28 anos). Metade
dos voluntários tomou a droga, e a outra metade não tomou. Todos os voluntários
tomaram duas doses de uísque. Uma hora mais tarde, selecionou-se uma amostra do
sangue de cada sujeito, observando-se os resultados a seguir. Usando 5% de
significância, pode-se concluir que o resultado do teste está associado à ingestão da
droga?
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
26
Teste droga Presença de álcool Ausência de álcool
Tomaram 8 32
Não tomaram 16 40
H0: Presença ou ausência de álcool independe de tomar droga
H1: Presença ou ausência de álcool está associada a tomar droga
Teste droga Presença de álcool Ausência de álcool
Tomaram 8 (10) 32 (30) 40
Não tomaram 16 (14) 40 (42) 56
96
.=
5 0 2 4 1 49 6
Valores entre parênteses (fe)
( ) ( ) ( ) ( ) ( )i i
i
ko e
c
i e
f fχ ,
f=
− − − − −= = + + + =∑
2 2 2 2 22
1
8 1 0 3 2 3 0 1 6 1 4 4 0 4 20 9 1 4
1 0 3 0 1 4 4 2
v = (2-1) . (2-1) = 1 gl
α = 0,05 → Qui-quadrado tabelado = 3,8415
Como o valor calculado (0,914) foi menor do que o tabelado, então o calculado caiu
na região de aceitação de H0.
Portanto, não temos indícios para rejeitar a hipótese H0, ou seja, o uso da droga não levou a uma inibição da absorção de álcool.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
27
Exercícios 1. Pretende-se lançar uma moeda 5 vezes e rejeitar a hipótese de que a moeda é não-
tendenciosa, isto é, pretende-se rejeitar Ho: π = 0,50, se em 5 (cinco) jogadas ocorrerem
5 coroas ou 5 caras. Qual é a probabilidade de se cometer erro do tipo I?
2. Você suspeita que um dado é viciado, isto é, você suspeita que a probabilidade de
obter face 6 é maior do que 1/6. Você decide testar a hipótese de que o dado é não-
viciado, jogando-o cinco vezes e rejeitando essa hipótese se ocorrer a face 6 (seis), 4 ou
5 vezes. Qual o nível de significância do teste?
3. Uma urna contém 6 fichas, das quais θ são brancas e 6 - θ são pretas. Para testar a
hipótese de nulidade de que θ = 3, contra a alternativa de que θ ≠ 3, são retiradas 2
(duas) fichas da urna ao acaso e sem reposição. Rejeita-se a hipótese nula se as duas
fichas forem da mesma cor.
(a) Determine P(Erro do Tipo I).
(b) Determine o poder do teste para os diferentes valores de θ.
(c) Considere, agora, que a segunda ficha é retirada após a reposição da primeira.
Calcule, novamente, o nível de significância e os valores do poder do teste.
(d). Compare os dois procedimentos (com e sem reposição da segunda ficha retirada).
Qual a conclusão?
4. Para decidirmos se os habitantes de uma ilha são descendentes da civilização A ou B,
iremos proceder da seguinte forma:
(i) Selecionamos uma amostra aleatória de 100 moradores adultos da ilha e
determinamos a altura média;
(ii) Se a altura média for superior a 176 cm, diremos que os habitantes são descendentes
de B, caso contrário, admitiremos que são descendentes de A.
Os parâmetros das duas civilizações são: A: µA = 175 cm e σA = 10 cm e B: µB = 177 cm
e σB = 10 cm.
Define-se ainda: erro do tipo I como sendo “dizer que os habitantes são descendentes de
B quando, na realidade, são de A” e erro do tipo II “dizer que os habitantes são de A
quando, na realidade, são descendentes de B”.
(a) Qual a probabilidade de erro do tipo I e do tipo II?
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
28
(b) Se σA = σB = 5, como ficariam os valores dos erros do tipo I e II?
(c) Qual deve ser a regra de decisão se quisermos fixar a a probabilidade de Erro I em
5%. Qual a probabilidade de erro II neste caso?
(d) Quais as probabilidades de Erro II, se as médias forem: µA = 178 e se µB = 180?
5. Fazendo o teste H0: µ = 1150 (σ = 150) contra H1: µ = 1200 (σ = 200) e com n = 100,
estabeleceuse a seguinte região crítica: RC = [1170, +∞).
(a) Qual a probabilidade α de rejeitar H0 quando verdadeira?
(b) Qual a probabilidade β de Aceitar H0 quando H1 é verdadeira?
6. Numa linha de produção é importante que o tempo gasto numa determinada operação
não varie muito de empregado para empregado. Em operários bem treinados a
variabilidade fica em 100 u2. A empresa colocou 11 novos funcionários para trabalhar na
linha de produção, supostamente bem treinados, e observou os seguintes valores, em
segundos:
125 135 115 120 150 130 125 145 125 140 130
Testar se a tempo despendido por estes funcionários pode ser considerado mais variável
do que os demais funcionários. Utilize 5% de significância.
7. Diversas políticas, em relação às filiais de uma rede de supermercados, estão
associadas ao gasto médio dos clientes em cada compra. Deseja-se comparar estes
parâmetros de duas novas filiais, através de duas amostras de 50 clientes,selecionados
ao acaso, de cada uma das novas filiais. As médias obtidas foram 62 e 71 unidades
monetárias. Supondo que os desvios padrões sejam idênticos e iguais a 20 um, teste a
hipótese de que o gasto médio dos clientes não é o mesmo nas duas filiais. Utilize uma
significância de 2,5%?
8. Em dois anos consecutivos foi feito um levantamento de mercado sobre a preferência
dos consumidores pelo por um determinado produto. No primeiro ano o produto era
anunciado com freqüência semanal nos veículos de comunicação e no segundo ano com
freqüência mensal. No levantamento foram utilizados duas amostras independentes de
400 consumidores cada. No primeiro ano o percentual de compradores ficou em 33% e
no segundo ano em 29%. Considerando o nível de significância de 5%, teste a hipótese
de que a freqüência do anúncio tem influência na manutenção da fatia de mercado.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
29
9. Para verificar se uma moeda é honesta, com base em 20 lançamentos independentes,
adotamos o seguinte critério: consideramos a moeda não honesta se o resultado for
menor do que 7 ou maior do que 13.
(a) Formule esse problema como um problema de teste de hipóteses.
(b) Quais são os significados dos erros tipo I e II?
(c) Qual é o nível de significância do teste?
10. No ano de 2003 foi feita uma pesquisa em uma estância turística e constatou-se que
apenas 60% dos visitantes estavam satisfeitos com a infraestrutura oferecida. Com o
intuito de aumentar essa proporção a prefeitura fez algumas melhorias na cidade e
depois de um ano, resolveu verificar se as mesmas produziram o efeito desejado. Para
isso entrevistou 50 turistas.
(a) Formule esse problema como um problema de teste de hipóteses.
(b) Quais são os significados dos erros tipo I e tipo II?
(c) Qual é a região crítica associada a um nível de significância de 10%.
(d) Se 37 dos 50 turistas entrevistados estavam satisfeitos com a infraestrutura oferecida,
qual é asua conclusão?
11. A marca Z de um produto é responsável por 50% das vendas desse produto em um
supermercado. Uma campanha promocional foi contratada e os promotores garantem
que a marca Z passará a ser responsável por uma porcentagem maior das vendas. O
dono do supermercado propõe entrevistar alguns clientes após o encerramento da
campanha promocional e perguntar a cada um deles se ele usualmente compra a marca
Z do produto.Sendo p a porcentagem de vendas do produto Z após a campanha (a)
Estabeleça as hipóteses apropriadas.
(b) Quais são os significados dos erros tipo I e tipo II para o problema?
(c) Se entre 18 clientes entrevistados, 12 responderam sim, qual é a sua conclusão com
base no nível descritivo?
(d) Se entre 324 clientes entrevistados, 178 responderam sim, qual é a sua conclusão
com base no nível descritivo?
12. Com o objetivo de testar uma hipótese H0 contra a hipótese alternativa Ha, um
pesquisador fixou as probabilidades de erros de 1ª e 2ª espécies, respectivamente, em
5% e 10%.
Realizado o teste, imaginem-se 2 situações diferentes:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
30
Em A: O pesquisador rejeitou a hipótese de nulidade
Em B: O pesquisador não rejeitou a hipótese de nulidade.
Para cada situação (A e B) assinale a alternativa correta e justifique.
a) O pesquisador certamente estará cometendo um erro cuja probabilidade de ocorrência
é igual a 5%;
b) O pesquisador certamente estará cometendo um erro cuja probabilidade de ocorrência
é igual a 10%;
c) Se o pesquisador estiver cometendo um erro, a probabilidade de ocorrência associada
a este erro é de 15%;
d) Se o pesquisador estiver cometendo um erro, a probabilidade de ocorrência associada
a este erro é de 10%;
e) Se o pesquisador estiver cometendo um erro, a probabilidade de ocorrência associada
a este erro é de 5%.
12. A resistência ao resfriado comum em uma dada indústria, durante o inverno, é de
p=0,60. Foi proposto um tratamento preventivo com a finalidade de aumentar a
resistência ao resfriado para p=0,70. Então:
a) formule as hipóteses.
b) fixando a= 0,05 (ou valor mais próximo) e admitindo ter sido sorteada uma amostra de
tamanho n=20, observou-se que 4 operários ficaram resfriados. Nestas condições, qual é
a conclusão quanto à eficiência do medicamento?
13. Para se estimar a letalidade da doença B, acompanhou-se uma amostra de 30
doentes durante um ano. Após esse período, cinco deles haviam morrido. Testar a
hipótese de que essa letalidade é igual a 20%. Fixe o erro de 1º espécie em um a=10%.
14. Certa comunidade apresentou em um período de vários anos coeficiente de
incidência da doença X de 12 por 10.000 hab.. Em 1999, a incidência foi de 70 casos e a
população estimada foi igual a 50.000 habitantes. Nestas condições, ao nível de
significância de 1% (ou mais próximo) diga se concorda com as autoridades sanitárias
que consideraram a situação dentro do esperado.
15. Desejando-se conhecer o coeficiente de prevalência de determinada doença na
cidade A, selecionou-se uma amostra aleatória de 500 pessoas. Nesta amostra
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
31
detectaram-se 20 doentes. Teste a hipótese de que a prevalência é semelhante à
descrita na literatura de 10%. (Fixando a=5%)
16. Uma nova espécie de trigo desenvolvida em laboratórios será testada quanto a sua
produtividade, em comparação com a espécie tradicional. Dados do governo revelam
que a produtividade média de lavouras que se utilizam da espécie tradicional é de 25
ton/ha. A produtividade de uma fazenda é uma variável aleatória normalmente
distribuída. Dezesseis fazendas foram preparadas para a avaliação da nova espécie.
Qual seria o seu parecer sobre a nova espécie se, em seu experimento você
observasse na amostra média de 28 ton/ha e variância de 12( ton / ha)2 .
17. Um novo método de emagrecimento é anunciado como o fim das gordurinhas a mais
que perseguem a parcela mais abonada da sociedade. Preocupado com a seriedade
profissional dos responsáveis pelo uso do método, o conselho de medicina decide
promover um experimento para avaliar a eficácia do tratamento. Trinta e dois voluntários
são divididos em 2 grupos de igual tamanho, recebendo cada grupo um tratamento
diferente. Um deles recebe o novo método e o outro o método tradicional. Anotou-se a
variação de peso de cada indivíduo após o final do tratamento. Os resultados foram:
ind. 1 2 3 4 5 6 7 8 9 10 11 1
2
13 14 15 16
Novo 5.3 -
3.4
-
8.1
-
9.0
1.3 -
3.4
-
8.0
2.3 -
3.1
-
13.4
-
8.9
3.
1
-
4.3
-
3.0
-
3.2
2.0
trad. 4.2 -
2.0
-
5.0
-
3.0
2.8 -
0.3
-
6.0
-
3.1
0.3 -
12.0
-
6.0
2.
0
-
2.1
-
1.0
-
2.0
-
1.0
Suponha que tanto a variação do peso com o tratamento novo, quanto a
variação com o tratamento tradicional sejam variáveis aleatórias com
distribuições normais.
(a) Teste a hipótese de que não há diferença entre os dois métodos, a um nível
de 0,01. Suponha que os dois grupos de voluntários sejam independentes (b)
suponha agora que os indivíduos do primeiro grupo são irmãos gêmeos dos
indivíduos do outro grupo(pares de gêmeos, é claro). Para cada par aplicou-se a
um dos gêmeos o tratamento novo e ao outro o tradicional. Teste com base
nessa informação adicional a mesma hipótese do item anterior, ao mesmo nível
de significância.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
32
18. Um novo método de aprendizagem foi testado através do seguinte experimento.
Em uma turma de 30 alunos utilizou-se o método novo e em outra turma de 30 alunas de
outra escola manteve-se o método tradicional. Ao final do curso aplicou-se um mesmo
exame às duas turmas. Os resultados foram:
Turma1-método novo: média=69 desvio padrão=10
Turma2-método antigo: média=60 desvio padrão=9.
Com base nestas informações, teste se há diferença significativa entre os dois
métodos, a um nível de 0,05. Suponha as notas individuais de cada aluno como v.a.
normais de mesma variância e médias possivelmente diferentes.
19. Um novo tratamento anti-corrosivo para chapas de aço foi testado. O experimento
realizado foi o seguinte: 9 chapas diferentes foram selecionadas sendo cada uma
dividida em duas. A uma das metades aplicou-se o tratamento novo e a outra metade
o tratamento antigo. Anotou-se, então, o tempo até o início da corrosão em cada
metade.Os resultados obtidos foram:
chapa 1 2 3 4 5 6 7 8 9
metade/novo 36.2 48.3 35.4 39.3 40.2 37.4 39.3 42.3 36.0
metade/antigo 31.4 39.2 35.0 33.4 41.3 36.8 38.1 43.0 35.0
Suponha que o tempo até a corrosão em cada metade é uma variável com
distribuição normal, e que o tratamento não influencia na variância desta variável, mas
apenas na sua média. Qual dos tratamentos voce recomendaria que fosse utilizado?
20. Um estudo é desenvolvido para investigar o efeito de um certo tratamento para
controlar a temperatura do corpo de porcos criados em laboratório e que possuem
uma deficiência genética que provoca redução na temperatura corpórea dos
porcos. As temperaturas de interesse foram medidas um dia antes e um dia
depois de submeterem os porcos ao tratamento. Os dados obtidos estão
apresentados na tabela abaixo.
animal 1 2 3 4 5 6 7 8 9 10
antes 38.1 38.4 38.3 38.2 38.2 37.9 38.7 38.6 38 38.2
depois 38.9 38.6 38.2 38.2 39.4 38.5 38.3 38.4 38.8 38.7
a) Há evidências de que o tratamento permite o controle da temperatura ?
b) Calcule um intervalo de confiança para a temperatura após a aplicação do
tratamento.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
33
21. Um entomologista está investigando se um inseto é predador de uma variedade
de uma espécie de plantas com folhas rugosas e uma outra com folhas lisas. Ele
acompanha o crescimento de cinco plantas de cada variedade e conta o número
de ovos do inseto em cada uma delas. Infelizmente ele perde uma observação
referente a planta de folha lisa. Para as 9 plantas que sobraram , ele obtem uma
quantidade média de 48,5 para lisa e 37,2 para rugosa. Fazendo os cálculos ele
encontra um valor t=2,65 com 7 graus de liberdade.
Após verificar melhor seus registros ele encontra a observação perdida, cujo valor é 110.
a) qual é agora o número médio de ovos do inseto para a planta lisa? b) como você acha
que ele determinou o valor de t? c) quando ele repete os cálculos fica surpreso de não
encontrar diferença sigificativa entre o número médio de ovos para os dois tipos de
folhas. O que pode ter acontecido?
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
34
C A P Í T U L O 2
ESTATÍSTICA EXPERIMENTAL
2.1 Introdução
Numa pesquisa científica o procedimento geral é formular hipóteses e verificá-las
diretamente ou por suas conseqüências.
Para isto é necessário um conjunto de observações e o planejamento de experimentos é
então essencial para indicar o esquema sob o qual as hipóteses possam ser verificadas
com a utilização de métodos de análise estatística que dependem da maneira sob a qual
as observações foram obtidas. Portanto, planejamento de experimentos e análise dos
resultados estão intimamente ligados e devem ser utilizados em uma seqüência nas
pesquisas científicas das diversas áreas do conhecimento. Isto pode ser visto por meio
da seguinte representação gráfica da circularidade do método científico.
2.1.1 Objetivo
Estudo dos experimentos, isto é, seu planejamento, execução, análise dos dados obtidos
e interpretação dos resultados.
2.1.2 A necessidade da estatística
Numa pesquisa científica, o procedimento geral é formular hipóteses e verificá-las
diretamente ou através de suas circunstâncias. Para tanto, é necessário um conjunto de
observações ou dados e o planejamento de experimentos é, então, essencial para indicar
o esquema sob o qual as hipóteses podem ser testadas.
O que nos obriga a utilizar a análise estatística, para testar as hipóteses formuladas é a
presença em todas as observações de efeito de fatores não controlados, que causam as
variações, tais como:
Diferenças genéticas dos animais, diferenças de fertilidade, etc.
Esses efeitos que sempre ocorrem, não podem ser medidos individualmente e tendem a
mascarar o efeito do tratamento em estudo.
O conjunto de efeitos de fatores não controlados é denominado de variação ao acaso ou
variação aleatória.
Visando tornar mínima a variação do acaso, o experimentador deve fazer o planejamento
de tal forma que consiga isolar os efeitos de todos os fatores que podem ser controlados.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
35
(2)
Observações
(1) (3)
Formulação de hipóteses Verificação das hipóteses formuladas
(4)
Desenvolvimento da teoria
Fica bastante claro neste esquema que técnicas de planejamento devem ser utilizadas
entre as etapas (1) e (2) e os métodos de análise estatística devem ser utilizados na
etapa (3).
Desenvolvendo um pouco mais está idéia podemos dizer que uma pesquisa científica
estatisticamente planejada consiste nas seguintes etapas
1. Enunciado do problema com formulação de hipóteses.
2. Escolha dos fatores (variáveis independentes) que devem ser incluídos no estudo.
3. Escolha da unidade experimental e da unidade de observação.
4. Escolha das variáveis que serão medidas nas unidades de observação.
5. Determinação das regras e procedimentos pelos quais os diferentes tratamentos são
atribuídos às unidades experimentais (ou vice versa).
6. Análise estatística dos resultados.
7. Relatório final contendo conclusões com medidas de precisão das estimativas,
interpretação dos resultados com possível referência a outras pesquisas similares e uma
avaliação dos itens de 1 a 6 (desta pesquisa) com sugestões para possíveis alterações
em pesquisas futuras.
EXEMPLO - Um pesquisador está interessado em estudar o efeito de vários tipos de
ração que diferem pela quantidade de potássio no aumento do peso de determinado tipo
de animal.
Este objetivo pode ser atingido se planejarmos a pesquisa com a finalidade de: comparar
as médias dos aumentos de peso obtidas com cada uma das rações. Neste exemplo, a
variável independente “ração” é um fator e os tipos de rações são os níveis deste fator,
ou tratamentos.
As medidas realizadas nas unidades experimentais após terem sido submetidas aos
tratamentos constituem os valores da variável dependente (ganho de peso).
Um delineamento experimental apropriado e bem conduzido deve ser o mais simples
possível, ter uma alta probabilidade de atingir seu objetivo e evitar erros sistemáticos.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
36
Suas conclusões devem ser as mais amplas possíveis e as respostas obtidas (dados)
devem ser analisados por
procedimentos estatísticos válidos.
Estudos dos experimentos, isto é, seu planejamento, execução, análise dos dados
obtidos e interpretação dos resultados.
Na etapa 5 de uma pesquisa cientifica descrita acima existem três princípios inerentes
em todos os delineamentos experimentais que são essenciais aos objetivos da ciência
estatística:
2.2. Conceitos importantes em experimentação
a. Experimento ou ensaio
É um trabalho previamente planejado, que segue determinados princípios básicos e no
qual se faz a comparação dos efeitos dos tratamentos.
b. Tratamento ou fator
é o método, elemento ou material cujo efeito desejamos medir ou comparar em um
experimento. Exemplos: a) variedades de milho; b) níveis de proteína na ração e c)
diferentes temperaturas de pasteurização do leite.
c. Unidade experimental ou parcela:
É a unidade que vai receber o tratamento e fornecer os dados que deverão refletir seu
efeito. Em qualquer pesquisa é necessário que o pesquisador discuta com o estatístico a
definição adequada do que constituirá a unidade experimental ou parcela. De um modo
geral, a escolha da parcela deve ser orientada de forma a minimizar o erro experimental,
ou seja, as parcelas devem ser o mais uniforme possível, para que, ao serem submetidas
a tratamentos diferentes, seus efeitos sejam detectados. Exemplos: a) uma fileira de
plantas com 3 metros de comprimento no campo; b) um leitão e c) um litro de leite.
d. Variações de Acaso
São variações que ocorrem nos experimentos atribuídos a efeito de fatores não
controlados, conhecidos ou não, que afetam os resultados experimentais.
Ex.:-diferenças genéticas entre os seres vivos;
-pequenas diferenças de fertilidade de solo;
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
37
-pequenas variações nas condições ambientais;
-pequenas variações nas doses de adubos, inseticidas, fungicidas, herbicidas, etc
-pequenos erros de pesagem ou de medida de nutrientes, de pesticidas ou do
produto agrícola, etc.;
-ligeiras variações na distribuição de rações
e. Delineamento experimental
É o plano utilizado na experimentação, e implica na forma como os tratamentos são
designados às unidades experimentais e em um amplo entendimento das análises a
serem feitas quando todos os dados estiverem disponíveis.
Como por exemplo temos:
Delineamento inteiramente casualizado ( DIC )
Delineamento em blocos casualizados (DBC)
Delineamento em quadrado latino (DQL)
f. Variável resposta
É a variável mensurada usada para avaliar o efeito de tratamentos.
g. Erro experimental: é o efeito de fatores que atuam de forma aleatória e que não são
passíveis de controle pelo experimentador.
2.2.1 Etapas da Pesquisa Cientıfica:
1. Enunciado do problema com formulação de hipóteses.
2. Escolha dos fatores (variáveis independentes) que devem ser incluídos no estudo.
3. Escolha da unidade experimental e da unidade de observação.
4. Escolha das variáveis que serão medidas nas unidades de observação.
5.Determinação das regras e procedimentos pelos quais os diferentes tratamentos
(combinação de níveis de fatores) são atribuídos às unidades experimentais (ou vice-
versa).
6. Análise estatística dos resultados.
7. Relatório final contendo conclusões com medidas de precisão das estimativas,
interpretação dos resultados com possível referência a outras pesquisas similares e uma
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
38
avaliação dos itens de 1 a 6 (desta pesquisa) com sugestões para possíveis alterações
em pesquisas futuras.
Exemplo: Estudar o efeito de 4 Rações e 3 Vitaminas no ganho de pesos de bovinos.
Denominações:
Fatores: são as variáveis independentes. Podem ser Fixos ou Aleatórios. No exemplo,
temos 2 fatores: A (Rações) e B ( Vitaminas)
Níveis:
No exemplo, temos 4 níveis de Rações (A1, A2, A3 e A4) e 3 níveis de variedade de
vitaminas(B1, B2, B3)
Tratamentos: Combinações dos níveis dos fatores
No exemplo, temos 4 x 3 tratamentos: A1B1;A1B2; ... ;A4B3
Tipos de fatores: Fixos ou hierárquicos
Classificação dos fatores: Cruzada ou Hierárquica
2.3 Escolha dos fatores e seus respectivos níveis 2.3.1 Escolha da Unidade Experimental
Em um grande número de situações práticas a unidade experimental é determinada pela
própria natureza do material experimental. Por exemplo, em experimentos com animais,
em geral, a unidade experimental é um animal.
Em outras situações, a escolha da unidade não é assim tão evidente, exigindo do
pesquisador juntamente com o estatístico algum estudo no sentido escolher a unidade
experimental mais adequada. Por exemplo, em experimentos com plantas, a unidade
experimental pode ser as vezes uma planta, um conjunto de plantas ou uma área. A
escolha da unidade experimental, de um modo geral, deve ser orientada no sentido de
minimizar o erro experimental, isto é, as unidades experimentais devem ser o mais
homogêneas possível, para que quando submetidas a dois tratamentos diferentes, seus
efeitos sejam facilmente detectados.
2.3.2 Escolha das Variáveis a Serem Medidas
As medidas realizadas nas unidades experimentais após terem submetidas aos
tratamentos constituem os valores da variável dependente. A variável dependente, em
geral, é pré-determinada pelo pesquisador, isto é, ele sabe qual a variável que ele quer
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
39
medir. O que constitui problema, às vezes, ´e a maneira como a variável é medida, pois
disto dependem a precisão das observações, e a distribuição de probabilidade da variável
a qual ´e essencial para a escolha do método de análise estatística. Assim, por exemplo,
se os valores de uma variável são obtidos diretamente por meio de um instrumento de
medida, (réguas, paquímetro, termômetro, etc.) a precisão de nossas observações vai
aumentar se, quando possível, utilizarmos como observação a média de três medidas da
mesma unidade experimental. Com relação à distribuição de probabilidade, em muitas
situações, as observações não são obtidas diretamente, e sim por meio de expressões
matemáticas que as ligam a outros valores obtidos diretamente. Neste caso, a
distribuição de probabilidade das observações vai depender da distribuição de
probabilidade da variável obtida diretamente e da expressão matemática que as
relaciona.
Portanto, as variáveis necessariamente presentes em um experimento são a variável
dependente, medida nas unidades experimentais, e o conjunto de fatores (variáveis
independentes), que determinam as condições sob as quais os valores da variável
dependente são obtidos. Qualquer outra variável que possa influir nos valores da variável
dependente deve ser mantida constante. Suponhamos, por exemplo, que o tempo
necessário para executar um experimento seja de 20 dias e que a temperatura ambiente
tenha influência sobre a variável dependente.
Neste caso, a temperatura ambiente deve ser mantida constante durante a execução do
experimento. Se, por problemas experimentais, for impossível mantermos a temperatura
ambiente constante, então devemos, além da variável dependente, medir a temperatura
correspondente a cada unidade experimental. Variáveis deste tipo são consideradas no
estudo como covariadas e sua informação é utilizada para reduzir o erro experimental.
2.3.3 Regras Segundo as quais os Tratamentos são Atribuídos as Unidades
Experimentais
Nas discussões apresentadas sobre cada um dos itens anteriores, a colaboração da
estatística é bem limitada exigindo-se a essencial colaboração do pesquisador. Porém, o
assunto discutido neste ıtem é o que poderíamos denominar planejamento estatístico de
experimentos. Trata-se de regras que associam as unidades experimentais aos
tratamentos e que praticamente determinam os diferentes planos experimentais.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
40
Lembramos neste ponto que os tratamentos são cada uma das combinações entre os
níveis de todos os fatores envolvidos no experimento.
Para que a metodologia estatística possa ser aplicada aos resultados de um experimento
é necessário, que em alguma fase do experimento o princípio a ser obedecido ´e a
repetição, segundo o qual devemos ter repetições do experimento para que possamos
produzir uma medida de variabilidade necessária aos testes de presença de efeitos de
tratamentos ou `a estimação desses efeitos.
Discutiremos a seguir estes dois princípios.
2.4 Princípios básicos da experimentação
Um delineamento experimental apropriado e bem conduzido deve ser o mais simples
possível, ter uma alta probabilidade de atingir seu objetivo e evitar erros sistemáticos.
Suas conclusões devem ser as mais amplas possíveis e as respostas obtidas (dados)
devem ser analisados por procedimentos estatísticos válidos.
Estudos dos experimentos, isto é, seu planejamento, execução, análise dos dados
obtidos e interpretação dos resultados.
2.4.1 Princípio da repetição
Repetição significa que um tratamento é repetido duas ou mais vezes. Sua função é
fornecer uma estimativa do erro experimental e dar uma medida mais precisa dos efeitos
dos tratamentos. O número de repetições que serão requeridas em um particular
experimento depende da magnitude das diferenças que o pesquisador deseja detectar e
da variabilidade dos dados com que se esta trabalhando. Levando-se em conta estas
duas coisas no começo do experimento, muitos problemas e frustrações serão evitadas.
Em condições de campo temos:
- Sem repetição
Baia 1 Baia 2
A B
- Com repetição
Baia 1 Baia 2 Baia 3 Baia 4 Baia 5
A A A A A
Baia 6 Baia 7 Baia 8 Baia 9 Baia 10
B B B B B
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
41
As principais funções da repetição são:
(i) o erro experimental é uma medida da variação que existe entre as observações de
parcelas tratadas semelhantemente. Esta variação, que é conhecida como variação
casual ou variação de acaso, é oriunda de 2 fontes principais: a variabilidade inerente
do material e aquela resultante da falta de uniformidade na condução física do
experimento.
(ii) O erro experimental é indispensável na determinação do erro de estimativa (por
ponto e por intervalo), no dimensionamento de amostra e na construção de testes de
hipóteses.
(iii) Através da repetição é que nos é possível estimar o erro experimental. Num experimento sem
repetição não nos é possível dizer se uma diferença constatada entre tratamentos pode ser
explicada como uma diferença entre tratamentos ou entre parcelas experimentais.
2.4.2 Princípio da casualização
Casualização é a designação dos tratamentos às unidades experimentais, tal que estas
têm a mesma chance (mesma probabilidade) de receber um tratamento. Sua função é
assegurar estimativas não-viesadas das médias dos tratamentos e do erro experimental.
Nesta fase do planejamento de um experimento já sabemos quais fatores serão
estudados e o número de níveis de cada fator que estarão presentes no experimento.
Sabemos ainda qual é a unidade experimental escolhida e a variável dependente.
Podemos imaginar que de um lado temos um conjunto U de unidades experimentais, e
de outro um conjunto T de tratamentos, que podem ser as combinações dos níveis de
todos os fatores envolvidos. Precisamos estabelecer esquemas que associam
subconjuntos de elementos de U a cada elemento de T. Vamos apresentar o esquema
mais simples. Para efeitos de notação vamos supor que o conjunto U tem n elementos, o
conjunto T tem k elementos, e o número de elementos de U submetidos ao tratamento Ti
é ri, com i=1, 2, ..., k, de tal modo que k
r nii 1
=∑=
O plano completamente aleatorizado é um esquema em que as unidades
experimentais que vão ser submetidas a cada tratamento são escolhidas completamente
ao acaso. Isto significa que cada unidade experimental tem igual probabilidade de
receber qualquer um dos tratamentos. Por exemplo, um pesquisador quer realizar um
experimento para estudar o efeito de um resíduo industrial que é adicionado em rações
de animais. Ele suspeita que este resíduo contém uma substância tóxica, cuja presença
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
42
no organismo produz um aumento relativo de alguns órgãos, como o fígado por exemplo.
Após uma entrevista com o pesquisador conseguimos as seguintes informações • O
experimento irá envolver um único fator, ração, com três níveis: t1 - ração normal, sem
resíduo industrial (grupo controle; t2 - ração normal com o resíduo tratado, e t3 - ração
normal com resíduo não tratado.
• Um conjunto de 18 camundongos foi selecionado. Todos, recém nascidos, com o
mesmo peso inicial e homogêneos com relação às características genéticas gerais. Por
isto foi decidido distribuir completamente ao acaso 6 animais para cada tratamento.
• A variável dependente (resposta) é o peso relativo do fígado após 90 dias do início do
experimento.
Uma maneira de se proceder ao sorteio é a seguinte:
• enumera-se as unidades experimentais de 1 a 18.
• coloca-se os tratamentos em seqüência , por exemplo:
T1 T1 T1 T1 T1 T1 , T2 T2 T2 T2 T2 T2 , T3 T3 T3 T3 T3 T3
• sorteia-se uma sequência de 18 números aleatórios. Pode-se obter, por exemplo, a
sequência :3, 1, 11, 15, 18, 16, 4, 5, 9, 12, 8, 7, 17, 14, 2, 6, 13, 10
• Distribuição das unidades experimentais segundo os tratamentos
Tratamentos Repetiçõe
T1 A3 A1 A11 A15 A18 A16
T2 A4 A5 A9 A12 A8 A7
T3 A17 A14 A2 A6 A13 A10
. Em condições de campo, temos:
- Sem casualização (com repetição)
Baia 1 Baia 2 Baia 3 Baia 4 Baia 5
A A A A A
Baia 6 Baia 7 Baia 8 Baia 9 Baia 10
B B B B B
- Com casualização (com repetição)
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
43
Baia 1 Baia 2 Baia 3 Baia 4 Baia 5
A B A B B
Baia 6 Baia 7 Baia 8 Baia 9 Baia 10
B A A B A
Se, após a repetição e a casualização, a ração A apresentar maior desempenho,
é de se esperar que esta conclusão seja realmente válida.
2.4.3 Princípio do controle local:
Este princípio de delineamento experimental permite certas restrições na aleatorização
para reduzir o erro experimental. Isto é comum quando o conjunto U de unidades
experimentais for muito heterogêneo (em termos da variável independente), o plano
experimental completamente casualizado torna-se pouco preciso porque o erro
experimental é muito grande. Em algumas situações dispomos de informações segundo
as quais, antes da realização do experimento, é possível agruparmos as unidades
experimentais em subconjunto de k unidades experimentais mais ou menos
homogêneas, sendo k o número de tratamentos envolvidos no experimento. Estes
subconjuntos são denominados blocos. Assim, a maior parte da heterogeneidade interna
do conjunto U é expressa pela heterogeneidade entre os blocos. A distribuição das
unidades experimentais entre os tratamentos obedece a uma restrição imposta pelos
blocos, isto é, as k unidades de cada bloco são distribuídas aleatoriamente entre os
tratamentos. Na análise de um experimento em blocos, além dos fatores de interesse,
deve-se levar em conta o fator controle experimental, blocos, diminuindo desta maneira
o erro experimental. Quanto maior for a heterogeneidade entre blocos, maior é a
eficiência deste plano experimental em relação ao completamente casualizado.
Em condições de campo, temos:
- Sem repetição, sem casualização, sem controle local
Baia 1 Baia 2
A B
- Com repetição, com casualização, com controle local
Bloco 1 Bloco 2 Bloco 3
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
44
A B B A B A
Bloco 4 Bloco 5 Bloco 6
A B A B B A
O controle local constitui restrições impostas na casualização para corrigir os efeitos da
variação conhecida ou suspeitada do material experimental. Considerando o controle
local, temos os seguintes tipos de delineamentos:
-Delineamento Inteiramente Casualizado (DIC) - sem controle local;
-Delineamento em Blocos Casualizados (DBC) - controle feito através de blocos
horizontais;
-Delineamento em Quadrado Latino (DQL) - controle feito através de blocos horizontais e
verticais.
A finalidade do controle local é dividir um ambiente heterogêneo em sub-ambientes
homogêneos. Este procedimento torna o experimento mais eficiente porque reduz o erro
experimental.
2.5 Número de repetições
O número de repetições de um experimento depende de uma série de fatores dos quais o
mais importante é o grau de precisão desejado.
Quanto menor a diferença real entre tratamentos que se quer detectar, maior é o número
de repetições necessárias. Há pouco valor em usar 10 repetições para detectar uma
diferença que 4 repetições detectaria; da mesma forma, há pouco valor em se executar
um experimento onde o número de repetições não é suficiente para detectar diferenças
que são importantes.
A heterogeneidade do material experimental é um fator que afeta o número de
repetições. Quanto maior o grau de heterogeneidade do material, maior deve ser o
número de repetições.
Como uma regra geral, aconselha-se usar um número de repetições que proporcione no
mínimo 10 graus de liberrdade para se estimar a variância residual (s2).
2.6 Bordaduras
São áreas que separamos na parcela para evitar a influência dos tratamentos aplicados
nas parcelas vizinhas. Assim, temos a área total e a área útil da parcela. Os dados a
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
45
serem usados na análise estatística serão aqueles coletados apenas na área útil da
parcela.
Como exemplo, temos : 10 m Área Total
Área Útil 4 m
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
46
Exercícios
1. Um experimento deve conter no mínimo o(s) seguinte(s) princípio(s) básico(s) da
experimentação:
a) repetição
b) casualização
c) controle local
d) repetição e controle local
e) repetição e casualização
f) casualização e controle local
g) nenhuma das respostas anteriores
2. A repetição tem a função de:
a) fornecer uma estimativa do erro experimental
b) validar a estimativa do erro experimental
c) controlar a heterogeneidade das unidades experimentais
d) nenhuma das anteriores
3. A casualização tem a função de:
a) fornecer uma estimativa do erro experimental
b) validar a estimativa do erro experimental
c) controlar a heterogeneidade das unidades experimentais
d) nenhuma das anteriores
4. Um extensionista, desejando comparar 10 rações para ganho de peso em animais,
procedeu da seguinte forma:
- tomou 10 animais de uma propriedade rural. Estes 10 animais visivelmente não eram
homogêneos entre si, porque foram oriundos de diferentes cruzamentos raciais e
apresentavam idades diferentes.
- as rações que o extensionista julgou ser as melhores foram designadas aos melhores
animais, e as rações que o extensionista julgou ser as piores foram designadas aos
piores animais, de tal forma que cada animal recebeu uma única ração.
- ao final de sua pesquisa, o extensionista recomendou a ração que proporcionou maior
ganho de peso nos animais.
Baseado nestas informações, pergunta-se:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
47
a) Quantos e quais foram os tratamentos em teste nesta pesquisa? Justifique sua
resposta.
b) Qual foi a constituição de cada unidade experimental nesta pesquisa? Justifique sua
resposta.
c) Qual(is) foi(ram) o(s) princípio(s) básico(s) da experimentação utilizados nesta
pesquisa? Justifique a sua resposta.
d) É possível estimar o erro experimental nesta pesquisa? Justifique sua resposta.
e) A conclusão dada pelo extensionista ao final da pesquisa, é estatisticamente
aceitável? Justifique a sua resposta.
5. Um bioquímico desejando verificar qual entre 5 enzimas (identificadas como E1, E2,
E3, E4 e E5) produz maiores fragmentos de DNA de células epiteliais de cobaias,
realizou o seguinte ensaio:
- selecionou um conjunto de 15 cobaias (sistematicamente identificadas como 1, 2, 3, 4,
5, 6, 7, 8, 9, 10, 11, 12, 13, 14 e 15) que eram supostamente homogêneas para as
características essenciais;
- de cada uma das 15 cobaias, tomou uma amostra de tecido epitelial de cada um dos
seguintes membros: superior, mediano e inferior. Procedeu posteriormente a uma mistura
das amostras coletadas dos três membros, denominada de amostra composta;
- cada amostra composta foi convenientemente tratada para a extração do DNA. A
amostra obtida contendo apenas o DNA foi denominada amostra genômica. As amostras
genômicas foram identificadas de acordo com o número da cobaia que a originou, ou
seja, a amostra genômica identificada como C1, conteve DNA extraído da cobaia 1; a
amostra genômica identificada como C2, conteve DNA extraído da cobaia 2; e assim por
diante. Ao final obteve-se as amostras genômicas C1, C2, C3, C4, C5, C6, C7, C8, C9,
C10, C11, C12, C13, C14 e C15;
- cada uma das amostras genômicas foi tratada com um tipo de enzima. A distribuição
das enzimas às amostras foi feita da seguinte forma sistemática: E1 foi destinada às
amostras genômicas C1, C2 e C3; E2 foi destinada às amostras genômicas C4, C5 e C6;
E3 foi destinada às amostras genômicas C7, C8 e C9; E4 foi destinada às amostras
genômicas C10, C11 e C12; e E5 foi destinada às amostras genômicas C13, C14 e C15;
- uma amostra de 1 ml de cada substrato químico dos fragmentos de DNA foi colocado
para correr em um gel. O tempo, em minutos, gasto por cada uma das 15 amostras para
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
48
percorrer a distância de 25 cm foi registrado para comparar o efeito das enzimas E1, E2,
E3, E4 e E5.
Com base nas informações fornecidas deste ensaio e das explicações fornecidas em sala
de aula, pergunta-se:
a) Quais foram os tratamentos em teste neste experimento? Justifique a sua resposta.
b) Neste experimento os tratamentos surgiram de uma forma aleatória, premeditada ou
sistemática? Justifique a sua resposta.
c) Qual foi a unidade experimental nesta pesquisa? Justifique a sua resposta.
d) O princípio da repetição foi utilizado nesta pesquisa? Justifique a sua resposta. Em
caso afirmativo, explique porque diferentes observações obtidas para um mesmo
tratamento não são iguais. Em caso negativo, faça uma análise crítica quanto à
necessidade do uso de repetições num experimento.
e) O princípio da casualização foi utilizado nesta pesquisa? Justifique a sua resposta.
f) O princípio do controle local foi utilizado nesta pesquisa? Justifique a sua resposta.
Em termos gerais, quando que o princípio do controle local deve ser utilizado em um
experimento?
g) É possível estimar o erro experimental nesta pesquisa? Justifique a sua resposta.
Em caso afirmativo, a estimativa do erro experimental é válida? Justifique a sua resposta.
Em caso negativo, indique o que deveria ser feito de diferente neste ensaio para ser
possível estimar o erro experimental. Justifique a sua resposta.
h) Neste ensaio, qual foi a variável resposta utilizada para comparar os efeitos de
tratamentos? Justifique a sua resposta.
6. Um pesquisador desejava comparar os efeitos que 8 tipos de óleo têm sobre o teor de
gordura total em preparos de maionese. Com esta finalidade, esse pesquisador procedeu
da seguinte forma:
- para a avaliação do teor de gordura total, o pesquisador tinha à sua disposição 8
bioquímicos. Devido à falta de experiência dos bioquímicos, o pesquisador temia que a
medição dos mesmos pudesse interferir na comparação dos tipos de óleo.
Visando controlar esta fonte de variação, o pesquisador decidiu que cada um dos 8
bioquímicos deveria fazer a medição do teor de gordura dos preparos de maionese
produzidos utilizando os 8 tipos de óleo;
- baseado em experimentos anteriores, o pesquisador sabia que, apesar do controle de
qualidade, havia variação entre os lotes de substrato de preparos de maionese.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
49
O substrato de preparo da maionese é o composto que tem todos os ingredientes do
preparo da maionese, exceto o óleo. Como um lote de substrato não seria suficiente para
testar os 8 tipos de óleo em todas as repetições desejadas, o pesquisador decidiu que
prepararia 8 lotes de substrato e dividiria cada lote em 8 partes iguais. Cada uma das 64
partes, assim obtidas, seria denominada de amostra básica;
- foi então realizada uma distribuição ao acaso dos 8 tipos de óleo às amostras básicas,
tendo as seguintes restrições na casualização:
1a) cada tipo de óleo deveria ser aplicado em uma única amostra básica de cada um dos
8 lotes de substrato.
2a) os 8 tipos de preparo de maionese obtidos misturando cada uma das amostras
básicas com cada um dos 8 tipos de óleo, deveriam ser avaliadas por cada um dos 8
bioquímicos;
No local que foi conduzido o experimento, o pesquisador constatou que, após certo
tempo do experimento ter sido instalado, houve uma pequena contaminação por fungo
em algumas unidades experimentais. O pesquisador, usando do seu conhecimento
técnico na área, julgou que a contaminação não comprometeria os resultados obtidos no
experimento.
Baseando-se nestas informações, responda com objetividade e clareza, as seguintes
perguntas:
a Quais foram os tratamentos em teste? Justifique a sua resposta.
b Como você classificaria a fonte de variação contaminação por fungo, observada
nesse experimento? Justifique a sua resposta.
c Qual foi a unidade experimental utilizada nesta pesquisa? Justifique a sua resposta.
d O princípio da repetição foi utilizado nesta pesquisa? Se sua resposta for afirmativa,
responda qual foi o número de repetições utilizado. Se a sua resposta for negativa,
responda se o procedimento do pesquisador está correto.
e O princípio da casualização foi utilizado nesta pesquisa? Justifique a sua resposta.
f O princípio do controle local foi utilizado nesta pesquisa? Se a sua resposta for
afirmativa, explique como este princípio foi utilizado. Se a sua resposta for negativa,
explique por que não houve a necessidade da utilização deste princípio.
g Qual foi a característica utilizada pelo pesquisador para avaliar o efeito de
tratamentos neste experimento. Justifique a sua resposta.
7. Um fabricante de móveis realizou um experimento para verificar qual dentre cinco
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
50
marcas de verniz proporciona maior brilho. Com esta finalidade, procedeu da seguinte
forma:
- Em sua fábrica identificou amostras de madeira que estariam disponíveis para a
realização deste experimento. Verificou que possuía cinco tábuas de Jatobá, cinco
tábuas de Cerejeira, cinco tábuas de Mogno, cinco tábuas de Goiabão e cinco tábuas de
Castanheira. Constatou também que as cinco tábuas de cada tipo de madeira eram
homogêneas para as características essenciais e que havia uma grande variedade de
cores entre os cinco tipos de madeira (Jatobá, Cerejeira, Mogno, Goiabão e Castanheira).
Sabe-se que a cor da madeira pode influenciar muito o brilho da mesma quando
envernizada;
- Resolveu então distribuir ao acaso as cinco marcas de verniz às tábuas de
madeira, de tal forma que cada tipo de madeira fosse testada com todas as marcas de
verniz;
- O brilho foi medido por meio de um aparelho que mede a refletância da luz branca
projetado sobre a tábua de madeira envernizada;
Baseado nas informações deste experimento, pergunta-se:
a. Qual foi a unidade experimental utilizada neste experimento? Justifique a sua resposta.
b. Quais foram os tratamentos comparados neste experimento? Justifique a sua resposta.
c. Quais foram os princípios básicos da experimentação utilizados neste experimento?
Justifique a sua resposta.
d. É possível estimar o erro experimental neste experimento? Justifique a sua resposta.
Se a resposta for afirmativa, a estimativa do erro é válida? Justifique. Se a resposta foi
negativa, explique o que deveria ser feito para obter uma estimativa válida para o erro
experimental.
e. O que faz surgir o erro num experimento? É possível eliminar totalmente o efeito do
erro experimental em um experimento? Justifique a sua resposta.
f. O procedimento adotado pelo pesquisador de distribuir as marcas de verniz ao acaso
dentro de cada tipo de madeira foi realmente necessário? Justifique a sua resposta.
8. Um pesquisador de uma indústria de alimentos desejava verificar se seis sabores de
sorvete apresentavam o mesmo o teor de glicose. O pesquisador, baseado em
experimentos anteriores, sabia que duas outras fontes de variação indesejáveis poderiam
influenciar o valor mensurado do teor de glicose: o tipo de recipiente utilizado para
armazenagem do sorvete e o equipamento utilizado para mensuração do teor de glicose.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
51
Para controlar estas duas fontes de variação o pesquisador decidiu que cada sabor
deveria ser avaliado em cada um dos seis equipamentos disponíveis; e armazenado em
cada um dos seis tipos de recipientes disponíveis. Com esta finalidade, o pesquisador
planejou o experimento da seguinte maneira:
- preparar 6 lotes de 100 ml de cada sabor. O total de lotes a serem preparados seria de
36 lotes;
- os lotes de sorvetes deveriam ser distribuídos ao acaso aos recipientes, com a restrição
de que cada tipo de recipiente recebesse todos os 6 sabores uma única vez;
os lotes de sorvetes seriam designados ao acaso aos equipamentos para a análise do
teor de glicose, com a restrição de que cada equipamento avaliasse cada um dos seis
sabores uma única vez.
Baseando-se nestas informações, pergunta-se:
a. Quais foram os tratamentos em teste neste experimento? Justifique a sua resposta.
b. O princípio da repetição foi utilizado neste experimento? Justifique a sua resposta.
c. O princípio do controle local foi utilizado neste experimento? Justifique a sua resposta.
Se a resposta for afirmativa, quantas vezes o mesmo foi utilizado? Se a resposta for
negativa, discuta sobre a necessidade do mesmo ser utilizado neste experimento.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
52
C A P Í T U L O 3
TESTES DE SIGNIFICÂNCIA
3.1. Introdução
Um dos principais objetivos da estatística é a tomada de decisões à respeito da
população com base nas observações de amostras.
AMOSTRAGEM
Inferência
estatística
População Amostra
Ao tomarmos decisões, é conveniente a formulação de Hipóteses relativas às
populações, as quais podem ser ou não verdadeiras.
Exemplo: Um veterinário está interessado em estudar o efeito de 4 tipos de rações que
diferem pela quantidade de potássio no aumento de peso de coelhos.
H0: Não existe diferença entre as rações, ou seja, quaisquer diferenças observadas são
devidas a fatores não controlados
H1: As rações propiciam aumentos de pesos distintos,
H0 é denominada de hipótese de nulidade, a qual assume que não existe efeito dos
tratamentos e H1 é a contra hipótese.
µ
Média populacional
X Média amostral
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
53
3.2. Contrastes 3.2.1. Introdução
O estudo de contrastes é muito importante na Estatística Experimental, principalmente
quando o experimento em análise é composto por mais do que dois tratamentos. Com o
uso de contrastes é possível ao pesquisador estabelecer comparações, entre tratamentos
ou grupos de tratamentos, que sejam de interesse.
Este capítulo visa dar fundamentos para estabelecer grupos de contrastes, obter a
estimativa para cada contraste estabelecido, bem com estimar a variabilidade associada
a cada um destes contrastes. Todos os conhecimentos adquiridos neste capítulo serão
utilizados no Capítulo 5 para se realizar testes de hipóteses para o grupo de contrastes
estabelecidos.
3.2.2. Definições
a. Contraste
Considere a seguinte função linear de médias populacionais de tratamentos
C = a1 m1 + a2 m2 + ... + aI mI
C será um contraste entre médias se satisfizer a seguinte condição: i
i
I
a=
=∑1
0
b. Estimador do Contraste
Na prática, geralmente não se conhece os valores das médias populacionais mi ,mas
suas estimativas. Daí, em Estatística Experimental, não se trabalhar com o contraste C
mas com o seu estimador Cˆ , que também é uma função linear de médias obtidas por
meio de experimentos ou amostras. Assim tem-se que o estimador para o contraste de
médias é dado por:
1 1 2 2 I IC a m a m ... a m= + + +
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
54
Exercício
3.1 Num experimento de consórcio na cultura do abacaxi, com 5 repetições, as médias
de produção de frutos de abacaxi (em t/ha), foram as seguintes:
Tratamentos m
1 - Abacaxi (0,90 x 0,30m) monocultivo 53,5 2 - Abacaxi (0,80 x 0,30 m) monocultivo 56,5 3 - Abacaxi (0,80 x 0,30 m) + amendoim 62,0 4 - Abacaxi (0,80 x 0,30 m) + feijão 60,4
Pede-se obter as estimativas dos seguintes contrastes:
C1 = m1 + m2 – m3 – m4
C2 = m1 – m2
C3 = m3 – m4
3.2.3. Medidas de dispersão associadas a contrastes
Considere o estimador do contraste C, dado por:
1 1 2 2 I IC a m a m ... a m= + + +
A variância do estimador do contraste é dada por:
1 1 2 2 I Iˆ V(C) V(a m a m ... a m )= + + +
Admitindo independência entre as médias
1 1 2 2 I IˆV(C) V(a m ) V(a m ) ... V(a m )= + + +
1 2 i Iˆ V(C) a V(m ) a V(m ) ... a V(m )= + + +
2 2 21 2
Sabe-se que: iI
i
σV(m )
r=
2
assim,
ii
i
σ σ σˆV(C) a a ... ar r r
= + + +
2 2 22 2 21 21 2
1 2
Admitindo-se homogeneidade de variâncias, ou seja n
σ σ ...σ σ= = =2 2 2 21 2 então,
Ii i
ii i
a a a aˆ V(C) ... σ σr r r r=
= + + + =
∑2 2 2 2
2 21 21
11 2
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
55
Na prática, geralmente, não se conhece a variância σ2 , mas sua estimativa a qual obtida
por meio de dados experimentais. Esta estimativa é denominada como estimador comum
(c
S2
)
Então o que normalmente se obtém é o valor do estimador da variância do estimador do
contraste, a qual é obtida por
( )I
ic
i i
aˆV C Sr=
= ∑2
2
1
Exercício
2.2 Por meio dos dados e dos contrastes fornecidos abaixo, obter as estimativas dos
contrastes e as estimativas das variâncias das estimativas dos contrastes.
m 1=11,2 m 2= 10,5 m 3= 10,0 m 4= 21,0
r r= =1 2 6 r =3 4 r =4 5 c
S2
=0,45
C1 = m1 + m2 – m3 – m4
C2 = m1 – m2
C3 = m3 – m4
3.2.4. Contrastes Ortogonais
Em algumas situações desejamos testar um grupo de contrastes relacionados com o
experimento em estudo. Alguns tipos de testes indicados para este objetivo, necessitam
que os contrastes, que compõem o grupo a ser testado, sejam ortogonais entre si. A
ortogonalidade entre os contrastes indica independência linear na comparação
estabelecida por um contraste com a comparação estabelecida pelos outros contrastes.
Sejam os estimadores dos contrastes de C1 e C2 dados, respectivamente, por:
1 1 2 2 I IC a m a m ... a m= + + +1
1 1 2 2 I IC b m b m ... b m= + + +2
A covariância entre ˆ ˆC e C1 2 supondo independência entre tratamentos, é obtida
por
i i Iˆ ˆCOV(C , C ) a b V(m ) a b V(m )... a b V(m )= + +1 2 1 1 1 2 2 2
A variância da média amostral é dada por: iI
i
σV(m )
r=
2
, para i = 1, 2, ..., I. Logo,
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
56
ii i
i
σ σ σˆ ˆCOV(C , C ) a b a b V ... a br r r
= + + +
2 2 21 2
1 2 1 1 2 21 2
Admitindo que exista homogeneidade de variâncias entre os tratamentos, ou seja
nσ σ ...σ σ= = =
2 2 2 21 2 então:
Ii i i i
ii i
a b a b a b a bˆ ˆCOV(C , C ) ... σ σr r r r=
= + + + =
∑2 21 1 2 2
1 211 2
Sabe-se que, se duas variáveis aleatórias são independentes, a covariância entre
elas é igual a zero. Assim, se 1 Cˆ e 2 Cˆ são independentes, a covariância entre eles é
igual
a zero, isto é:
ˆ ˆCOV(C , C ) =1 20
Para que a covariância seja nula, é necessário, portanto que: I
i i
i i
a b
r=
=∑1
0
Esta é a condição de ortogonalidade entre dois contrastes para um experimento com
número diferente de repetições para os tratamentos. Para um experimento com o mesmo
número de repetições, satisfazendo as mesmas pressuposições (médias independentes
e homogeneidade de variâncias), a condição de ortogonalidade se resume
a: I
i i
i
a b=
=∑1
0
Para um experimento com I tratamentos, podem ser formados vários grupos de
contrastes ortogonais, no entanto cada grupo deverá conter no máximo (I-1) contrastes
ortogonais, o que corresponde ao número de graus de liberdade para tratamentos.
Dentro de um grupo de contrastes ortogonais, todos os contrastes tomados dois a dois,
serão também ortogonais.
Exercícios
1. Verificar se os contrastes do Exercício 2.1 formam um grupo de contrastes ortogonais.
2. Verificar se os contrastes do Exercício 2.2 formam um grupo de contrastes ortogonais.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
57
33. Métodos para obtenção de grupos de contrastes mutuamente ortogonais
Obtenção por Meio de Sistema de Equações Lineares
Neste método, deve-se estabelecer, a princípio, um contraste que seja de interesse e, a
partir deste é que os demais são obtidos. Por meio da imposição da condição de
ortogonalidade e da condição para ser um contraste, obtém-se equações lineares, cujas
incógnitas são os coeficientes das médias que compõem o contraste. Como o número de
incógnitas é superior ao número de equações existentes, será sempre necessário atribuir
valores a algumas incógnitas. É desejável que os valores a serem atribuídos, permitam
que os coeficientes sejam números inteiros.
Exercício
1. Foi instalado para avaliar a produção de 4 híbridos cujas características são
apresentadas na tabela a seguir.
Hibrido 1 2 3 4
Porte Alto Alto Alto Baixo Inicio do Florescimento
Precoce
Tardio
Tardio
Precoce
Índice de acamamento
Médio
Alto
Baixo
Médio
ri 3 3 3 3
Suponha que ao estabelecer as comparações dos híbridos com relação a produção, seja
levado em consideração
• o porte;
• o início do florescimento;
• o índice de acamamento.
Obtenha um grupo de contrastes ortogonais que permita testar as comparações segundo
os critérios citados.
Obtenção por Meio de Regras Práticas
Por meio desta metodologia, é possível estabelecer facilmente um grupo de contrastes
ortogonais. A metodologia pode ser resumida nos seguintes passos (BANZATTO e
KRONKA, 1989):
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
58
Divide-se o conjunto das médias de todos os tratamentos do experimento em dois
grupos. O primeiro contraste é obtido pela comparação das médias de um grupo contra
as médias do outro grupo. Para isso atribui-se sinais positivos para membros de um
grupo e negativos para membros do outro grupo.
Dentro de cada grupo formado no passo anterior, que possui mais que uma média,
aplica-se o passo 1, subdividindo-os em subgrupos. Repete-se este passo até que se
forme subgrupos com apenas uma média. Ao final, deveremos ter formado (I-1)
comparações.
Para se obter os coeficientes que multiplicam cada média que compõem os contrastes
estabelecidos, deve-se, para cada contraste:
Verificar o número de parcelas experimentais envolvidas no 1º grupo, digamos g1, e o
número de parcelas experimentais envolvidas no 2º grupo, digamos g2. Calcula-se o
mínimo múltiplo comum (m.m.c.) entre g1 e g2.
Dividir o m.m.c. por g1. O resultado será o coeficiente de cada média do 1º grupo
Dividir o m.m.c. por g2. O resultado será o coeficiente de cada média do 2º grupo.
Multiplicar os coeficientes obtidos pelo número de repetições da respectiva média.
Se possível, simplificar os coeficientes obtidos por uma constante. No caso em que o
número de repetições é igual para todos os tratamentos, este passo pode ser eliminado.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
59
Exercícios
1. Num experimento inteiramente casualizado, com 4 repetições, foram comparados os
efeitos de 5 tratamentos em relação ao crescimento de mudas de Pinus oocarpa, 60 dias
após a semeadura. Os tratamentos utilizados e os resultados obtidos foram (BANZATTO
e KRONKA, 1989):
Tratamentos Totais
1 – Solo de cerrado (SC) 21,0
2 – Solo de cerrado + esterco (SC+E) 27,1
3 – Solo de cerrado + esterco + NPK (SC+E+NPK) 26,6
4 – Solo de cerrado + vermiculita (SC+V) 22,1
5 – Solo de cerrado + vermiculita + NPK (SC+V+NPK)
25,6
Obtenha um grupo de contrastes ortogonais entre as médias.
2. Suponha agora para o exemplo 1 que os tratamentos 1 e 4 tenham 3 repetições e os
tratamentos 2, 3 e 5 tenham 4 repetições. Obtenha um grupo de contrastes ortogonais
entre médias.
3. Dados
Tratamentos Média Repetições
1 25,0 5
2 18,7 5
3 30,4 5
4 27,5 6
e os contrastes
C1 =m1 – m2
C2 =m1 + m2 - 2 m3
C3 = m1 + m2 + m3 – 3 m4
Admitindo-se que os estimadores das médias sejam independentes e que c
S2
=0,45,
pede-se
ˆ ˆC , C1 2 e C 3
ˆ ˆV(C ),V(C )1 2 e ˆV(C )3
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
60
c) as estimativas das covariâncias entre os estimadores dos contrastes, e por meio das
mesmas, dizer quais são os contrastes ortogonais entre si.
4. Supondo independência entre médias, homogeneidade de variâncias entre
tratamentos e admitindo que 1 2 3 m ,m e m têm, respectivamente, 5, 3 e 6 repetições,
verificar se os contrastes dados abaixo são ortogonais.
C1 = m1 – m2
C2 =m1 + m2 -2 m3
.
5. Considere um experimento com 4 tratamentos e as seguintes informações:
cS
2
=4,10
r r r= =1 2 3=4; r =4 3
C1 =m1 + m2 + m3 - 3 m4
C2 = m1 – 2 m2 + m3
Pede-se:
a) Forme um grupo de contrastes ortogonais, a partir dos contrastes C1 e C2, por meio
do método do sistema de equações lineares.
b. Obtenha ( )ˆV C 1
c. Obtenha ( )V C 1
6. Num experimento com 4 tratamentos e 5 repetições, são dados os seguintes
contrastes ortogonais:
C1 = m2 – m4
C2 = − 2m1 + m2 + m4
Determinar um contraste C3 que seja ortogonal a C1 e C2.
7. Com os dados abaixo, obter o contraste C3 ortogonal aos contrastes C1 e C2 .
C1 m1 - m2 r1 = r3 - 4
C2 4m1 + 5m2 - 9m4 r2 =r4 = 5
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
61
8. Dado o contraste C1 = 2m1 – m2 – m3, referente a um experimento com 3 tratamentos
(r1 = r2 = r3 = 5), obter um contraste ortogonal C2 em relação a C1.
9. Dado o contraste C1 = 2m1 – m2 – m3, referente a um experimento com 3
tratamentos (r1 = r2 = 4 e r3 = 5), obter um contraste ortogonal C2 em relação a C1
10. Dado o contraste C1 = 9m1 – 4m2 – 5m3, referente a um experimento com 3
tratamentos (r1 = r2 = 4 e r3 = 5), obter um contraste ortogonal C2 em relação a C1.
11. Dados os contrastes C1 = m2 – m4 e Y2 = – 2m1 + m2 + m4, referente a um
experimento com 4 tratamentos (r1 = r2 = r3 = r4 = 5), obter um contraste ortogonal C3 em
relação a C1 e C2.
12. Dados os contrastes C1 = m1 + m2 + m3 – 3m4 e C2 = m1 – 2m2 + m3, referente a um
experimento com 4 tratamentos (r1 = r2 = r3 = 4 e r4 = 3), obter um contraste ortogonal C3
em relação a C1 e C2.
13. Dados os contrastes C1 = m1 – 4m2 + m3 + 2m4 e C2 = m1 – m3, referente a um
experimento com 4 tratamentos (r1 = r3 = 6, r2 = 4 e r4 = 5), obter um contraste ortogonal
C3 em relação a C1 e C2.
.
14. Para verificar o efeito de três tipos de adoçantes no teor de glicose no sangue, foi
realizada uma pesquisa em que se ministrou cada um destes tipos de adoçantes a um
determinado grupo de cobaias, por certo período de tempo. Ao final deste período, o teor
médio de glicose (i
m ) no sangue foi avaliado para cada grupo, obtendo-se os seguintes
resultados:
Adoçante No de Cobaias i
m S2
1-Químico 8 115 30
2-Químico 10 90 30
3- Natural 5 75 30
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
62
A partir dos dados fornecidos acima, pede-se:
a).Desejando-se testar o teor médio de glicose do conjunto de cobaias que recebeu
adoçante químico contra o grupo que recebeu adoçante natural, qual seria o contraste
apropriado? Qual o valor da estimativa deste contraste?
b) Suponha que seja de interesse testar a seguinte comparação: C1 = m2 – m3, no
entanto, desejamos testar outros contrastes que sejam ortogonais a C1. Obtenha o (s)
outro (s) contraste (s) ortogonal (is) necessário (s) para completar o grupo de contrastes
ortogonais a C1.
15. Num experimento, 4 novos tipos de herbicida foram comparados para verificar se
são eficazes para combater ervas daninhas e assim manter a produção de milho em
níveis elevados. Um resumo do experimento é dado a seguir
Herbicida Média de produção (kg/ha)
Repetições
1 – Biológico 46 4
2 – Químico à base de nitrogênio e enxofre 31 4
3 – Químico à base de nitrogênio e fósforo 32 4
4 – Químico à base de inativadores enzimáticos 25 4
Suponha que seja de interesse testar o seguinte contraste entre as médias de
tratamentos C1 = 3m1 – m2 – m3 – m4 . Suponha ainda que todos os tratamentos
possuam uma mesma variância e que sua estimativa é igual a 35 (kg/ha)2 . Pergunta-se:
a) Qual a comparação que está sendo feita pelo contraste C1? Qual a estimativa para
este contraste?
b) Por meio da estimativa obtida para o contraste C1 pode-se AFIRMAR que exista um
grupo melhor de herbicidas do que outro? Justifique a sua resposta.
c) Qual a estimativa da variância para a estimativa do contraste C1?
d) Forme um grupo de contrastes ortogonais a partir do contraste C1. Descreva qual
comparação que está sendo feita por cada contraste que você obteve. Baseando-se nos
dados amostrais fornecidos, obtenha também a estimativa para cada um dos contrastes.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
63
16. Considere um experimento, onde foi avaliada a variável produção (kg/parcela) de
quatro tratamentos (adubações), denominados como: T1 = Sulfato de Amônio, T2 =
Sulfato de Amônio + Enxofre, T3 = Nitrocálcio e T4 = Nitrocálcio + Enxofre. Os resultados
obtidos foram:
Tratamentos Média Repetições
1 – Sulfato de Amônio 24,0 4
2 – Sulfato de Amônio + Enxofre 28,0 5
3 – Nitrocálcio 27,0 4
4 – Nitrocálcio + Enxofre 25,0 5
cS =
2
0,75 a) Estabelecer as seguintes comparações de interesse (as comparações solicitadas, não
são necessariamente ortogonais):
i) Sulfato de Amônio versus Nitrocálcio na ausência de Enxofre
ii) Sulfato de Amônio versus Sulfato de Amônio + Enxofre
iii) Nitrocálcio versus Nitrocálcio + Enxofre
b) Sendo dados, com base em outros critérios, os seguintes contrastes:
C1 = m1 – m2
C2 = 4m1 + 5m2 + 4m3 – 13m4
Pede-se:
i) Obter a estimativa do contraste C2.
ii) Obter a estimativa da variância da estimativa do contraste C2.
iii) Obter a variância do contraste C.
iv) Os contrastes C1 e C2 são ortogonais? Justifique a sua resposta.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
64
3.4 Teste F para a análise de variância
O teste F é a razão entre duas variâncias e é usado para determinar se duas estimativas
independentes da variância pode ser assumida como estimativas da mesma variância.
Na análise de variância, o teste F é usado para testar a igualdade de médias, isto é, para
responder a seguinte questão, é razoável supor que as médias dos tratamentos são
amostras provenientes de populações com médias iguais? Considere o seguinte exemplo
de cálculo da estatística F; vamos supor que de uma população normal N (µ, σ2) foram
retiradas, aleatoriamente, 5 (n=5) amostras de tamanho 9 (r=9).
Calcule as médias das 5 amostras e (((( ))))(((( ))))
−−−−====
−−−−
2222y yy yy yy y11112222SSSS iiii 9 19 19 19 1
Estime σ2 por meio da fórmula: 5
25
S22
S21
S2S
+++
=...
, a qual é uma média das
variâncias das amostras e será denominada de variabilidade dentro das amostras
2
DS .
Estime a variância populacional das médias 2y
σ , por meio das médias das 5 amostras:
15
5
1i
2y2
iy
2y
S−
∑=
++−+=
De 2y
S estime novamente , usando a relação 2y
S ou S2 = 2y
rs , denominada de
variabilidade entre as amostras
2
ES .
Calcule 2D
S
2E
S
cF =
A estimativa de 2E
S do numerador foi feita com base em n - 1 = 4 graus de liberdade ( n é
o número de amostras) e a estimativa de 2D
S do denominador foi feita com base em n(r –
1) = 5(9 -1) = 40. A repetição deste procedimento amostral muitas vezes gera uma
população de valores de F, os quais quando colocados em um gráfico de distribuição de
freqüência tem o seguinte formato
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
65
O valor de F = 2,61 é o valor acima do qual, 5% dos valores de F calculados têm valor
acima dele. Este é o valor para um nível de 5% encontrado na Tabela F para 4 e 40
graus de liberdade (veja Tabela F).
Dado que as estimativas da variância utilizadas estatística F são estimativas da mesma
variância σ2, espera-se que o valor de F seja bem próximo de 1,a menos que um conjunto
de amostras não usual foi retirado.
Para qualquer conjunto de amostras retiradas de n = 5 e r = 9 a probabilidade (ou a
chance) de um valor de F calculado ser maior ou igual a 2,61 é 0,05 (5%) (P[F >2,61]
= 0,05 ).
As hipóteses estatísticas que testamos quando aplicamos o teste F são
22
211H
22
210H
σσ:
σσ:
>
=
A Hipótese H0 estabelece que as duas variâncias populacionais são iguais, o que
equivale a admitir que as amostras foram retiradas da mesma população. A hipótese H1
(contra hipótese, ou hipótese alternativa) estabelece que as variâncias são provenientes
de populações diferentes e, mais ainda, a variância da primeira é maior que a variância
da segunda. Os valores de F são tabelados em função dos graus de liberdade das
estimativas de s2 do numerador (n1) e do denominador (n2) no cálculo da estatística F e
para diferentes valores de níveis de significância (5%, 1%,etc.).
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
66
3.4.1. Regra de decisão
Todos os possíveis valores que o teste estatístico pode assumir são pontos no eixo
horizontal do gráfico da distribuição do teste estatístico e é dividido em duas regiões; uma
região constitui o que denominamos de região de rejeição e a outra região constitui o que
denominamos de região de aceitação. Os valores do teste estatístico que formam a
região de rejeição são aqueles valores menos prováveis de ocorrer se a hipótese nula é
verdadeira, enquanto que os valores da região de aceitação são os mais prováveis de
ocorrer se a hipótese nula é verdadeira. A regra de decisão nos diz para rejeitar H0 se o
valor do teste estatístico calculado da amostra é um dos valores que está na região de
rejeição e para não rejeitar H0 se o valor calculado do teste estatístico é um dos valores
que está na região de aceitação. O procedimento usual de teste de hipóteses é baseado
na adoção de um critério ou regra de decisão, de tal modo que α = P(Erro tipo I) não
exceda um valor pré-fixado. Porem, na maioria das vezes, a escolha de α é arbitrária. Um
procedimento alternativo consiste em calcular o “menor nível de significância para o qual
a hipótese H0 é rejeitada, baseado nos resultados amostrais”. Este valor, denominado de
nível descritivo do teste ou nível mínimo de significância do teste, será denotado por valor
de p (ou “p-value”). Todos os programas computacionais modernos calculam este valor.
A representação gráfica a seguir mostra uma ilustração da regra de decisão do teste F,
visto anteriormente.
Região de aceitação Região de rejeição
EXEMPLO: Amostras aleatórias simples e independentes, após dois tipos de esforços, do
nível de glicose no plasma de ratos após uma experiência traumática forneceram os
seguintes resultados:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
67
Esforço 1: 54 99 105 46 70 87 55 58 139 91
Esforço 2: 93 91 93 150 80 104 128 83 88 95 94 97
Estes dados fornecem suficiente evidência para indicar que a variância é maior na
população de ratos submetidos ao esforço 1 do que nos ratos submetidos ao esforço 2.
Quais as suposições necessárias para se aplicar o teste?
Solução:
●As variâncias amostrais são =21
S 852,9333 e =22
S 398, 2424 respectivamente.
●Suposições: Os dados constituem amostras aleatórias independentes retiradas, cada
uma, de uma população com distribuição normal. (Esta é a suposição geral que deve ser
encontrada para que o teste seja válido).
●Hipóteses estatísticas
22
211H
22
210H
σσ:
σσ:
>
=
●Cálculo do Teste Estatístico
1417222
S
21
S
cF , 2424 398,
852,9333===
●Distribuição do Teste Estatístico: quando H0 é verdadeira a estatística F tem distribuição
F com n1 – 1 e n2 – 1 graus de liberdade.
●Regra de Decisão: fazendo α = 5%, o valor crítico de F(9,11,0,05) = 2,896, então, rejeita-se
H0 se FC ≥ 2,896, . A ilustração gráfica desta regra de decisão é mostrada a seguir,
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
68
Região de aceitação Região de rejeição
2,896
●Decisão estatística: não podemos rejeitar H0, dado que 2,1417<2,896; isto é, o FC
calculado caiu na região de aceitação.
● Conclusão: não podemos concluir que as variâncias dos esforços 1 e 2 são diferentes,
o nível mínimo de significância do teste é p=0,116 .
3.5 Análise de variância (ANAVA)
Embora o teste F possa ser aplicado independentemente, a sua maior aplicação é na
análise de variância dos Delineamentos Experimentais.
Vamos considerar os seguintes dados de Delineamento Inteiramente Casualizado, (DIC).
TRATAMENTOS REPETIÇÕES
1 2 3 4
A B C D
12,4 15,2 14,3 12,6 13,2 16,2 14,8 12,9 12,1 11,3 10,8 11,4 10,9 9,8 9,4 8,3
ES
Dentro de um mesmo tratamento o valor observado nas diferentes repetições não é o
mesmo, pois estes valores estão sujeitos à variação ao acaso
2
eσ . Quando passamos
de um tratamento para outro, os dados também não são iguais, pois estes estão sujeitos
a uma variação do acaso acrescida de uma variação devida ao efeito do tratamento, i.é,
2t
2e σσ +
2,1417
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
69
3.5.1 Quadro da análise de variância do DIC
Considere os dados do exemplo anterior, onde tínhamos 4 tratamentos (k=4) e 4
repetições. A Tabela da Análise de variância fica sendo
Fonte de variação G.L. Soma de Quad. Quadrado Médio teste F
Tratamentos k – 1 ( )2 2t y y1
r k ri 1 .+++ −∑
=
1r
SQTrat
−
sidQM
QMTrat
Re
Resíduo k.r – k ∑=
∑=
∑=
+−t
1i
r
1j
t
1i r
2iy2
ijy
)( SQ s
k r 1
Re
. −
Total k.r – 1 ∑=
∑=
∑=
++−t
1i
r
1j
t
1i kr
2y2ij
y)(
Deste quadro notamos que o Quadrado médio do resíduo estima a variação casual (do
resíduo) 2eσ . Enquanto que o quadrado médio dos tratamentos estima a variação casual
(resíduo) acrescida de uma possível variância devido ao efeito dos tratamentos
+ 2
T2e σσ então
2e
2T
2e
F
σ
σσ +=
Se não houver efeito dos tratamentos os dois quadrados médios (Quadrado médio dos
tratamentos e quadrado médio do resíduo) estimam a mesma variância, o que implica o
valor de F 1,0, e qualquer diferença que ocorra entre os valores médios dos tratamentos
é meramente casual.
3.6. Teste t de Student. Considere uma outra retirada de amostras repetidas de um
determinado tamanho, por exemplo, r=5 de uma população normal.
Para cada amostra calcule a média y o desvio padrão, s , o erro padrão da média y s e
uma outra estatística
yS
yct
µ−=
Graficamente temos
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
70
amostra1 ( )
1ys
1y1t
5
21s
1ys
15
2y1y21
Sµ
;;−
==−
−=
amostra 2 ............................................................
amostra M ( )
1ys
1yMt
5
21s
Mys
15
2y1y2M
Sµ
;;−
==−
−=
Organizando estes milhares de valores da estatística t em distribuição de freqüência.
Esta distribuição de freqüência terá a seguinte forma
Existe uma única distribuição t para cada tamanho de amostra. Neste exemplo em que
r=5 (tamanho 5), 2,5 % dos valores de t serão maiores ou iguais do que 2,776 e 2,5%
serão menores do que -2,776. Os valores da estatística t – student são apresentados em
tabelas (ver Tabela da distribuição t ). Por exemplo, para 10 graus de liberdade, o valor
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
71
tabelado esperado para t com probabilidade de 0,01 (1%) é 3,169. A distribuição t –
student converge rapidamente para a distribuição normal. Quanto maior
for a amostra maior é aproximação da distribuição t – student com a distribuição normal.
Quando os valores de t são calculados em amostras de tamanho r=60, estes são bem
próximos dos valores da distribuição normal.
3.6.1. Regra de decisão
Todos os possíveis valores que o teste estatístico pode assumir são pontos no eixo
horizontal do gráfico da distribuição do teste estatístico e é dividido em duas regiões; uma
região constitui o que denominamos de região de rejeição e a outra região constitui o que
denominamos de região de aceitação. Os valores do teste estatístico que formam a
região de rejeição são aqueles valores menos prováveis de ocorrer se a hipótese nula é
verdadeira, enquanto que os valores da região de aceitação são os mais prováveis de
ocorrer se a hipótese nula é verdadeira. A regra de decisão nos diz para rejeitar H0 se o
valor do teste estatístico calculado da amostra é um dos valores que está na região de
rejeição e para não rejeitar H0 se o valor calculado do teste estatístico é um dos valores
que está na região de Testes de Significância
aceitação. Em particular, no caso do teste t – student a regra de decisão fica sendo:
rejeita-se H0 se t tcn 1
2
α,
≥ −
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
72
Exemplo: Em um hospital veterinário amostras de soro de amilase de 15 animais sadios e
22 animais hospitalizados foram colhidos. Os resultados da média e dos desvios-padrões
foram as seguintes:
y1 =120 unidades/ml, s1= 40 unidades/ml
y2 =96 unidades/ml, s1= 35 unidades/ml
Neste exemplo, o erro padrão amostral y s da fórmula da estatística t, será substituído
pelo erro padrão da média “pooled”, ou seja,
( ) ( )
2 2r 1 S r 1 S1 22 1 2Sp
r 1 r 11 2
( ) ( )− + −=
− −
Cálculos:
Suposições: os dados constituem duas amostras independentes, cada uma, retirada de
uma população normal. As variâncias populacionais são desconhecidas e assumidas
iguais;
Hipóteses: H0: µ1 = µ2
H1: µ1 ≠ µ2
Teste estatístico: tc = ( ) ( )y y1 2 1 2
2 2S Sp p
r r1 2
µ µ− − −
+
Distribuição do teste estatístico: quando H0 for verdadeira, o teste segue uma distribuição
t – Student com r1 + r2 – 2 graus de liberdade;
Regra de decisão: Rejeita-se H0 se t tcr r 21 2
2
α,
≥ + −
,, neste exemplo, t 2 03c ,≥ ;
Cálculo do teste estatístico: primeiro o cálculo da variância amostral
2 214 40 21 352S 1450p
14 21
120 96 0 24t 1 88c
12 751450 1450
15 22
( ) ( ),
( ),
,
+= =
+− −
= = =
+
Decisão estatística: não se rejeita H0, visto que 2,030 1,88 2,030 ; ou seja, 1,88 caiu
na região de aceitação;
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
73
Conclusão: com base nestes dados não podemos concluir que as médias das duas
populações são diferentes. Neste teste o nível mínimo de significância do teste está entre
0,05 e 0,10(0,05<p<0,10).
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
74
C A P Í T U L O 4
DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)
4.1 Introdução
O DIC é mais simples dos delineamentos. No Delineamento Inteiramente Casualizado
(DIC) a distribuição dos tratamentos às unidades experimentais é feita inteiramente ao
acaso. Os outros delineamentos experimentais, por exemplo: blocos casualizados e
quadrado latino, se originam do DIC pelo uso de restrição na casualização. O DIC utiliza
apenas os princípios básicos da repetição e da casualização.
Como não faz restrições na casualização, o uso do DIC pressupõe que as unidades
experimentais estão sob condições homogêneas. Estas condições homogêneas
geralmente são obtidas em locais com ambientes controlados tais como laboratórios,
estufas e casas de vegetação..
Vamos começar com um exemplo:
• Em um estudo do efeito da glicose na liberação de insulina, 12 espécies de tecido
pancreático idênticas foram subdivididas em três grupos de 4 espécies cada uma. Três
níveis (baixo - tratamento 1, médio tratamento - 2 e alto tratamento - 3) de concentração
de glicose foram aleatoriamente designados aos três grupos, e cada espécie dentro de cada
grupo foi tratado com o nível de concentração de glicose sorteado a eles. A quantidade de insulina
liberada pelos tecidos pancreáticos amostrados são as seguintes:
Tratamento Repetições 1 2 3 4
Nº de repetições
Total
Média
Variância
Nível baixo (T1) Nível médio (T2) Nível alto (T3)
1,59 1,73 3,64 1,97 3,36 4,01 3,49 2,89 3,92 4,82 3,87 5,39
4 4 4
8,93 13,75 18,00
2,23 3,44 4,50
0,91 0,21 0,54
Total 12 40,68
Este é um estudo experimental com 12 unidades experimentais (amostras de tecido
pancreático) e k=3 tratamentos. Cada tratamento é um nível de fator simples:
concentração de glicose. Existem 4 repetições para cada tratamento. Os dados,
quantidade de insulina liberada pelo tecido pancreático podem ser considerados como
três amostras aleatórias, cada uma com r=4 repetições, ou de tamanho r=4 sorteadas de
três populações.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
75
Dado que os tratamentos são designados às unidades experimentais completamente ao
acaso, este delineamento é denominado de DELINEAMENTO INTEIRAMENTE AO
ACASO (DIC). Em geral em um
DIC, um número fixo de k tratamentos são sorteados às N unidades experimentais de tal
forma que o i-ésimo tratamento é sorteado a exatamente ri unidades experimentais.
Assim, ri é o número de repetições
do i-ésimo tratamento e r1+r2+r3+...+rk. No caso em que ri são iguais, i.é., r1=r2=r3=...=rk,
então N = rk e o delineamento é balanceado.
Notação:
Repetições Tratamento
1 2 3 ... j ... r Total Média
1 2 3 . . . . I . . . k
y11 y21 y31
y12 y22 y32
y13 y23 y33
...
...
... . . . . . . .
...
...
... . . . yij. . .
.
y1r y2r y3r .
.
.
.
.
.
ykr
y1+ y2+ y3+ .
.
.
.
.
.
.
y1+
y2+
y3+
.
.
.
.
. yk+
N=rk Y++ y++
Convenções: yi+ e yi+ representam, respectivamente, o total e a média do iésimo tratamento,
respectivamente, Y++ e y++ representam, respectivamente, o total geral (soma de todas as observações) e
a média geral de todas as observações.
4.2 Análise de variância (ANAVA)
O método da análise de variância pode ser visto como uma extensão do teste t de
student para amostras independentes. Como no teste t de amostras independentes, o
método da ANAVA compara uma medida da magnitude variabilidade observada dentro
das k amostras com uma medida da variabilidade entre as médias das k amostras.
4.3 Modelo matemático do DIC com efeitos de tratamentos fixos
O modelo associado ao DIC com efeitos fixos é
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
76
i
jiiji
rj
tiEty
,...,2,1
,...,2,1,)(
=
=++=µ
onde:
yij = valor da parcela que recebeu o tratamento i na repetição j;
µµµµ = média geral;
ti = efeito do tratamento i;
E(i)j = erro da parcela que recebeu o tratamento i na repetição j.
Pela definição de µ e ti acima, temos que este modelo possui a restrição
1
0i
k
i ii
n t
=
=∑ ,pois, ( )1 1 1
0i
k k k
i i i i i ii i i
r t r r rµ µ µ µ
= = =
= = − = − =∑ ∑ ∑
4.4 Suposição associada ao modelo
As suposições usualmente associadas aos componentes do modelo do DIC são que os
eij são variáveis aleatórias independentes e identicamente distribuídas com distribuição N
(0 ,σσσσ2 ) . Como os yij são funções lineares dos eij , das suposições sobre os erros
decorre que:
i E( yij )= µtiµ;
Var (yij) = σσσσ2;
yij são normalmente distribuídos e independentes, ou, resumidamente que yij ~ N (µi ,σσσσ2 )
Portanto, estamos supondo que as observações do experimento a ser analisado
correspondem a amostras aleatórias de k populações normais com a mesma variância e
que podem ou não ter médias diferentes.
4.5 Hipóteses estatísticas
A Hipótese geral é:
H0=t1 = t2 = ...= tk ,
ou seja, vamos testar a não existência de efeito do fator (tratamento).
4.6 Partição da soma de quadrados
Voltemos ao quadro de representação das observações no DIC
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
77
Repetições Tratamento
1 2 3 ... j ... r Total Média
1 2 3 . . . . I . . . k
y11 y21 y31
y12 y22 y32
y13 y23 y33
...
...
... . . . . . . .
...
...
... . . . yij. . .
.
y1r y2r y3r .
.
.
.
.
.
ykr
y1+ y2+ y3+ .
.
.
.
.
.
.
y1+
y2+
y3+
.
.
.
.
. yk+
N=rk Y++ y++
Podemos identificar os seguintes desvios:
• yij − y++ , como o desvio de uma observação em relação a média amostral geral;
• yij − yi+ ,como o desvio da observação em relação à média de seu grupo ou do i-ésimo
tratamento;
• y yi −+ ++ , como o desvio da média do i-ésimo tratamento em relação á média geral.
Consideremos a identidade
(yij − y++ ) = (yij − yi+ ) = ( y yi −+ ++ )
a qual diz que a “ a variação de uma observações em relação à média geral amostral é
igual à soma variação desta observação em relação à média de seu grupo com a
variação da média do i-ésimo tratamento em que se encontra esta observação em
relação à média geral amostral “.
Elevando-se ao quadrado os dois membros da identidade acima e somando em relação
aos índices i e j, obtemos:
( ) ( ) ( )1 1
22
1 1 1 1 1
r rk k k
i j i j i i ii j i j i
y y y y r y y++ + + ++
= = = = =
− = + +∑∑ ∑∑ ∑
os duplos produtos são nulos.
O termo
( )1
1 1
0rk
i ji j
y y++
= =
− =∑∑
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
78
é denominado de Soma de Quadrados Total e vamos denotá-lo por SQT.O número de
graus de liberdade associado à SQT é kr - 1, ou N – 1, pois temos N observações e a
restrição
( )+=
−∑2
1
ir
i j ij
y y,
Possui ri – 1 graus de liberdade. Assim, o número de graus de liberdade associado à
SQR é:
( )1
1j k
ii
r k r k N k
=
− = − = −∑
A componente ( )21
k
i i
i
r y y+ ++=
−∑ , mede a variabilidade entre as médias dos tratamentos
e por isso é denominada de Soma de Quadrados Entre Tratamentos, representada por
SQTr. Quanto mais diferentes entre si forem as médias dos tratamentos, maior será a
SQTr. Desde que temos k tratamentos e a restrição de que
( )1
0k
i ii
r y y+ ++
=
− =∑
A SQTr possui k - 1 graus de liberdade. Com esta notação, podemos escrever que:
SQT = SQR + SQTr.
4.7 Quadrados médios
Dividindo a SQR e SQTr pelos correspondentes graus de liberdade, obtemos,
respectivamente o Quadrado Médio Residual (QMR) e o Quadrado Médio Entre
Tratamentos (QMTr), isto é, S Q RQ M RN k=−
e 1S Q T rQ M T rk=−
4.8 Estatística e região crítica do teste
A estatística para o teste é
=C
Q M T rFQ M R
a qual, deve ser próximo de 1 se H0 for verdadeira, enquanto que valores grandes dessa
estatística são uma indicação de que H0 é falsa. A teoria nos assegura que Fc tem sob
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
79
H0 distribuição F – Snedecor com (k -1) e (N – k) graus de liberdade. Resumidamente,
indicamos:
FC~F(K-1,N-K), sob H0
Rejeitamos H0 para o nível de significância α se
FC>F(K-1,N-K,α),
sendo, F(K-1,N-K)o quantil de ordem (1 −α ) da distribuição F-Snedecor com (k -1) e (N – k)
graus de liberdade. Graficamente temos:
4.9 Quadro da análise de variância (ANAVA)
Dispomos as expressões necessárias ao teste na Tabela abaixo denominada de Quadro
de Análise de Variância (ANAVA).
Fonte de Variação g. l. S. Q. Q. M. Fc Entre Tratamentos
(I - 1)
( )+++
=
−∑iiiirrrr
iiii
iiii iiii
YYYYYYYYJ NJ NJ NJ N
22
1 =−
S Q T rS Q T rS Q T rS Q T rQ M T rQ M T rQ M T rQ M T rIIII 1
Q M T rQ M T rQ M T rQ M T rQ M RQ M RQ M RQ M R
Resíduo (dentro dos tratamentos)
I(J-1) (((( ))))++++
= = == = == = == = =
−−−−∑∑ ∑∑∑ ∑∑∑ ∑∑∑ ∑k r kk r kk r kk r k
iiiii ji ji ji j
i j ii j ii j ii j i
YYYYYYYY
JJJJ
2
2
1 1 1 =−
S Q RS Q RS Q RS Q RQ M RQ M RQ M RQ M R
(
I J
)(
I J
)(
I J
)(
I J
)
1
Total
(J – 1)
( )++
= = =
−∑∑ ∑k r kk r kk r kk r k
i ji ji ji ji j ii j ii j ii j i
YYYYYYYY
nnnn
2
2
1 1 1
Pode-se provar que:
• E(QMR) =σ2 , ou seja, QMR é um estimador não viesado da variância σ2 ;
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
80
• E( QMTr) = =
=− ∑
2
1(
1
)
k
ii
r tkσ , ou seja, QMTr é um estimador não viesado da
variância 2 s se a hipótese H0 t1 =t2 =... =tk= é verdadeira.
4.10 Detalhe computacional
Apresentaremos alguns passos que facilitam os cálculos das somas de quadrados da
ANAVA.
• Calcule a correção para a média ( )++=
2YC M
N
• Calcule a Soma de Quadrados dos Totais (SQT)
= =
= −∑∑2
1 1
irk
i ji j
S Q T Y C M
• Calcule a Soma de Quadrados Entre os Tratamentos (SQTr)
+= −
2i
i
YS Q T r C Mr
• Calcule a Soma de Quadrados Residual (SQR) pela diferença, isto é,SQR = SQT −
SQTr ;
• Calcule os Quadrados Médios Entre os Tratamentos (QMTr) e o Quadrado Médio
Residual (QMR)
=−
1S Q T rQ M T rk e =
−
S Q RQ M RN k
• Calcule Fc para tratamentos =C
Q M T rFQ M R
Notem que estas fórmulas computacionais assumem que existe ri repetições para o i-
ésimo tratamento; consequentemente, para umexperimento balanceado com r repetições
para cada tratamento, ri deve ser
substituído por r. Estas várias soma de quadrados obtidas nestes cinco passos podem
ser resumidas no quadro da ANOVA apresentado no item 8.
Exemplo 1
Vamos considerar os dados apresentados no item 1. Desejamos testar a hipótese nula
H0: µ1 = µ2 = µ3
H1: µi ≠ µj para pelo menos um par i ≠ j
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
81
Os cálculos para montar-mos o quadro da ANOVA são: temos k = 3, r = 4, e N = 3x4 =12.
Então
• Graus de liberdade:
Total = N – 1 = 12 – 1 = 11; Trat. = k – 1 =3 -1 = 2; Res. = N – k = 12 – 3 = 9
•( )
24 0 , 6 81 3 7 , 9 1
1 2C M
= =
• ( ) ( ) ( )2 2 21 , 5 9 1 , 7 3 . . . 5 , 3 9 1 5 3 , 1 8 1 3 7 , 1 8 1 5 , 2 8S Q T C M
= + + + − = − =
•( ) ( ) ( )
= + + − = − =
2 2 28 , 9 3 1 3 , 7 5 1 8 , 0 01 4 8 , 2 0 1 3 7 , 9 1 1 0 , 3 0
4 4 4S Q T r C M
•SQR = SQT − SQTr = 15,28 − 10,30 = 4,98
• = =
1 0 , 3 0 5 , 1 52
Q M T r
• = =
4 , 9 8 0 , 5 59
Q M R
• = =
5 , 1 5 9 , 3 60 , 5 5C
F
O quadro da ANAVA para a variável insulina liberada é o seguinte:
Fonte de Variação g. l. S. Q. Q. M. Fc Entre Tratamentos
2
10.30 5,15 9,36
Resíduo (dentro dos tratamentos)
9
4,98 0,55
Total
11
15,28
Das tabelas das distribuições F, temos queF(2,9;0.05)= 4,257 e F(2,9;0,01)= 8,022. O valor Fc=9,31 é
maior do que estes valores tabelados, então rejeitamos a hipótese nula H0 a um nível a = 0,01, ou
1% de probabilidade (se é significativo a 1%, logo também é significativo a 5%).
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
82
Podemos concluir que, para um nível de α= 0,01, ou 1%, que a quantidade de insulina
liberada é diferente para pelo menos dois níveis de glicose.
: Em um experimento em que se mediu o peso corporal (kg), 19 porcos foram distribuídos
aleatoriamente a 4 grupos. Cada grupo foi alimentado com dietas diferentes. Deseja-se
testar se oos pesos dos porcos são os mesmos para as 4 dietas.
Desejamos testar a hipótese nula
H0: µ1 = µ2 = µ3
H1: µi ≠ µj para pelo menos um par i ≠ j
As observações obtidas são
Tratamento Repetições
1 2 3 4 5
Nº de repetições
Total
Dieta 1 60,8 57,7 65,0 58,6 61,7 5 303,1
Dieta 2 68,7 67,7 74,0 66,3 69,8 5 346,5
Dieta 3 102,6 102,1 100,2 96,5 * 4 401,4
Dieta 4 87,9 84,2 83,1 85,7 90,3 5 431,2
Total 1482,2
Temos um experimento desbalanceado com número de repetições desigual para os
tratamentos. Então, os cálculos para montar-mos o quadro da ANAVA são:
• Graus de liberdade:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
83
Total = N – 1 = 19 – 1 = 18; Trat. = k – 1 =4 -1 = 3; Res. = N – k = 19 – 4 = 15
•( )
= =
21 4 8 2 , 21 1 5 . 6 2 7 , 2 0 2
1 9C M
• ( ) ( ) ( )= + + + −
= − =
2 2 26 0 , 8 5 7 , 7 . . . 9 0 , 31 1 9 . 9 8 1 , 9 0 0 1 1 5 . 6 2 7 , 2 0 2 4 . 3 5 4 , 6 9 8
S Q T C MS Q T
•( ) ( ) ( ) ( )
= + + + −
=
2 2 2 23 0 3 , 1 0 3 4 6 , 5 0 4 0 1 , 4 0 4 3 1 , 25 5 4 5
1 1 9 . 8 5 3 , 9 0 0 - 1 1 5 . 6 2 7 , 2 0 2 = 4 . 2 2 6 , 3 4 8
S Q T r C M
S Q T r
•SQR = SQT − SQTr = 4354,698 - 4226,202 =128,350
• = =
4 . 2 2 6 , 3 4 8 1 . 4 0 8 , 7 8 33
Q M T r
• = =
1 2 8 , 3 5 0 8 , 5 5 71 5
Q M R
• = =
1 . 4 0 8 , 7 8 3 1 6 58 , 5 5 7C
F
O quadro da ANAVA para a variável insulina liberada é o seguinte:
Fonte de Variação g. l. S. Q. Q. M. Fc Entre Tratamentos
3
4.226,348 1.408,783 165
Resíduo (dentro dos tratamentos)
15
8,557 8,557
Total
18
4.354,698
Das tabelas das distribuições F, temos queF(3,15;0.05)= 3,287 e F(3,15;0,01)= 5,417 é maior que estes
valores, então, rejeitamos a hipótese nula H0 a um nível α = 0,01, ou 1% de probabilidade (se é
significativo a 1%, logo também é significativo a 5%).
Graficamente a regra de decisão fica
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
84
Podemos concluir que, para um nível de α = 0,01, ou 1%, que os pesos dos porcos são
diferentes para pelo menos duas dietas.
4.11 Estimadoresde mínimos quadrados
Nesta seção mostraremos os estimadores do modelo do DIC jiiji Ety )(++=µ . Estes
estimadores são obtidos minimizando-se a expressão do erro deste modelo
( )= =
−∑∑⌢
2
1 1
irk
i j i ji j
y y
Em relação a µ e ti , i=1, 2, ...k, sujeito a restrição =
=∑1
0k
i ii
r t. Assim procedendo,
obtemos os estimador de ++=
=∑ ⌢
1
k
i
yµ e + ++= −
⌢
i it y y
e oestimador de
+= − = =⌢
⌢ ⌢1 , 2 , . . . ,
i i it y i k
µ µ . Para construir um intervalo de confiança para a média
de cada tratamento, devemos notar que:
( )+
−
−,
~i in k
i
y tQ M R
r
µ
i.é. tem distribuição t – Student com (n – k) graus de liberdade. Um intervalo de confiança
para i
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
85
µ com um coeficiente de confiança (1 −a ) é dado por
( ) + −
− = ± ;2
; 1 ,i i N k
Q M RI C y tr
αµ α
sendo,
−
;2
N k
tα
o quantil de ordem
−
12α da distribuição t – Student com (n – k) graus
de liberdade, os mesmos graus de liberdade do resíduo da ANAVA.
Como primeiro exemplo, vamos considerar os dados do experimento apresentado no
item 11. As médias destes dados são:
•
+ +
+ +
++
= = = =
= = = =
1 2
3 4
3 0 3 , 1 0 3 4 6 , 5 06 0 , 6 2 ; 6 9 , 3 0 ;5 5
4 0 1 , 4 0 4 3 1 , 2 01 0 0 , 3 5 ; 8 6 , 2 44 5
e a m d i a g e r a l 7 9 , 1 3
y y
y y
é é y
• do quadro da ANOVA temos o valor de QMR para calcular desvio padrão médio para os
tratamentos 1, 2 e 4 é
= =
= =
8 , 5 5 7 1 , 3 1 ; P a r a o t e r c e i r o t r a t a m e n t o o e r r o p a d r ã o5
8 , 5 5 7m é d i o é 1 , 4 64
i
i
Q M Rr
Q M Rr
• o valor de t(0,025;15) =2,1314 •
Assim, os intervalos são:
( ) + += ± = ±
8 , 5 5 7; 9 5 % 2 , 1 3 1 4 1 , 3 15i i i
I C y yµ para i = 1,2,3 e 4
( ) + += ± = ±
8 , 5 5 7; 9 5 % 2 , 1 3 1 4 1 , 4 64i i i
I C y yµ para i =3
Dieta 1 Dieta 2 Dieta 3 Dieta 4
µi 60,62 69,30 100,35 86,24
IC (µi ,95%) (59,31; 61,93) (67,99; 70,61) (98,89 101,81) (84,93; 87,55)
Problema: identificar quais as Dietas (tratamentos) que tiveram efeitos não nulos sobre o peso dos
suínos.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
86
Como segundo exemplo, vamos considerar os dados do experimento apresentado no
item 1, cujos cálculos foram mostrados no item 10. As médias destes dados são:
• + + +
++
= = = = = =1 2 3
8 , 9 3 1 3 , 7 5 1 8 , 0 02 , 2 3 ; 3 , 4 4 ; 4 , 54 4 4
e 3 , 3 9
y y y
y
• do quadro da ANOVA temos o valor de QMR para calcular
= =
0 , 5 5 3 0 , 3 7 2 ;4
Q M Rr
•o valor de t(0,025;9)= 2,262 .
Assim, os intervalos são:
( ) + += ± = ±
0 , 5 5 3; 9 5 % 2 , 2 6 2 0 , 8 4 14i i i
I C y yµ
Nível baixo de glicose Nível baixo de glicose Nível baixo de glicose
µi 2,23 3,44 4,50
IC (µi ,95%) (1,389; 3,071) (2,599; 4,281) (3,659; 5,341)
Problema: identificar quais os níveis de glicose (tratamentos) que tiveram efeitos não
nulos sobre a liberação de insulina dos tecidos.
4.12 Coeficiente de determinação (R2) e de variação (CV).
A parte da Soma de Quadrados Total (SQT), a variação total nas observações , que pode
ser explicada pelo modelo matemático do DIC, é denominada de coeficiente de
determinação. Assim, o coeficiente de
determinação para modelo do DIC, yij = µ +ti + eij , é definido como
=2
S Q T rRS Q T
Pode ser verificado que 0 ≤ R2 ≤ 1 e que R2 = 1 quando toda variabilidade nas
observações esta sendo explicada pelo modelo matemático do DIC.
A variabilidade entre as unidades experimentais de experimentos envolvendo diferentes
unidades de medidas e/ou tamanhos de parcelas pode ser comparada pelos coeficientes
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
87
de variação, os quais expressam o desvio padrão por unidade experimental como uma
porcentagem da média geral do experimento, ou seja,
++
=* 1 0 0SC V
Y
mas, da ANOVA sabemos que S = Q M R
, daí resulta que
++
=* 1 0 0Q M RC V
Y
Como exemplo vamos considerar os dados do experimento apresentado no item 1, cujos
cálculos foram mostrados no item 10. Neste exemplo temos:
• SQT = 15,28 e SQTr = 10,30 então = = =2
1 0 , 3 0 0 , 6 7 41 5 , 2 8
S Q T rRS Q T
• ++
= = =
0 , 5 5* 1 0 0 * 1 0 0 2 1 , 8 83 , 3 9
Q M RC VY
Concluímos que 67,4% da variabilidade que existe nas observações deste experimento
são explicadas pelo modelo matemático do DIC e que este experimento apresenta um
coeficiente de variação de aproximadamente 22%.
4.13 Checando as violaçãoes das suposições da ANAVA.
Falando de um modo geral, o teste F da ANAVA não é muito sensível às violações da
suposição de distribuição normal. Ele também é moderadamente insensível às violações
de variâncias iguais, se os tamanhos das amostras são iguais e não muito pequenas em
cada tratamento. Entretanto, variâncias desiguais podem ter um efeito marcante no nível
do teste, especialmente se amostras pequenas estão associadas com tratamentos que
têm as maiores variâncias. Existe uma série de procedimentos para se testar se as
suposições da ANOVA são violados.
Entre estes temos o teste de Anderson-Darling, teste de Shapiro-Wilks e teste de
Kolmogorov-Smirnov, que testam a normalidade da população. A igualdade das
variâncias (homocedasticidade) pode ser testada pelos testes de Bartlett e de Levene.
Com o advento dos modernos computadores, métodos gráficos são ferramentas muito
populares para checar as violações das hipóteses da ANAVA. Alguns destes métodos
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
88
gráficos mais comumente usados para checar as suposições da ANAVA são baseados
em gráficos denominados gráficos dos resíduos.
Resíduos. O resíduo correspondente a uma observação yij é definido como:
+= − = − − = −⌢ ⌢i j i j i j i j i i j i
e y y y t y yµ
ou seja, o resíduo corresponde á parte da observação que não foi explicada pelo modelo.
Calculando os resíduos correspondentes a todas as observações de um experimento e
analisando-os descritivamente de forma apropriada, podemos saber se as suposições da
ANOVA estão sendo satisfeitas.
4.14. Experimentos Inteiramente Casualizados com parcela perdida
É comum nos ensaios de campo, laboratório, casa de vegetação, viveiros, galpões ou
outros locais experimentais, quer na área vegetal ou animal, ocorrer a perda de parcela
ocasionada pela morte de planta ou de animais, ou ainda, por causas acidentais. No
experimento em DIC, estas perdas não causam nenhum problema mais sério e a análise
de variância pode ser desenvolvida sem grandes complicações.
A partição da variação é feita seguindo o mesmo processo visto nas estruturas
balanceadas.
Temos:
( ) ( ) ( ). . . . . .y y y y y y
Variação Total Variação Entre Variação Dentro
i jj
r
i
t
ij
r
i
t
i j ij
r
i
ti i i
−−−− ==== −−−− ++++ −−−−======== ======== ========∑∑∑∑∑∑∑∑ ∑∑∑∑∑∑∑∑ ∑∑∑∑∑∑∑∑2
11
2
11
2
11
Variação Total = SQTO = ( ). .
. .y y y
y
ni j
j
r
i
t
i jj
r
i
ti i
−−−− ==== −−−−======== ========∑∑∑∑∑∑∑∑ ∑∑∑∑∑∑∑∑2
11
2
2
11
= y Ci jj
r
i
t i2
11
−−−−========∑∑∑∑∑∑∑∑ , onde C
y
nn ri
i
t
==== ========∑∑∑∑
. .,
2
1
SQTotal = y Ci jj
r
i
t i2
11
−−−−========∑∑∑∑∑∑∑∑
Variação Entre = SQTrat = ( ). . .y yij
r
i
t i
−−−− ============∑∑∑∑∑∑∑∑ 2
11
==== −−−− ==== −−−− ==== −−−−==== ====∑∑∑∑ ∑∑∑∑ ∑∑∑∑
y
r
y
n
y
rC
T
rC
i
ii
ti
ii
ti
ii
. . . .
2 2
1
2
1
2
SQTrat = T
rCi
ii
2
−−−−∑∑∑∑
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
89
Variação Dentro = SQE = SQR = ( ).y yi j ij
r
i
t i
−−−− ============∑∑∑∑∑∑∑∑ 2
11
==== −−−− ==== −−−− −−−− −−−−
==== −−−− −−−− −−−− ==== −−−−
∑∑∑∑∑∑∑∑∑∑∑∑ ∑∑∑∑∑∑∑∑ ∑∑∑∑
∑∑∑∑∑∑∑∑ ∑∑∑∑
======== ========
========
yT
ry
y
n
T
r
y
n
y CT
rC SQTO SQTrat
i j
i
iij
r
i
t
i jj
r
i
ti
ii
i jj
r
i
ti
ii
i i
i
22
11
2
2
11
2 2
2
11
2
( ) ( )
( ) ( )
. . . .
= SQErro = SQTO - SQTrat
Os quadrados médios e o teste F são calculados do mesmo modo que no modelo
balanceado. A análise de variância está apresentada na Tabela 2.3.
TABELA 2.3. Análise de variância de um experimento inteiramente ao acaso
não balanceado com t tratamentos e ri repetições. Causas de Variação
G. L. S. Q. Q. M. F
Tratamentos t - 1 SQT QMT QMT / QME Erro n - t SQE QME Total n - 1 SQTO
n rii
t
========∑∑∑∑
1
4.15 Vantagens e desvantagens do DIC.
As principais vantagens do DIC
• é fácil de ser planejado e é flexível quanto ao número de tratamento e de repetições
tendo como única limitação o número de unidades experimentais disponíveis para o
experimento;
• o número de repetições pode variar de tratamento para tratamento, embora o desejável
é ter o mesmo número de unidades experimentais em todos os tratamentos;
• o DIC proporciona o número máximo de graus de liberdade para o resíduo;
• a análise estatística é simples mesmo que se perca algumas unidades experimentais.
Algumas desvantagens
• é mais apropriado para um pequeno número de tratamentos e para um material
experimental homogêneo;
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
90
• todas as fontes de variação não associadas aos tratamentos farão parte do resíduo,
podendo comprometer a precisão das análises;
• super-estima a variância residual.
4.16 Resumo
. O DIC é mais útil onde não existe nenhuma fonte de variação identificável entre as
unidades experimentais, exceto às dos efeitos dos tratamentos. É o mais flexível com
respeito ao arranjo físico das unidades experimentais. Ele maximiza os graus de
liberdade para a estimação da variância por unidade experimental (erro experimental ou
erro residual) e minimiza o valor da estatísca F requerido para a significância estatística.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
91
Exercícios
1. Para comparar a produtividade de quatro variedades de milho, um agrônomo tomou
vinte parcelas similares e distribuiu, inteiramente ao acaso, cada uma das 4 variedades
em 5 parcelas experimentais. A partir dos dados experimentais fornecidos abaixo, é
possível concluir que existe diferença significativa entre as variedades com relação a
produtividade, utilizando o nível de significância de 5%?
Variedades
A B C D
25 31 22 33
26 25 26 29
20 28 28 31
23 27 25 34
21 24 29 38
Totais 115 135 130 165
Médias 23 27 26 33
2. Um treinador de corrida rústica, objetivando melhorar o desempenho de seus atletas,
testou três novas técnicas de preparação. Para tanto trabalhou com um grupo de 15
atletas completamente homogêneos para as aracterísticas essenciais. A designação das
técnicas de preparação aos atletas foi feita totalmente ao acaso e de tal forma que o
número de atletas avaliados em cada uma das técnicas fosse o mesmo. Os resultados
obtidos, após um determinado período de tempo de aprendizado da técnica pelos atletas,
foram os seguintes (minutos / 25 Km):
Técnicas de Preparação
Repetições 1 2 3
1 130 125 135
2 129 131 129
3 128 130 131
4 126 129 128
5 130 127 130
Totais 643 642 653
De acordo com os resultados obtidos, pede-se.
a) Quais foram os Princípios Básicos da Experimentação utilizados pelo pesquisador
neste experimento?
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
92
b) Qual foi a unidade experimental nesta pesquisa?
c) É possível concluir que existe diferença entre as técnicas de preparação com relação
ao tempo médio gasto para percorrer a distância de 25 km? (α = 1%)
d) Qual seria a técnica a ser recomendada?
3. Com o objetivo de diminuir o consumo dos motores à gasolina, uma determinada
indústria petroquímica testou 4 novas formulações de gasolina, as quais se diferenciavam
pelo tipo de aditivo que era acrescentado à mesma durante o seu processo de
fabricação.
Para efetuar o teste, a indústria petroquímica utilizou carros completamente homogêneos
para todas as características. A designação das formulações aos carros foi feita
inteiramente ao acaso. Após os testes de rodagem, os resultados obtidos foram (km/l):
Aditivo a base de Ácido Forte Ácido Fraco Base Forte Base Fraca Médias 14,81 6,56 10,06 10,09 Nº de carros 10 10 10 10
SQResíduo=6,0264 Com base nos resultados acima, pede-se:
a) Existe diferença entre os 4 tipos de formulações? (α = 5%)
b) Estabeleça um contraste entre o grupo à base de formulação ácida contra o grupo à
base de formulação básica. Obtenha a estimativa para este contraste.
c) Estabeleça um contraste para comparar aditivos de formulação ácida. Obtenha a
estimativa para este contraste.
d) Estabeleça um contraste para comparar aditivos de formulação básica. Obtenha a
estimativa para este contraste.
4. Com o objetivo de verificar se a parótida tem influência na taxa de glicose no sangue,
em ratos, um experimento no DIC foi realizado. Vinte e quatro ratos machos da raça W
foram escolhidos aleatoriamente e separados em três grupos. Os dados referentes as
taxas de glicose, em miligramas por 100 ml de sangue, segundo o grupo, em ratos
machos com 60 dias de idade são dados abaixo:
Parotidectomizado 96,0 95,0 100,0 108,0 120,0 110,5 97,0 92,5
Pseudoparotidectomizado 90,0 93,0 89,0 88,0 87,0 92,5 87,5 85,0
Normal 86,0 85,0 105,0 105,0 90,0 100,0 95,0 95,0
Usando α = 5%, testar a hipótese de que as médias relativas aos três grupos são iguais,
e concluir.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
93
5.O resultado das vendas efetuadas por 3 vendedores de uma indústria de pesticidas
durante certo período é dado a seguir. Ao nível de 5% de probabilidade e considerando
os vendedores como tratamentos de um D.I.C., verifique se há diferença de eficiência
entre os vendedores.
Vendedores
A B C
29 27 30
27 27 30
31 30 31
29 28 27
32 29
30
Totais 178 112 147
6. Baseado nas informações fornecidas abaixo e supondo que os tratamentos que
possuem as maiores médias são os desejados, pergunta-se:
Qual(is) tratamento(s) deve(m) ser recomendado(s)? Justifique a sua resposta. Use o
nível de 1% de significância.
FV GL SQ QM F Tratamentos 2 14,80 7,40 Resíduo Total 14 78,40
Médias de tratamentos:
m 1= 128,6 m 2= 128,4 m 3= 130,6
7. Os seguintes dados referem-se a ganhos de peso, em kg, de animais durante um
período experimental.
Repetições Rações 1 2 3 4 Totais
A 7,1 8,9 6,0 7,0 29,0 B 6,2 8,8 4,9 6,1 26,0 C 6,0 5,0 9,1 3,9 24,0 D 11,1 10,8 10,2 11,9 44,0 E 7,0 11,3 10,0 11,7 40,0
Totais 163,0
Tais dados são descritos segundo o modelo estatístico: Yij = m + ti + eij. Baseando nas
informações fornecidas, pede-se:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
94
a. Proceda a análise de variância dos dados (use α = 5%)
b. De acordo com o resultado do teste F, pode-se concluir que existe efeito
significativo de rações com relação ao ganho de peso médio proporcionado pelas
mesmas?
c. Proponha um contraste que compare as rações B e C juntas contra as rações D e E.
Obtenha a estimativa para este contraste.
d. Calcule o coeficiente de variação e interprete-o.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
95
C A P Í T U L O 5
TESTES DE COMPARAÇÕES MÚLTIPLAS
5.1 Introdução
O fator ou fatores em avaliação em um experimento podem ser classificados como
qualitativo ou quantitativo. Um fator quantitativo é aquele onde cada nível é descrito por
uma quantidade numérica em uma escala. Como exemplos tem-se temperatura,
umidade, concentração de um princípio ativo, níveis de insumo, pH, etc ... Para estudar o
efeito deste tipo de fator recomenda-se realizar uma análise de regressão, assunto que
será abordado no Capítulo 10.
Por outro lado, um fator qualitativo é aquele onde os níveis diferem por algum atributo
qualitativo. Como exemplos têm-se variedades, tipos de defensivos, métodos de conduzir
uma determinada tarefa, etc. Para estudar o efeito deste tipo de fator, deve-se proceder à
análise de variância dos dados e, se for conveniente, proceder às comparações entre as
médias dos níveis do fator usando algum dos procedimentos para comparações múltiplas
descritos neste capítulo.
A análise de variância, conforme visto no capítulo anterior, serve para verificar se existe
alguma diferença significativa entre as médias dos níveis de um fator a um determinado
nível de significância. Se o teste F para a fonte de variação que representa o fator em
estudo for não-significativa, ou seja, a hipótese de nulidade (Ho: m1 = m2 = ... = mI) não
for rejeitada, todos os possíveis contrastes entre médias de tratamentos são
estatísticamente nulos. Neste caso, não é necessário a aplicação de nenhum
procedimento de comparações múltiplas.
Por outro lado se o teste F for significativo, ou seja a hipótese de nulidade for rejeitada,
implica que existe pelo menos um contraste entre médias estatisticamente diferente de
zero. Os procedimentos de comparações múltiplas a serem vistos neste capítulo, visam
identificar qual(is) é(são) esse(s) contraste(s), para podermos por conseqüência
identificarmos qual(is) é(são) o(s) nível(is) do fator em estudo que apresentou(ram)
maior(es) média(s).
Dentre os diversos testes existentes na literatura, serão vistos os quatro testes mais
comumente utilizados. Estes testes podem ser divididos em duas categorias principais de
acordo com os tipos de contrastes que podem ser testados:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
96
1a) Procedimentos para testar todos os possíveis contrastes entre duas médias dos
níveis do fator em estudo
a) Teste de Tukey
b) Teste de Duncan
2a) Prodedimentos para testar todos os possíveis contrastes entre médias dos níveis
do fator em estudo
a) Teste t de Student
b) Teste de Scheffé
Todos os procedimentos se baseiam no cálculo de uma diferença mínima significativa
(dms). A dms representa o menor valor que a estimativa de um contraste deve apresentar
para que se possa considerá-lo como significativo. Por exemplo, para um contraste entre
duas médias, a dms representa qual é o menor valor que tem que ser detectado entre as
suas estimativas para que se possa concluir que os dois tratamentos produzam efeitos
significativamente diferentes.
A princípio um determinado contraste, por exemplo, entre duas médias poderia ser
testado por cada um dos procedimentos aqui apresentados. A conclusão a respeito da
significância do contraste pode variar de um procedimento para outro, pois o valor da
dms varia de um teste para outro, pois cada um se baseia numa distribuição de
probabilidades específica. Devido a esta possibilidade na diferença de conclusões a
respeito da significância do contraste, nós podemos dizer que um teste é mais
conservador (ou rigoroso) que o outros. Na estatística dizemos que um teste é mais
conservador que o outro quando a dms dele é maior, pois ele tende a “conservar” a
hipótese de igualdade entre médias como verdadeira. Isto porque quanto maior a dms
mais difícil se torna rejeitar a hipótese de nulidade.
Este maior ou menor conservadorismo de um teste pode ajudar o pesquisador a escolher
um procedimento de comparação múltipla. Se por exemplo, por experiência própria o
pesquisador sabe que as diferenças entre os efeitos dos níveis do fator em teste são
pequenas e ele deseja detectar estas pequenas diferenças, então ele deve usar um
procedimento menos conservador, ou seja, que apresenta uma menor dms. Se por outro
lado, ele quer concluir que os níveis do fator têm efeitos diferentes somente quando a
diferença nos seus efeitos for realmente grande, então ele deve usar um teste mais
conservador, ou seja, com maior dms.
Vamos ver a partir de agora cada procedimento com mais detalhe. Considere para tanto,
que estamos interessados em comparar as médias dos I níveis de um fator qualitativo, as
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
97
quais foram obtidas a partir da realização de um experimento no delineamento
inteiramente casualizado com J repetições, para o qual o teste F para fator foi
significativo; e que o número de graus de liberdade para o fator em estudo foi igual a n1 e
para o resíduo foi igual a n2, ou seja,
FV GL SQ QM F
Fator I-1 SQFator QMTrat significativo
Resíduo I(J-1) SQRes QMRes
Total IJ - 1 SQTotal
5.2. Alguns Procedimentos Para Comparações Múltiplas
Dentre vários procedimentos existentes para comparações múltiplas, serão apresentados
quatro: teste de Tukey, teste de Duncan, teste t de Student e teste de Scheffé.
5.2.1.Teste de Tukey
O teste de Tukey, pode ser utilizado para comparar a totalidade dos contrastes entre
duas médias, ou seja, para os I(I−1)/2 contrastes do tipo C=mi – mu; para 1 ≤ i < u ≤ I, em
que I é o número de níveis do fator em estudo. Este teste baseia-se na diferença mínima
significativa (d.m.s.) representada por ∆ e dada por:
( )ˆˆq V C∆∆∆∆ =
12
em que,
q = qα (I,n2 ) = é o valor tabelado da amplitude total estudentizada, que é obtido em
função do nível α de significância do teste, número de níveis do fator em estudo (I) e
número de graus de liberdade do resíduo (n2) da análise de variância.
( )i u
ˆV C QMResr r
= +
1 1
No caso em que todos os tratamentos apresentaram o mesmo número de
repetições, ou seja, ri = ru = K, o valor de ∆ é simplificado com a seguinte
expressão
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
98
QMResq
k∆∆∆∆ =
Para a realização do teste Tukey,a um nível de significância α, é necessário:
1. Enunciar as hipóteses: H0: C = 0 vs Ha: C≠ 0, em que C = mi – mu, para i ≠ u;
2. Obtenção das estimativas dos contrastes, i u
C m m= − , com base nos valores
amostrais;
3. Cálculo do ∆ ;
4. Concluir a respeito da significância dos I(I−1)/2 contrastes em teste, usando a seguinte
relação: se C ≥ ∆ , rejeita-se H0 ; caso contrário, não se rejeita H0 . Neste caso, indicar
as médias iguais, seguidas por uma mesma letra.
Considerações:
1. O teste de Tukey é válido para a totalidade dos contrastes de duas médias.
2. O teste de Tukey exige, em princípio, balanceamento. Mas, no caso dos tratamentos
apresentarem números de repetições diferentes, o resultado obtido por este teste é
apenas uma aproximação.
3. O teste de Tukey é exato para testar a maior diferença, nos demais casos é
conservador.
5.2.2. Teste de Duncan
Tal como o teste de Tukey, o teste de Duncan é um procedimento seqüencial, válido para
a totalidade dos contrastes de duas médias do tipo C = mi – mu. O teste de Duncan
necessita a prévia ordenação das médias, dos níveis do fator em estudo. Este teste
baseia-se na amplitude total mínima significativa (Di) dada por:
( )i iˆˆD Z V C=
12
em que,
Zi = Zα(n, n2)= é o valor tabelado da amplitude total estudentizada, que é obtido em
função do nível α de probabilidade, número de médias ordenadas abrangidas pelo
contraste entre os níveis do fator em estudo (i) e número de g.l. do resíduo da ANOVA
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
99
(n2). Como se trata de um processo seqüencial, n1 varia seu valor durante a aplicação do
teste;
( )i u
ˆV C QMResr r
= +
1 1
i i
QMResD Z
k=
Para a realização do teste Duncan a um nível de significância α é necessário:
1. Enunciar as hipóteses: H0: C = 0 vs Ha: C≠ 0, em que C = mi – mu, para i ≠ u;
2. Ordenar as médias do fator em estudo em ordem crescente ou decrescente;
3. Obter o valor da estimativa do contraste entre a maior e a menor média, com base nos
valores amostrais;
4. Calcular o valor de i D , com base no número de médias ordenadas abrangidas pelo
contraste. Neste primeiro passo i= I;
5. Concluir a respeito da significância do contraste em teste, usando o seguinte critério:
a) Se o valor de i D for maior do que o módulo da estimativa do contraste, não rejeita-se 0
H e as médias são ligadas por um traço, indicando que não há diferença entre elas;
b) Caso contrário, reduzir de uma unidade o valor de n1. Calcula-se o novo valor de i D e,
para todos os pares de médias que não estejam ligadas por um mesmo traço e que
envolvem n1 médias, repetir o procedimento que consta no item 3 e nos seguintes;
6. Proceder ao item 3 e seguintes até que i = 2.
Este teste tem como inconveniente, além de ser um teste trabalhoso, o fato das médias
ordenadas não serem independentes e o valor de zi em conseqüência, não ser exato.
Considerações:
1. O teste Duncan é um procedimento seqüencial válido para a totalidade dos contrastes
de duas médias.
2. Tal como o teste de Tukey, o teste de Duncan exige, em princípio, balanceamento.
Mas, no caso de serem diferentes os números de repetições este teste pode ainda ser
usado, mas então é apenas aproximado.
3. Quando a maior média não diferir significativamente da menor, não se admitirá
diferença significativa, entre as médias intermediárias.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
100
5.2.3. Teste t de Student
O teste t pode ser utilizado para testar contrastes envolvendo duas ou mais médias.
Porém este teste exige que:
1. as comparações a serem realizadas sejam escolhidas a priori, ou seja, antes de serem
examinados os dados;
2. podem-se testar no máximo, tantos contrastes quantos são os graus de liberdade para
tratamentos, e estes contrastes devem ser ortogonais.
A ortogonalidade entre os contrastes indica independência linear na comparação
estabelecida por um contraste com a comparação estabelecida pelos outros contrastes.
Entre I médias de um fator, podem ser obtidos I – 1 contrastes ortogonais.
Consideremos um contraste de médias, entre os níveis de um fator, em sua forma geral:
C = a1 m1 + a2 m2 + ... + ai mi
do qual obtemos a estimativa por meio do estimador
1 1 2 2 I IC a m a m ... a m= + + +
que pode ser testada pelo teste t, calculando-se a estatística t, dada por.
( ) Ii
i i
ˆ ˆC C C Ct
ˆˆ aV C QMResr=
− −= =
∑2
1
que tem distribuição t de Student com n2 graus de liberdade, sendo n2 o número de
graus de liberdade do resíduo e QMResíduo o quadrado médio residual da análise de
variância.
Caso o número de repetições seja o mesmo para todos os tratamentos, ou seja
r1 = r2 =...= rI = K, então a fórmula para a aplicação do teste t é
Ii
i i
C Ct
aQMRes
r=
−=
∑2
1
Quando aplicamos o teste t a um contraste, C, geralmente o interesse é testar as
hipóteses: H0: C = 0 vs Ha: C ≠ 0.
O valor tabelado de t é obtido por ttab=t α (n2).
A regra de decisão, neste caso, é a seguinte:
Se |t| ≥ ttab ⇒ rejeita-se H0 .
Caso contrário não se rejeita H0 .
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
101
Considerações:
1. O nível de significância α é válido para um único contraste, e não para uma série deles;
2. O nível de significância α é válido somente se o contraste for estabelecido a priori e
não sugerido pelos dados, pois, pode ficar caracterizado uma estatística de ordem ao
querer comparar a maior com a menor média, o que acarretaria certa dependência entre
as médias.
5.2.4. Teste de Scheffé
Este teste pode ser aplicado para testar todo e qualquer contraste entre médias, mesmo
quando sugerido pelos dados. É freqüentemente utilizado para testar contrastes que
envolvam grupos de médias. É um teste mais conservador que o teste t, porém não exige
que os contrastes a serem testados sejam ortogonais e nem que estes contrastes sejam
estabelecidos antes de se examinar os dados.
Se o valor de F obtido não for significativo, nenhum contraste poderá ser significativo pelo
teste de Scheffé, e sua utilização não se justifica.
A estatística do teste, denotada por S, é calculada por:
( ) ( )TABˆˆS I F V C= −
1
em que,
I = é o número de níveis do fator em estudo;
Ftab = Fα(I-1; n2) é o valor tabelado de F, obtido em função do nível α de probabilidade,
número de graus de liberdade do fator em estudo, ou seja I-1, e número de graus de
liberdade do resíduo, ou seja n2;
( )I
i
i i
aˆV C QMResr=
= ∑2
1
Caso o número de repetições seja o mesmo para todos os tratamentos, ou seja,
r1=r2=...= rI = K, então a fórmula para a aplicação do teste Schheffé é
( )I
iTAB
i i
aS I F QMRes
r=
= − ∑2
1
1
Deve-se então, calcular a estimativa do contraste C, ou seja
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
102
1 1 2 2 I IC a m a m ... a m= + + +
Se verificarmos que C ≥ S, dizemos que o contraste é significativamente diferente de
zero ao nível α de probabilidade, indicando que os grupos de médias confrontados no
contraste diferem entre si a esse nível de probabilidade.
Considerações:
1. O teste de Scheffé é válido para a totalidade dos contrastes.
2. Para testar um único contraste, ou para testar um número pequeno deles, o teste de
Scheffé é bastante rigoroso.
5.3. Vantagens e Desvantagens dos Procedimentos Para Comparações
Múltiplas
O teste t não é recomendado para testar todas as possíveis comparações entre médias
de um experimento, pois este teste aponta pequenas diferenças como significativas. O
procedimento de Duncan também é sensitivo, no sentido de declarar pequenas
diferenças como significativas. Para estes dois testes, Duncan e t, o nível de significância
conjunto para um grande número de comparações é elevado. Quando são utilizados para
esta finalidade, estes testes podem apontar como significativos contrastes, quando na
verdade estes contrastes são não-significativos. Neste acaso o erro tipo I tende a ocorrer
mais frequentemente do que o estabelecido pelo nível de significância do teste.
O teste de Tukey é bastante rigoroso no sentido de apontar diferenças significativas.
Este teste é útil quando se deseja informações preliminares a respeito das diferenças
entre os efeitos dos níveis de um fator. O procedimento de Scheffé é ainda mais rigoroso
que o Tukey para comparar pares de médias.
Para a comparação de um número grande de médias, não há um procedimento
ideal. Testes como Tukey ou Scheffé, tornam-se extremamente rigorosos, pois o nível de
significância conjunto para a maioria dos contrastes é muito menor do que o
estabelecido.
O inverso ocorre com o teste t e Duncan.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
103
Exercícios
1. Aplique os testes Tukey e Duncan, aos exemplos dados ao final da apostila do
Capítulo de Delineamento Inteiramente Casualizado.
2. Para os dados fornecidos a seguir, conclua pelo teste Duncan e Tukey (α = 5%) .
m =1 370 m =2 338 m =3 380 m =4 320 m =5 325 m =6 367
D6 = 31 D5 = 30,2 D4 = 28,7 D3 = 26 D2 = 24,6 ∆ = 33
3. Aplicar o teste de Duncan às comparações múltiplas obtidas com as médias dos
tratamentos instalados em um experimento segundo o Delineamento Inteiramente
Casualizado (DIC).Concluir para α = 5% de probabilidade.
T1 = 452,16 T2 = 481,80 T3 = 442,56 T4 = 469,52 T5 = 439,48 T6 = 461,6
SQTratamento 331,8677 SQTotal 783,4964 r 4
4. Um experimento para avaliar a influência de 4 tipos de aleitamento no ganho de peso
de leitões foi conduzido utilizando-se o delineamento inteiramente casualizado com 4
repetições. Foram obtidos os seguintes resultados parciais:
Tratamentos 1 2 3 4
Totais 37,2 44,8 31,6 32,8
FV GL SQ QM F
Tratamento 26,76
Resíduo
Total 33,82
Complete o quadro da ANOVA e, considerando-se α = 1%, responda qual(is) o(s)
melhor(es) tipo(s) de aleitamento. (Use o teste de Tukey, se necessário)
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
104
5. Com o objetivo de verificar se existe diferença, no tempo médio gasto para ir de 0-100
km/h, entre 5 marcas de carro de mesma categoria, 4 carros de cada marca foram
escolhidos inteiramente ao acaso da linha de produção de cada marca e avaliados em
uma pista de provas apropriada. Os resultados obtidos, em segundos, foram:
Marcas
1 2 3 4 5
12 12 8 12 13
11 10 7 12 14
11 10 8 10 15
13 11 6 11 13
Usando o nível de 5% de probabilidade
a. Existe de diferença significativa entre as marcas de carro quanto ao tempo médio
gasto para ir de 0-100 km/h?
b. Qual(is) é(são) a(s) marca(s) mais lenta(s) para ir de 0-100 km/h, pelo teste de
Duncan?
c. Qual(is) é(são) a(s) marca(s) mais rápida(s) para ir de 0-100 km/h, pelo teste de
Tukey?
d. Suponha que em termos de custo final ao consumidor pode-se classificar os carros
produzidos pela marca 1 como de custo alto, os produzidos pelas marcas 2 e 3 de custo
médio e aqueles produzidos pelas marcas 4 e 5 como de custo alto. Suponha também
que este experimento tinha como objetivos verificar se existe diferença no tempo médio
para ir de 0-100 km/h entre: 1) os carros de custo alto e os demais carros; 2) entre os
carros de custo médio e os de custo alto; 3) os carros de custo médio; e 4) os carros de
custo baixo. Utilize os testes de Scheffé e de t para verificar se estas comparações são
significativas.
6. Quatro padarias da cidade de São Paulo, oram fiscalizadas para verificar a quantidade
de bromato de potássio existente nos pães franceses que elas produzem.
Com esta finalidade foi tomada uma amostra de pães, inteiramente ao acaso, de cada
padaria e para cada um deles foi avaliado o teor de bromato de potássio (mg de bromato
de potássio/1kg de pão). O resumo da avaliação é fornecido a seguir:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
105
Padaria 1 2 3 4
Teor médio 10 11 8 9
Núm. de pães avaliados 7 8 7 8
SQResíduo = 52
Usando o nível de 5% de probabilidade a. Pode-se concluir que existe diferença
significativa no teor médio de bromato de potássio no pão entre as padarias avaliadas?
b. Suponha que as padarias 1 e 2 suprem a classe social A, a padaria 3 a classe B e a 4
a classe C. Verifique, por meio de um contraste, pelo teste de Scheffé e pelo teste t, se
existe diferença no teor médio de bromato de potássio entre as padarias que suprem as
classes A e C.
7. Com os dados fornecidos a seguir oriundos de um experimento instalado no DIC com 4
repetições, para o qual o teste F da ANOVA para tratamentos foi significativo, aplicar o
teste de Duncan e o teste de Tukey para se concluir qual(is) tratamento(s)
apresentou(aram) maior(es) média(s) ao nível de 5% de probabilidade.
SQResíduo = 905,6790
T1 = 813,44 T2 = 729,52 T3 = 786,32 T4 = 661,52 T5 = 755,44 T6 = 612,50
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
106
C A P Í T U L O 6
DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC)
6.1 Introdução
Suponha que um experimentador esteja interessado em estudar os efeitos de 3
diferentes dietas. A primeira providência do pesquisador foi a de se inteirar a respeito da
natureza do material experimental disponível. Feito isto, constatou que ele disporia de 12
animais com aproximadamente o mesmo peso. Entretanto, estes 12 animais eram
provenientes de 4 ninhadas, cada uma contendo três animais. Dentro de uma ninhada, os
três animais foram sorteados às três dietas. Os animais foram colocados em 12 baias
idênticas e alimentados com as dietas sorteadas, em idênticas condições.
Mediu-se, então, o ganho de peso desses animais depois de 12 semanas. Os dados
obtidos são apresentados no quadro abaixo:
Dieta
Ninhada
1 2 3 4
Total
1 28,7 29,3 28,2 28,6 114,8
2 30,7 34,9 32,6 34,4 132,6
3 31,9 34,2 34,9 35,3 136,3
Total 91,3 98,4 95,7 98,3 383,7
O delineamento experimental para este ensaio de dietas é um exemplo de um
Delineamento em Blocos Casualizados com três tratamentos e quatro blocos. Os
tratamentos são níveis de um fator experimental, as três dietas; os blocos são os níveis
do fator confundido, as ninhadas. Dado que os animais em diferentes ninhadas
respondem diferentemente a uma dada dieta, a ninhada é considerada, um fator de
confundimento. As 12 unidades experimentais (animais) são agrupados em 4 blocos de
tal forma que, dentro de cada grupo, três unidades são afetadas pelo mesmo nível do
fator de confundimento. Por causa da porção das características inerentes aos animais
dentro de uma mesma ninhada (bloco), suas respostas serão muito similares, enquanto
que as respostas dos animais pertencentes a diferentes ninhadas irão variar muito; isto é,
as unidades experimentais são mais homogêneas dentro dos blocos do que entre os
blocos. Assim, resumidamente, podemos definir que um DBC é um delineamento no qual
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
107
as unidades (unidades experimentais) às quais os tratamentos são aplicados são
subdivididos em grupos homogêneos, denominados de blocos, tal que o número de
unidades experimentais em um bloco é igual ao número (ou algum múltiplo do número)
de tratamentos estudados. Os tratamentos são então sorteados às unidades
experimentais dentro de cada bloco. Deve-se ressaltar que cada tratamento aparece em
cada bloco, e todo bloco recebe todos os tratamentos. Quando se usa o DBC, o objetivo
é isolar e remover do termo de erro (resíduo) a variação atribuída ao bloco, garantindo
assim, que as médias dos tratamentos estão livres do efeito dos blocos. A efetividade
deste delineamento depende da habilidade em se obter blocos homogêneos de unidades
experimentais. A habilidade para formar blocos homogêneos depende do conhecimento
que o pesquisador tem do material experimental. Quando os blocos são usados
adequadamente, o QMR (quadrado médio do resíduo) no quadro da ANOVA será
reduzido, a estatística F aumentará, e a chance de se rejeitar H0 (hipótese de nulidade)
será maior.
Em experimentos com animais, quando acredita-se que diferentes raças de animais
responderá diferentemente ao mesmo tratamento, a raça do animal pode ser usada como
um fator a ser considerado na formação dos blocos. O DBC pode, também, ser
empregado efetivamente quando um experimento deve ser conduzido em mais de um
laboratório (bloco) ou quando vários dias (blocos) são requeridos para a realização do
experimento. No DBC temos os três princípios básicos da experimentação: repetição,
casualização e controle local.
6.2 Vantagens e devantagens de um DBC
Vantagens
Com o agrupamento das parcelas, geralmente se obtém resultados mais precisos que
aqueles obtidos num DIC.
a) Desde exista material experimental suficiente, o delineamento será sempre
balanceado, podendo-se incluir qualquer número de tratamentos.
b) A análise estatística é bastante simples.
c) Se a variância do erro experimental é maior para alguns tratamentos que para outros,
pode-se obter um erro não viesado para testar qualquer combinação específica das
médias dos tratamentos.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
108
Desvantagem
Aparece quando da perda de parcela(s) em algum tratamento. Apesar de existir um
método apropriado de estimação desses valores, há a perda de eficiência na comparação
de médias envolvendo esses tratamentos.
6.3 Organização do dados no DBC
Vamos considerar k -tratamentos; r – blocos e ij y é o valor observado na parcela que
recebeu o tratamento i e se encontra no bloco j. Assim, um quadro para representar os
valores amostrais de um DBC pode ser da forma abaixo:
Tratamentos Blocos 1 2 3 4 5 Totais de blocos
1 y11 y21 y31 y41 y51 1 Y+
2 y12 y22 y32 y42 y52 2 Y+
3 y13 y23 y33 y43 y53 3 Y+
4 y14 y24 y34 y44 y54 4 Y+
Totais de tratamentos 1 Y + 2 Y + 3 Y + 4 Y + 5 Y + Y++
Média dos tratamentos 1 Y + 2 Y + 3 Y + 4 Y + 5 Y +
6.4 Modelo matemático do DBC
O modelo matemático deste experimento é:
y t b E i
j
i j i j i j==== ++++ ++++ ++++ ====
====
µµµµ ( ) , , , , ,
, , ,
1 2 3 4 5
1 2 3 4
onde,
yij = produção porcentual de ovos das aves que receberam o tipo de calcário i no
estágio de produção j;
µµµµ = média geral do experimento;
ti = efeito do calcário i;
bj = efeito do estágio de produção j;
E(ij) = erro associado à produção porcentual de ovos das aves que receberam o
tipo de calcário i no estágio de produção j.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
109
6.5. Suposições do modelo
Neste modelo,
• cada ij y observado constitui uma amostra aleatória independente de tamanho 1 de
cada uma das kr populações
• os e ij são independentes e normalmente distribuídos com média 0 e variância σ2, ou
seja, εij~ N (0 , σ2 ) . Isto implica em que as kr populações são normalmente distribuídas
com média µij e a mesma variância σ2 , ou seja, yij ~N (µi , σ2 ) ;
• os efeitos de blocos e tratamentos são aditivos. Esta suposição pode ser interpretada
como não existe interação entre tratamentos e blocos. Em outras palavras, uma particular
combinação bloco-tratamento não produz um efeito que é maior que ou menor que a
soma dos efeitos individuais.
6.6. Hipótese estatística
Podemos testar
H0: ζi = 0, com i = ,1 2,..., k
H1: nem todos os ζi= 0
Geralmente o teste de hipótese com relação aos efeitos de blocos não é feito por dois
motivos: primeiro o interesse principal é testar os efeitos de tratamento, o propósito usual
dos blocos é eliminar fontes estranhas de variação. Segundo, embora as unidades
experimentais sejam distribuídas aleatoriamente aos tratamentos, os blocos são obtidos
de uma maneira não aleatória.
6.7 Partição da soma de quadrados
Voltemos ao quadro de representação das observações no DBC
Tratamentos Blocos 1 2 3 4 5 Totais de blocos
1 y11 y21 y31 y41 y51 1 Y+
2 y12 y22 y32 y42 y52 2 Y+
3 y13 y23 y33 y43 y53 3 Y+
4 y14 y24 y34 y44 y54 4 Y+
Totais de tratamentos 1 Y + 2 Y + 3 Y + 4 Y + 5 Y + Y++
Média dos tratamentos 1 Y + 2 Y + 3 Y + 4 Y + 5 Y +
Podemos identificar os seguintes desvios:
• Yij Y − ++ , como o desvio de uma observação em relação a média amostral geral;
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
110
• Yij i Y − + , como o desvio da observação em relação à média de seu grupo ou do i-
ésimo tratamento;
• Yi Y −+ ++ , como o desvio da média do i-ésimo tratamento em relação á média geral.
• Yj Y −+ ++ ,como o desvio da média do j-ésimo bloco em relação á média geral.
Consideremos a identidade
( ) ( )y yi j
y y y y y y y y y yij i j ij i jTotal
( ) ( )− ++
= − = − + − + − ++ ++ + ++ +− + ++++
a qual representa a “ a variação de uma observações em relação à média geral amostral
como uma soma da variação desta observação em relação à média de seu grupo, com a
variação desta observaçãoem relação à média do j-ésimo bloco em que se encontra esta
observação, com a variação do erro experimental “. Elevando-se ao quadrado os dois
membros da identidade acima e somando em relação aos índices i e j, obtemos:
( ) ( ) ( ) ( )k r k r k r k r2 2 2 2
y y y y y y y y y yij ij i j ij i ji 1 j 1 i 1 j 1 i 1 j 1 i 1 j 1
− = − + − + − − +∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑++ + + ++ + + ++= = = = = = = =
O termo
( )k r 2
y yiji 1 j 1
−∑ ∑ ++= =
é denominado de Soma de Quadrados Total e vamos denotá-lo por SQT.O número de
graus de liberdade associado à SQT é kr - 1, ou N – 1, pois temos N observações e a
restrição
( )k r 2
y y 0iji 1 j 1
− =∑ ∑ ++= =
O termo:
( )k r 2
y yii 1 j 1
−∑ ∑ + ++= =
é denominado de Soma de quadrados de tratamentos, representada por SQTr, e é
uma medida da variabilidade entre os tratamentos. Quanto mais diferentes entre si forem
as médias dos tratamentos, maior será a SQTr. Desde que temos k tratamentos e a
restrição de que
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
111
( )k r 2
y y 0ii 1 j 1
− =∑ ∑ + ++= =
a SQTr está associada a k-1 graus de liberdade.
O termo
( )k r 2
y yji 1 j 1
−∑ ∑ + ++= =
É denominado de Soma de quadrados de blocos, representada por SQB, e é uma
medida da variabilidade entre os blocos. Quanto mais diferentes entre si forem as médias
dos blocos, maior será a SQB, justificando assim, a utilização do delineamento em
blocos. Desde que temos r blocos e a restrição de que
( )k r 2
y y 0ji 1 j 1
− =∑ ∑ + ++= =
a SQB está associada a r-1 graus de liberdade.
Finalmente, o termo
( )k r 2
y y y yij i ji 1 j 1
− − +∑ ∑ + + ++= =
Notem que a magnitude da SQR não depende da diferença entre as médias dos
tratamentos. Os graus de liberdade associada à SQR é (k-1)(r-1), isto é, o produto dos
graus de liberdade dos tratamentos e blocos SQT = SQB + SQTr + SQR ,
e os graus de liberdade associados a cada membro da equação acima fica
total = blocos + tratamentos + resíduo kr-1 = (r-1) + (k-1) + (k-1)(r-1)
6.8 Quadrados médios
Dividindo a SQB, SQTr e SQR pelos correspondentes graus de liberdade, obtemos,
respectivamente o Quadrado Médio Blocos (QMB), o Quadrado Médio Entre
Tratamentos (QMTr) e o Quadrado Médio Resíduo, isto é,
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
112
( ) ( )
SQBQMB
r 1
SQTrQMTr
k 1
SQRQMR
k 1 r 1
=−
=−
=− −
6.9 Estatística e região crítica do teste
A estatística para o teste é
QMTrFc
QMR=
a qual, deve ser próximo de 1 se H0 for verdadeira, enquanto que valores grandes dessa
estatística são uma indicação de que H0 é falsa. A teoria nos assegura que Fc tem, sob
H0 distribuição F – Snedecor com (k -1) e (k-1)(r-1) graus de liberdade no numerador e
no denominador, respectivamente. Resumidamente, indicamos:
FC ~ F((k-1),(k-1),(r-1),α) , sob H0
Rejeitamos H0 para o nível de significância α se
FC > F((k-1),(k-1),(r-1),α),
sendo, F((k-1),(k-1),(r-1),α), o quantil de ordem (1 −a ) da distribuição F-Snedecor com (k -1) e
(k-1)(r-1) graus de liberdade no numerador e no denominador.
6.10 Quadro da análise de variância (ANAVA)
Dispomos as expressões necessárias ao teste na Tabela abaixo, denominada de Quadro
de Análise de Variância (ANAVA).
Fonte de Variação g. l. S. Q. Q. M. Fc Tratamentos
k - 1
( )+ ++
=
−∑
22
1
ir
i
i
YYr k r =
−1
S Q T rQ M T rk
Q M T rQ M R
Blocos r - 1
( )+ ++
=
−∑
22
1
rj
j
YYk k r =
−1
S Q BQ M Br
Q M BQ M R
Resíduo
(k – 1)(r – 1)
≠ ( ) ( )
=− −
1 1S Q RQ M R
k r
Total
N - 1
( )+ +
= = =
−∑∑ ∑
2
2
1 1 1
k r k
i ji j i
YY
k r
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
113
Pode-se provar que:
• E(QMR) = σ2 , ou seja, QMR é um estimador não viesado da variância σ2 ;
• E( QM)r) σ2 +( )
krti
k 1 i 1∑
− =, ou seja, QMTr é um estimador não viesado da variância σ2
se a hipótese H0 : t1 =t2 =... =tk = é verdadeira.
• E( QMB) σ2 +( )
rkj
r 1 j 1
β∑− =
6.11 Detalhes computacionais
Apresentaremos alguns passos que facilitam os cálculos das somas de quadrados da
ANAVA.
• Calcule a correção para a média ( )++=
2YC M
N
• Calcule a Soma de Quadrados dos Totais (SQT)
= =
= −∑∑2
1 1
irk
i ji j
S Q T Y C M
• Calcule a Soma de Quadrados Entre os Tratamentos (SQTr)
+= −
2i
i
YS Q T r C Mr
• Calcule a Soma de Quadrados de blocos (SQB) ( )+ ++
=
= −∑
22
1
rj
j
Y YS Q B
k k r
• Calcule a Soma de Quadrados Residual (SQR) pela diferença, isto é,SQR = SQT –
SQTr - SQB ;
• Calcule os Quadrados Médios Entre os Tratamentos (QMTr), o Quadrado Médio
Residual (QMR) e o Quadrado Médio de Blocos
=−
1S Q T rQ M T rk , =
−
S Q RQ M RN k e =
−1
S Q BQ M Br
• Calcule Fc para tratamentos e FC para blocos =C T r
Q M T rFQ M R =C B l
Q M BFQ M R
EXEMPLO 1: Vamos considerar os dados apresentados no item 1.
Os cálculos para montar-mos o quadro da ANOVA são: k = 3, r = 4, e kr = N =(3)(4) =12.
Então
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
114
• Graus de liberdade:
Total = Kr – 1 = N – 1 = (3)(4) – 1 = 11; Trat = k – 1 = 3 – 1 = 2
Blocos = r – 1 = 4 – 1 = 3 e Res. = (3-1) (4-1) = 6
•( )2383 80
CM 12 275 2012
,. ,= =
•
( ) ( ) ( )2 2 2SQT 28 70 29 30 35 30 CM
SQT 12.353,35 -12.268,81 =84,54
, , ... ,= + + + −
=
•
( ) ( ) ( )2 2 2114 80 132 60 136 30
SQTr CM4 4 4
SQTr 12.334,7 - 12.268,81 = 66,06
, , ,= + + −
=
•
( ) ( ) ( ) ( )2 2 2 291 30 98 40 95 70 98 30
SQB CM3 3 3 3
SQB 12.279,88 -12.268,81 =11,07
, , , ,= + + + −
=
•
66 02QMTR 33 03
2
11 07QMB 3 69
3
7 41QMR 1 24
6
,,
,,
,,
= =
= =
= =
•
QMTr 33 03F 26 64cTr
QMR 1 24
QMB 3 69F 2 99CBl
QMR 1 24
.,
,
,,
,
= = =
= = =
Organizando estes resultados no Quadro da ANAVA, temos:
Fontes de Variação G. L. S. Q. Q. M. Fc Tratamentos Blocos
2 3
66,06 11,07
33,03 3,69
26,64** 2,99
Resíduo 6 7,41 1,24 Total 11 84,54
Das tabelas das distribuições F, temos que F(2,6.0,05) = 5,14 e F(2,6;0,01) = 10,92.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
115
O valor FcTr = 26,64 é maior do que estes valores tabelados, então rejeitamos a
hipótese
nula H0 para um nível α = 0,01, ou 1% de probabilidade (se é significativo a 1%, também
é significativo a 5%), e concluímos que existe uma diferença entre as três dietas. As
conclusões sobre ás diferenças entre os efeitos de ninhadas (blocos) podem ser
baseadas no Fc para blocos (FcBl = 2,98 com p=0,118). Parece que não existe uma
variação significativa entre as ninhadas nos ganhos de peso. O teste F da ANOVA para
os blocos é um teste aproximado mesmo quando as suposições são satisfeitas.
Alguns pesquisadores sugerem que não se considere o efeito colocado nos blocos em
futuros estudos similares, somente se o valor mínimo significativo (valor de p) associado
à estatística calculada for maior ou igual a 0,25 ( p ³ 0,25 ) . Para estes dados, FcBl =
2,99 tem um p = 0,118. Portanto, mesmo que existe insuficientes evidências para rejeitar
H 0 0 : b j = , ou seja, não existe efeito de ninhada, não é uma boa idéia ignorar os efeitos
de ninhada em futuros estudos.
6.12. O problema da perda de parcela
Embora não seja desejável, a perda de parcelas faz parte do cotidiano do
experimentador e precisa ser superada. Na experimentação com animais, isso ocorre
devido a doenças durante a realização do experimento ou até mesmo no caso de morte
de um animal. Em agronomia isso pode ocorrer devido a problemas de execução do
experimento, morte ou doença das plantas, extravio de fichas onde os dados são
registrados, registro de um valor superestimado (absurdo) ou duvidoso.
De qualquer forma a experimentação é um processo que exige muita sensibilidade por
parte do pesquisador, o que torna aqueles com mais experiência, verdadeiros consultores
em caso de dúvidas ou fenômenos inesperados. De qualquer forma essa experiência e
também sensibilidade só é adquirida com o tempo e após a execução de vários
experimentos. Portanto, sempre que houver dúvidas, é recomendável recorrer a um
estatístico, ou mesmo a algum profissional da área que tenha experiência e familiaridade
com a experimentação.
Os experimentos que contém perda de parcelas são denominados “não balanceados”. No
caso de um DIC isso é facilmente realizado com a aproximação de algumas fórmulas da
Análise de Variância. No caso de um DBC apresentaremos uma alternativa bastante
simples para a superação deste problema. A alternativa seria a utilização de métodos de
Análise Multivariada, que na verdade se trata de uma estatística bastante avançada que
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
116
é vista em cursos de pós-graduação em estatística, e, portanto foge do escopo deste
curso. O caminho a ser seguido em nosso caso consiste inicialmente em estimar o valor
da parcela que foi perdida por meio da fórmula:.
Vamos considerar o seguinte exemplo:
Exemplo:
Tratamentos
Classe de idade (Blocos)
1 2 3 4
Total
A 15 11 20 18 64
B 22 31 45 26 124
C 33 37 * 30 100
D 44 31 49 34 158
E 37 30 36 21 124
Total 151 140 150 129 570
A generalização destes dados pode ser representada no quadro abaixo
Blocos Tratamentos 1 2 3 … j r Total
1 y11 Y12 y13 … .… y1r 1 Y +
2 y12 y22 y32 … … y2r 2 Y +
3 i
y13
y23 y33 … …
ij Y
y3r 3 Y +
… k
…
yk1
…
yk2
…
yk3
… …
ykr
4 Y+
Total 1 Y + 2 Y + 3 Y +
5 Y + Y++
sendo:
ij Y a estimativa da parcela perdida;
k o número de tratamentos e r o número de blocos;
Y++ o total das parcelas disponíveis;
Yi+ o total das parcelas restantes no bloco onde ocorreu a parcela perdida;
Y+j o total das parcelas res tes no tratamento onde ocorreu a parcela perdida.
Uma solução interessante para o caso da perda de uma parcela consiste em estimar seu
valor usando a fórmula:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
117
( ) ( )kY rY Yi j
yijk 1 r 1
´ ´ ´ˆ
−+ + ++=
− −
No exemplo acima, temos uma parcela perdida no tratamento C no bloco 3 (classe de
idade). Nestes dados temos:
• k= 5, r= 4 Y 3´+ = 150 Y3
´+=100 e Y
´++ = 570
•a estimativa da parcela é dada por ( ) ( )
5 100 4 150 570y 44 17ij
5 1 4 1
( ) ( )ˆ ,
+ −= =
− −
Este valor deve ser substituído no lugar do dado perdido e a análise é feita como
anteriormente. A única diferença é que se perde um grau de liberdade no resíduo,
obtendo-se o seguinte quadro de análise de variância:
Fontes de Variação G. L. S. Q. Q. M. Fc Tratamentos Blocos
4 3
1289,00 488,56
322,25 162,86
10,21**
Resíduo 11 347,18 31,56 Total 18 2124,75 F(4; 11; 0,05) = 3,36; F(4; 11; 0,01) = 5,67; F(3; 11; 0,05) = 3,59 ; F(3; 11; 0,01) = 6,62
Observação: Nessa última análise, o quadrado médio do resíduo está corretamente
estimado, mas aquele correspondente a tratamento está ligeiramente exagerado. Para
corrigi-lo, basta subtrair da SQTr a seguinte quantidade:
2Yk 1 j
U Yijk k 1
ˆ − +
= − −
Então, temos: 2
5 1 150U 44 17 35 59
5 5 1, ,
− = − = −
, logo a SQTr correta fica igual a SQTr =
1289,00 – 35,59 = 1253,41 e a _QMTr = 313,35.
FC = 9,93. Como o valor de FC> F ( 4,11: 0,05 ) a conclusão sobre a presença de pelo menos
um efeito de tratamento não nulo, continua valendo.
OBS: Muitas vezes, dispensa-se o uso dessa correção, já que nem sempre ela
altera os resultados. Entretanto, na dúvida, devemos aplicar essa correção.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
118
6.13 Análise de variância de medidas repetidas
Um delineamento experimental de medidas repetidas é aquele no qual, várias medidas
são feitas na mesma unidade experimental (geralmente animal), e estas medidas
repetidas constituem as repetições. Para ilustrar melhor esta característica vamos
considerar o exemplo 2, item 11 da Aula 3 , pg 35. Neste exemplo tínhamos 4 amostras
independentes de animais e todos os animais de cada grupo foram alimentados, depois
do sorteio, com uma das 4 dietas. Nos delineamentos de medidas repetidas não existe
amostras independentes de animais; ao contrário, cada um dos 5 animais
terão seus pesos medidos depois que foram submetidos a uma determinada dieta, depois
de um certo período de tempo, os mesmos cinco animais terão seus pesos avaliados
depois de terem sidos submetidos a outra dieta, e assim sucessivamente, até serem
submetidos a todas as dietas. A tabulação dos dados pode ser bem parecida com a
representação dos dados do DBC. Neste exemplo podemos ter:
Animais Dietas 1 2 3 4 5 Total
1 y11 y21 y31 y41 y51 1 Y+
2 y12 y22 y32 y42 y52 2 Y+
3 y13 y23 y33 y43 y53 3 Y+
4 y14 y24 y34 y44 y54 4 Y+
Total 1 Y + 2 Y + 3 Y + 4 Y + 5 Y + Y++
Os resultados dos cálculos da ANOVA de um delineamento de medidas repetidas são os
mesmos de uma análise de um DBC. A grande vantagem deste tipo de delineamento é o
seu econômico requerimento de unidades experimentais (animais).
Este delineamento tem desvantagens se existe um efeito por causa da seqüência em que
os tratamentos são administrados (dietas no presente exemplo) aos animais. Uma outra
desvantagem surge se o tempo entre a aplicação de diferentes tratamentos é insuficiente
para evitar a sobreposição de efeitos do tratamento anterior.
EXEMPLO. Considere o conjunto de dados abaixo os quais se referem a níveis de
concentração de colesterol (mg/dl) em sangue de 7 animais experimentais, depois que
foram tratados cada um com uma das três drogas, com suficiente tempo entre as
aplicações das drogas para que seu efeito desaparecesse do animal.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
119
Drogas Animais 1 2 3 Total
1 164 152 178 494 2 202 181 222 605 3 143 136 132 411 4 5 6 7
210 228 173 161
194 219 159 157
216 245 182 165
620 692 514 483
Total 1281 1198 1340 3819
Faça os cálculso e apresente os resultados
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
120
Exercícios 1. Os dados abaixo, se referem a um experimento instalado segundo o DBC, em que os
tratamentos, 5 produtos comerciais para suprir deficiência de micronutriente em caprinos,
foram fornecidos aos animais os quais foram separados em 3 grupos segundo a idade.
Os resultados obtidos, expressos em ppm de micronutriente/ml de sangue, foram os
seguintes:
Produtos comerciais Bloco 1 2 3 4 5 Totais
1 83 86 103 116 132 520 2 63 69 79 81 98 390 3 55 61 79 79 91 365
Totais 201 216 261 276 321 1275
Pede-se proceder a ANOVA e aplicar o teste Tukey e Duncan, usando o nível de 5% de
probabilidade.
2. Com a finalidade de aumentar a produção de lã de suas ovelhas, por meio de uma
alimentação mais apropriada um criador separou 28 ovelhas de sua criação. Como as
ovelhas eram de idades diferentes, dividiu-as em 7 grupos, sendo que dentro de cada um
destes grupos havia 4 ovelhas de mesma idade e homogeneidade para as demais
características. Dentro de cada grupo foi realizado um sorteio para distribuir ao acaso, os
4 Tipos de Alimentação (TA) às ovelhas do grupo. O experimento se iniciou logo após as
ovelhas terem sido submetidas a uma tosquia e se encerrou quando já era o momento de
se realizar uma nova tosquia da qual foram obtidos os seguintes resultados, expressos
em unidade de medida de lã por animal:
grupos Bloco 1 2 3 4 5 6 7 Totais
1 30 32 33 34 29 30 33 221 2 29 31 34 31 33 33 29 220 3 43 47 46 47 48 44 47 322 4 23 25 21 19 20 21 22 151
Totais 125 135 134 131 130 128 131 914
Com base nas informações anteriores, pede-se (α = 1%):
a) Qual o tipo de delineamento experimental que o criador utilizou? Justifique sua
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
121
resposta.
b) Existe diferença entre os tipos de alimentação fornecidos às ovelhas com
relação a produção de lã?
c) Com base no teste Tukey, qual(is) seria(m) o(s) tipo(s) de alimentação a ser(em)
recomendada(s) às ovelhas?
3. Um experimento no DBC com 4 repetições forneceu os dados abaixo:
Blocos Tratamentos 1 2 3 4 Totais
1 142,36 144,78 145,19 138,88 571,21 2 139,28 137,77 144,44 130,61 552,10 3 140,73 134,06 136,07 144,11 554,97 4 150,88 135,83 136,97 136,36 560,04 5 153,49 165,02 151,75 150,22 620,48
Totais 726,74 717,46 714,42 700,18 2858,8
Para o nível de 5% de significância, pede-se:
a) ANOVA
b) Teste Tukey
c) Teste Duncan
d) Aplicar o teste Scheffé ao contraste C = m1 + m2 − 2m5
e) Aplicar o teste t aos contrastes
C1 = m1 + m2 - 2m5
C2 = m2 + m3 – m1 - m4
C3 = m1 – m4
4. O resumo da Análise de Variância de um experimento instalado segundo o
Delineamento em Blocos Casualizados, para verificar se existe diferença entre 5 tipos de
Levedura na produção de cerveja, é fornecido a seguir:
FV GL QM F Blocos 3 Tratamentos Resíduo 4,895 Total
Totais de Tratamentos:
T1 = 12,0 T2 = 25,2 T3 = 22,0 T4 = 24,0 T5 = 45,6
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
122
Ao nível de 5% de probabilidade, pede-se:
a) Existe diferença entre os 5 tipos de Levedura, na produção de cerveja?
b) Pelo teste Tukey, qual(is) o(s) tipo(s) de Levedura que apresentou(aram) maior
produção?
c) Pelo teste Duncan, qual(is) o(s) tipo(s) de Levedura que apresentou(aram) menor
produção?
5. Um Engenheiro-Agrícola, com o objetivo de verificar qual tipo de pneu que proporciona
menor consumo de combustível, para trabalhar em terrenos encharcados,
testou 4 diferentes tipos de pneus. Como a área que dispunha para realizar o
experimento era heterogênea com relação à declividade, ele subdividiu a área total em 3
sub-áreas de tal forma que dentro de cada uma delas existia uniformidade com relação à
declividade.
Após isto, dentro de cada sub-área realizou um sorteio ao acaso, dos tipos de pneus às
unidades experimentais. Com a realização da pesquisa, obteve-se os seguintes
resultados de consumo expressos em litros/hora trabalhada.
Pneu Sub-áreas Tipo 1 Tipo 2 Tipo 3 Tipo 4 Totais
1 30 32 33 35 130 2 29 30 31 33 123 3 25 26 30 31 112
Totais 84 88 94 99 365
Por meio das informações fornecidas acima, pede-se (use o nível de 5% designificância,
quando necessário).
a) Quais foram os Princípios Básicos da Experimentação utilizados neste experimento?
Justifique sua resposta.
b) Qual foi o tipo de delineamento experimental utilizado pelo Engenheiro-Agrícola?
Justifique sua resposta.
c) Em termos do consumo, conclua com relação aos tipos de pneus, por meio de uma
análise de variância.
d) Qual tipo de pneu que proporciona o pior consumo? Use o teste Duncan, se
necessário
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
123
6. Suponha que alguém solicite sua ajuda, na aplicação de testes de médias aos dados
de um experimento, instalado segundo o DBC com 4 repetições, para o qual o F da
Análise de Variância para tratamentos foi significativo. Para tanto você recebe as
seguintes informações:
Tratamentos 1 2 3 Totais 400 440 360
SQResíduo = 360 α = 5%
C1 = 3m1 − 2m2 − 2m3 C2 = m1 − 2m2 + m3 C3 = m1 – m2
a) Obtenha a V(C2)
b) Admita que ele deseja aplicar o teste de Scheffé em C1 e C2. Proceda a aplicação
do teste Scheffé de maneira adequada conforme visto em sala de aula.
c) Admita que ele deseja aplicar o teste t em C2 e C3. Proceda a aplicação do teste t
de maneira adequada conforme visto em sala de aula.
d) Obtenha um grupo de contrastes ortogonais a partir apenas de C3, usando o método
do sistema de equações lineares.
7. Um pesquisador foi encarregado de verificar se havia diferença de durabilidade entre 4
tipos de microaspersores presentes no mercado, produzidos por duas fábricas diferentes,
conforme quadro abaixo:
Tratamentos Microaspersor Fabricado por 1 Tipo A Água Boa S.A. 2 Tipo B Água Boa S.A. 3 Tipo C Água Boa S.A. 4 Tipo Único Água Ardente Ltda
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
124
Desconsiderando como o experimento foi conduzido, bem como o tipo de informação
usado na avaliação, considere os seguintes dados, após uma análise parcial dos
mesmos:
FV GL SQ QM F Blocos 3 1760 35,2 Tratamentos 4 Resíduo 12 4,895 50 Total 19
Com base nas informações acima pede-se: (use α=5%)
a) Cada tratamento foi repetido quantas vezes? Justifique sua resposta.
b) Que hipótese estaríamos testando pela ANOVA? Qual a sua conclusão no presente
caso?
c) Para responder qual é o melhor microaspersor, o que deveríamos fazer? Apenas
comente rapidamente.
d) Faça um teste (à sua escolha) para saber se há diferença entre os resultados médios
apresentados pelos microaspersores da fábrica Água Boa S.A. com o apresentado pelo
microaspersor da fábrica Água Ardente Ltda.
Médias dos Tratos m =1 36
m =2 40
m =3 60
m =4 40
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
125
C A P Í T U L O 7
DELINEAMENTO EM QUADRADO LATINO (DQL)
7.1 Introduão
Vimos que o Delineamento em Bloco Casualizado (DBC) é um delineamento
experimental simples que permite fazer comparações entre as respostas esperadas dos
tratamentos depois da eliminação (do ajuste) do efeito de uma variável de confundimento.
O delineamento utiliza os níveis desta variável de confundimento para formar blocos de
unidades experimentais. Pela imposição da restrição de que todos os tratamentos devam
ser aplicados a exatamente uma unidade experimental em cada bloco, podemos
assegurar que o delineamento eliminará os efeitos de bloco quando da comparação dos
efeitos dos tratamentos. Delineamentos simples para a eliminação dos efeitos de mais de
uma variável de confundimento pode ser construída analogamente ao DBC. Em
particular, o Delineamento Quadrado Latino (DQL) pode ser usado para ajustar os efeitos
de duas variáveis de confundimento.
A estrutura de um DQL para comparar k tratamentos pode ser visualizada em um arranjo
de k2 unidades experimentais em um quadrado de k linhas e k colunas. As respostas das
unidades experimentais em uma mesma linha são afetadas por um efeito comum de
confundimento denominado efeito da linha. Similarmente, as respostas das unidades
experimentais na mesma coluna são afetadas por um efeito comum de confundimento
denominado efeito da coluna. Os k tratamentos são aplicados às k2 unidades
experimentais de tal maneira que todo tratamento
aparece exatamente uma única vez em cada linha e uma em cada coluna.
Considere o seguinte exemplo, extraído de Rao, P.V. Statistical research methods in the
life science, pg 727: Em um estudo para comparar as tolerâncias de gatos a quatro
substâncias cardíacas (A, B, C, D) foi conduzida utilizando-se um DQL , no qual as linhas
representavam quatro combinações de dois períodos (A.M. , P.M.)
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
126
Dias
1 2 3 4 Yi.. i Y ++ I,AM Y11(D)
3,26
Y12(B) 4,15
Y13(A) 3,02
Y14(C) 3,67
Y1++
14,10
1 Y ++
I,PM Y21(B) 2,73
Y22(D) 3,38
Y23(C) 3,29
Y24(A) 4,50
Y2++
13,90 2 Y ++
II,AM Y31(A) 3,45
Y32(C) 4,09
Y33(B) 2,66
Y34(D) 3,51
Y3++
13,71 3 Y ++
II,PM Y41(C) 3,20
Y42(A) 3,14
Y43(D) 3,48
Y44(B) 3,40
Y4++
13,22 4 Y ++
Y+j+ Y+1+
12,64 Y+2+
14,76 Y+3+
12,45 Y+4+
15,08 Y+++
54,93
1 Y+ + 2 Y+ + 3 Y+ + 4 Y+ + Y+j+
Combinações de tempo e técnicas Totais dos tratamentos:
Y++( A)= Y13( A)+ Y24( A)+ Y31( A)+ Y42( A) = 3,02+ 4,50+ 3,45+ 3,14 = 14,11
Y++(B)= Y12( B)+ Y21( B)+ Y33( B)+ Y44( B) = 4,15+ 2,73+ 2,66+ 3,40 = 12,94
Y++( C)= Y14( C)+ Y23( C)+ Y32( C)+ Y41( C) = 3,67+ 3,29+ 4,09+ 3,20= 14,25
Y++( D)= Y11( D)+ Y22( D)+ Y34( D)+ Y43( D) = 3,26+ 3,38+ 3,51+ 3,48= 13 63
Notação:
• Y++i = soma das observações da i-ésima linha (i = 1, 2,..., k);
• Y+i+ = soma das observações da j-ésima coluna (j=1,2, ..., k);
• Y++(t) = soma das observações do t-ésimo tratamento
7.2 Modelo Matemático. Hipóteses
O modelo matemático de um experimento em quadrado latino é:
y l c t E i j k t n ti j k i j k i jk==== ++++ ++++ ++++ ++++ ==== ====µµµµ ( ) ( , , , , . . . , ; )1 2 2
onde:
yi j k = valor da parcela que recebeu o tratamento k na linha i e coluna j;
µµµµ = média geral do experimento;
li = efeito da linha i (1a variável de controle);
cj = efeito da coluna j (2a variável de controle);
tk = efeito do tratamento k;
E(i j k) = erro da parcela que recebeu o tratamento k, na linha i e coluna j.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
127
Observação: Como existe apenas uma observação por parcela, somente 2 dos 3 índices são necessários para identificar a parcela. Basta conhecer i e j para você saber qual é o tratamento k envolvido. - Tipos de Modelo
Fixo, aleatório ou misto.
- Hipóteses do Modelo
a) Aditividade
Não pode haver interação entre as variáveis de controle e tratamento.
b) Homogeneidade de variâncias
c) Normalidade e Independência de Erros
7.3 Objetivo do Controle em 2 Direções
O objetivo do controle é remover a variabilidade do material experimental ou do ambiente
em 2 direções. As variações entre blocos horizontais e verticais, que esperamos serem
grandes, são eliminadas do erro experimental.
7.4 Caracterização do Quadrado Latino
Cada tratamento aparece uma única vez em cada linha (bloco horizontal) e em cada
coluna (bloco vertical). A exigência principal do quadrado latino é que o número de
repetições seja igual ao número de tratamentos. Quando este número for muito grande, o
DQL é impraticável.
É um delineamento bem menos flexível que o DBC e, como este, o erro experimental
pode aumentar com o tamanho do quadrado. Os quadrados latinos mais usados são
aqueles com 5 a 8 tratamentos. O QL 2 x 2 não é usado isoladamente, pois o erro fica
com zero grau de liberdade, o que é inviável; os QL’s 3 x 3 e 4 x 4 já são bem usados,
porém repetidos várias vezes. Os tipos 5 x 5 a 8 x 8 são usados sem repetição.
Os quadrados latinos recebem este nome porque o número de parcelas totais do
experimento corresponde ao quadrado do número de tratamentos (n = t2) e por terem
sido, originalmente, representados por letras latinas.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
128
7.5 Partição da soma de quadrados
Do quadro de representação das observações no DQL, podemos notar as seguintes
desvios:
Podemos identificar os seguintes desvios:
• ijt Y – Y+++ , como o desvio de uma observação em relação à média geral;
• ijtY - Y+++ t , como o desvio da média do t-ésimo tratamento em relação à média geral;
• iY ++ - Y+++ , como o desvio da média da i-ésimo linha em relação á média geral;
• jY+ + - Y+++ , como o desvio da média da j-ésima coluna em relação á média
geral;
Então, podemos escrever a igualdade:
( ) ( ) ( ) ( ) ( ) ( )Y Y Y Y Y Y Y Y Y Y Y 2Yijt i j t ijt i j ij Y − = − + − + − + − − − ++++ ++ +++ + + +++ ++ +++ ++ + + + +++ a qual representa a “ a variação de uma observação em relação à média geral amostral
como uma soma da variação da média da i-ésima linha em relação à média geral, com a
variação da média da j-ésima coluna em relação à média geral, com a variação da média
da j-ésima coluna em relação à média geral, com a variação da média do k-ésima
tratamento em relação à média geral, com a variação do erro experimental “. Elevando-se
ao quadrado os dois membros da identidade acima e somando em relação aos índices i e
j, obtemos:
( ) ( ) ( ) ( )
( )
Y Y Y Y Y Y Y k Y
Y Y Y Y 2Y
k k k k k2 22 2ijk i j i
i 1 j 1 i 1 i 1 i 1
k k k 2ijk i j ij
i 1 j 1t 1
− = − + − + −
+ − − − +
∑ ∑ ∑ ∑ ∑+++ ++ +++ + + +++ + +++= = = = =
∑ ∑ ∑ ++ + + + +++= = =
Ou seja, a “ Soma de quadrados do Total (SQT) é igual à Soma de Quadrados do efeito
colocado nas linhas (SQL), mais a Soma de Quadrados do efeito colocado nas colunas
(SQC), Mais a Soma de Quadrados dos tratamentos (SQTr), mais a Soma de Quadrados
dos resíduos (SQR). Notem que existe k2 observações, então a SQT tem k2 -1 graus de
liberdade. Existe k – linhas, k – colunas e k – tratamentos, tal que cada uma das três
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
129
soma de quadrados SQL, SQC e SQTr têm k-1 graus de liberdade. Finalmente, os graus
de liberdade para SQR pode ser
calculado pela diferença entre os graus de liberdade entre a SQT e soma dos graus de
liberdade para linhas, colunas e tratamentos. ((k2-1)-(k-1)-k-1)-(k-1)=(k-1)(k-2)).
Assim, os graus de liberdade associados a cada membro da equação acima fica
Total Linhas Colunas Tratamentos Resíduo ( k2 -1) = (k-1) + (k-1) + (k-1) + (k-1)(k-2)
7.6. Quadrados médios
Dividindo a SQL, SQC, SQTr e SQR pelos correspondentes graus de liberdade,
obtemos, respectivamente o Quadrado Médio das Linhas (QML), o Quadrado Médio
das Colunas (QMC) , o Quadrado Médio de Tratamentos (QMTr) e o Quadrado
Médio Resíduo (QMR), isto é,
( ) ( )
SQLQML
k 1
SQCQMC
k 1
SQTrQMTr
k 1
SQRQMR
k 1 k 2
=−
=−
=−
=− −
7.7 Eestatística e região crítica do teste A estatística para o teste é
QMTrF
QMRc =
a qual, deve ser próximo de 1 se H0 for verdadeira, enquanto que valores grandes dessa
estatística são uma indicação de que H0 é falsa. A teoria nos assegura que Fc tem, sob
H0 distribuição F – Snedecor com (k -1) e (k-1)(k-2) graus de liberdade no numerador e
no denominador, respectivamente. Resumidamente, indicamos:
c k 1 k 1 k 2 0 FC ~ F( ( k- 1,( k- 1)( k 2 ),α ) , sob H0 .
Rejeitamos H0 para o nível de significância α se
FC > F( ( k- 1,( k- 1)( k 2 ),α ) ,
sendo, F( ( k- 1,( k- 1)( k 2 ),α ) o quantil de ordem (1 −α ) da distribuição F-Snedecor com (k -1)
e (k-1)(k-2) graus de liberdade no numerador e no denominador
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
130
7.8 Quadro da análise de variância (ANAVA)
Dispomos as expressões necessárias ao teste na Tabela abaixo, denominada de Quadro
de Análise de Variância (ANAVA).
Fontes de Variação G. L. S. Q. Q. M. F Tratamentos
k - 1 ( )Y Y
kk
2 2kt
2i 1
− +++++∑=
SQTr
k 1−
QMTr
QMR
Linhas
k - 1 ( )Y Y
kk
2 2ki
2i 1
− +++++∑=
SQL
k 1−
QML
QMR
Colunas Resíduo
k - 1
(k-1)(k-2)
( )YY
kk
2 2k j
2i 1
−+ + +++∑
=
≠
SQC
k 1−
SQL
k 1−
QMC
QMR
Total kr - 1 ( )2k k Y2Yijt 2ki 1 j 1
+++−∑ ∑= =
Pode-se provar que:
• E(QMR) = σ2 , ou seja, QMR é um estimador não viesado da variância σ2 ;
• E( QM)r) σ2 +( )
krti
k 1 i 1∑
− =, ou seja, QMTr é um estimador não viesado da variância σ2
se a hipótese H0 : t1 =t2 =... =tk = é verdadeira.
7.9 Detalhes computacionais
Apresentaremos alguns passos que facilitam os cálculos das somas de quadrados da
ANAVA.
• Calcule a correção para a média ( )+++=
2
2
YC M
k
• Calcule a Soma de Quadrados dos Totais (SQT)
= =
= −∑∑2
1 1
k k
i j ti j
S Q T Y C M
• Calcule a Soma de Quadrados Entre os Tratamentos (SQTr)
++= −
2t
YS Q T r C Mk
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
131
• Calcule a Soma de Quadrados das Linhas (SQL) ++
=
= −∑2
1
ki
j
YS Q L C Mk
• Calcule a Soma de Quadrados dasColunas (SQC) + +
=
= −∑2
1
kj
j
YS Q C C M
k
• Calcule a Soma de Quadrados Residual (SQR) pela diferença, isto é,SQR = SQT –
SQTr – SQL - SQC ;
• Calcule os Quadrados Médios Entre os Tratamentos (QMTr), o Quadrado Médio
Residual (QMR) o Quadrado Médio de Linhas (QML) e o Quadrado Médio de Colunas
(QMC)
=−
1S Q T rQ M T rk ,
( ) ( )=
− −1 2S Q RQ M R
k k , =−
1S Q LQ M Lk e =
−1
S Q CQ M Ck
• Calcule Fc para tratamentos, FC para Linhas e FC para Colunas
=C T r
Q M T rFQ M R =C L
Q M LFQ M R =C C
Q M CFQ M R
EXEMPLO 1: Vamos considerar os dados do exemplo apresentado no item1.
Os cálculos para montar-mos o quadro da ANAVA são:
k = 4, e k2 = N =16. Então
• Graus de liberdade:
Total= k2 - 1 = N - 1 = 16 - 1 = 15; Trat = k – 1 = 4 - 1 = 3
Linhas = k - 1 = 4 - 1 = 3 Colunas = k - 1 = 4 - 1 = 3 e
Res. = (k-1) (k-2) = (4)(2) = 8
• ( )
= =
25 4 , 9 31 8 8 , 5 8 1 6
1 6C M
• SQT = (3,26)2+ (4,15)2 +...+ (3,40)2 – CM = 192,1871 – 188,5816 =3,6055
• ( ) ( ) ( ) ( )++= − = + + + −
=
2 2 2 22 1 4 , 1 1 1 2 , 9 4 1 4 , 2 5 1 3 , 6 34 4 4 4
1 8 8 , 8 4 3 8 - 1 8 8 , 5 8 1 6 = 0 , 2 6 2 2
tYS Q T r C M C M
kS Q T r
• ( ) ( ) ( ) ( )++
=
= − = + + + −
=
∑
2 2 2 22
1
1 4 , 1 0 1 3 , 9 0 1 3 , 7 1 1 3 , 2 24 4 4 4
1 8 8 , 6 8 8 1 - 1 8 8 , 5 8 1 6 = 0 , 1 0 6 5
ki
j
YS Q L C M C Mk
S Q L
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
132
• ( ) ( ) ( ) ( )+ +
=
= − = + + + −
=
∑
2 2 2 22
1
1 2 , 6 4 1 4 , 7 6 1 2 , 4 5 1 5 , 0 84 4 4 4
1 9 0 , 0 0 9 0 - 1 8 8 , 5 8 1 6 = 1 , 4 2 7 4
kj
j
YS Q C C M C M
kS Q C
• SQR = SQT − SQTr − SQL −SQC = 3,6055 − 0,2622 −0,1065 −1,4274 =1,8094
• = = =−
0 , 2 6 2 2 0 , 0 8 7 41 3
S Q T rQ M T rk
• = = =−
0 , 1 0 6 5 0 , 0 3 5 51 3
S Q LQ M Lk
• = = =−
1 , 4 2 7 4 0 , 4 7 5 81 3
S Q CQ M Ck
• ( ) ( )
= = =− −
1 , 8 0 9 4 0 , 3 0 1 661 2
S Q RQ M Rk k
• = = =
0 , 0 8 7 4 0 , 2 8 9 80 , 3 0 1 6C T r
Q M T rFQ M R
• = = =
0 , 0 3 5 5 0 , 1 1 7 70 , 3 0 1 6C L
Q M LFQ M R
• = = =
0 , 4 7 5 8 1 , 5 7 7 60 , 3 0 1 6C C
Q M CFQ M R
Organizando estes resultados no Quadro da ANAVA, temos: Fontes de Variação G. L. S. Q. Q. M. F Tratamentos 3 0,2622 0,0874 0,2898 Linhas 3 0,1065 0,0355 Colunas Resíduo
3 6
1,4274 1,8094
0,4758 0,3016
Total 15 3,6055 Das tabelas das distribuições F, temos que F(3,6;0,05)= 4,76 e F(3,6;0,01)= 9,78.
O valor FcTr = 0,2898 é menor do que estes valores tabelados, então não rejeitamos a
hipótese nula H0 para um nível a = 0,05, ou5% de probabilidade e concluímos que os
dados não evidenciam uma diferença significativa entre as quatros drogas. Os dados
também não evidenciam uma variação significativa entre os efeitos colocados nas linhas
(p=0,946) e nas colunas (p=0,290). Seguindo o que alguns pesquisadores sugerem não
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
133
consideraríamos os efeitos de linhas e colunas em futuros experimentos, tendo em vista
que o valor do nível de significância para linhas e colunas é superior a 0,25.
Exemplo 2. Com o objetivo de estudar o efeito da idade da castração no
desenvolvimento e produção de suínos, foi utilizado um delineamento em quadrado latino
com 4 tratamentos envolvendo a castração aos 7 dias (C); aos 21 dias (D); aos 56 dias
(A) e suínos inteiros (B). A variação existente entre as leitegadas foi controlada pelas
linhas do quadrado e a variação dos pesos dos leitões dentro das leitegadas foi isolada
pelas colunas. Os ganhos de peso, em kg, ao final do experimento (252 dias) estão
apresentados no quadro a seguir:
Leitegada Pesos dos leitões dentro das leitegadas
1 2 3 4 Totais
1 93,0 (A) 108,6 (B) 108,9 (C) 102 (D) 412,5
2 115,4 (B) 96,5 (D) 77,9 (A) 100,2 (C) 390,0
3 102,1 (C) 94,9 (A) 116,9 (D) 96,0 (B) 409,9
4 117,6 (D) 114,1 (C) 118,7 (B) 97,6 (A) 448,0
Totais 428,1 414,1 422,4 395,8 1660,4
Organizando estes resultados no Quadro da ANAVA, temos: Fontes de Variação G. L. S. Q. Q. M. F Tratamentos 3 913,57 304,52 4,42 Linhas 3 436,55 145,52 2,11 Colunas Resíduo
3 6
148,95 413,00
49,65 68,83
0,72
Total 15 1912,07 Das tabelas das distribuições F, temos que F(3,6;0,05)= 4,76 e F(3,6;0,01)= 9,78.
O valor FcTr = 4,42 é menor do que estes valores tabelados, então não rejeitamos a
hipótese nula H0 para um nível a = 0,05, ou5% de probabilidade e concluímos a hipótese
de que os efeitos de tratamento são todos nulos não é rejeitada, ou seja, os ganhos de
peso dos leitões submetidos às diferentes idades de castração são todos iguais a 103,78.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
134
7.10 Como contornar o problema de pequeno número de graus de liberdade para o
resíduo ?
Um problema que aparece quando usamos o delineamento em quadrado latino com um
número pequeno de tratamentos, é que o resíduo passa a ser estimado com um número
pequeno de graus de liberdade. No quadro a seguir, apresentamos o número de graus de
liberdade do resíduo no DQL para diferentes números de tratamentos:
Número de tratamentos g.l. do resíduo 3 2 4 6 5 12 6 20 7 30 8 42
RESPOSTA: Planejar mais de uma repetição do quadrado latino para conseguir
um número satisfatório de graus de liberdade para o resíduo. Por exemplo, se k = 4
tratamentos e queremos um número de g.l. para o resíduo superior a 12, devemos
fazer pelo menos r = 2 repetições do Q.L. original.
Solução 1: usar as mesmas linhas e mesmas colunas;
QL1 C1 C2 C3 C4 QL1 C1 C2 C3 C4 L1 A B C D L1 D A B C L2 B C D A L2 C C D A L3 C D A B L3 B C D A L4 D A B C L4 A B C D
Quadro da ANAVA resultante
Causas de variação gl QL r – 1 = 2
Tratamentos k – 1 = 3 Linhas k – 1 = 3
Colunas k – 1 = 3 Resíduo (k – 1)[ r (k + 1) – 3] = 21
Total r (k2 – 1 ) = 31
Solução 2: usar as mesmas linhas com as colunas diferentes (ou mesmas colunas
com linhas diferentes);
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
135
QL1 C1 C2 C3 C4 QL1 C5 C6 C7 C8 L1 A B C D L1 D A B C L2 B C D A L2 C D A B L3 C D A B L3 B C D A L4 D A B C L4 A B C D
Quadro da ANAVA resultante Causas de variação gl
QL r – 1 = 2 Tratamentos k – 1 = 3
Linhas k – 1 = 3 Colunas (QL) r ( k – 1 ) = 6
Resíduo (k – 1)(r k – 2 )= 18 Total r (k2 – 1 ) = 31
Solução 3: usar linhas e colunas diferentes.
QL1 C1 C2 C3 C4 QL1 C5 C6 C7 C8 L1 A B C D L5 D A B C L2 B C D A L6 C D A B L3 C D A B L7 B C D A L4 D A B C L8 A B C D
Quadro da ANAVA resultante
Causas de variação gl QL r – 1 = 2
Tratamentos k – 1 = 3 Linhas(QL)* r ( k - 1) = 6
Colunas (QL)** r ( k – 1 ) = 6 Resíduo (k – 1) [ k (k – 1) –1]=15
Total r (k2 – 1 ) = 31 (*) lê-se “Efeito de linhas dentro de quadrado latino”
(**) lê-se “Efeito de colunas dentro de quadrado latino” Suponha que um experimentador esteja interessado em estudar os efeitos da atividade
da estimulação hormonal folicular (follicle-stimulation hormone - FSH) em vacas é medido
em bioensaios pesando-se o ovário (mg) de ratos imaturos. Duas variáveis conhecidas
que influenciam o peso de ovários de ratos são: a constituição genética e o peso
corporal. Acredita-se que o peso corporal é independente das diferenças genéticas,
assim o delineamento quadrado latino (DQL) é adequado.
Dois quadrados latinos 4 x 4 foram usados com as linhas = ninhadas de ratos e colunas =
classes de peso corporal. O pesquisador considerou a diferença nos pesos corporais nos
dois quadrados para preservar os graus de liberdade do erro experimental, dado que a
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
136
amplitude do peso corporal era consistente de ninhada para ninhada, ou seja, o
pesquisador repetiu o experimento considerando as mesmas classes de peso corporal
(Solução 2).
QL1 C1 C2 C3 C4 totais QL1 C5 C6 C7 C8 Totais L1 (D) 44 (C) 39 (B) 52 (A) 73 208 L5 (B) 51 (C) 74 (A) 74 (D) 82 270 L2 (B) 26 (A) 45 (D) 49 (C) 58 178 L6 (D) 62 (A) 74 (C) 75 (B) 79 290 L3 (C) 67 (D) 71 (A) 41 (B) 76 295 L7 (A) 71 (D) 67 (B) 60 (C) 74 272 L4 (A) 77 (B) 74 (C) 88 (D) 100 339 L8 (C) 49 (B) 47 (D) 58 (A) 68 222
Totais 214 229 270 307 1020 Totais 233 251 267 303 1054
Totais dos tratamentos: 563 (A), 465 (B), 513 (C), 533 (D)
Cálculos:
• ( )++ +
= − =
22 2 1 0 2 0 1 0 5 44 4 . . . 6 8 7 7 1 0
8 3 2S Q T
• ( )++ +
= − =
22 2 1 0 2 0 1 0 5 45 6 3 . . . 5 3 3 6 3 5
8 3 2S Q T r
• ( )++ + +
= − =
22 2 2 1 0 2 0 1 0 5 42 0 8 1 7 8 . . . 2 2 2 4 8 8 9
4 3 2S Q L
• ( ) ( ) ( )+ + + +
= − =
2 2 22 1 4 2 2 3 . . . 3 0 7 + 3 0 3 1 0 2 0 1 0 5 41 9 1 4
8 3 2S Q C
Quadro da ANAVA resultante Fontes de variação gl SQ QM F
QL 1 20 20 Tratamentos 3 635 221,67 13,05
Linhas 6 4889 814,83 50,24 Colunas * 3 1914 638,00 39,33 Resíduo 18 292 16,22
Total 31 7730
Das tabelas das distribuições F, temos que F(3,18;0,05) =3,16 e F(3,18;0,05) = 5,09 . O valor
FcTr = 13,05 é maior que estes valores tabelados, então rejeitamos a hipótese nula H0
para um nível a = 0,01, ou1% de probabilidade e concluímos que a hipótese de que os
efeitos de tratamento são todos nulos é rejeitada, ou seja, os pesos dos ovários de ratos
imaturos (bioensaio para vacas) existe pelo menos dois tratamentos que diferem entre si
no peso de ovários.
Podemos usar o teste de Tukey para compararmos as médias dos tratamentos (note que
temos 4 tratamentos e cada um deles aparece 8 vezes). Então,
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
137
( )= = =8 ,1 8 ; 0 , 0 5
1 6 , 2 24 , 0 8 8 , 2 7 2 28
Q M Rd m s qr k
Drogas Peso médio* (mg)
A 70,4 a D 66,6 a C 64,1 ab B 58,1 b
* Médias seguidas pelas mesmas letras na coluna não diferem entre si pelo teste de Tukey a 5%.
Baseado nos resultados apresentados na tabela anterior pode-se afirmar que os pesos
de ovários tratados com as drogas A, D e C não diferem entre si e os pesos dos ovários
tratados com as drogas C e B também não diferem entre si. As diferenças nos pesos de
ovários estão entre as drogas A e D quando comparadas, individualmente, com a droga
B.
7.11 Casualização dos tratamentos
Suponha que queremos dispor os tratamentos A, B, C, e D sobre um quadrado latino 4 x
4 • escolhemos aleatoriamente um dos quadrados padrões de tamanho 4.
Suponha
1 2 3 4
1 A B C D
2 B C D A
3 C D A B
4 D A B C
• selecionemos uma das permutações de 1, 2, 3, e 4. suponha 2, 4, 1, 3.
então
1 2 3 4
2 B C D A
4 D A B C
1 A B C D
3 C D A B
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
138
• selecionemos uma outra das permutações de 1, 2, 3, e 4. suponha 1, 3, 4, 2.
então
1 2 3 4
2 B D A C
4 D B C A
1 A C D B
3 C A B D
Este é o delineamento escolhido.
7.12. Exemplos em que as unidades experimentais são animais ou pessoas
Neste tipo de experimento os próprios animais ou pessoas servem como um critério de
classificação (linhas) e o tempo (colunas) é o outro, ou seja, medidas repetidas não
aleatórias são obtidas de cada animal (pessoa) distribuídos a uma seqüência de
tratamentos.
Exemplo1
Por exemplo,
• avaliação da digestibilidade total aparente em cinco rações calculadas para conter : 7,0;
9,5; 12,0; 14,5 e 17,0 % de proteína bruta com base na matéria seca, tendo como
ingredientes feno de capim elefante, fubá de milho, farelo de soja e mistura mineral;
• a condução do experimento exige gaiolas metabólicas individuais para medir o consumo
da ração, coleta de fezes, urina, etc. cada gaiola conterá um novilho zebu com peso em
torno de 280 kg;
• o processo de digestão permite a obtenção de resposta no tempo. Assim sendo definiu-
se por cinco períodos sequênciais de 21 dias cada, nos quais 14 dias iniciais seriam
considerados de adaptação à ração e os 7 dias finais para o registro de resultados;
• cada período experimental deveria conter as cinco rações, testadas uma em cada
animal. o efeito do período deve ser blocado porque condições climáticas variáveis entre
os períodos podem afetar o consumo e a digestibilidade;
• o efeito dos cinco novilhos deve ser blocado;
• o delineamento escolhido é o D.Q.L 5 x 5;
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
139
• a resposta medida foi a digestibilidade aparente de carboidratos totais (%).
Novilho PERÍODOS
1 2 3 4 5 Totais
B246 46 (A) 60 (B) 62 (C) 69 (D) 65 (E) 302
AT14 65 (E) 69 (A) 72 (D) 64 (B) 60 (C) 330
NN89 54 (C) 80 (D) 67 (A) 71 (E) 63 (B) 335
AG90 63 (B) 72 (C) 74 (E) 66 (A) 64 (D) 339
SS45 69 (D) 85 (E) 74 (B) 72 (C) 70 (A) 370
Totais 297 366 349 342 322 1676
(COMO EXERCÍCIO, OBTENHA A ANÁLISE DE VARIÂNCIA PARA ESTE
EXPERIMENTO)
Exemplo 2:
• avaliação do efeito de anestésicos sobre o metabolismo animal é imprescindível ao
cirurgião;
• vamos considerar 5 anestésicos e analisar variáveis como: frequência
cardíaca,respiratória, pressão sanguínea, tempo efetivo de anestesia. Estas variáveis são
muito instáveis com c.v. > 35,0 %. Existe uma reação muito diferente de animal para
animal o que exigiria um número muito grande destes ( de 13 a 49 animais) para cada
anestésico.
• por outro lado estas respostas são de fluxo contínuo. Podemos testar todos os
anestésicos, em ocasiões diferentes com intervalos de 2 a 3 dias, no mesmo animal.
• se um animal recebe todos os anestésicos , em sequência controlada, todos os demais
deverão também recebê-los, mas cada um dos cachorros deverá estar submetido a um
anestésico diferente, de modo que , em um mesmo dia, todos os cães e todos os
anestésicos estejam sendo testados. Com este procedimento, o eventual efeito de dia
poderá estar controlado.
• a maneira mais simples de se controlar o efeito de dia de experimentação (ou período) e
o efeito de cães, é o efeito de controle local (blocos);
• uma solução prática que leva em conta os dois tipos de blocagem (período e animal) é o
croqui do delineamento quadrado latino (D.Q.L.) onde as letras representam um
anestésico específico.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
140
PERÍODO
ANIMAL 1 2 3 4 5
1 A E B D C
2 D B A C E
3 C A E B D
4 E C D A B
5 B D C E A
Resumo
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
141
Exercícios 1. Um pesquisador instalou um experimento para comparar 5 tipos de bacilos (A, B, C,D,
e E) usados para produção de iogurte. No momento da instalação do experimento, o
pesquisador verificou que o material experimental disponível (25 unidades de 1 litro de
leite) não era completamente homogêneo entre si, pois apresentavam variação quanto ao
teor de gordura e grau de acidez. Para controlar estas duas fontes de variação, o
pesquisador distribuiu os bacilos ao acaso às amostras de leite de tal forma que cada
bacilo pudesse ser testado em todas as condições de teor de gordura e grau de acidez. O
quadro dado a seguir ilustra a distribuição dos bacilos às amostras de leite bem como o
volume (em ml) de iogurte produzido:
Grau de Acidez
Totais Teor de Gordura 1 2 3 4 5
1 450 A
620 E
680 C
620 D
780 B
3150
2 750 C
990 B
750 E
660 A
830 D
3980
3 750 D
910 C
690 A
990 B
760 E
4100
4 650 E
890 C
835 B
850 C
875 A
4100
5 750 B
720 A
850 D
770 E
890 C
3980
Totais 3350 4130 3805 3890 4135 19310
Com base nas informações fornecidas, pergunta-se:
1. Qual foi a unidade experimental utilizada?
2. Quais foram os tratamentos em teste?
3. Quantas vezes o princípio do controle local foi utilizado neste experimento?
4. Qual foi o Delineamento experimental utilizado nesta pesquisa?
5. Usando os dados experimentais fornecidos anteriormente e o teste F para testar a
fonte de variação bacilos, pode-se concluir que ao nível de 5% de probabilidade que a)
existe pelo menos um contraste entre médias de bacilos estatisticamente diferente de
zero
b) todos os possíveis contrastes entre médias de bacilos são estatisticamente nulos
c) o bacilo A é o melhor
d) o bacilo B é o melhor
e) o bacilo C é o melhor
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
142
f) nenhuma das alternativas anteriores
6. O teste de Tukey indica que o(s) bacilo(s) que proporciona(m) maior(es) média(s)
de produção de iogurte é (são) (use o nível de 5% de significância) foi(ram)
a) o bacilo A
b) o bacilo B
c) o bacilo C
d) o bacilo D
e) o bacilo E
f) os bacilos A, B e C
g) os bacilos B, C e D
h) os bacilos C, D e E
i) os bacilos A, D e E
j) nenhuma das alternativas anteriores
2. Um experimento foi conduzido numa região do Pantanal com o objetivo de selecionar
forrageiras que garantissem uma maior produção de matéria seca. Foi utilizado o
delineamento em quadrado latino, buscando controlar diferenças de fertilidade em duas
direções, sendo avaliadas 7 forrageiras (A, B, C, D, E, F, G). Foram obtidos os seguintes
resultados parciais com a realização do experimento:
Tratamentos A B C D E F G
Totais 30,8 25,2 19,6 14 13,3 9,8 8,4
Linhas 1 2 3 4 5 6 7
Totais 18,9 19,9 14,5 18,1 15,6 17,4 16,7
SQTotal = 72,36 SQColunas = 1,27
Verificar se existe efeito significativo de forrageiras, pelo teste F, e concluir para α=1%.
3. Num experimento de competição de variedades de cana forrageira foram usadas 5
variedades: A=CO290; B=CO294; C=CO297; D=CO299 e E=CO295, dispostas em um
quadrado latino 5x5. O controle feito através de blocos horizontais e verticais teve por
objetivo eliminar influências devidas a diferenças de fertilidade em duas direções. As
produções, em kg/parcela, foram as seguintes:
Colunas
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
143
Linhas 1 2 3 4 5 Totais
1 432(D) 518(A) 458(B) 583(C) 331(E) 2322
2 724(C) 478(E) 524(A) 550(B) 400(D) 2676
3 489(E) 384(B) 556(C) 297(D) 420(A) 2146
4 494(B) 500(D) 313(E) 486(A) 501(C) 2294
5 515(A) 660(C) 438(D) 394(E) 501(C) 2325
Totais 2654 2540 2289 2310 1970 11763
Considerando α = 5% , pede-se:
a. Análise de Variância
b. Qual a variedade a ser recomendada? Utilize teste de Tukey, se necessário
4. Aplicar o teste de Tukey para comparar as médias de tratamentos, relativos ao
Quadrado Latino 5x5, dados:
SQResiduo = 34116,0 α = 5%
T1 = 3024,0; T2 = 2549,0; T3 = 2349,0; T4 = 1970,0; T5 = 1734,0
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
144
C A P Í T U L O 8
EXPERIMENTOS FATORAIS
8.1 Introdução
Experimentos fatoriais são aqueles em que se estudam simultaneamente dois ou mais
fatores, cada um deles com dois ou mais níveis. O fatorial é um tipo de esquema, ou seja,
uma das maneiras de organizar os tratamentos e não um tipo de delineamento, que
representa a maneira pela qual os tratamentos são distribuídos às unidades
experimentais. Na verdade, os experimentos fatoriais são montados segundo um tipo de
delineamento experimental, como por exemplo: o DIC e o DBC.
Nos experimentos fatoriais, os tratamentos são obtidos pelas combinações dos níveis dos
fatores. Num experimento fatorial completo, cada nível de um fator combina com todos os
níveis dos outros fatores. A principal aplicação de experimentos fatoriais é quando se
quer saber sobre o efeito de diversos fatores que influenciam na variável em estudo e o
relacionamento entre eles.
A simbologia comumente utilizada, para experimentos fatoriais é indicar o produto dos
níveis dos fatores em teste. Por exemplo: Experimento Fatorial 2x4x6. O produto 2x4x6
informa que no experimento foram testados simultaneamente 3 fatores. O primeiro possui
2 níveis, o segundo 4 níveis e o terceiro 6 níveis. Quando o número de níveis é igual para
todos os fatores, pode-se utilizar a seguinte simbologia: nF, em que F é o número de
fatores n é o número de níveis de cada fator. Por exemplo: Experimento Fatorial 43. A
potência 43 informa que o experimento tem 3 fatores com 4 níveis cada um.
8.2. Tipos de efeitos avaliados em um experimento fatorial Nos experimentos fatoriais, podem ser estudados os seguintes efeitos:
8.2.1. Efeito simples de um fator
como a medida da variação que ocorre com a característica em estudo (ganho de peso,
neste exemplo) correspondente às variações nos níveis desse fator, em cada um dos
níveis do outro fator.
• Efeito simples do antibiótico no nível 0 de vitamina B12 :
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
145
A(dentro de b0) = a1 b0 - a0 b0= 32 – 14 = 18 0
• Efeito simples do antibiótico no nível 1 de vitamina B12:
A(dentro de b1) = a1 b1- a0 b1= 53 - 23 = 30
• Efeito simples da vitamina B12 no nível 0 de antibiótico :
B(dentro de a0)= a0 b1 – a0 b0 = 23 - 14 =9
• Efeito simples da vitamina B12 no nível 1 de antibiótico :
B(dentro de a1)= a1 b1 - a0 b0 = 53 - 32 = 21
8.2.2. Efeito principal de um fator
é uma medida da variação que ocorre com a característica em estudo, correspondente
às variações nos níveis desse fator, em média, de todos os níveis do outro fator.
( ) ( )
( ) ( )
18 3024
2
B9 21
152
A Adentro de b dentro de b0 1Efeito principal de A=
2B
dentro de a dentro de a0 1Efeito principal de B=2
++
= =
++
= =
8.2.3. Efeito de interação entre os dois fatores
é uma medida da variação que ocorre com a característica em estudo, correspondente às
variações nos níveis de um fator, ao passar de um nível a outro do outro fator.
( ) ( )
( ) ( )
30 186
2
B21 9
62
A - Adentro de b dentro de b0 1Efeito da interação de AxB=
2B
dentro de a dentro de a0 1Efeito da interação de BxA=2
−= =
−−
= =
isto é, tanto faz calcular a interação A x B como a interação B x A - Efeito de Interação: é o efeito simultâneo dos fatores sobre a variável em estudo.
Dizemos que ocorre interação entre os fatores quando os efeitos dos níveis de um fator
são modificados pelos níveis do outro fator.
O efeito da interação pode ser mais facilmente compreendido por meio de gráficos. Para
ilustrar o efeito da interação, considere um experimento fatorial 3x2, em que os fatores
em testes são Variedade (V) e Espaçamento (E). Os tratamentos para este experimento
são os seguintes:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
146
V1E1 V2E1 V3E1
V1E2 V2E2 V3E2
Suponha os seguintes resultados fictícios, para a variável altura de plantas (cm), deste
experimento, nas seguintes situações:
1) Não há interação
Variedades Espaçamento V1 V2 V3
E1 8 10 12 E2 6 8 10
Quando não há interação as diferenças entre os resultados dos níveis de um fator são
estatisticamente iguais para todos os níveis do outro fator.
2) Há interação Variedades Espaçamento V1 V2 V3
E1 2 4 6 E2 5 10 2
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
147
8.3. Quadro de tabulação de dados Uma maneira de tabular os dados de um experimento fatorial, com dois fatores A e B,
com I e níveis, respectivamente, instalados segundo o DIC, com K repetições, é fornecida
a seguir:
A1 A2 A3 Repetição B1 B2 ... BJ B1 B2 ... BJ ... B1 B2 ... BJ
Y111 Y121 Y1J1 Y211 Y221 Y2J1 Yi11 YI21 YIJ1 Y112 Y122 Y1J2 Y212 Y222 Y2J2 YI12 YI22 YIJ2 ... ... ... ... ... ... ... ... ... ... ... ... Y11K Y12K Y1JK Y21K Y22K Y2JK YI1K YI2K YIJK Total Y11• Y12• Y1J• Y21• Y22• Y2J• YI1• YI2• YIJ•
Deste quadro, pode-se tirar algumas informações que posteriormente serão úteis na
análise de variância:
Total do ij-ésimo tratamento: ( )K
IJK IJIJk
AB Y Y •=
= =∑1
Total do i-ésimo nível do fator A: J ,K
I IJK I
j ,k
A Y Y ••= =
= =∑1 1
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
148
Total do j-ésimo nível do fator B: J ,K
J IJK J
j ,k
B Y Y• •= =
= =∑1 1
Total Geral: I ,J,K I J
IJK I J
I , j ,k i i j
G Y A B Y= = = = =
= = = =∑ ∑ ∑1 1 1 1 iii
Média do i-ésimo nível do fator A: i
iA
Am
JK=
Média do j-ésimo nível do fator B: J
j
B
Bm
IK=
Média geral: G
mN
=
Número total de parcelas: N=IJK
Pode-se montar um quadro auxiliar contendo os totais de tratamentos, cujos valores são
obtidos pela soma de todas as repetições para o tratamento em questão. Este quadro
facilita o cálculo das somas de quadrados devido aos fatores A e B, e da interação entre
eles. Para a situação citada, o quadro de totais de tratamentos é do seguinte tipo:
Fator A Fator B
B1 B2 ... BJ Totais A1 Y111 Y121 Y1J1 A1
A2 Y112 Y122 Y1J2 A2
... ... ... ... ... ... AI YI1. YI2. YIj. AI
Totais B1 B2 Bj G
8.4. Modelo matemático de um experimento fatorial
O modelo de um experimento fatorial com dois fatores, num delineamento inteiramente
casualizado com r repetições, pode ser escrito como:
yijk i j ij ijkµ α β (αβ) ε= + + + +
Sendo:
• yijk é a k ésima resposta que recebeu o i ésimo nível do fator α e o j ésimo nível do fator
β
• µ é uma constante (média ) comum a todas as observações;
• αi é o efeito do i ésimo nível do fator com i 1,...,a;
• βj é o efeito do j ésimo nível do fator com j 1, ...,b;
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
149
(αβ)ij é o efeito da interação do i- ésimo nível do fator α com o efeito do j- ésimo nível do
fator β
• εijk é o erro experimental associado à observação yijk com k 1... r,
8.5. Análise de Variância
A análise de variância de um experimento fatorial é feita desdobrando-se a soma de
quadrados de tratamentos nas partes devido aos efeitos principais de cada fator e na
parte devido à interação entre os fatores. O quadro a seguir apresenta como seria a
análise de um experimento fatorial, com 2 fatores A e B, com I e J níveis,
respectivamente, e K repetições, instalado segundo o DIC.
FV GL SQ QM F A (I-1) SQA ( )SQA I −
1
B (J-1) SQB ( )SQB J −1
A x B (I-1)(J-1) SQAxB ( )( )SQAxB I J− −1 1
Tratamentos (IJ-1) (SQTrat) ( )SQTrat IJ −1
Residuo n2=IJ(K-1) SQRes Total IJK – 1 SQTotal
As fórmulas para a obtenção das somas de quadrados são as seguintes:
I,J ,K
ijk
i ,j ,k
SQTotal Y C= = =
= −∑2
1 1 1 I,J
ij
i ,j
YSQTrat C
K= =
= −∑2
1 1
Jj
j
BSQB C
IK=
= −∑2
1
I,J ,K
ijk
i ,j ,k
Y
CIJK
= = =
=∑
2
1 1 1
Ii
i
ASQA C
Jk=
= −∑2
1 J
j
j
BSQB C
ik=
= −∑2
1
SQResíduo = SQTotal – SQTrat SQAxB = SQTrat – SQA – SQB
O quadro abaixo apresenta como seria a análise de um experimento fatorial, com 2
fatores A e B, com I e J níveis, respectivamente, e K repetições (ou blocos), instalado
segundo o DBC.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
150
FV GL SQ QM F A (I-1) SQA ( )SQA I −
1
B (J-1) SQB ( )SQB J −1
A x B (I-1)(J-1) SQAxB ( )( )SQAxB I J− −1 1
Tratamentos (IJ-1) (SQTrat) ( )SQTrat IJ −1
Blocos K-1 SQBlocos Residuo n2=(IJ-1)(K-1) SQRes Total IJK – 1 SQTotal
Nesta situação
Kk
k
WSQBlocos C
IJ=
= −∑2
1
em que,
→ Total do k-ésimo bloco:Wk=I ,J
k ijk k
i , j
W Y Y= =
= =∑1 1 iii
Conforme apresentado nas duas tabelas anteriores, na análise dos dados oriundos de
um experimento fatorial, para os dois tipos de delineamentos, deve-se inicialmente
proceder ao teste F para a interação entre os fatores. As hipóteses para o teste F da
interação são:
H0: Os fatores A e B atuam independentemente sobre a variável resposta em estudo.
Ha: Os fatores A e B não atuam independentemente sobre a variável resposta em estudo.
O resultado deste teste F para a interação indica como as comparações dos níveis de um
fator devem ser realizadas. Temos dois resultados possíveis para o teste F da interação
os quais serão apresentados a seguir.
8.5.1 Interação não-significativa Este caso ocorre quando a hipótese H0 para a interação entre os fatores não é rejeitada.
Este resultado implica que os efeitos dos fatores atuam de forma independente.
Portanto recomenda-se que as comparações dos níveis de um fator sejam feitas de
forma geral em relação ao outro fator, ou seja, independente dos níveis outro fator. O
passo seguinte na análise estatística dos dados experimentais é proceder ao
teste F para cada fator como ilustrado na tabela apresentada a seguir para o caso
do DBC.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
151
FV GL SQ QM F A (I-1) SQA ( )SQA I −
1
B (J-1) SQB ( )SQB J −1
A x B (I-1)(J-1) SQAxB ( )( )SQAxB I J− −1 1
Não significativo
Tratamentos (IJ-1) (SQTrat) ( )SQTrat IJ −1
Blocos K-1 SQBlocos Residuo n2=(IJ-1)(K-1) SQRes Total IJK – 1 SQTotal
As hipóteses para realizar o teste F para os efeitos principais são:
Fator A
H0: mA1 = mA2 =...= mAI ou seja, todos os possíveis contrastes entre as médias dos
níveis do fator A, são estatisticamente nulos, ao nível de probabilidade em que foi
executado o teste.
Ha:não H0 ou seja, existe pelo menos um contraste entre as médias dos níveis do fator A,
que é estatisticamente diferente de zero, ao nível de probabilidade em que foi executado
o teste. Fator B
H0: mB1 = mB2 =... = mBJ ou seja, todos os possíveis contrastes entre as médias dos
níveis do fator B, são estatisticamente nulos, ao nível de probabilidade em que foi
executado o teste.
Ha:não H0 ou seja, existe pelo menos um contraste entre as médias dos níveis do fator B,
que é estatisticamente diferente de zero, ao nível de probabilidade em que foi executado
o teste.
Se os fatores A e B forem qualitativos, e o teste F para A e/ou B, for não significativo, a
aplicação do teste de médias é desnecessária. Se o teste F for significativo, para A e/ou
B, aplica-se um teste de médias para comparar os níveis do fator. As estimativas das
médias dos níveis dos fatores são obtidas por
i
iA
AFator A m
JK→ =
i
j
B
BFator B m
IK→ =
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
152
Para realizar o teste de Tukey para comparar as medias dos níveis dos fatores em teste
temos que usar
∆ qα
A QMRes
qJK
(I;n2)
B QMResq
IK (J;n2)
Para o teste de Duncan temos que usar
∆ qα
A i
QMResZ
JK (nA;n2)
B i
QMResZ
IK (nB;n2)
Em que nA e nB são os números de médias ordenadas abrangidas pelo contraste sendo
testados.
As hipóteses para os testes Tukey e Duncan para comparar as médias dos níveis dos
fatores são
Fator A → H0 : mAi = mAu versus Ha : mAi ≠ mAu para i ≠ u = 1, 2, 3, ... , I
Fator B → H0 : mBj = mBu versus Ha : mBj ≠ mBu para j ≠ u = 1, 2, 3, ... , J
Para a aplicação do teste t temos que usar
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
153
t tα
A A A
I
i
i
C C
QMResa
JK =
−
∑2
1
tα (n2)
B B B
I
i
i
C C
QMResb
IK =
−
∑2
1
tα (;n2)
Em que
CA = a1mA1 + a2mA2 + ... + aImAI e
CB = b1mB1 + b2mB2 + ... + bImBJ
Para a aplicação do teste Scheffé para testar os contrastes YA e YB temos que usar
S Ftab
A ( )I
TAB i
i
QMResS I F a
JK =
= − ∑2
1
1 Ftα [(I-1);n2]
B ( )J
TAB j
j
QMResS J F b
IK =
= − ∑2
1
1 Fα [(J-1);n2]
As hipóteses para os testes de Scheffé e t para testar os contrastes são
Fator A → H0 : CA = 0 versus Ha : CA ≠ 0
Fator B → H0 : CB = 0 versus Ha : CB ≠ 0
Exemplo Fatorial 2 x 3 (com interação não significativa):
O crescimento do conteúdo de água em tecidos de lesmas sob 6 diferentes condições
experimentais foi avaliada. As 6 condições foram obtidas combinado-se os dois níveis de
temperatura (fator A) com três níveis de umidade (fator B) com.
Foram feitas 4 repetições para cada combinação de tratamento. Os resultados, em
porcentagem, foram :
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
154
Fator umidade (%) Fator temperatura(0C) 45 75 100
20 76 64 72 82 100 96 79 71 86 86 92 100
30 72 72 72 75 100 94
64 70 82 84 98 99
Os totais das 4 repetições para o fatorial A x B = (2)(3)= 6 tratamentos são os
seguintes:
(4) Níveis de A (Temperatura
ºC))
Níveis de B (Umidade (%)) Total
b1 = 45 % b2 = 75 % b3 = 100 %
a1 = 20 ºC 290 326 388 1004 a2 = 30 ºC 278 313 391 982 Total 568 639 779 1986
( )2 2Y 19862 2 2 2
SQ Y Y 76 99 3386 5T 111 222 a b r 2 3 4
2 2 2 2 2 2 2 2 2Y Y Y Y Y 290 326 391 198611 12 21 22SQ 2922TRr r r r a b r 4 4 4 2 3 4
22 2 2YY Y Y1 2 iSQ Abr br br a b
... ( ... ) ,( )( )( ) ( )( )( )
...( )( )( ) ( )( )( )
( ) ...( )(
+++= + + − = + + − =+
+++= + + + − = + + + − =
++ ++ ++ +++= + + + −
( )
2 2 21004 982 1986
20 17r 3 4 3 4 2 3 4
22 2 2 2 2 2YY Y Y 568 779 19861 2 iSQ B 2881 75ar ar ar a b r 2 4 2 4 2 3 4
SQ SQ SQ A SQ B 2922 20 17 2881 75 20 8TRA x B
,)( ) ( )( ) ( )( ) ( )( )( )
( ) ... ,( )( )( ) ( )( ) ( )( ) ( )( )( )
( ) ( ) , , ,
= + − =
+ + + + + + +++= + + + − = + − =
= − − = − − =Quadro da ANAVA no DIC
Fonte de variação gl SQ QM Fc Temperatura (A) 1 20,17 20,17 0,78 ns
Umidade (B) 2 2881,75 1440,88 55,85**
Int. AxB 2 20,08 10,04 0,39 ns
Tratamentos (5) 2922,00 Resíduo 18 464,5 25,81 Total 23 3386,5 F(1, 18; 0,05) = 4,41 F(1, 18, 0,01)= 8,29 F(2, 18; 0,05)= 3,55 F(2, 18, 0,01)= 6,01 F(5, 18; 0,05) = 2,77 F(5, 18, 0,01)= 4,25 Do quadro acima, observamos que o teste da interação entre a temperatura e umidade
não é significativa (p>0,05), e concluímos que os dados não suportam a hipótese de uma
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
155
interação entre temperatura e umidade. Dado que a interação não foi significativa, a
análise prossegue analisando-se os efeitos principais da temperatura e da umidade
isoladamente. Isto pode ser feito analisando-se os dois tipos de diferenças:
• as diferenças entre os conteúdos médios da água nos tecidos nos dois níveis de A
(temperatura).
• as diferenças entre os conteúdos médios da água nos tecidos nos três níveis de B
(umidade).
O teste F para o efeito principal A é não significativo (p>0,05), e portanto não existe
evidências suficientes para concluir que os valores médios do conteúdo da água nos
tecidos são diferentes nos dois níveis de temperatura, entretanto, o teste F para o efeito
principal da umidade é altamente significativo (p<0,01), o que implica que os dados
suportam a conclusão de que os valores médios do conteúdo da água nos tecidos não
são os mesmos nos três níveis da umidade. Isto pode ser visualizado na tabela de
médias abaixo (última linha):
(4) Níveis de A
(Temperatura ºC))
Níveis de B (Umidade (%)) Médias de A Temperatura
b1 = 45 % b2 = 75 % b3 = 100 %
a1 = 20 ºC
a2 = 30 ºC
72,5 81,5 97,00
69,5 78,25 97,75
83,67 A
81,83 A
Médias de B
Umidade
71,00 a 79,88 b 97,38 c 82,75
Médias com a mesma letra maiúscula nas colunas não diferem entre si pelo teste de Tukey a 5% Médias com a mesma letra minúscula nas linhas não diferem entre si pelo teste de Tukey a 5%
Cálculos do teste de Tukey:
• para o efeito principal A (temperatura):
q(2;18;0,05) = 2,97
25 81dms 2 97 4 36A
12
,, ,= =
• para o efeito principal de B (Umidade):
q(2;18;0,05) = 3,63
25 81dms 3 63 6 52B
8
,, ,= =
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
156
O gráfico das médias dos tratamentos fornece um conveniente método de mostrar os
resultados. As linhas sólidas no gráfico da interação são praticamente paralelas; isto
confirma o resultado do teste F para a interação entre temperatura e umidade.
Mais ainda, a proximidade das duas linhas sólidas indicam que a diferença entre as
respostas médias observadas nas duas temperaturas são não significativas; esta
conclusão é confirmada pelo teste F do efeito principal da temperatura. Uma checagem
gráfica para presença do efeito principal da umidade é dada pela orientação da linha
pontilhada. Se o efeito principal de tal efeito não estivesse presente, então a linha
pontilhada deveria estar paralela ao eixo x. O gráfico mostra que não é este o caso. O
teste F para o efeito principal de B (umidade) suporta esta conclusão.
Outra forma de explicar a significância do fator B é por meio da regressão polinomial
Umidade (%)
Média obs
ervada
do conteú
do da águ
a (%)
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
157
Gráfico das médias do fator B Equação ajustada
y=82.471-0.585*x+0.007*x^2+eps
8.5.2 Interação significativa
Este caso ocorre quando a hipótese H0 para a interação entre os fatores é rejeitada. Este
resultado implica que os efeitos dos fatores atuam de forma dependente. Neste caso as
comparações entre os níveis de um fator levam em consideração o nível do outro fator,
pois o resultado significativo para a interação indica que o efeito de um fator depende do
nível do outro fator.
Portanto, não é recomendado realizar o teste F para cada fator isoladamente tal como foi
apresentado para o caso da interação nãosignificativa.
O procedimento recomendado é realizar o desdobramento do efeito da interação.
Para realizar este desdobramento deve-se fazer uma nova análise de variância em que
os níveis de um fator são comparados dentro de cada nível do outro fator, tal como
apresentado nas tabelas a seguir.
40 45 50 55 60 65 70 75 80 85 90 95 100 105
Média obs
ervada
do conteú
do da águ
a (%)
100 96 92 88 84 80 76 72 68
Umidade (%)
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
158
Desdobramento para comparar os níveis de A dentro de cada nível de B, ou seja, estudar
A/B
FV GL SQ QM F A/B1 (I-1) SQA/B1
( )SQA / B
I −
11
QMA / B
QMRes
1
A/B2 (I-1) SQA/B2
( )SQA / B
I −
21
QMA / B
QMRes
2
... ... ... ... A/BJ (I-1) SQA/BJ
( )SQA / BJ
I −1
QMA / BJ
QMRes
Residuo n2 SQRes Total IJK – 1 SQTotal
As hipóteses para testar as fontes de variação da tabela acima, para j=1, 2, 3, ..., J, são
H0 : mA1/Bj = mA2/Bj = ... = mAI/Bj
Ha:não H0
Desdobramento para comparar os níveis de B dentro de cada nível de A, ou seja estudar
B/A
FV GL SQ QM F B/A1 (J-1) SQA/A1
( )SQA / A
J −
11
QMB / A
QMRes
1
B/A2 (J-1) SQA/A2
( )SQA / A
J −
21
QMB / A
QMRes
2
... ... ... ... B/AI (J-1) SQA/AI
( )SQA / AI
J −1
QMB / AI
QMRes
Residuo n2 SQRes Total IJK – 1 SQTotal
As hipóteses para testar as fontes de variação da tabela acima, para i=1, 2, 3, ..., I, são
H0 : mB1/Ai = mB2/Ai = ... = mBJ/Ai
Ha:não H0
Em que as SQA/Bj e SQB/Ai podem ser obtidas usando a fórmula geral para a soma de
quadrados dada por
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
159
k
ikii
ki i
i
i
Xx
SQr
r
=
=
=
= −∑
∑∑
2
21
1
1
Se os fatores forem qualitativos, procede-se ao teste F para cada fonte de variação do
desdobramento. Nas fontes de variação em que o teste F foi significativo e o fator tem
mais de dois níveis, recomenda-se a aplicação de um teste de médias. As estimativas
das médias dos níveis dos fatores são obtidas por
Fator A → iAi
Am
K=
Fator B → j
Bj
Bm
K=
Para realizar o teste de Tukey para comparar as médias dos níveis dos fatores em teste
temos que usar
∆ qα
A QMRes
qK
(I;n2)
B QMResq
K (J;n2)
Para o teste de Duncan temos que usar
∆ qα
A i
QMResZ
K (nA;n2)
B i
QMResZ
K (nB;n2)
Em que nA e nB são os números de médias ordenadas abrangidas pelo contraste sendo
testados.
As hipóteses para os testes Tukey e Duncan para comparar as médias dos níveis dos
fatores são
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
160
Fator A → H0 : mAi/Bj = mAu/Bj versus Ha : mAi/Bj ≠ mAu/Bj para i ≠ u = 1, 2, 3, ..., I e j = 1,
2, ... , J
Fator B → H0 : mBj/Ai = mBu/Ai versus Ha : mBj/Ai ≠ mBu/Ai para j ≠ u = 1, 2, 3, ., J e i = 1,
2, ... , I
Para a aplicação do teste t temos que usar
t tα
A A A
I
i
i
C C
QMResa
K =
−
∑2
1
tα (n2)
B B B
I
i
i
C C
QMResb
K =
−
∑2
1
tα (;n2)
Em que
CA = a1mA1/Bj + a2mA2/Bj + ... + aImAI/Bj para j = 1, 2, ..., J e
CB = b1mB1/Ai + b2mB2/Ai + ... + bImBJ/Ai para i = 1, 2, ... , I
Para a aplicação do teste Scheffé para testar os contrastes CA e CB temos que usar
S Ftab
A ( )I
TAB i
i
QMResS I F a
K =
= − ∑2
1
1 Ftα [(I-1);n2]
B ( )J
TAB j
j
QMResS J F b
K =
= − ∑2
1
1 Fα [(J-1);n2]
As hipóteses para os testes de Scheffé e t para testar os contrastes são
Fator A → H0 : CA = 0 versus Ha : CA ≠ 0
Fator B → H0 : CB = 0 versus Ha : CB ≠ 0
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
161
Exemplo:
considere o esquema fatorial 2 x 2 ( dois níveis de antibiótico, dois níveis de vitamina
B12) para estudar o aumento de peso (Kg) diário em suínos.
a0 – sem antibiótico; a1 – com 40 mg de antibiótico
b0 – sem vitamina B12 ; b1 – com 5 mg de vitamina B12
Repetição a0 a1 b0 b1 b0 b1
1 1,30 1,26 1,05 1,52 2 1,19 1,21 1,00 1,56 3 1,08 1,19 1,05 1,55
Total 3,57 3,66 3,10 4,66
OBS: neste caso o delineamento experimental foi o inteiramente casualizado com os
tratamentos num esquema fatorial 2 x 2, com 3 repetições Outra forma de apresentação
dos dados
Tratamento Repetição Total a0b0
a0b1
a1b0
a1b1
1,30 1,19 1,08 1,26 1,21 1,19 1,05 1,00 1,05 1.52 1,56 1,55
3,57 3,66 3,10 4,63
14,96
Calculo das Soma de Quadrados: SQT= (1,302 +1,192+1,082+1,262+1,212+1,192+1,052+1,002+1,052+1,522+1,562+1,552) -
( )214 99
12
,
SQT = 0,4418
SQTrat= ( ) ( )214 961 2 2 2 23 57 3 66 3 10 4 633 12
,, , , ,+ + + −
SQtrat=0,4124
SQResiduo = SQT – SQTrat = 0,4418 – 0,4124
SQResiduo = 0,0294
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
162
e então, podemos construir um primeiro quadro de análise de variância: Fonte de variação gl SQ QM F Tratamentos 3 0,4124 0,1375 37,16**
Resíduo 8 0,0294 0,0037 Total 11 Como F(3,8;0,01)= 7,59 podemos concluir que pelo menos duas médias de tratamentos
diferem significativamente (p<0,01) entre si quanto ao ganho de peso diário de suínos. A
continuação da análise pode envolver a comparação das médias dos tratamentos por
meio de um dos procedimentos de comparações múltiplas conhecidos, como os testes de
Tukey, Duncan, t-Student, Scheffé etc.
Uma alternativa de análise mais simples e mais informativa, está baseada no esquema
fatorial dos tratamentos. Utilizando o quadro com os totais das combinações dos níveis
dos fatores A e B e as fórmulas apresentadas anteriormente, podemos construir um novo
quadro de análise de variância que permitirá testar se existe interação entre os dois
fatores e se cada um dos fatores tem efeito significativo sobre o desenvolvimento dos
suínos.
Quadro auxiliar com os totais das combinações dos níveis de antibióticos (a0, a1) e vitamina B12
(3) b0 b1 Totais a0
a1
3,57 3,66 3,10 4,63
7,23 7,76
Totais 6,67 8,29 14,99 Assim
( ) ( )
( ) ( )
214 961 2 2SQ A 7 32 7 76 0 02097
6 12
214 961 2 2SQ B 6 67 8 29 0 21883
6 12
SQ AxB SQTrat SQ A SQ B
SQ AxB 0 4124 0 02097 0 21883
SQ AxB 0 1723
,( ) , , ,
,( ) , , ,
( ) ( ( ) ( ))
( ) , ( , , )
( ) ,
= + − =
= + − =
= − +
= − +
=
SQT= (1,302 +1,192+1,082+1,262+1,212+1,192+1,052+1,002+1,052+1,522+1,562+1,552) -
( )214 99
12
,
SQT = 0,4418 O novo quadro da ANAVA fica:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
163
FV GL SQ QM F
Antibiótico (A) 1 0,02097 0,02097 5,67*
Vitamina B12 (B) 1 0,21883 0,2183 59**
Int. AxB 1 0,1723 0,1723 46,57**
Tratamentos (3) 0,4124
Resíduo 8 0,0294 0,0037
Total 11
Da tabela apropriada, temos F(3, 8; 0,01) = 7,59; F(1, 8, 0,05) = 5,32 ; F(1, 8 ; 0,01) =
11,26 Comparando os valores calculados das estatísticas F, podemos concluir que:
• o teste para a interação AxB foi significativo (p < 0,01), indicando que o efeito da
vitamina B12 na presença ou ausência de antibiótico é significativamente diferente.
1,8 Níveis de antibiótico 1,7 1,6 1,5 Peso diário (kg) 1,4 1,3 1,2 1,1 1,0 b0 b1
Níveis de vitamina B12 Gráfico das médias de ganho de peso dos níveis de vitamina B12 por nível de antibiótico
Como a interação AxB resultou significativa (veja o gráfico apresentado acima), as
interpretações dos testes dos efeitos simples de Antibiótico (A) e de Vitamina B12 (B)
perdem o significado. Precisamos estudar a interação fazendo os seguintes
desdobramentos:
a) Desdobramento da interação AxB para estudar o comportamento dos fator A dentro
de cada nível de vitamina B12 (b0 e b1) :
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
164
( ) ( ) ( )2 2Y1 1 6 672 2 2 2SQ A Y Y 3 57 3 10 0 0368
11 21r 2 r 3 2 3dentro de b0
( , ). , ,
( ) ( )+++= + − = + − =
( ) ( ) ( )2 2Y1 1 8 292 2 2 2SQ A Y Y 3 66 4 63 0 1568
12 22r 2 r 3 2 3dentro de b1
( , ). , ,
( ) ( )+++= + − = + − =
Assim, monta-se a seguinte análise de variância do desdobramento dos graus de
liberdade da interação A x B para se estudar o efeito do antibiótico no ganho de peso
diário de suínos na ausência e na presença da vitamina B12.
Fonte de variação GL SQ QM F A dentro de b0 1 0,0368 0,0368 10,03
**
A dentro de b1 1 0,1568 0,1568 42,73**
Resíduo 8 0,0294 0,0037
A linha do resíduo é a mesma da ANOVA anterior.
Comparando os valores calculados da estatística F com o valor tabelado F(1;8;0,05) = 5,32 e
F(1;8;0,01) =11,3, conclui-se que o efeito do fator antibiótico no peso diário de suínos no
nível b0 de vitamina B12 é significativo (p<0,05) e significativo (p<0,01) no nível b1 da
vitamina B12. Ou então, que:
• Quando se utiliza a dose b0 de vitamina B12 existe uma diferença no peso diário dos
suínos. A estimativa desta diferença é dado por A(dentro de b0) a1 b0 – a0 b0 = 3,10 - 3,57 =
0,47 Kg E ela é significativa pelo teste F da ANOVA do desdobramento, indicando que
somente o efeito somente do antibiótico prejudica o peso diário dos suínos.
• Quando se utiliza a dose b1 de vitamina B12 existe uma diferença no peso diário dos
suínos. A estimativa desta diferença é dada por A(dentro de b1) = a b1 – a0 b1 = 4,63 – 3,66
=0, 97 Kg
E ela é significativa pelo teste F da ANOVA do desdobramento, indicando que a
combinação dos níveis a1 do antibiótico e b1 da vitamina B12 favorece o peso diário dos
suínos.
a) Desdobramento da interação AxB para estudar o comportamento dos fator B dentro
de cada nível de antibiótico A (a0 e a1) (preencher os espaços)
( ) ( )2 2Y1 12 2SQ B Y Y
11 21r 2 r 3
( )( )dentro de a0 ( )
+++= + − = − =
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
165
( ) ( )2 2Y1 12 2SQ B Y Y
21 22r 2 r 3
( )( )dentro de a1 ( )
+++= + − = − =
Assim, monta-se a seguinte análise de variância do desdobramento dos graus de
liberdade da interação A x B para se estudar o efeito da vitamina B12 no ganho de peso
diário de suínos na ausência e na presença de antibiótico:
Fonte de variação gl SQ QM F B dentro de a0
*
B dentro de a1
Resíduo
Concluir como no desdobramento anterior
Podemos comparar as médias de peso diário de suínos dos antibióticos , para cada uma
dos níveis de vitamina B12 , utilizando o Teste de Tukey (a = 5%). Para tanto,
calculamos:
( ) ( )QM QM 0 00367R Rd m s q q 3 26 0 1140a g l 2 8 0 05r 3 3do resíduo 0,05
,. . . , ,. . . ; ; ,= = = = =
Quadro auxiliar com as médias dos antibióticos para cada um dos níveis da
vitamina B12
b0 b1
a0 3,57 A 3,66 A
a1 3,10 B 4,63 B
Obs.: médias seguidas pelas mesmas letras maiúsculas, nas colunas, não diferem entre si a 5% de probabilidade, pelo Teste de Tukey
(fazer como exercício o teste de Tukey a 5%, para as linhas)
Notação geral dos totais de um esquema fatorial 2 x 2 organizados em uma tabela 2x2,
do tipo:
r b0 b1 Total
a0 Y11+ Y12+ Y1++
a1 Y21+ Y22+ Y2++
Total Y+1+ Y+2+ Y+++
As fórmulas das Soma de Quadrados podem ser escritas de uma forma geral:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
166
( )
( )
( )
( )( )
2Y2 2SQ Y YT 111 222 a b r
2Y1 2 2 2 2SQ Y Y Y YTR 11 12 21 22r a b r
2Y1 2 2SQ A Y Y1 22r a b r
2Y1 2 2SQ B Y Y1 22r a b r
SQ SQ SQ A SQ BTRA x B
...( )( )( )
( )( )( )
( )( )( )( )
( )( )( )( )
( ) ( )
+++= + + −+
+++= + + + −
+++= + −++ ++
+++= + −+ + + +
= − −
8.6. Vantagens e desvantagens de um experimento fatorial
Vantagens
a. Permite o estudo dos efeitos principais e o efeito da interação entre os fatores.
b. O no de graus de liberdade associado ao resíduo é alto quando comparado com os
experimentos simples dos mesmos fatores, o que contribui para diminuir a variância
residual, aumentando a precisão do experimento.
c. todas as parcelas são utilizadas no calculo dos efeitos principais dos fatores e dos
efeitos das interações, a razão pela qual o número de repetições é elevado
Desvantagem
a. sendo os tratamentos constituídos por todas as combinações possíveis entre os níveis
dos diversos fatores, o número de tratamento aumenta muito e, muitas vezes não
podemos distribuí-los em blocos casualizados devido à exigência da homogeneidade das
parcelas dentro de cada bloco.
b. a análise estatística é mais trabalhosa que nos experimentos simples, e a interpretação
dos resultados tornam mais difíceis à medida que aumentamos oi número de níveis no
experimento
c. Requer maior número de unidades experimentais em relação aos experimentos
simples.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
167
Exercícios
1. Seja um experimento fatorial instalado no DIC, com dois fatores: Irrigação (A) e
Calagem (B), cada um deles com dois níveis: presença (A1 B1 ) A e B e ausência (A0,B0 ).
Os dados obtidos (kg de planta/parcela) para cada tratamento são fornecidos abaixo.
Pede-se realizar a ANOVA e obter as conclusões sobre os fatores. Use α = 5%.
A0B0 A0B1 A1B0 A1B1
25 35 41 60
32 28 35 67
27 33 38 59
2. Em um experimento fatorial no DIC em que foram combinadas duas doses de N e duas
doses de fósforo, com 5 repetições, são dados:
P0
P1
N0 10,5 11 9,8 11,2 9,9 11,2 11 10,4 13,1 10,6
N1 11,5 12,4 10,2 12,7 10,4 14 14,1 13,8 13,5 14,2
Considerando o nível de significância de 5%, concluir sobre os efeitos dos fatores.
3. Suponha que você esteja participando de uma seleção para um emprego numa
empresa de pesquisa. Dentre as várias áreas em avaliação, consta a área de Estatística,
que objetiva avaliar seus conhecimentos na área, não simplesmente pedindo-lhe para
fazer "contas" (o que eles acham ser de menor importância), mas sim com respeito à
estratégia de análise, interpretação, discussão e tomada de decisão.
São feitas as seguintes perguntas:
a) Como você faria um "leigo" entender o que vem a ser INTERAÇÃO ENTRE DOIS
FATORES A e B. Para explicar você pode usar exemplos, gráficos, tabelas, etc, à sua
escolha.
b) Qual a estratégia de análise a ser efetuada (ou os passos da análise subseqüente) nos
seguintes casos de um fatorial com dois fatores A e B:
b.1) INTERAÇÃO NÃO SIGNIFICATIVA;
b.2) INTERAÇÃO SIGNIFICATIVA.
4. Num experimento com suínos foram comparadas três rações (A, B, C) e dois níveis de
proteína (1-Alto, 2-Médio), utilizando um delineamento inteiramente casualizado num
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
168
esquema fatorial com 5 repetições. Ao final do experimento, obteve-se o seguinte quadro
de interação para os totais de tratamentos:
Rações
Proteína A B C Totais
1 498 428 477 1403
2 469 350 406 1225
Totais 967 778 883 2628
Ao nível de 5% de probabilidade, pede-se:
a. Complete o quadro da ANOVA e verifique se os fatores rações e níveis de proteína
atuam independentemente.
FV GL SQ QM F
Ração Proteína Interação 2 140,4667 0,34
(Tratamentos) Resíduo 4957,20 Total
b. Qual seria a ração a ser recomendada? (Use o teste de Duncan se necessário)
c. Qual seria o nível de proteína a ser recomendado? (Use o teste de Duncan se
necessário).
5. Com os dados do quadro de interação do fatorial 2x6, no delineamento em Blocos
Casualizados com 2 repetições, e considerando α = 5% com os fatores A e B atuando
dependentemente, pede-se :
a) testar e concluir a respeito do fator A dentro do nível B4
b) Fazer o estudo do fator B dentro dos níveis de A procedendo a análise de variância e o
teste de Tukey se necessário
B1 B2 B3 B4 B5 B6 Totais
A1 46,8 48,2 47,3 49 48,5 46,9 286,7
A2 47,2 60,8 69,3 71,6 61,5 46,8 357,2
Totais 94 109 116,6 120,6 110 93,7 643,9
SQResíduo = 120,8325
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
169
6. Em um experimento de substituição do farelo de soja pelo farelo de girassol na ração
de suínos, montou-se um experimento fatorial 2x5, com os fatores Sexo (machos e
fêmeas) e Ração com substituição de farelo de soja por farelo de girassol (0%, 25%,
50%, 75% e 100%), utilizando-se 30 suínos (15 machos e 15 fêmeas) castrados da raça
Duroc-Jersey, num delineamento em blocos casualizados com 3 repetições, de acordo
com os grupos de pesos iniciais. Os resultados de ganho de peso dos animais aos 112
dias de experimento estão apresentados na tabela a seguir:
Bloco Machos Fêmeas
G0 G25 G50 G75 G100 G0 G25 G50 G75 G100
1 85,0 94,5 99,5 93,0 83,0 77,9 71,5 67,5 71,5 89,5
2 86,0 96,0 98,0 96,0 80,0 83,2 73,5 63,5 70,8 91,8
3 84,0 95,8 104,0 90,5 78,5 83,5 70,5 65,0 72,9 92,9
Total 255,0 286,3 301,5 279,5 241,5 244,6 215,5 196,0 214,8 274,2
Pede-se:
a. Montar o esquema da Análise de Variância e fazer os testes convenientes;
b Comparar as médias dos níveis do fator G dentro de cada um dos níveis do fator S;
c. Construir gráficos para estudar o comportamento das respostas médias dos níveis de
G para cada um dos níveis de S.
7. O rendimento de um processo químico está sendo estudado. As duas variáveis mais
importantes acreditam-se ser a pressão e a temperatura. Três níveis de cada fator são
selecionados, e um experimento fatorial com duas repetições é realizado. Os dados de
rendimento seguem:
Pressão (Psig)
Temperatura (ºC)
200 215 230
150 90,4 90,7 90,2
90,2 90,6 90,4 160 90,1 90,5 89,9 90,3 90,6 90,1
170 90,5 90,8 90,4 90,7 90,9 90,1
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
170
a) Faça a análise de variância do fatorial completo e escreva as conclusões. Use α = 0,05.
b) Prepare gráficos de resíduos apropriados e comente sobre a adequação do modelo.
c) Obtenha os efeitos lineares e quadráticos de temperatura e pressão.
d) Ajuste um modelo de regressão apropriado para os dados de resposta (rendimento).
Use este modelo para prover conselhos a respeito das condições de operação para o
processo.
8. A percentagem de madeira em polpa fina, a pressão da cuba e o tempo de cozimento
da polpa estão sendo investigados sobre seus efeitos na resistência do papel. Três
níveis de concentração de madeira, três níveis de pressão, e dois tempos de cozimento
são selecionados. Um experimento fatorial com duas repetições é conduzido, e os
seguintes dados são obtidos:
Percentagem de concentração de madeira (%)
Tempo de Cozimento 3.0 Horas Tempo de Cozimento 4.0 Horas Pressão Pressão
400 500 650 400 500 650 2 196,6 197,7 199,8 198,4 199,6 200,6 196,0 196,0 199,4 198,6 200,4 200,9 4 198,5 196,0 198,4 197,5 198,7 199,6 197,2 196,9 197,6 198,1 198,0 199,0 8 197,5 195,6 197,4 197,6 197,0 198,5 196,6 196,2 198,1 198,4 197,8 199,8
a) Analise os dados (fazer a anava do modelo fatorial) e tire suas conclusões. Use α
= 0,05.
b) Prepare gráficos de resíduos apropriados e comente sobre a adequação do
modelo.
c) Ajuste um modelo de regressão para os dados.
d) Sobre que conjunto de condições você gostaria de operar esse processo? Por
quê?
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
171
9. Um experimento foi conduzido no delineamento de blocos casualizados, com três
repetições, com a finalidade de estudar o efeito de matéria orgânica e calagem no
desenvolvimento de mudas de café. Os tratamentos foram dispostos num esquema
fatorial 3x2, sendo três tipos de matéria orgânica (esterco de aves, esterco bovino e
composto orgânico) e dois níveis de calagem (60 e 120 kg de calcáreo/m3 de terra). Os
valores obtidos de altura das mudas (cm) foram:
Blocos Teste- 60 120 Total
munha Aves Bovino Orgânico Aves Bovino Orgânico
I 17 25 26 28 30 33 37 II 16 25 24 26 29 32 36 II 14 21 23 25 27 30 34
a) Fazer a análise de variância completa, com desdobramento de graus de liberdade e
comparações múltiplas quando pertinentes
10. Uma pesquisa está estudando o efeito da lidocaína no nível de enzima do músculo
cardíaco de cães da raça beagle. No experimento foram testadas três diferentes marcas
de lidocaína (A), três níveis de dosagem (B), e 3 cães diferentes (C). O experimento é um
fatorial 33, com 2 repetições. Os dados abaixo se referem aos níveis de enzima
observados no estudo.
Marcas de
lidocaína Dosagem
Repetição 1 Repetição 2 Cão Cão
1 2 3 1 2 3
1 1 86 84 85 84 85 86 2 94 99 98 95 97 90 3 101 106 98 105 104 103
2 1 85 84 86 80 82 84 2 95 98 97 93 99 95 3 108 114 109 110 102 100
3 1 84 83 81 83 80 79 2 95 97 93 92 96 93 3 105 100 106 102 111 108
Faça a análise de variância e conclua sobre os resultados
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
172
C A P Í T U L O 9
EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS
9.1 Introdução
Vimos que nos experimentos fatoriais ou esquemas fatoriais, os tratamentos gerados
pelas combinações dos níveis dos fatores são designados às unidades experimentais de
acordo com o procedimento de aleatorização do delineamento inteiramente casualizado
(DIC), ou do delineamento em blocos casualizados (DBC), ou do delineamento em
quadrado latino (DQL). Entretanto, outros tipos de aleatorização são possíveis. O
delineamento em parcelas subdivididas surge de uma destas aleatorizações alternativas.
O princípio básico deste delineamento é: parcelas ou unidades inteiras que recebem os
níveis de um dos fatores são subdivididas em subparcelas, às quais os níveis de um fator
adicional são aplicados. Assim cada parcela funciona como um bloco para as
subparcelas. Os níveis do fator colocados nas parcelas são denominados de tratamentos
principais e os níveis do fator sorteados nas subparcelas são denominados de
tratamentos secundários. O Delineamento em Parcelas Subdivididas é freqüentemente
usado com experimentos fatoriais e tem muito em comum com delineamentos
parcialmente hierárquico. O termo "PARCELA SUBDIVIDIDA" surgiu na experimentação
agronômica onde um único nível de um fator (ou tratamento)‚ aplicado a uma parcela
relativamente grande de terra (whole plot), mas todos os níveis de um segundo fator são
aplicados às subparcelas (split-plots) dessa parcela maior. Os tratamentos primários são
distribuídos às parcelas de acordo com um delineamento especificado (DIC, DBC, DQL
etc.) e os tratamentos secundários são distribuídos aleatoriamente às subparcelas de
cada parcela.
EXEMPLO 1: A seguir apresentamos o croqui de um experimento em parcelas
subdivididas com o Fator A com 2 níveis (tratamentos primários) aplicados às parcelas de
acordo com um delineamento em blocos
casualizados com 3 repetições e o Fator B com 3 níveis (tratamentos secundários)
aplicados às subparcelas. Vale notar que os níveis de A são sorteados entre as duas
parcelas de cada bloco e os níveis de B são sorteados entre as três subparcelas de cada
parcela
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
173
ou seja, o delineamento em parcelas subdivididas representa uma restrição à
casualização completa existente em um ensaio fatorial envolvendo o mesmo número de
fatores e de níveis.
Na análise estatística desses experimentos, as Fontes de Variação que fazem parte da
variação entre as parcelas (Fator-A e Blocos, por exemplo) são usualmente agrupadas
separadamente daquelas que fazem parte da variação dentro das parcelas ou entre as
subparcelas (Fator-B e interação AxB). Neste caso, temos dois resíduos distintos:
um referente às parcelas e outro referente às subparcelas.
O uso em parcelas subdivididas é desejável quando:
• os tratamentos associados com os níveis de um ou mais fatores exigem maiores
quantidades de material experimental em uma mesma unidade experimental (ou parcela)
que outros tratamentos;
• um fator adicional vai ser incorporado ao experimento para aumentar a sua
abrangência;
• uma maior precisão é desejada para comparações entre os níveis de alguns fatores.
Parcelas
Subparcelas
Bloco I Bloco II Bloco III
A1 A2
B1 B2 B3 B3
B2 B1
A2 A1
B3 B2 B2 B3
B1 B1
B1 B2 B3 B3
B2 B1
A2 A1
BLOCO 1
A1B1 A1B2
A2B3 A1B3
A2B2 A2B1
BLOCO 2
A1B3 A2B2
A2B2 A1B3
A2B1 A1B1
BLOCO 3
A1B1 A2B2
A2B3 A1B3
A1B2 A2B1
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
174
9.2 Vantagem e desvantagem de um experimento em parcelas subdividas
Vantagem
• permite utilizar fatores que requerem quantidades relativamente grandes de material
experimental e outros fatores que requerem quantidades pequenas, combinados num
mesmo experimento.
Desvantagens
• geralmente, o erro associado às parcelas é muito maior que o erro associado às
subparcelas. Desse modo, os efeitos de tratamentos primários, ainda que notáveis
(grandes), podem não ser significativos, enquanto que os efeitos de tratamentos
secundários, ainda que muito pequenos, podem ser estatisticamente significativos.
• para diferentes comparações entre médias de tratamentos existem diferentes variâncias
9.3. Análise de variância (ANAVA)
A análise de variância de um experimento em parcelas subdivididas é feita desdobrando
os efeitos das parcelas e das subparcelas nas partes que as compõem. Para cada um
destes desdobramentos, existe um resíduo, o qual é utilizado para testar o efeito das
fontes de variação pertinentes.
No quadro a seguir, apresentamos a partição dos graus de liberdade de um experimento
em parcelas subdivididas com “a” tratamentos primários, “b” tratamentos secundários, “r”
repetições e diferentes delineamentos para os tratamentos aplicados às parcelas.
D.I.C. (“r” repetições) D.B.C.(“r” blocos) D.Q.L. (“a” repetições)
Fonte de Variação g.l. Fonte de Variação g.l. Fonte de Variação g.l. Linhas (a-1)
Blocos (r-1) Colunas (a-1) A (a-1) A (a-1) A (a-1)
Resíduo (a) a(r-1) Resíduo (a) a(r-1) Resíduo (a) a(r-1) (Parcelas) (ar-1) (Parcelas) (ar-1) (Parcelas) (ar-1)
B (b-1) B (b-1) B (b-1) AxB (a-1)(b-1) AxB (a-1)(b-1) AxB (a-1)(b-1)
Resíduo (b) a(r-1)(b-1) Resíduo (b) a(r-1)(b-1) Resíduo (b) a(r-1)(b-1) Total abr-1 Total abr-1 Total abr-1
9.4 Modelo matemático e suposições
Considerando um experimento em parcelas subdivididas envolvendo “a” tratamentos
primários arranjados em um DIC com “r” repetições e “b” tratamentos secundários, o
modelo pode ser escrito como:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
175
yijk = µ + αi +Sik + βj + (αβ)ij +εijk, com k = 1,...,r1; i = 1,...,a; j = 1,...,b sendo: µ: a média geral;
αi: o efeito do i ésimo nível de A;
Sik: efeito da k ésima parcela recebendo o i ésimo nível de A~ N(0,σ2), erro(a);
βj : o efeito do j ésimo nível de B;
(αβ)ij : o efeito conjunto de i ésimo nível de A e j ésimo nível de B;
εijk: efeito do erro aleatório ~N(0,σ2)
Considerando agora, um experimento em parcelas subdivididas envolvendo “a”
tratamentos primários arranjados em “r” blocos casualizados e “b” tratamentos
secundários, o modelo pode ser escrito como:
yijk = µ + αi +Sik + Rk + (SR)ik βj + (αβ)ij + εijk, com k = i 1,...,r1 ; i =1,...,a; j = 1,...,b
sendo: µ: a média geral;
αi: o efeito do i ésimo nível de A;
Sik: efeito da k ésima parcela recebendo o i ésimo nível de A~ N(0,σ2), erro(a);
Rk:efeito do k ésimo bloco;
(SR)ik: o efeito conjunto de i ésimo nível de A e o k ésimo bloco
βj : o efeito do j ésimo nível de B;
(αβ)ij : o efeito conjunto de i ésimo nível de A e j ésimo nível de B;
εijk: efeito do erro aleatório ~N(0,σ2)
9.5 Hipótese estatística
As seguintes hipóteses podem ser testadas nos experimentos em parcelas subdivididas.
• A hipótese de que não existe ou existe interação AB é equivalente às hipóteses
H0AB: (αβ)ij vs H1AB: (αβ)ij ≠ 0 com i = 1,..., a e j = 1,...,b;
usamos a estatística FAB = QM(AxB)/QMRes(b), que sob H0, tem distribuição F-
Snedecor com graus de liberdade da interação no numerador e graus de liberdade do
resíduo (b) no denominador.
• as hipóteses de que não existe efeito principal do fator A é
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
176
H0AB:αi vs H1AB αi ≠ 0 com i = 1,..., a e j = 1,...,b usamos a estatística FA =
QMA/QMRes(a), que sob H0, tem distribuição F-Snedecor com graus de liberdade do
fator A no numerador e graus de
liberdade do erro (a) no denominador.
• as hipóteses de que não existe efeito principal do fator B é
H0AB: βj vs H1AB βj ≠ 0 com i = 1,..., a e j = 1,...,b, usamos a estatística FB =
QMB/QMRes(b), que sob H0, tem distribuição F-Snedecor com graus de liberdade do
fator B no numerador e graus de liberdade do erro (b) no denominador.
9.6 Somas de quadrados
Apresentaremos alguns passos que facilitam os cálculos das somas de quadrados da
ANAVA.
No DIC:
• Soma de Quadrados do Total (SQT)
( ) ( )2 2r a b y y2SQ yT ijk abr abrk 1i 1 j 1
sendo C =,+++ +++= −∑ ∑ ∑= = =
• Soma de Quadrados do fator A, SQ(A) a1 2SQ A Y C
ibr i 1
( ) = −∑ ++=
• Soma de Quadrados da Parcelas, SQ(Parc) ( )a b1 2SQ Parcelas Y C
ijb i j
,
,= −∑ +
• SQRes(a) = SQ(Parc) – SQ(A);
• Soma de Quadrados do fator B, SQ(B) b1 2SQ B Y C
iar i 1
( ) = −∑ + +=
• Soma de Quadrados da interação AxB, SQ(AxB)=SQ(A,B)- SQ(A)-SQ(B)
ou a b1 2SQ AxB Y C
ijr i 1 j 1
( ) = −∑ ∑ += =
,sendo a SQ(A,B) a soma de quadrado conjunta, a qual
nos fatoriais a a x b é igual à soma de quadrados dos tratamentos (SQTr).
Para calcular os coeficientes de variação para as parcelas e para as subparcelas
usamos, respectivamente:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
177
QM QMR a R bCV a x100 CV b x100
Y Y
( ) ( )( ) ; ( )= =
+++ +++
SQ2 ModeloR x100
SQT= , sendo que SQModelo = SQ(Parc ) + SQ(B) + SQ( AxB)
Dos testes de hipóteses sugeridos anteriormente, se ocorrer interação AxB significativa,
torna-se imprescindível fazer o desdobramento SQ B(Dentro de A) , para i = 1, 2, ..., a ou SQ
A(Dentro de B) , para j = 1, 2, ..., b.
Para testar se “as médias de B são iguais, dentro de cada nível de A” usaremos como
denominador da estatística F, 2sB QMRes(b), com seus a(r-1)(b-1) graus de liberdade.
Para testar se “as médias de A são iguais, dentro de cada nível de B” usaremos como
denominador da estatística F, o valor obtido de Re (*) [(QMRes(a)+ ( b 1)QMRe s( b)]b ,
que tem n’ graus de liberdade, o qual é calculado pela Fórmula de Sattertwait:
[ ]( )
ba
ba
b
bVb
n
V
VbVn
222
2
'
1
)1(
−+
−+=
9.7 Comparações múltiplas entre mádias de tratamentos
Após tirarmos as conclusões sobre os testes de hipóteses da Análise de Variância,
poderemos estar interessados em comparar as médias dos tratamentos primários (A),
dos secundários (B) ou da interação (AxB). Daí, o problema consiste em usar a
estimativa da variância (s2) apropriada. A seguir, resolvemos esses problemas para os
casos mais freqüentes.
1º Caso: Entre médias de tratamento primário
• Para testar um contraste escolhido a priori,
Y = c1 µ1 + c2 µ2 + ... + ca µa , onde i =1, 2,..., a i são as médias dos tratamentos primários
usamos a estatística t-Student
YitQMR a 2
cir i
ˆ
( )=
∑
com graus de liberdade do Res(a)
• Para testar um contraste entre duas médias de A, Y = µi − µj, usamos a estatística t-
Student
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
178
Yit2
QM abr
ˆ
(R( )
=
• Para os testes de Tukey e de Duncan usamos, respectivamente,
( )
( )
QMR adms q eA a gl brs a
QMR adms zB a gl brs a
( ); Re ( )
( ); Re ( )
= =
= =
Sendo, que “q” e “z” correspondem aos valores tabelados da distribuição de Tukey e
Duncan.
20 Caso: Entre média de tratamento secundário
• Para testar um contraste escolhido a priori,
Y = c1 µ1 + c2 µ2 + ... + ca µa , onde i =1, 2,..., b, são as médias dos tratamentos
secundários, usamos a estatística t-Student
• Para testar um contraste entre duas médias de B, Y = µi − µj, usamos a estatística t-
Student
Yit2QM b
ar
ˆ
(R( )
=
• Para os testes de Tukey e de Duncan usamos, respectivamente,
( )
( )
QMR bdms q eA a gl ars a
QMR bdms zB a gl ars a
( ); Re ( )
( ); Re ( )
= =
= =
Sendo, que “q” e “z” correspondem aos valores tabelados da distribuição de Tukey e
Duncan.
30 Caso: Entre médias do tratamento secundário num mesmo nível de i de A
• Para testar um contraste escolhido a priori,
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
179
Y = c1 µi1 + c2 µi2 + ... + ca µib , onde µij j =1, 2,..., b, são as médias dos tratamentos
secundários num mesmo nível “i” de A, usamos a estatística t-Student
• Para testar um contraste entre duas médias de B, Y = µi − µj, usamos a estatística t-
Student
YitQM R b 2
cir i
ˆ
( ( ))=
∑
, com os graus de liberdade do QMRes(b).
• Para testar um contraste entre duas médias de B num mesmo nível de A, Y = µij − µij,
usamos a estatística t-Student
Yit2QM b
r
ˆ
(R( )
= ,com os graus de liberdade do QMRes(b).
• Para os testes de Tukey e de Duncan usamos, respectivamente,
( )
( )
QMR bdms q eA b gl rs a
QMR bdms zB b gl rs a
( ); Re ( )
( ); Re ( )
= =
= =
Sendo, que “q” e “z” correspondem aos valores tabelados da distribuição de Tukey e
Duncan.
40 Caso: Entre médias do tratamento primário num mesmo nível de B
• Para testar um contraste escolhido a priori,
Y = c1 µ1j + c2 µ2j + ... + ca µaj , sendo µij 1 =1,2, ..., a as médias dos tratamentos
primários num mesmo nível “j” de B, usamos a estatística t-Student
YitQMR a b 1 QMR b 2c
ibr i
ˆ
( ) ( ) ( )
=+ −
∑
com n’ graus de liberdade calculados pela Fórmula de
Sattertwait
• Para testar um contraste entre duas médias de A num mesmo nível de B,YI = µij − µij,
usamos a estatística t-Student
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
180
Yit2
QM b 1 QMa R bbr
ˆ
( )(R( ) ( )
= + −
, com n’ graus de liberdade calculados pela Fórmula
de Sattertwait
Para os testes de Tukey e de Duncan usamos, respectivamente
( )
( )
1dms q QM QMR a b 1 R bb n br
1dms z QM QMB R a b 1 R bb n br
( ) ( ) ( ); '
( ) ( ) ( ); '
= = + −
= = + −
sendo os valores de “q” e “z” correspondem a “b” tratamentos e n’ graus de liberdade
para o resíduo (calculados pela Fórmula de Sattertwait) e são encontrados em tabelas
próprias.
EXEMPLO: supor um experimento com três rações A, B e C em seis blocos
casualizados, sendo cada parcela constituída de dois bovinos de corte. Em uma
determinada fase do experimento, os bovinos dentro de cada parcela, passaram a
receber, por sorteio, um dos dois tipos de suplementos minerais M e P.
Croqui do experimento em parcelas subdivididas em blocos casualizados:
Bloco I
B A C P M M P P M
Bloco II
A C B P M M P P M
Bloco III
B C A P M M P M P
Bloco IV
A B C M P M P P M
Bloco V
C A B P M M P P M
Bloco VI
C B A M P M P P M
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
181
1ª letra fator ração
2ª letra fator suplemento mineral
Blocos
I II III IV V VI
BP AM BP AM CP CM
BM AP BM AP CM CP
AM CM CM BM AM BM
AP CP CP BP AP BP
CP BP AM CP BP AP
CM BM AP CM BM AM
Esquema da análise de variância
Fonte de variação gl Blocos) 5
Ração (Trat. principal) A 2 Erro (a) 10
Parcelas (17) Suplemento mineral (Trat. Secundário) B 1 Ração x Suplemento 2 Erro (b) 15 Total 35 Os ganhos individuais ao final do experimento foram:
Blocos Ração A Ração B Ração C Total M P M P M P
I II III IV V VI
107 89 117 101 122 98 111 101 90 95 116 90
116 101 136 110 130 104 122 91 117 100 114 94
90 96 112 89
99 92 105 78 110 90 114 93
599 665 645 608 602 621
Total 663 574 735 600 630 538 3.740
Quadro de Totais I
Blocos(2)*
Ração A Ração B Ração C Total
I II III IV V VI
196 218 220 212 185 206
217 246 234 213 217 208
186 201 191 183 200 207
599 665 645 608 602 621
Total 1.237(12) 1.335(12) 1.168(12) 3.740(36)
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
182
(*) Os números entre parênteses representam o total de parcelas somadas para se obter os
valores observados da tabela.
Cálculos:
( )2
3 7402 2 2SQ 107 2 89 93 388 544 44T3 2 6
., ... . ,
( )( )( )= + + + − =
( )2
1 3 7402 2 2SQ 599 665 621 588 22Bloc6 2 3 6
.... ,os ( )( )( )
= + + + − =
Para obtermos a soma de quadrados das parcelas usamos o quadro auxiliar I com os
totais de cada parcela. Como temos duas subparcelas em cada parcela temos
( )2
1 3 7402 2 2SQ 196 217 207 2 377 56Parcelas2 2 3 6
.... . ,
( )( )( )= + + + − =
Para as demais SQ, organizamos o seguinte quadro de totais II que relaciona os níveis
dos dois fatores entre si:
SUPLEMENTOS
(6)
RAÇÃO
Totais
A B C
M
P
663
574
735
600
630
538
2.028
1.712
Totais 1.237 1.335 1.168 3.740
( )2
1 3 7402 2 2SQ 1 237 1 335 1 168 1 173 73Rações12 2 3 6
.. . . . ,
( )( )( )= + + − =
SQ =SQ -SQ -SQ =2.377,56-582,22-1.173,73=621,61 (Res(a)) Parcelas Blocos Rações
( )2
1 3 7402 2SQ 2 028 1 712 2 773 83Supl18 2 3 6
.. . . ,. ( )( )( )
= + − =
( )2
1 3 7402 2 2SQ 663 574 538 4 057 89R S6 2 3 6
.... . ,( , ) ( )( )( )
= + + + − =
( )SQ SQ SQ SQ 4 057 89 1 173 73 2 773 78 110 38R S R SRxS . , . , . , ,( , )= − − = − − =
( )SQ =SQ -SQ -SQ -SQ =6.061,56-2.377,56-2.773,78-110,38=799,84(Res(b)) T Parcelas Supl. RxC
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
183
Quadro da ANAVA
FV GL SQ QM F Blocos 5 588,22 117,644 2,21 Ração (Trat. principal) A 2 1173,73 586,865 11,01 Erro (a) 10 621,61 62,161 1,17 Parcelas 17 2377,56 139,857 2,62 Suplemento mineral (Trat. Secundário) B 1 2773,78 2773,78 52,02 Ração x Suplemento 2 110,38 55,19 1,04 Erro (b) 15 799,84 53,3227 Total 35 8445,12
Obs. Os efeitos das rações e dos blocos são testados usando o resíduo (a). Os efeitos
dos suplementos e da interação são testados usando o resíduo b.
F(5,10; 0,05)=3,33 ; F(5,10; 0,01)= 5,64; F(2,10; 0,05)= 4,10; F(2,10; 0,01)= 7,56; F(1,15;
0,05)= 4,54
F(1,15; 0,01)= 8,86; F(2,15; 0,05)= 3,68; F(2,15; 0,01)= 6,36
Conclusão: como a interação não foi significativa (p>0,05) devemos interpretar as
diferenças significativas dos efeitos principais da ração e do suplemento.
QMR a 62 16CV a x100 x100 7 59
Y 103 89
QMR b 53 32CV b x100 x100 7 03
Y 103 89
( ) ,( ) , %
,
( ) ,( ) , %
,
= = =
= = =
Teste de Tukey:
• duas médias de A
( )
2E adms qA a glE rba
124 32dms 3 88 12 44A
12
sendo E(a) = QM(R(a))( )
,; ( )
,, ,
= =
= =
• duas médias de B
( )2E b
dms qB a glE rab
106 64dms 3 01 7 33B
18
sendo E(b) = QM(R(b))( )
,; ( )
,, ,
= =
= =
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
184
Quadro de médias SUPLEMENTOS
(6)
RAÇÃO
Totais
A B C
M
P
110,5
95,7
122,5
100,0
105
89,7
112,7 A
95,1 B
Totais 103,1 ac 111.3 a 97,3 c 103,9
Médias seguidas pela mesma letra minúsculas na linha não diferem entre si pelo teste de Tukey a 5% Médias seguidas pela mesma letra maiúsculas na coluna não diferem entre si pelo teste de Tukey a 5%
QUADRO 8.2. Produção de massa verde de capim Cameroon em t/ha no ensaio de idade de corte.
Blocos Idade (dias) Totais de blocos 30 60 90 120 150 1 12,4 45,0 23,4 45,0 31,5 157,3 2 13,0 28,0 38,0 28,0 22,9 129,9 3 10,0 32,0 32,0 32,0 19,0 125,0 4 11,0 34,0 63,0 35,0 11,0 154,0
Total de idades 46,4 139,0 156,4 140,0 84,4 566,2 Os quatro graus de liberdade referentes a tratamentos (idades) serão decompostos em
componentes individuais a fim de estudar separadamente os efeitos de 1o grau ou linear,
de 2o grau ou quadrático, de 3o grau ou cúbico e de 4o grau. Como temos 5 níveis
igualmente espaçados, podemos usar a tabela de polinômios ortogonais. Os coeficientes,
os divisores e multiplicadores a serem usados para os componentes de 1o , 2o , 3o e 4o
graus, são mostrados no quadro seguinte, juntamente com os totais de tratamento:
Produções totais Coeficientes (T) Linear (C1 ) Quadrático (C2 ) Cúbico (C3 ) 4o grau (C4 )
46,4 -2 2 -1 1 139,0 -1 -1 +2 -4 156,4 0 -2 0 6 140,0 1 -1 -2 -4 84,4 2 2 1 1 K 10 14 10 70 M 1 1 5/6 35/12
Em seguida multiplicamos cada total de tratamento pelo coeficiente respectivo e
somamos os produtos. Assim obtemos:
C T x x x x1 2 46 4 1 139 0 1 139 0 140 0 2 84 4 77 0==== −−−− −−−− ++++ ++++ ++++ ====∑∑∑∑ , , , , , ,
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
185
A soma de quadrados para o componente linear é dada por:
SQRLinearC T
rK====
∑∑∑∑( )1
2
1
onde r é o número de parcelas (repetições) em cada total e K1 é a soma dos quadrados
dos coeficientes. Como r = 4 e K1 = 10, obtemos:
SQR Linearx
==== ====( , )
,77 0
4 10148 2250
2
Para os componentes quadráticos, cúbicos e de 4o grau obtemos:
∑∑∑
−=
=
−=
8,46
0,36
2,330
4
3
2
TC
TC
TC
com as seguintes somas de quadrados:
SQRQuadráticaC T
rK x
SQRCúbicaC T
rK x
====∑∑∑∑ ====
−−−−====
====∑∑∑∑
==== ====
( ) ( , ),
( ) ( ),
2
2
2 2
3
2
3
2
330 2
4 141947 0007
36
4 1032 4000
SQR 4O grau = ( ) ( , )
,C T
rK x
4
2
4
246 8
4 707 8223
∑∑∑∑ ====−−−−
====
Como a decomposição em componentes linear, quadrático, cúbico e 4o grau é ortogonal,
a soma de suas somas de quadrado é igual à soma de quadrados de tratamentos (idades
de corte), ou seja:
SQIdadesdecorte
SQIdadesdecorte
==== ++++ ++++ ++++ ++++ −−−−
====
46 4
4
139 0
4
156 4
4
140 0
4
84 4
4
566 2
20
2135 4480
2 2 2 2 2 2, , , , , ,
,
SQQL + SQRQ + SQRC + SQR4O grau = 148,2250 + 1947,0007 + 32,4000 + 7,8223 =
2135,4480 = SQIdades de corte
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
186
As outras variações isoladas pelo experimento são calculadas como segue:
SQTotal
SQBloco
SQErro SQTotal SQIdades SQBlo
==== ++++ ++++ ++++ −−−− ====
==== ++++ ++++ ++++ −−−− ====
==== −−−− −−−−
12 4 45 0 11 0566 2
203544 8580
157 3
5
129 9
5
125 0
5
154 0
5
566 2
20162 5380
2 2 22
2 2 2 2 2
, , . . . ,,
,
, , , , ,,
cos
= 3544,8580 - 2135,4480 - 162,5380 = 1246,8720 O quadro de análise de variância tem a seguinte forma: Causas de variação G. L. S. Q. Q. M. F Regressão linear 1 148,2250 148,2250 1,43 Regressão quadrática 1 1947,0007 1947,0007 18,74 ∗ ∗ Regressão cúbica 1 32,4000 32,4000 < 1 Regressão de 4o grau 1 7,8223 7,8223 < 1 Blocos 3 162,5380 54,1793 < 1 Erro 12 1246,8720 103,9060 Total 19 3544,8580
∗ ∗ Significativo ao nível de 1% de probabilidade. Cada um dos quadrados médios é testado por meio do erro e a hipótese de nulidade é a
de que a média de população para a comparação é zero. Se somente o efeito linear é
significativo, conclui-se que o aumento na resposta para níveis sucessivos do fator é
constante. A resposta pode ser negativa ou positiva quer ela diminua ou aumente com os
aumentos do nível do fator. Um efeito quadrático significativo indica que uma equação de
regressão de 2o grau ajusta melhor os dados, isto é, o aumento ou decréscimo para cada
aumento de nível do fator não é constante mas muda progressivamente.
Para o nosso exemplo a análise mostra efeito quadrático altamente significativo para as
idades de corte do capim Cameroom. Observando nossos dados, vemos que as
produções médias aumentam até a idade de 50 dias e a partir daí começam a decrescer;
verifica-se, também, que os aumentos e os decréscimos não são constantes. Os
componentes de 3o e 4o graus não significativos indicam que não trariam melhora alguma
ao ajustamento.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
187
Exercícios
1. Um experimento foi conduzido para avaliar o comportamento de diferentes cultivares
de soja em diversas épocas de semeadura. Os tratamentos épocas foram sorteados nas
parcelas e os cultivares nas subparcelas, utilizando-se o delineamento em blocos
casualizados com três repetições. Os resultados obtidos da porcentagem de germinação
foram:
Época de Blocos Cultivar Total das Parcelas
Média
Semeadura E316 Emb1 Rai Iti
Outubro 1 81 60 94 57 292(4) 2 77 56 90 53 276 3 85 64 97 61 307
Novembro 1 90 92 96 90 368 2 94 96 99 94 383 3 86 88 92 86 352
Dezembro 1 86 90 90 91 357 2 82 94 94 95 365 3 90 86 86 87 349
Total 771(9) 726 838 714 3049(36)
Fonte: Dados adaptados de Pereira (1998).
a) Faça a análise de variância e interpretar os resultados;
b) Identifique qual o melhor cultivar em de cada época;
c) Identifique qual a melhor época para cada cultivar.
d) Para os itens (b) e (c) faça o desdobramento da interação e aplique o SNK para
comparar os tratamentos.
2. Um experimento foi realizado para avaliar o comportamento de três cultivares de trigo
submetido a três níveis de irrigação. O fator irrigação foi casualizado nas parcelas e os
cultivares nas subparcelas utilizando-se o delineamento em blocos casualizados com três
repetições. Os valores de índice de glúten (em %) foram:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
188
Cultivar Irrigação Blocos 1 2 3 A 0 75 83 74 40 81 85 80 80 84 90 85 B 0 80 82 80 40 84 89 83 80 90 93 89 C 0 79 82 78 40 87 93 88 80 96 97 95
a) Faça a análise de variância, interprete os resultados obtidos;
b) Faça o desdobramento da interação para comparar os cultivares em cada nível de irrigação e aplique o teste de Tukey (%) para avaliar os cultivares;
c) Faça o desdobramento da interação para comparar os níveis de irrigação em cada cultivar e use a análise de regressão para descrever o efeito da irrigação;
3. Valores da enzima PFO em função do tipo de colheita e da época de colheita de
cafeeiro cultivar mundo novo em experimento em blocos casualizados, com três
repetições e tratamentos dispostos em parcelas subdivididas. As épocas de colheitas
constituem o fator das parcelas. Fazer a análise de variância completa, com aplicação de
teste de comparação múltipla e desdobramento de interação, se for necessário.
Tipo de Colheita
Bloco Época de Colheita 31-05 14-06 28-06 12-07 26-07 10-08
Pano 1 58 61 66 68 67 70 2 57 63 67 66 69 72 3 59 59 65 69 65 68
Chão 1 56 59 60 61 62 63 2 57 58 59 63 61 61 3 54 61 61 59 63 63
4. Um pesquisador pretende instalar um experimento para avaliar o efeito dos fatores
temperatura de armazenamento (ambiente, resfriado e congelado) e soluções de cálcio
(0%, 1%, 2% e 3%) em maças, visando a conservação de frutos de maça com boa
qualidade. Como o pesquisador poderá instalar esse experimento? Justifique o uso dos
delineamentos experimentais (DIC, DBC ou QL), o número de repetições (quatro?), o que
será a unidade experimental? Apresente o esquema de análise de variância
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
189
considerando que os tratamentos podem ser dispostos, na sua instalação, nos esquemas
em fatorial e em parcela subdividida. Comente qual poderá ser a melhor opção para o
pesquisador.
5. Um experimento foi conduzido para avaliar condições de armazenamento para
conservação de banana prata. Os tratamentos primários foram duas temperaturas (120C
e 250C) e os tratamentos secundários (AR, AR+AE, AM, e AM+AE) constituídos pelo
armazenamento refrigerado (AR), atmosfera modificada (AM) pelo uso de filme de
polietileno de baixa densidade associados com a absorção de etileno (AE). Utilizou-se o
delineamento em blocos casualizados, com duas repetições. Os resultados obtidos para
firmeza da polpa (N) foram:
Temperatura Blocos Tratamentos
AR AR+AE AM AM+AE
120C 1 7,0 7,0 5,7 6,6
2 6,5 6,7 5,4 6,9
250C 1 6,2 9,4 7,1 10,5
2 5,8 8,9 6,5 9,6
a) Faça a análise de variância, interprete os resultados obtidos;
b) Faça o desdobramento da interação para comparar os tipos de armazenamentos em cada nível de temperatura e aplique o teste de Tukey (%) para avaliar os tipos de armazenamentos;
c) Faça o desdobramento da interação para comparar os níveis de temperaturas em cada tipo de armazenamento e use o teste F para comparar os efeitos das temperaturas.
6. Um experimento foi realizado com o objetivo de comparar sistemas de preparo de solo
na cultura do milho, bem como determinar a melhor cultivar. O delineamento
experimental foi o blocos casualizado com quatro repetições, com os tratamentos
dispostos no esquema de parcelas subdivididas. Os valores de produção de grãos (t/ha)
obtidos foram:
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
190
Sistema de Cultivar Blocos Total
Preparo Solo I II III IV
Aração A 4,2 4,6 4,5 4,4 B 4,5 4,7 4,3 4,7 C 5,2 5,0 6,8 5,8
Aração+Gradagem A 3,8 4,4 4,8 3,9 B 3,7 3,5 3,1 3,7 C 3,5 3,1 3,4 3,3
Subsolagem A 4,2 4,2 5,2 5,1 B 4,0 3,8 3,7 4,1 C 3,9 3,9 3,7 4,0
a) Faça a análise de variância completa, incluindo todos os desdobramentos e interpretações; 7. Um experimento foi conduzido no delineamento inteiramente casualizado com duas
repetições, com o objetivo de controlar ninfas (formas jovens) de cigarrinhas (Deois
flavopicta) das pastagens através do uso de inseticidas e do manejo (modos de
aplicação, em tempo após corte). Os valores obtidos da porcentagem de eficiência do
controle químico foram:
Manejo Repetição Inseticidas
(Dias após corte)
Decis FW Mipcin 4G Mipcin 2GF
Toxafeno Lorsban
1 dia 1 53 58 80 28 25 2 57 64 84 32 29
8 dias 1 55 28 47 58 33 2 66 32 51 64 37
15 dias 1 35 77 55 68 40 2 37 71 53 64 42
a) Faça a análise de variância com desdobramento de interação e interpretação dos
resultados.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
191
C A P Í T U L O 10 Regressão na análise de variância
10.1. Introdução
Um fator em estudo num experimento pode ser classificado como qualitativo ou
quantitativo. Um fator qualitativo é aquele onde os seus níveis diferem por algum atributo
qualitativo. Como exemplos têm-se variedades, tipos de defensivos, métodos de conduzir
uma determinada tarefa, etc. Por outro lado, um fator quantitativo é aquele onde os níveis
se diferem com relação a quantidade do fator. Como exemplos têm-se temperatura,
umidade, concentração de um princípio ativo, níveis de insumo, pH, etc.
Quando o fator é qualitativo, deve-se proceder à análise de variância dos dados e às
comparações entre médias dos níveis do fator usando algum dos procedimentos para
comparações múltiplas, quando o F for significativo. Para o caso de um fator quantitativo,
deve-se estudar o efeito do fator quantitativo pó r meio de uma relação funcional entre o
mesmo e a variável resposta. A técnica indicada neste caso é a análise de regressão.
A análise de regressão consiste na realização de uma análise estatística com o objetivo
de verificar se a relação funcional estabelecida entre um fator quantitativo e uma variável
resposta é significativa. Em outras palavras, consiste na obtenção de uma equação que
tenta explicar a variação significativa de uma variável resposta em função da variação
dos níveis de um ou mais fatores quantitativos.
10.2. Escolha do modelo para equacionar o fenômeno em estudo
Para tentar estabelecer uma equação que representa o fenômeno em estudo, pode-se
plotar um diagrama de dispersão para verificar como se comportam os valores da
variável resposta (Y) em função da variação dos níveis do fator quantitativo (X).
O comportamento de Y em relação a X, pode se apresentar de diversas maneiras:
linear, quadrático, cúbico, exponencial, logarítmico, etc... . Para se estabelecer o modelo
para explicar o fenômeno, deve-se verificar qual tipo de curva e equação de um modelo
matemático que mais se aproxime dos pontos plotados no diagrama de dispersão.
Contudo, pode-se verificar que os pontos do diagrama de dispersão, não vão se ajustar
perfeitamente à curva do modelo matemático proposto. Haverá na maioria dos pontos,
uma distância entre os pontos do diagrama e aqueles obtidos quando a curva do modelo
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
192
proposto é traçada. Isto acontece, devido ao fato do fenômeno que está em estudo, não
ser um fenômeno matemático e sim um fenômeno que está sujeito a influências de
inúmeros fatores. Assim, o objetivo da regressão é obter um modelo matemático que
melhor se ajuste aos valores observados de Y em função da variação dos níveis da
variável X.
O modelo matemático que irá ser ajustado deve satisfazer as seguintes condições:
- Modelo selecionado deve ser coerente para representar em termos práticos, o
fenômeno em estudo;
- Modelo deve conter apenas as variáveis que são relevantes para explicar o fenômeno.
10.3. Método para obter a equação estimada
Como foi dito anteriormente, os pontos do diagrama de dispersão ficam um pouco
distantes da curva do modelo matemático escolhido. Um dos métodos que se pode
utilizar para obter a relação funcional, se baseia na obtenção de uma equação estimada
de tal forma que as distâncias entre os pontos do diagrama e os pontos da curva do
modelo matemático, no todo, sejam as menores possíveis. Este método é denominado
de Método dos Mínimos Quadrados (MMQ). Em resumo por este método a soma de
quadrados das distâncias entre os pontos do diagrama e os respectivos pontos na
curva da equação estimada é minimizada, obtendo-se, desta forma, uma relação
funcional entre X e Y, para o modelo escolhido, com um mínimo de erro possível.
10.3.1. Modelo linear de 1º grau O modelo estatístico para esta situação seria:
Yi = β0 + β1 Xi + ei
em que
Yi é o valor observado para a variável dependente Y no i-ésimo nível da variável
independente X;
β0 é a constante de regressão. Representa o intercepto da reta com o eixo dos Y;
β1 é o coeficiente de regressão. Representa a variação de Y em função da variação de
uma unidade da variável X;
Xi é o i-ésimo nível da variável independente X (i = 1,2,K,n); e
ei é o erro que está associado à distância entre o valor observado Yi e o correspondente
ponto na curva, do modelo proposto, para o mesmo nível i de X.
Para se obter a equação estimada, vamos utilizar o MMQ, visando a minimização
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
193
dos erros. Assim, tem-se que:
ei = β0 + β1 Xi
elevando ambos os membros da equação ao quadrado
[ ]i 1 ie β β X= +22
0
aplicando o somatório,
[ ]i 1 ie β β X= +∑ ∑22
0
Por meio da obtenção de estimadores de β0 e β1, que minimizem o valor obtido na
expressão anterior, é possível alcançar a minimização da soma de quadrados dos erros.
Sabemos do Cálculo que para se encontrar o mínimo de uma equação deve-se derivar a
equação em relação à variável de interesse, e igualar a derivada resultante ao valor zero.
Portanto, derivando a expressão (1) em relação a 0 1 β e β e igualando-as a zero, obtém-
se:
( )
( ) ( )
n
i n ni
i i
i i
n
i n ni
i i i i
i i
eˆ ˆ ˆ ˆY β β X Y β β X
β
eˆ ˆ ˆ ˆY β β X X Y β β X X
β
=
= =
=
= =
∂
= ⇒ − = − = ⇒ − = = ∂∂ = ⇒ − = − = ⇒ − = = ∂
∑∑ ∑
∑∑ ∑
2
11 0 1 1 0 1
1 10
2
11 0 1 1 0 1
1 11
0 2 1 0 0
0 2 0 0
n n n n n
i i i i
i i i i i
n n n n n n
i i i i i i i i
i i i i i i
ˆ ˆ ˆ ˆY β β X Y nβ β X
ˆ ˆ ˆ ˆYX β X β X YX β X β X
= = = = =
= = = = = =
− − = ⇒ − − =
− − = ⇒ − − =
∑ ∑ ∑ ∑ ∑
∑ ∑ ∑ ∑ ∑ ∑
0 1 0 11 1 1 1 1
2 20 1 0 1
1 1 1 1 1 1
0 0
0 0
n n
i i
i i
n n
i i i
i i
ˆ ˆY nβ β X
ˆ ˆYX β β X
= =
= =
= +
= +
∑ ∑
∑ ∑
0 11 1
20 1
1 1
Este é o sistema de equações normais, que permite a obtenção de estimativas de
β0 e β1, que minimizam a soma de quadrados dos erros.
Uma vez obtidas estas estimativas, podemos escrever a equação estimada:
î iˆ ˆY β β X= +0 1
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
194
10.3.2. Modelo linear de 2º grau O modelo estatístico para esta situação seria:
Yi = β0 + β1 Xi + β2i
X2
+ ei
em que,
Yi é o valor observado para a variável dependente Y no i-ésimo nível da variável
independente X;
β0 é a constante de regressão;
β1 é o coeficiente de regressão;
Xi é o i-ésimo nível da variável independente X (i = 1,2,K,n);
Β2 é o coeficiente de regressão;
iX
2
é o i-ésimo nível da variável independente X, elevado ao quadrado;
ei é o erro que está associado à distância entre o valor observado Yi e o correspondente
ponto na curva para o mesmo nível i de X.
Utilizando o MMQ, no modelo de 2º grau, chegar-se-á ao seguinte sistema de equações
normais, para se obter as estimativas de β0, β1 e β2 :
n n
i i
i i
n n n n
i i i i
i i i i
n n n n
i i i i i
i i i i
ˆ ˆY nβ β β X
ˆ ˆ ˆYX β X β X β X
ˆ ˆ ˆYX β X β X β X
= =
= = = =
= = = =
= + +
= + +
= + +
∑ ∑
∑ ∑ ∑ ∑
∑ ∑ ∑ ∑
20 1 2
1 1
2 30 0 1 2
1 1 1 1
2 2 3 40 1 3
1 1 1 1
Uma vez obtidas estas estimativas, podemos escrever a equação estimada:
îˆ ˆ ˆY β β X β X= + +0 1 1 2 2
10.4. Análise de variância da regressão A equação estimada obtida, apenas estabelece uma relação funcional, entre a variável
dependente e a variável independente, para representar o fenômeno em estudo.
Portanto a simples obtenção da equação estimada não responde ao pesquisador se a
variação da variável independente influencia significativamente na variação da variável
dependente.
Para se responder a esta pergunta, é necessário realizar um teste estatístico para as
estimativas dos coeficientes da equação de regressão estimada. Um teste que pode ser
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
195
realizado para verificar tal fato é o teste F da análise de variância. Portanto, é necessário
realizar uma análise de variância dos dados observados, em função do modelo proposto.
Contudo, a estratégia da análise de variância depende se houve ou não repetições no
experimento.
10.4.1. Apenas um único valor observado para cada nível da variável
independente
Nesta situação não existe repetição. A única estimativa da variância residual é aquela
dada pela falta de ajuste dos valores observados ao modelo ajustado. O quadro para a
análise de variância para a regressão para esta situação é do seguinte tipo:
FV GL SQ QM F
Regressão p SQReg SQReg
p
QMReg
QMInd
Independente da Regressão
n-1-p SQInd SQInd
n p− −1
Total n-1 SQTotal
em que,
p = no de coeficientes de regressão (não inclui o β0)
n = no de observações.
As fórmulas para a obtenção das somas de quadrados total e da soma de quadrados do
independente da regressão são as mesmas, tanto para o modelo linear de 1o grau
quanto para o de 2o grau, as quais são dadas a seguir:
n
ini
i
i
Y
SQTotal Yn
=
=
= −∑
∑
2
12
1 SQInd = SQTotal – SQRegressão
Já a soma de quadrados para a regressão varia de acordo com o modelo em teste
1º grau 2º grau
n
in ni
i i i
i i
Yˆ ˆSQRegressão β Y β YX
n
=
= =
= +∑
∑ ∑
2
10 1
1 1
n
in n ni
i i i i i
i i i
Yˆ ˆ ˆSQRegressão β Y β YX β YX
n
=
= = =
= + +∑
∑ ∑ ∑
2
120 1 2
1 1 1
As hipóteses estatísticas para o teste F são as seguintes:
H0 : β1 = β2 = .... = βp = 0 , o que significa dizer que as p variáveis independentes não
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
196
exercem influência na variável dependente, segundo o modelo proposto.
Ha: βi ≠ β0 , para pelo menos um i, o que significa dizer que pelo menos uma das p
variáveis independentes exerce influência na variável dependente, segundo o modelo
proposto.
O valor de F da análise de variância, deve ser comparado, com o valor de F tabelado
(Ftab) , o qual se obtém na tabela da distribuição F de acordo com o nível de significância
do teste, e o número de graus de liberdade para a regressão e independente da
regressão, ou seja:
Ftab = Fα (p;n 1 p) .
A regra decisória para o teste F é:
- Se F ≥ ⇒ Ftab Rejeita-se 0 H0 ao nível de significância que foi realizado o teste. Podese
inferir que a variável independente influência significativamente a
variável dependente Y.
- Se F < ⇒ FTab Não rejeita-se H0 ao nível de significância que foi realizado o teste.
Pode-se inferir que a variável independente não influência significativamente a variável
dependente Y.
10.4.2. Mais de um valor observado para cada nível da variável independente
Nesta situação, existe mais de um valor observado para cada nível da variável
independente. Assim é possível obter uma estimativa da variância residual tal como
aquela obtida em modelos de delineamento, o que não é possível quando se tem uma
única observação para cada nível da variável independente.
Normalmente o que se faz numa situação como esta é inicialmente proceder a uma
análise de variância usual considerando o efeito do fator quantitativo como se fosse a
fonte de variação tratamentos numa análise de variância usual. Isto é realizado para que
se quantifique a variância residual. Posteriormente, o efeito de tratamentos é desdobrado
nos efeitos associado a um ajuste de um modelo de regressão e também a falta de ajuste
deste modelo. A escolha do modelo de regressão a ser ajustado é aquele que mais se
aproxima dos pontos médios observados para cada nível da variável independente. O
quadro abaixo resume o que acabou de ser descrito, para uma situação geral em que se
está testando I níveis da variável independente em um experimento instalado segundo o
delineamento inteiramente casualizado com K repetições. Pressupõe-se também que se
está testando um modelo de regressão com p coeficientes de regressão. O total de
observações neste experimento é igual a N=IK.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
197
FV GL SQ QM F
Regressão p SQReg SQReg
p
QMReg
QMRes
Falta de Ajustamento I-1-p SQFalta SQFalta
I −1
(Tratamentos) I-1 SQTrat ___
Resíduo I(K – 1) SQRes
( )SQRes
I J −1 QMFalta
QMRes
Total IK – 1 SQTotal ___
O teste F para a falta de ajustamento é realizado para verificar se o modelo adotado está
se ajustando bem aos dados. Se o teste F para a falta de ajustamento for significativo,
indica que o modelo ajustado não é apropriado e um novo modelo que se ajuste melhor
aos dados deve ser testado. Se por outro lado, a falta de ajustamento for não-significativa
indica que o modelo adotado se ajusta bem aos dados.
Conseqüentemente faz sentido analisar o teste F para a fonte de variação regressão para
saber se a variável independente tem influência significativa sobre a variável dependente.
No caso de falta de ajustamento significativa não faz sentido realizar o teste para a
regressão, pois o modelo de regressão não se ajustou significativamente aos dados.
As hipóteses para a falta de ajustamento são:
H0: a falta de ajustamento não é significativa
Ha: a falta de ajustamento é significativa
O valor tabelado de F para a falta de ajustamento é encontrado usando
FTab = Fα (p; I 1 p)
A regra decisória para o teste F para a falta de ajustamento é:
Se F ≥ ⇒ Ftab Rejeita-se H0 ao nível de significância que foi realizado o teste. O modelo
adotado não se ajusta bem aos dados. Um novo modelo deve ser testado.
Se F < ⇒ FTab Não rejeita-se H0 ao nível de significância que foi realizado o teste. O
modelo adotado se ajusta bem aos dados. Não há necessidade de se testar um novo
modelo. Procede-se ao teste F para regressão.
O teste F para a regressão é idêntico ao caso anterior, ou seja, com apenas uma
observação para cada nível da variável independente.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
198
10.5. Coeficiente de determinação (R2)
O coeficiente de determinação fornece uma informação auxiliar ao resultado da análise
de variância da regressão, para verificar se o modelo proposto é adequado ou não para
descrever o fenômeno.
Para o caso em que se tem uma única observação para cada nível da variável
independente , o R2 é obtido por:
SQRegR
SQTotal=
2
Já para o caso em que se tem mais de um valor observado para cada nível da variável
independente, o valor de R2 é obtido por:
SQRegR
SQTrat=
2
O valor de R2 varia no intervalo de 0 a 1. Valores próximos de 1 indicam que o modelo
proposto é adequado para descrever o fenômeno.
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
199
Exercícios
1. Verificar, utilizando os dados amostrais fornecidos abaixo, se a temperatura tem
influência significativa sobre o comprimento de uma barra de aço. Utilize o modelo linear
de 1º grau e o nível de 5% de significância.
Temperatura (ºC) 10 15 20 25 30
Comprimento (mm) 1003 1005 1010 1011 1014
2. Para verificar se existe uma relação linear de 1º grau entre Umidade Relativa (UR) do
ar da secagem de sementes e a germinação das mesmas, um pesquisador realizou um
teste com 4 diferentes valores para a % de UR do ar que atravessava as sementes
armazenadas, obtendo-se os seguintes valores amostrais:
UR (%) 20 30 40 50
Germinação (%) 94 96 95 97
Ao nível de 5% de probabilidade, qual seria a conclusão do pesquisador? Qual seria a
equação estimada?
3. Para o seguinte conjunto de valores de X (variável independente) e Y (variável
dependente), faça a análise de regressão segundo o modelo linear de 1º grau e obtenha
a equação de regressão estimada. Use o nível de significância de 5%.
X 2 4 6 8 10 12 14 16 18 20
Y 10,3 18,2 25,1 35,6 43 50 59,1 67,8 75,2 85
4. De acordo com os dados fornecidos abaixo para a variável X (dose do micronutriente
Zn em ppm) e a variável Y (matéria seca em g/planta), verifique, usando o nível de 5% de
probabilidade e o modelo linear de 2º grau, se a relação entre as variáveis X
(independente) e Y (dependente) é significativa.
X 1 2,5 4 5,5 7 8,5
Y 20,3 31,3 34,6 35,1 30,2 19,7
5. O modelo linear abaixo foi proposto para explicar a relação entre a quantidade de
ração fornecida e produção de leite por cabras:
Yi = a + bXi + ei Pede-se por meio dos dados abaixo, verificar se a ração influencia
significativamente a produção de leite (α = 5%):
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
200
Níveis de Ração (g) 50 75 100 125 150
Produção de leite (l/dia) 1,2 1,7 2 2,1 2,5
6. Para se avaliar o efeito de diferentes dosagens de um micronutriente no
desenvolvimento de duas espécies vegetais, foi realizado em experimento fatorial 4x2 no
D.B.C. com 5 repetições. Após a coleta e tabulação dos dados (em produção de matéria
verde por determinada unidade de área) foi montado o seguinte quadro de totais de
tratamentos:
Dose 1 Dose 2 Dose 3 Dose 4 Totais
Espécie 1 60 52 60 90 262
Espécie 2 56 50 40 40 186
Totais 116 102 100 130 448
A análise de variância dos dados no computador forneceu o seguinte quadro (incompleto)
da ANAVA:
FV GL SQ QM F
Fator A Fator B 58,2 Int. AxB 49,2 (Trat.) Blocos Resíduo 10 Total
Com base nos dados apresentados acima, pede-se: (obs.: use α = 5%):
a) Obtenha a soma de quadrados para o fator A. Apresente os cálculos.
b) Os fatores em estudo atuam independentemente na variável em análise?
JUSTIFIQUE.
c) Qual espécie deveria ser usada de modo a termos uma maior produção de massa
verde, quando for usada a dose 3 do micronutriente? JUSTIFIQUE.
d) Como deveríamos continuar a análise caso fosse de nosso interesse determinar a
melhor dose do micronutriente? Descreva a estratégia de análise de maneira resumida,
apresentando a seqüência dos procedimentos a serem realizados juntamente com
algumas discussões, mas sem precisar fazer nenhum tipo de cálculo
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
201
7. Suponha que um colega seu tenha usado um programa de computador para realizar a
análise de regressão de um experimento no DIC com 4 repetições, no qual foi avaliado o
efeito de 5 níveis de adubo na produção de soja. O orientador desse seu colega pediu
que ele testasse três modelos. Como seu colega "matou" todas as aulas de estatística,
ele foi pedir sua ajuda para a escolha do melhor modelo a partir dos dados abaixo,
referentes à análise de cada modelo. Baseado no quadro fornecido abaixo, pede-se
escolher o melhor modelo. Explique, para cada modelo, a razão dele ter sido selecionado
ou eliminado. Use α = 5%.
MODELO 1
FV GL SQ QM
Regressão 1 36 36 Falta de Ajust. 3 60 20 (Trat.) (4) 96 Resíduo 15 75 5 Total 19 171
MODELO 2
FV GL SQ QM
Regressão 2 66 33 Falta de Ajust. 2 30 15 (Trat.) (4) 96 Resíduo 15 75 5 Total 19 171
MODELO 3
FV GL SQ QM
Regressão 3 76 25,3 Falta de Ajust. 1 20 20 (Trat.) (4) 96 Resíduo 15 75 5 Total 19 171
O gráfico de dispersão dos valores médios de produção em função das doses de adubo
obtido pelo seu colega foi
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
202
8. Com o objetivo de estudar o efeito da temperatura no ganho de peso de determinada
espécie de animal de pequeno porte, foi realizado um estudo em que alguns animais
foram submetidos a diferentes temperaturas no local em que eram confinados.
Com base nos dados de ganho de peso, obtidos depois de determinado período,
ajustouse a seguinte equação de regressão:
Y = - 6,89 + 0,93X – 0,02X2
Considerando que a análise de variância da regressão resultou em F significativo para
regressão, pede-se:
a) Qual seria o ganho de peso (em quilos) esperado, se fosse mantida constante, no local
de confinamento do animal em questão, a temperatura de 23 oC?
b) Qual seria a temperatura a ser usada para que fosse obtido o máximo de ganho de
peso?
9. Suponha que tenha sido realizada uma pesquisa a respeito da influência do tempo de
estudo na nota da prova de determinada disciplina. Os dados obtidos com respeito a
cinco alunos aleatoriamente entrevistados são dados abaixo:
Xi = Tempo de estudo (em horas) 2 3 4 5 6
Y = Nota obtida (em 10) 3 5 6 8 9
20 40 60
Doses (kg/ha)
Produçã
o – kg/unid
25 20 15 10 5
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
203
iX =∑2 0 iX =∑
2 9 0 iY =∑
3 1 i iX Y =∑
1 3 9 iY =∑
2 2 1 5
Pede-se:
a) Ajuste um modelo de regressão linear de 1o grau para tentar explicar a variação na
nota do aluno em função do tempo de estudo.
OBS.: Indique a resolução, inclusive apresentando o sistema de equações normais.
b) Poderíamos dizer que o tempo de estudo influencia significativamente a nota obtida?
(use α = 5%).
10. Suponha que um pesquisador, tendo como objetivo desenvolver uma bebida Láctea
com sabor natural de laranja e temendo que o uso do suco natural resultasse em elevada
acidez, resolveu testar 10 dosagens de suco natural (10, 15, 20, 25, 30, 35, 40, 45, 50 e
55 ml) com relação ao ph da bebida Láctea. Para tanto preparou um lote da fórmula
básica da bebida Láctea. A fórmula básica é aquela que contém todos os ingredientes da
bebida Láctea, exceto o suco de laranja. Como o lote era completamente homogêneo,
dividiu o lote em 30 amostras. Procedeu-se então a distribuição inteiramente ao acaso
das dosagens de suco de laranja às amostras. Ao final, cada dosagem foi designada a 3
amostras. Após a mistura do suco de laranja às amostras, o pH da bebida Láctea foi
medido. Um gráfico de dispersão da dosagem versus pH, mostrou que o modelo linear de
1o grau era indicado para estudar o fenômeno. Com base nos dados, as seguintes
informações foram obtidas
Quadro da ANAVA da Regressão
FV GL SQ QM F
Regressão 237,692
Falta de Ajust.
(Trat.) (23,372)
Resíduo
Total 25,1520
Equação da regressão ajustada: î
Y = 0,063 – 0,08Xi
Com base nas informações fornecidas acima e usando o nível de 5% de significância,
pede-se:
OBSERVAÇÃO: UTILIZAR QUATRO DECIMAIS NOS CÁLCULOS
a. O modelo ajustado é adequado para descrever o fenômeno?
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
204
b. A dosagem do suco de laranja tem efeito significativo na acidez da bebida Láctea?
c. Quanto se espera que varie o pH da bebida Láctea em função da variação de 1
ml de suco de laranja?
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
205
Tabela 1, Distribuição t de Student
Teste Unilateral
gl
15% 10% 5% 2,5% 2% 1% 0,5% 0,1% 0,05%
Teste Bilateral
30% 20% 10% 5% 4% 2% 1% 0,2% 0,1%
1 1,9626 3,0777 6,3137 12,7062 15,8945 31,8210 63,6559 318,2888 636,5776
2 1,3862 1,8856 2,9200 4,3027 4,8487 6,9645 9,9250 22,3285 31,5998
3 1,2498 1,6377 2,3534 3,1824 3,4819 4,5407 5,8408 10,2143 12,9244
4 1,1896 1,5332 2,1318 2,7765 2,9985 3,7469 4,6041 7,1729 8,6101
5 1,1558 1,4759 2,0150 2,5706 2,7565 3,3649 4,0321 5,8935 6,8685
6 1,1342 1,4398 1,9432 2,4469 2,6122 3,1427 3,7074 5,2075 5,9587
7 1,1192 1,4149 1,8946 2,3646 2,5168 2,9979 3,4995 4,7853 5,4081
8 1,1081 1,3968 1,8595 2,3060 2,4490 2,8965 3,3554 4,5008 5,0414
9 1,0997 1,3830 1,8331 2,2622 2,3984 2,8214 3,2498 4,2969 4,7809
10 1,0931 1,3722 1,8125 2,2281 2,3593 2,7638 3,1693 4,1437 4,5868
11 1,0877 1,3634 1,7959 2,2010 2,3281 2,7181 3,1058 4,0248 4,4369
12 1,0832 1,3562 1,7823 2,1788 2,3027 2,6810 3,0545 3,9296 4,3178
13 1,0795 1,3502 1,7709 2,1604 2,2816 2,6503 3,0123 3,8520 4,2209
14 1,0763 1,3450 1,7613 2,1448 2,2638 2,6245 2,9768 3,7874 4,1403
15 1,0735 1,3406 1,7531 2,1315 2,2485 2,6025 2,9467 3,7329 4,0728
16 1,0711 1,3368 1,7459 2,1199 2,2354 2,5835 2,9208 3,6861 4,0149
17 1,0690 1,3334 1,7396 2,1098 2,2238 2,5669 2,8982 3,6458 3,9651
18 1,0672 1,3304 1,7341 2,1009 2,2137 2,5524 2,8784 3,6105 3,9217
19 1,0655 1,3277 1,7291 2,0930 2,2047 2,5395 2,8609 3,5793 3,8833
20 1,0640 1,3253 1,7247 2,0860 2,1967 2,5280 2,8453 3,5518 3,8496
21 1,0627 1,3232 1,7207 2,0796 2,1894 2,5176 2,8314 3,5271 3,8193
22 1,0614 1,3212 1,7171 2,0739 2,1829 2,5083 2,8188 3,5050 3,7922
23 1,0603 1,3195 1,7139 2,0687 2,1770 2,4999 2,8073 3,4850 3,7676
24 1,0593 1,3178 1,7109 2,0639 2,1715 2,4922 2,7970 3,4668 3,7454
25 1,0584 1,3163 1,7081 2,0595 2,1666 2,4851 2,7874 3,4502 3,7251
26 1,0575 1,3150 1,7056 2,0555 2,1620 2,4786 2,7787 3,4350 3,7067
27 1,0567 1,3137 1,7033 2,0518 2,1578 2,4727 2,7707 3,4210 3,6895
28 1,0560 1,3125 1,7011 2,0484 2,1539 2,4671 2,7633 3,4082 3,6739
29 1,0553 1,3114 1,6991 2,0452 2,1503 2,4620 2,7564 3,3963 3,6595
30 1,0547 1,3104 1,6973 2,0423 2,1470 2,4573 2,7500 3,3852 3,6460
35 1,0520 1,3062 1,6896 2,0301 2,1332 2,4377 2,7238 3,3400 3,5911
40 1,0500 1,3031 1,6839 2,0211 2,1229 2,4233 2,7045 3,3069 3,5510
50 1,0473 1,2987 1,6759 2,0086 2,1087 2,4033 2,6778 3,2614 3,4960
60 1,0455 1,2958 1,6706 2,0003 2,0994 2,3901 2,6603 3,2317 3,4602
12
0
1,0409 1,2886 1,6576 1,9799 2,0763 2,3578 2,6174 3,1595 3,3734
+∞∞∞∞ 1,0364 1,2816 1,6449 1,9600 2,0537 2,3264 2,5758 3,0902 3,2905
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
206
F
TABELA 2 Distribuição
F de Snedecor
α = 0,05
GL
denom.- n2 GL no numerador – n1
1 2 3 4 5 6 7 8 9 10 1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 35 4,12 3,27 2,87 2,64 2,49 2,37 2,29 2,22 2,16 2,11 40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 45 4,06 3,20 2,81 2,58 2,42 2,31 2,22 2,15 2,10 2,05 50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 ∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83
área = = 0,05
(valor tabulado)
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
207
F
TABELA 3 Distribuição
F de Snedecor
α = 0,01
GL
denom n2 GL no numerador – n1
1 2 3 4 5 6 7 8 9 10 1 4052,2 4999,3 5403,5 5624,3 5764,0 5859,0 5928,3 5981,0 6022,4 6055,9 2 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,40 3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,23 4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 35 7,42 5,27 4,40 3,91 3,59 3,37 3,20 3,07 2,96 2,88 40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 45 7,23 5,11 4,25 3,77 3,45 3,23 3,07 2,94 2,83 2,74 50 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,70 100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 2,50 120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 ∞ 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32
área = = 0,01
(valor tabulado)
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
208
Tabela 4 - Valores da amplitude total estudentizada (q), para uso no teste de Tukey, ao
nível de 5% de probabilidade
GL k= Número e tratamentos
2 3 4 5 6 7 3 9 10
1 17,97 90,03
26,98 135,00
32,82 164,30
37,08 185,60
40,41 202,20
43,12 215,80
45,40 227,20
47,36 237,00
49,07 245,6
2 6,09 14,04
8,33 19,02
9,80 22,29
10,88 24,72
11,74 26,63
12,44 28,20
13,03 29,53
13,54 30,68
13,99 31,69
3 4,50 8,26
5,91 10,62
6,83 12,17
7,50 13,33
8,04 14,24
8,48 15,00
8,85 15,64
9,18 16,20
9,46 16,69
4 3,93 6,51
5,04 8,12
5,76 9,17
6,29 9,96
6,71 10,58
7,05 11,10
7,35 11,55
7,60 11,93
7,83 12,27
5 3,64 5,70
4,60 6,98
5,22 7,80
5,67 8,42
6,03 8,91
6,33 9,32
6,58 9,67
6,80 9,97
6,99 10,24
6 3,46 5,24
4,34 6,33
4,90 7,03
5,30 7,56
5,63 7,97
5,90 8,32
6,12 8,61
6,32 8,87
6,49 9,10
7 3,34 4,95
4,16 5,92
4,68 6,54
5,06 7,01
5,36 7,37
5,61 7,68
5,82 7,94
6,00 8,17
6,16 8,37
8 3,26 4,75
4,04 5,64
4,53 6,20
4,89 6,62
5,17 6,96
5,40 7,24
5,60 7,47
5,77 7,68
5,92 7,86
9 3,20 4,60
3,95 5,43
4,41 5,96
4,76 6,35
5,02 6,66
5,24 6,91
5,43 7,13
5,59 7,33
5,74 7,49
10 3,15 4,48
3,88 5,27
4,33 5,77
4,65 6,14
4,91 6,43
5,12 6,67
5,30 6,87
5,46 7,05
5,60 7,21
11 3,11 4,39
3,82 5,15
4,26 5,62
4,57 5,97
4,82 6,25
5,03 6,48
5,20 6,67
5,35 6,84
5,49 6,99
12 3,08 4,32
3,77 5,05
4,20 5,50
4,51 5,84
4,75 6,10
4,95 6,32
5,12 6,51
5,27 6,67
5,39 6,81
13 3,06 4,26
3,73 4,96
4,15 5,40
4,45 5,73
4,69 5,98
4,88 6,19
5,05 6,37
5,19 6,53
5,32 6,67
14 3,03 4,21
3,70 4,89
4,11 5,32
4,41 5,63
4,64 5,88
4,83 6,08
4,99 6,26
5,13 6,41
5,25 6,54
15 3,01 4,17
3,67 4,84
4,08 5,25
4,37 5,56
4,59 5,80
4,78 5,99
4,94 6,16
5,08 6,31
5,20 6,44
16 3,00 4,13
3,65 4,79
4,05 5,19
4,33 5,49
4,56 5,72
4,74 5,92
4,90 6,08
5,03 6,22
5,15 6,35
17 2,98 4,10
3,63 4,74
4,02 5,14
4,30 5,43
4,52 5,66
4,70 5,85
4,86 6,01
4,99 6,15
5,11 6,27
18 2,97 4,07
3,61 4,70
4,00 5,09
4,28 5,38
4,49 5,60
4,67 5,79
4,82 5,94
4,96 6,08
5,07 6,20
19 2,96 4,05
3,59 4,67
3,98 5,05
4,25 5,33
4,47 5,55
4,65 5,73
4,79 5,89
4,92 6,02
5,04 6,14
20 2,95 4,02
3,58 4,64
3,96 5,02
4,23 5,29
4,45 5,51
4,62 5,69
4,77 5,84
4,90 5,97
5,01 6,09
24 2,92 3,96
3,53 4,55
3,90 4,91
4,17 5,17
4,37 5,37
4,54 5,54
4,68 5,69
4,81 5,81
4,92 5,92
30 2,89 3,89
3,49 4,45
3,85 4,80
4,10 5,05
4,30 5,24
4,46 5,40
4,60 5,54
4,72 5,65
4,82 5,76
40 2,86 3,82
3,44 4,37
3,79 4,70
4,04 4,93
4,23 5,11
4,39 5,26
4,52 5,39
4,63 5,50
4,73 5,60
60 2,83 3,76
3,40 4,28
3,74 4,59
3,98 4,82
4,16 4,99
4,31 5,13
4,44 5,25
4,55 5,36
4,65 5,45
120 2,80 3,70
3,36 4,20
3,68 4,50
3,92 4,71
4,10 4,87
4,24 5,01
4,36 5,12
4,47 5,21
4,56 5,30
∞ 2,77 3,64
3,31 4,12
3,63 4,40
3,86 4,60
4,03 4,76
4,17 4,88
4,29 4,99
4,39 5,08
4,47 5,16
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
209
Tabela 5. Teste de Dunnett
GL (N-k) αααα
k níveis
2 3 4 5 6 7 8 9 10
5
0,05 2,57 3,03 3,29 3,48 3,62 3,73 3,82 3,9 3,97
0,01 4,03 4,63 4,98 5,22 5,41 5,56 5,69 5,8 5,89
6
0,05 2,45 2,86 3,1 3,26 3,39 3,49 3,57 3,64 3,71
0,01 3,71 4,21 4,51 4,71 4,87 5 5,1 5,2 5,28
7
0,05 2,36 2,75 2,97 3,12 3,24 3,33 3,41 3,47 3,53
0,01 3,5 3,95 4,21 4,39 4,53 4,64 4,74 4,82 4,89
8
0,05 2,31 2,67 2,88 3,02 3,13 3,22 3,29 3,35 3,41
0,01 3,36 3,77 4 4,17 4,29 4,4 4,48 4,56 4,62
9
0,05 2,26 2,61 2,81 2,95 3,05 3,14 3,2 3,26 3,32
0,01 3,25 3,63 3,85 4,01 4,12 4,22 4,3 4,37 4,43
10
0,05 2,23 2,57 2,76 2,89 2,99 3,07 3,14 3,19 3,24
0,01 3,17 3,53 3,74 3,88 3,99 4,08 4,16 4,22 4,28
11
0,05 2,2 2,53 2,72 2,84 2,94 3,02 3,08 3,14 3,19
0,01 3,11 3,45 3,65 3,79 3,89 3,98 4,05 4,11 4,16
12
0,05 2,18 2,5 2,68 2,81 2,9 2,98 3,04 3,09 3,14
0,01 3,05 3,39 3,58 3,71 3,81 3,89 3,96 4,02 4,07
13
0,05 2,16 2,48 2,65 2,78 2,87 2,94 3 3,06 3,1
0,01 3,01 3,33 3,52 3,65 3,74 3,82 3,89 3,94 3,99
14
0,05 2,14 2,46 2,63 2,75 2,84 2,91 2,97 3,02 3,07
0,01 2,98 3,29 3,47 3,59 3,69 3,76 3,83 3,88 3,93
15
0,05 2,13 2,44 2,61 2,73 2,82 2,89 2,95 3 3,04
0,01 2,95 3,25 3,43 3,55 3,64 3,71 3,78 3,83 3,88
16
0,05 2,12 2,42 2,59 2,71 2,8 2,87 2,92 2,97 3,02
0,01 2,92 3,22 3,39 3,51 3,6 3,67 3,73 3,78 3,83
17
0,05 2,11 2,41 2,58 2,69 2,78 2,85 2,9 2,95 3
0,01 2,9 3,19 3,36 3,47 3,56 3,63 3,69 3,74 3,79
18
0,05 2,1 2,4 2,56 2,68 2,76 2,83 2,89 2,94 2,98
0,01 2,88 3,17 3,33 3,44 3,53 3,6 3,66 3,71 3,75
19
0,05 2,09 2,39 2,55 2,66 2,75 2,81 2,87 2,92 2,96
0,01 2,86 3,15 3,31 3,42 3,5 3,57 3,63 3,68 3,72
20
0,05 2,09 2,38 2,54 2,65 2,73 2,8 2,86 2,9 2,95
0,01 2,85 3,13 3,29 3,4 3,48 3,55 3,6 3,65 3,69
24
0,05 2,06 2,35 2,51 2,61 2,7 2,76 2,81 2,86 2,9
0,01 2,8 3,07 3,22 3,32 3,4 3,47 3,52 3,57 3,61
30
0,05 2,04 2,32 2,47 2,58 2,66 2,72 2,77 2,82 2,86
0,01 2,75 3,01 3,15 3,25 3,33 3,39 3,44 3,49 3,52
40
0,05 2,02 2,29 2,44 2,54 2,62 2,68 2,73 2,77 2,81
0,01 2,7 2,95 3,09 3,19 3,26 3,32 3,37 3,41 3,44
60
0,05 2 2,27 2,41 2,51 2,58 2,64 2,69 2,73 2,77
0,01 2,66 2,9 3,03 3,12 3,19 3,25 3,29 3,33 3,37
Nagib Yassin ESTATÍSTICA EXPERIMENTAL
210
Tabela 6 - Valores da amplitude total estudentizada (z), para uso no teste de Duncan, ao
nível de 5% de probabilidade
n2 2 3 4 5 6 7 8 9 10
1 18,00 18,00 18,00 18,00 18,00 18,00 18,00 18,00 18,00
2 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09
3 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50
4 3,93 4,01 4,02 4,02 4,02 4,02 4,02 4,02 4,02
5 3,64 3,74 3,79 3,83 3,83 3,83 3,83 3,83 3,83
6 3,46 3,58 3,64 3,68 3,68 3,68 3,68 3,68 3,68
7 3,35 3,47 3,54 3,58 3,60 3,61 3,61 3,61 3,61
8 3,26 3,39 3,47 3,52 3,55 3,56 3,56 3,56 3,56
9 3,20 3,34 3,20 3,34 3,41 3,52 3,52 3,52 3,52
10 3,15 3,30 3,15 3,30 3,37 3,47 3,47 3,47 3,47
11 3,11 3,27 3,35 3,39 3,43 3,44 3,45 3,46 3,46
12 3,08 3,23 3,33 3,36 3,40 3,42 3,44 3,44 3,46
13 3,06 3,21 3,30 3,35 3,38 3,41 3,42 3,44 3,45
14 3,03 3,18 3,27 3,33 3,37 3,39 3,41 3,42 3,44
15 3,01 3,16 3,25 3,31 3,36 3,38 3,40 3,42 3,43
16 3,00 3,15 3,23 3,30 3,34 3,37 3,39 3,41 3,43
17 2,98 3,13 3,22 3,28 3,33 3,36 3,38 3,40 3,42
18 2,97 3,12 3,21 3,27 3,32 3,35 3,37 3,39 3,41
19 2,96 3,11 3,19 3,26 3,31 3,35 3,37 3,39 3,41
20 2,95 3,10 3,18 3,25 3,30 3,34 3,36 3,38 3,40
22 2,93 3,08 3,17 3,24 3,29 3,32 3,35 3,37 3,39
24 2,92 3,07 3,15 3,22 3,28 3,31 3,34 3,37 3,38
26 2,91 3,06 3,14 3,21 3,27 3,30 3,34 3,36 3,38
28 2,90 3,04 3,13 3,20 3.26 3,30 3,33 3,35 3,37
30 2,89 3,04 3,12 3,20 3,25 3,29 3,32 3,35 3,37
40 2,86 3,01 3,10 3,17 3,22 3,27 3,30 3,33 3,35
60 2,83 2,98 3,08 3,14 3,20 3,24 3,28 3,31 3,33
100 2,80 2,95 3,05 3,12 3,18 3,22 3,26 3,29 3,32
∞ 2,77 2,92 3,02 3,09 3,15 3,19 3,23 3,26 3,29
n = nº de médias ordenadas abrangidas pelo contraste n2 = nº de graus de liberdade do resíduo