Sob a hipótese de normalidade e homogenidade de variâncias a estatística S12/S22, tem uma distribuição F com n1-1,n2-1 graus de liberdade. Deve escolher-se as amostras 1 e 2 de forma a que vobs seja maior que 1. Sob a hipótese nula o quociente entre os desvios padrões deverá ter um valor aproximadamente igual a 1. Desvios significativos deste valor dificilmente poderão ser explicados por erros aleatórios indicando que a hipótese nula deve ser rejeitada.
Exemplo: ( Analyst 1982, 107, 1047 , D. Ballinger, A. Lloyd , A. Morrish) Um método proposto para a determinação do consumo químico de oxigênio em águas residuais foi comparado com o método de referência (método do sal de mercúrio). Os resultados seguintes foram obtidos para uma amostra de esgotos. Foram feitas 8 determinações.
Método | Média | Desvio padrão |
Standard | 72 | 3.31 |
Proposto | 72 | 1.51 |
Ho : 12= 22 vs H1: 22>12
vobs:
(3.31)2/(1.51)2 = 4.8
f(7,7) 0.95= 3.79
Como o valor observado excede o quantil relativo ao valor 0.95 da função de distribuição rejeita-se a hipótese nula.
Exemplo: Relativamente ao método testado do exemplo anterior e supondo
verificada a hipótese de normalidade das observações, poderíamos, sem fazer
qualquer comparação com outro método simplesmente testar a hipótese do erro
aleatório ser inferior a 3.
Ho: 2= 02 vs H1: 2< 02
qobs =
(1.512/32).7=1.77
f(7)0.05=2.17
Como 1.77<2.17 rejeitamos a hipótese do desvio padrão ser igual a 3 aceitando a hipótese alternativa.
Vimos igualmente, para o caso de comparação de duas amostras que podíamos utilizar amostras de diferentes concentrações desde que o erro não fosse dependente dessa mesma concentração. Se assim não for, e o método deva ser testado para uma grande amplitude de amostras tipo, podíamos conceber para cada uma, em separado, um teste. Este processo pode não ser prático, exigindo um grande esforço de análise.
Deste modo torna-se inequívoca a necessidade de outra metodologia quando a variabilidade deva ser testada relativamente aos erros aleatórios e a outro fator adicional. Precisamente o método que se descreve em seguida, permite-nos comparar resultados obtidos quando não apenas o erro aleatório está a ser considerado, mas quando existe um outro fator que pode ser preponderante na explicação da variabilidade, a ANÁLISE DE VARIÂNCIA, normalmente descrita por ANOVA. Esta metodologia é uma poderosa ferramenta na análise estatística subjacente à experimentação. Ilustrações da sua aplicabilidade são por exemplo as seguintes situações, relativas à comparação:
condições de armazenamento | replicadas | médias |
A- Preparado fresco | 102,100,101 | 101 |
B- guardado 1 hr no escuro | 101,101,104 | 102 |
C- guardado 1 hr a meia luz | 97,95,99 | 97 |
D- guardado 1 hr em luz forte | 90,92,94 | 92 |
média global | 98 |
SST = SSE + SSR
Consideremos um caso geral de p amostras de dimensão ni num total de n observações:
significa que a variabilidade total pode ser decomposta numa soma que explica :
SSE -> a variação aleatória global soma da variação dentro de cada amostra
SSR -> a variação entre amostras
Relativamente aos graus de liberdade de cada estatística,
Podemos estudar a distribuição das médias dos desvios quadrados
Vamos analisar em detalhe o modelo que está subjacente aos dados, realçando antes a diferença entre um modelo de fator fixo e aleatório.
Exemplo: Suponhamos que se pretendia realizar um estudo comparativo para um grupo de laboratórios perfeitamente definido, a fim de identificar o viés analítico inter -laboratorial . Este modelo corresponde a um modelo de fator controlado, ou fixo. O modelo é assim estabelecido uma vez que a variabilidade tem duas componentes, uma relativa ao erro aleatório, intra-laboratórial, e outra fixa , resultante de variação inter-laboratórial, que está definida apenas para o grupo em estudo. Se no entanto o estudo fosse relativo a todos os laboratórios, a dimensão elevada dos mesmos não permitiria um censo, sendo escolhida uma amostra aleatória de laboratórios onde o estudo seria efetuado. Neste caso referimo-nos a um modelo aleatório porque além do erro aleatório, igualmente presente no modelo anterior, intra -laboratorial, existe um outro fator também aleatório, resultante igualmente da variação entre laboratórios. A diferença fundamental reside no fato de se estudar um grupo perfeitamente definido, para o qual pode ser formalizada como uma constante, a componente descritiva de cada elemento do grupo ou essa componente é uma variável aleatória resultante da escolha de uma amostra para representar uma população.µ
.....
O outup de ANOVA para o exemplo descrito (MINITAB) ANALYSIS OF VARIANCE SOURCE DF SS MS F p FACTOR 3 186.00 62.00 20.67 0.000 ERROR 8 24.00 3.00 TOTAL 11 210.00 INDIVIDUAL 95 PCT CI'S FOR MEAN BASED ON POOLED STDEV LEVEL N MEAN STDEV ------+---------+---------+---------+ C1 3 101.00 1.00 (----*-----) C2 3 102.00 1.73 (-----*-----) C3 3 97.00 2.00 (----*-----) C4 3 92.00 2.00 (-----*-----) ------+---------+---------+---------+ POOLED STDEV = 1.73 92.0 96.0 100.0 104.0Como p<0.05 rejeitamos a hipótese de igualdade de v. médios