|
|
 |
Disciplina
de Métodos Quantitativos em Medicina (mpt-164 / edição 2003)
|
 |
 |
|
Regressão
e ANOVA
|
Este texto
é parte integrante da aula sobre
Correlação
e Regressão
| publicação: |
|
20/out/1999 |
| última modificação: |
|
06/nov/2000 |
Após ter desenvolvido um modelo básico de regressão
linear, podemos utilizar a análise de variância para verificar
quanto a reta de regressão "explica" os valores
observados que foram utilizados para o ajuste. Este texto
descreve uma maneira de obter esta medida.
Modelo ajustado por
regressão:
Adote, neste texto, a seguinte notação
para o modelo de regressão linear
ajustado:

| onde: |
 |
... |
estimador do coeficiente linear (ou intercepto) |
 |
... |
estimador do coeficiente angular |
|
 |
Em outras palavras, observe o seguinte
gráfico:

Os valores observados ( , representados por ) são utilizados para ajustar uma reta
de regressão ( ) ajustada através de :
 |
e |
 |
Os valores by,x e a,
assim obtidos, são estimadores do coeficiente angular
e do intercepto, portando são notados neste texto por
e .
Suponha que os valores de y não sejam influenciados
pelos valores de x. Se y não depende
de x, graficamente, teríamos y constante
( ,
dado que b=0 e y=a): estaríamos
supondo que os valores observados são flutuações, ao acaso,
ao redor de um valor médio .
Podemos medir quanto a reta de regressão (valores
) difere deste valor
médio pela soma
dos quadrados das distâncias entre e ( ), o que corresponde a . Também podemos medir o
espalhamento dos valores observados em relação à reta,
o que corresponde a dado pela soma dos quadrados
das distâncias entre e ( ). Por isto que dizemos que corresponde a quanto da
variação de é "justificado"
pela reta ajustada e
a quanto "sobra" para ser explicado.
|
 |
Medida
de qualidade do ajuste, o R-quadrado:
Podemos verificar que percentual da
variância total que é explicada pela reta obtida de um modelo
de regressão linear, utilizando:

Nota: os denominadores 1
e n-1 correspondem
aos graus de liberdade de SQregressão
e SQtotal.
Teste F para regressão
linear simples:
Podemos também testar:

| ou seja, se a porção da variância
total explicada pela regressão é estatisticamente
significativa. A hipótese nula é a de que a variação
de y não depende de x, portanto
rejeitando H0
estamos admitindo que y é função de x.
Para isto compararemos as variâncias descritas
acima com: |
 |
| que, sob H0,
tem distribuição F com graus de liberdade
(1,n-2). Portanto rejeita-se H0
quando MQregressão
for significativamente maior que a MQresíduos. |
| É comum se ter, entre os resultados
do ajuste de uma reta de regressão dados por um
pacote estatístico, uma tabela como a seguinte: |
| ANOVA
de uma regressão simples |
| |
d.f. |
SQ |
MQ |
F |
valor p |
| Regressão |
1 |
SQregressão |
MQregressão |
SQregressão / MQresíduos |
|
| Resíduos |
n-2 |
SQresíduos |
MQresíduos |
|
|
| Total |
n-1 |
SQtotal |
|
|
|
|
|
|
| |
|
|
©2003, Informática
Médica do Departamento de Patologia
da Faculdade de Medicina da USP
Todos
os direitos reservados: para o uso ou reprodução total ou
parcial deste texto entre em contato com os autores.
(Veja
também as instruções para referenciar nosso material didático)
O uso ou reprodução total ou parcial deste
material didático pode ser permitido exclusivamente para uso
acadêmico ou de ensino que não envolva ganho comercial. Solicitamos
que:
- Mantenha este texto e o link para http://www.fm.usp.br/dim intactos;
- Entre em contato conosco através do e-mail vilma@dim.fm.usp.br,
informando-nos da ocorrência.
|
responsáveis:
|
|
Prof.
Dr. Eduardo Massad |
editor: |
|
Prof.
Dr. Paulo Sérgio Panse Silveira
|
|
coordenador:
|
|
Prof.
Dr. Koichi Sameshima |
autores: |
|
Docentes
da DIM |
|
|
suporte:Telemedicina
e Informática Médica
|
|
|
|