Disciplina de Métodos Quantitativos em Medicina (mpt-164 / edição 2003)


 

Correlação e Regressão        

downloadClique aqui para Download

veja também a lista de exercícios

publicação: 14/out/1999
última modificação: 01/nov/2000


Objetivos:

Ao final desta aula, o aluno deve estar apto a:

  • Definir diagrama de dispersão, retas de regressão, coeficiente de regressão, intercepto, equação de regressão e coeficiente de correlação.
  • Calcular o coeficiente de regressão e o intercepto.
  • Calcular o coeficiente de correlação.
  • Representar graficamente a relação entre as variáveis de um estudo e a reta de regressão a partir da equação de regressão obtida.
  • Testar a significância do coeficiente de correlação obtido em um estudo de regressão linear.



Um problema com o qual nos deparamos freqüentemente é se determinada característica de uma população está ou não relacionada com outra(s) e em que grau.

Como vimos anteriormente, os métodos estatísticos para testes de hipóteses estabelecem se existe associação entre duas variáveis, porém estas técnicas não permitem representar a relação sob a forma de uma função.

Suponha que desejássemos realizar uma investigação sobre a ocorrência de anemia e infecção numa comunidade: seria interessante poder estimar a concentração de hemoglobina e a contagem de eritrócitos e leucócitos no sangue pela medida do hematócrito.

Para verificar a possibilidade de se usar tal procedimento conduzimos um estudo piloto a partir dos resultados da rotina de um laboratório de hematologia.




Resultados (hipotéticos) de uma rotina de um laboratório de hematologia:
exame no leucócitos
(x 103/mm3)
eritrócitos
(x 106/mm3)
hemoglobina
(g/dl)
hematócrito
(%)
1 6.8 4.50 14.6 41
2 9.7 5.20 15.6 47
3 4.3 4.55 14.4 41
4 7.9 4.65 14.4 41
5 7.4 4.40 13.8 40
6 7.6 4.40 14.0 40
7 2.8 4.30 13.6 40
8 7.8 4.60 13.8 42
9 5.5 4.90 15.2 44
10 4.6 4.10 13.0 39
11 8.0 5.00 17.0 46
12 7.0 5.17 16.0 47
13 7.1 4.20 11.7 35
... ... ... ... ...
138 10.5 4.50 13.4 39
139 6.9 4.50 14.2 40
140 13.5 4.45 13.6 40
141 8.3 3.70 11.0 33
142 7.0 4.30 12.7 38
143 4.3 4.67 14.0 43
144 2.7 4.40 12.7 39
145 11.2 4.40 13.3 38
147 5.9 4.40 11.9 37
148 12.3 4.24 10.0 31



A interpretação dos dados acima fica bastante mais fácil sob forma gráfica.

Assim sendo, como estamos interessados na relação entre hematócrito e outras medidas hematológicas, observe os gráficos que se seguem:







CORRELAÇÃO E REGRESSÃO

  • Grau de associação entre variáveis quantitativas
  • Predição de uma variável em função de outra



Conceitos

Diagrama de dispersão - gráfico sobre o qual cada medida individual é representada por um ponto (ou outro símbolo qualquer), sendo que a posição de cada ponto é determinada pelos valores observados em um indivíduo para as duas características medidas (por exemplo, hematócrito e hemoglobina). Denominado também de gráfico XY.




Retas de Regressão - funções resultantes do ajuste de uma função linear entre 2 variáveis y e x. Para obter a reta de regressão é necessário calcular o Coeficiente angular (Coeficiente de regressão) e o intercepto da reta com a ordenada.




Coeficiente Angular (by,x)- medida da variação que ocorre em uma característica quando outra característica se modifica de uma unidade. Também é chamado de coeficiente angular ( = tgQ).

Intercepto (a) - Ponto de intersecção da reta com a ordenada (eixo Y). Equivale ao valor de Y quando X=0.

Equação de Regressão - equação que define a linha reta que descreve a associação entre duas características e que permite estimar o valor de uma medida pela outra.




Coeficiente de Correlação (r)

Karl Pearson
Nascimento: 27 de março de 1857, em Londres
Morte: 27 de abril de 1936, em Londres

http://www.vma.bme.hu/mathhist/Mathematicians/Pearson.php Site externo




Coeficiente de Correlação (r)- medida do grau de associação entre duas características a partir de uma série de observações.

Grau de associação máximo:      r = 1 (diretamente proporcional)
r = -1 (inversamente proporcional)



Teste de hipótese: H0 : r=0

Estatística de teste:

e sob H0 , t tem distribuição t-Student com (n-2) graus de liberdade (d.f.)

Nota: este teste verifica se o r obtido é diferente de zero.
Pode ser necessário usar também uma análise de variância.
Clique aquiAbre em outra janela para saber mais





r aproximadamente igual a ... 0,8774
n = 148
 aproximadamente igual a ... 21,9829 veja a tabela t para 146 grausAbre em outra janela de liberdade:
erro alfa = 5%, tc aproximadamente igual a ... 1,978 (bicaudal)




r aproximadamente igual a ... 0,0289
n = 148
 aproximadamente igual a ... 0,3492 veja a tabela t para 146 grausAbre em outra janela de liberdade:
erro alfa = 5%, tc aproximadamente igual a ... 1,978 (bicaudal)



Precauções no uso e interpretação

- A relação deve ser representável por uma linha reta
- A reta não pode ser extendida além dos pontos medidos
- Associação não implica necessariamente em relação causalOutro trecho desta aula
- Variabilidade amostral



Critérios de Causalidade de Hill

leitura adicional:
   http://prevmed.vet.ohio-state.edu/Teaching/Vm611/1999/Lectures/Cause2/index.phpSite externo

  • Força da Associação
  • Consistência
  • Especificidade
  • Temporalidade
  • Gradiente Biológico
  • Plausibilidade
  • Coerência
  • Evidências Experimentais
  • Evidências por Analogia



Técnica de Ajuste - Mínimos Quadrados


 
Paciente X Y
1 0 72
2 5 66
3 10 70
4 15 64
5 20 66

Pegue a planilha utilizada para gerar este exemploAbre em outra janela

onde: Y = Pressão arterial diastólica
X = tempo (minutos) em repouso
somatoria.gif (172 bytes)X = 50 somatoria.gif (172 bytes)X2 = 750
somatoria.gif (172 bytes)Y = 338 somatoria.gif (172 bytes)Y2 = 22982
somatoria.gif (172 bytes)XY = 3310



   

©2003, Informática Médica do Departamento de Patologia
da Faculdade de Medicina da USP

Todos os direitos reservados: para o uso ou reprodução total ou parcial deste texto entre em contato com os autores.
(Veja também as instruções para referenciar nosso material didático)

O uso ou reprodução total ou parcial deste material didático pode ser permitido exclusivamente para uso acadêmico ou de ensino que não envolva ganho comercial. Solicitamos que:
- Mantenha este texto e o link para http://www.fm.usp.br/dim intactos;
- Entre em contato conosco através do e-mail vilma@dim.fm.usp.br, informando-nos da ocorrência.

responsáveis:
Prof. Dr. Eduardo Massad editor: Prof. Dr. Paulo Sérgio Panse Silveira
coordenador:
Prof. Dr. Koichi Sameshima autores: Docentes da DIM
suporte:Telemedicina e Informática Médica