Regressão linear
Origem: Wikipédia, a enciclopédia livre.
Em estatítica, regressão linear é um método para se estimar a condicional (valor esperado) de uma variável y, dados os valores de algumas outras variáveis x.
A regressão, em geral, trata da questão de se estimar um valor condicional esperado.
A regressão linear é chamada "linear" porque se considera que a relação da resposta às variáveis é uma função linear de alguns parâmetros. Os modelos de regressão que não são uma função linear dos parâmetros se chamam modelos de regressão não-linear.
Índice |
[editar] Equação da Regressão Linear
Para se estimar o valor esperado, usa-se de uma equação, que determina a relação entre ambas as variáveis.
Em que: Yi - Variável explicada (dependente); é o valor que se quer atingir;
α - É uma constante, que representa a intercepção da recta com o eixo vertical;
β - É outra constante, que representa o declive da recta;
Xi - Variável explicativa (independente), representa o factor explicativo na equação;
εi - Variável que inclui todos os factores residuais mais os possíveis erros de medição. O seu comportamento é aleatório, devido à natureza dos factores que encerra. Para que essa fórmula possa ser aplicada, os erros devem satisfazer determinadas hipóteses, que são: serem variáveis normais, com a mesma variância, independentes e independentes da variável explicativa X.
[editar] Cálculo dos factores α e β
Definindo e , temos que α e β se relacionam por:
[editar] Desenvolvimento
<showhide> Estas fórmulas podem ser desenvolvidas a partir da definição de mínimos quadrados __HIDER__ <hide>
O objectivo é determinar α e β de forma que a soma dos quadrados dos erros seja mínima, ou seja, devemos minimizar
Desenvolvendo este quadrado e eliminando os termos constantes (ou seja, aqueles que não têm termos em α e β, chega-se a:
A partir desse ponto, pode-se resolver usando-se cálculo (tomando as derivadas parciais, etc), ou através de uma transformação de coordenadas:
ou
Transformando a expressão a ser minimizada em:
ou
Esta expressão se separa na soma de duas expressões quadráticas independentes, que podem ser minimizadas usando matemática elementar:
Cujos valores minimizadores são:
</hide> </showhide>
[editar] Memorização
Uma forma fácil de memorizar esta expressão (sim, em pleno século XXI ainda existem professores carrascos que obrigam alunos a decorar fórmulas) é escrever:
- Y = α + Xβ
- XY = Xα + X2β
e, em seguida, somar as colunas:
[editar] Bibliografia
- REIS, E., Estatistica Descritiva (2ª ed.). Lisboa: Edições Sílabo, 1994