Visitante
Regressão Linear - vídeo aula
Regressão Linear
O exemplo mais simples de aproximação por mínimos quadrados é ajustar uma reta a um conjunto de pares de observação: $(x_{1}, y_{1}), (x_{2}, y_{2}), ... , (x_{n}, y_{n})$. A expressão matemática do ajuste por uma reta é $$ y = a_{0} + a_{1}x + e, $$ onde $a_{0}$ e $a_{1}$ são coeficientes representando a intersecção com o eixo $y$ e a inclinação, respectivamente, e $e$ é o erro ou resíduo entre o modelo e a observação, o qual pode ser representado, depois de se reorganizar a equação acima, por $$ e = y - a_{0} - a_{1}x. $$ Portando, o erro ou resíduo é a discrepância entre o valor verdadeiro de $y$ e o valor aproximado, $a_{0} + a_{1}x$, previsto pela equação linear.
Critérios para o melhor ajuste
Suponha que temos um conjunto de $n$ pontos ($x$,$y$) de uma função e queremos calcular uma reta da forma $y = a_{0} + a_{1}x$ que melhor represente esses pontos.
Para achar os valores dos coeficientes $a_{0}$ e $a_{1}$ que descrevem a reta, poderíamos tentar resolver o sistema:
$$\begin{cases}
y_{1} = a_{0} + a_{1}x_{1}
\\ y_{2} = a_{0} + a_{1}x_{2}
\\ y_{3} = a_{0} + a_{1}x_{3}
\\ \vdots
\\ y_{n} = a_{0} + a_{1}x_{n}
\end{cases} $$
Porém, temos um sistema com $n$ equações e 2 incógnitas (sobredeterminado). Se os pontos não forem colineares, o sistema será impossível.
Dessa forma, como não podemos encontrar uma reta que passe por todos esses pontos, nos resta fazer o melhor ajuste de maneira a achar esses coeficientes.
O ajuste por Mínimos Quadrados é feito de maneira a minimizar a soma dos quadrados dos erros em todos os pontos, ou seja, a diferença entre o $y$ da função original e o $y$ calculado na aproximação. Dessa forma, temos que a soma total dos resíduos é dada por:
Exemplo 1
Ajuste uma reta para o conjunto de pontos ($x$,$y$) de uma função dados abaixo.
${x_i}$ | ${y_i}$ |
---|---|
$1$ | $0.5$ |
$2$ | $2.5$ |
$3$ | $2.0$ |
$4$ | $4.0$ |
$5$ | $3.5$ |
$6$ | $6.0$ |
$7$ | $5.5$ |
$n = 7$ |
---|
$ \sum x = 1 + 2 + 3 + 4 + 5 + 6 + 7 = 28 $ |
$ \sum x^2 = 1^2 + 2^2 + 3^2 + 4^2 + 5^2 + 6^2 + 7^2 = 140 $ |
$ \sum y = 0.5 + 2.5 + 2.0 + 4.0 + 3.5 + 6.0 + 5.5 = 24 $ |
$ \sum xy = 1*0.5 + 2*2.5 + 3*2.0 + 4*4.0 + 5*3.5 + 6*6.0 + 7*5.5 = 119.5 $ |
Portanto, o ajuste por mínimos quadrados é
$$y = 0.071428 + 0.839286x.$$ A Figura (2) ilustra a reta obtida, bem como os pontos originais.
(Figura 2)
Exemplo 2
Use a regressão por mínimos quadrados para ajustar uma reta aos pontos tabelados abaixo:
${x_i}$ | ${y_i}$ |
---|---|
$6$ | $29$ |
$7$ | $21$ |
$11$ | $29$ |
$$\begin{cases} 29 = a_{0} + 6a_{1} \\ 21 = a_{0} + 7a_{1} \\ 29 = a_{0} + 11a_{1} \end{cases} $$ Para encontrar os parâmetros da reta, devemos resolver o sistema: $$ X^TX \hat{a} = X^TY, $$ ou seja,
$$a_0 = 21.7619,$$ $$a_1 = 0.5714.$$
Em consequência, a melhor reta que ajusta esse conjunto de pontos é:
$$y = 21.7619 + 0.5714x.$$
A Figura abaixo ilustra o resultado obtido:
Exemplo com Geogebra
Considerando a tabela abaixo, encontre a melhor reta que representa o conjunto de pontos.
${y}$ | ${x}$ |
---|---|
${2}$ | ${0.25}$ |
${3}$ | ${2}$ |
${4}$ | ${4}$ |
${5}$ | ${3.35}$ |
${6}$ | ${6}$ |
Solução: