A Regressão e a Correlação são ferramentas importantes para a análise do relacionamento entre as variáveis e para a previsão do resultado de uma em função da outra. Existem vários métodos de Regressão, e neste módulo, veremos a Regressão Linear Simples.
O conteúdo está distribuído em quatro unidades:
Com a conclusão deste módulo, você estará apto a utilizar esses conceitos para a Inferência no Coeficiente Angular da Regressão.
Ao final deste módulo, você será capaz de:
Muitas vezes, é importante saber como uma variável se comporta em relação a outra. Uma técnica é escrever uma equação com as variáveis:
Dependente: variável de interesse do estudo, aquela que se deseja explicar.
Independente: também conhecida como variável explicativa, é aquela que pretende explicar o fenômeno em questão.
À variável independente se atribui a letra X, e à variável dependente, a letra Y.
Quer ver um exemplo?
Para entender como se comporta o volume de vendas em função do gasto com mídia, o volume de vendas é Y e o gasto com a mídia X, uma vez que o volume de vendas depende do gasto com mídia.
Depois de definir qual variável chamar de X e qual chamar de Y, busca-se expressar o relacionamento entre elas como a equação de uma reta:
São muitos os métodos para prever situações em estudos que utilizam métodos quantitativos. Para a utilização do Método dos Mínimos Quadrados, é necessário um conjunto de pares (X, Y) após o encontro da Equação de Regressão. Substituindo-se X por um número hipotético, será obtido um Y previsto para a condição estabelecida para aquele X hipotético escolhido.
Um importante indicador para a Análise de Regressão é o coeficiente de determinação.
Variação não explicada: termo referente aos erros da Regressão quando utilizados para a previsão. A diferença é calculada para cada dado observado, e a soma desses erros ao quadrado é a variação não explicada pela Regressão.
Variação total: termo referente aos erros caso a média dos Y seja utilizada em vez da Regressão. As diferenças são elevadas ao quadrado e somadas.
Os parâmetros populacionais são apresentados com letras gregas (μ, σ, σ2, π), já as estatísticas amostrais são apresentadas com letras romanas (, s, s²,
).
Para o estudo completo da Regressão, é importante realizar a Inferência sobre os seus parâmetros.
Para que seja possível utilizar esses métodos de forma conclusiva, é preciso saber se o problema apresentado atende às seguintes hipóteses:
O Coeficiente de Correlação de Pearson é uma métrica muito utilizada para compreender o relacionamento entre duas variáveis. Seu objetivo é identificar se existe relação forte ou fraca entre elas e se essa correlação é positiva ou negativa. O Coeficiente de Correlação amostral é representado por r e o populacional por p (rho)