Módulo 3

Regressão e Correlação

Introdução

A Regressão e a Correlação são ferramentas importantes para a análise do relacionamento entre as variáveis e para a previsão do resultado de uma em função da outra. Existem vários métodos de Regressão, e neste módulo, veremos a Regressão Linear Simples.

O conteúdo está distribuído em quatro unidades:

  • Equação dos Mínimos Quadrados
  • Previsão Utilizando a Regressão e a Análise do Coeficiente de Determinação
  • Inferência no Coeficiente Angular da Regressão
  • Coeficiente de Correlação de Pearson

Com a conclusão deste módulo, você estará apto a utilizar esses conceitos para a Inferência no Coeficiente Angular da Regressão.

Objetivos do módulo

Ao final deste módulo, você será capaz de:

  • Desenvolver uma Equação de Regressão Estimada entre duas variáveis.
  • Fazer previsões utilizando a Equação de Regressão Estimada.
  • Analisar a Regressão por meio do Coeficiente de Determinação.
  • Inferir sobre os parâmetros da Equação de Regressão Estimada.
  • Calcular e analisar o Coeficiente de Correlação de Pearson.
Unidade 1

Equação dos Mínimos Quadrados

Muitas vezes, é importante saber como uma variável se comporta em relação a outra. Uma técnica é escrever uma equação com as variáveis:

Dependente: variável de interesse do estudo, aquela que se deseja explicar.
Independente: também conhecida como variável explicativa, é aquela que pretende explicar o fenômeno em questão.

À variável independente se atribui a letra X, e à variável dependente, a letra Y.

Quer ver um exemplo?

Para entender como se comporta o volume de vendas em função do gasto com mídia, o volume de vendas é Y e o gasto com a mídia X, uma vez que o volume de vendas depende do gasto com mídia.

Depois de definir qual variável chamar de X e qual chamar de Y, busca-se expressar o relacionamento entre elas como a equação de uma reta:

Unidade 2

Previsão utilizando a Regressão e a
Análise do Coeficiente de Determinação

São muitos os métodos para prever situações em estudos que utilizam métodos quantitativos. Para a utilização do Método dos Mínimos Quadrados, é necessário um conjunto de pares (X, Y) após o encontro da Equação de Regressão. Substituindo-se X por um número hipotético, será obtido um Y previsto para a condição estabelecida para aquele X hipotético escolhido.

Análise do Coeficiente de Determinação

Um importante indicador para a Análise de Regressão é o coeficiente de determinação.

Terminologia

Variação não explicada: termo referente aos erros da Regressão quando utilizados para a previsão. A diferença é calculada para cada dado observado, e a soma desses erros ao quadrado é a variação não explicada pela Regressão.

Variação total: termo referente aos erros caso a média dos Y seja utilizada em vez da Regressão. As diferenças são elevadas ao quadrado e somadas.

Unidade 3

Inferência no Coeficiente
Angular da Regressão

Os parâmetros populacionais são apresentados com letras gregas (μ, σ, σ2, π), já as estatísticas amostrais são apresentadas com letras romanas (, s, s², ).

Para o estudo completo da Regressão, é importante realizar a Inferência sobre os seus parâmetros.

Para que seja possível utilizar esses métodos de forma conclusiva, é preciso saber se o problema apresentado atende às seguintes hipóteses:

  • existem dados de mensuração tanto para X quanto para Y;
  • a variável dependente é aleatória;
  • para cada valor de X há uma distribuição condicional de Y que é normal;
  • os desvios padrões de todas as distribuições condicionais são iguais.
Unidade 4

Coeficiente de Correlação
de Pearson

O Coeficiente de Correlação de Pearson é uma métrica muito utilizada para compreender o relacionamento entre duas variáveis. Seu objetivo é identificar se existe relação forte ou fraca entre elas e se essa correlação é positiva ou negativa. O Coeficiente de Correlação amostral é representado por r e o populacional por p (rho)

Informação Extra
  • Um relacionamento positivo entre duas variáveis indica que os valores evoluem na mesma direção, ou seja, se X aumenta, Y também aumenta.
  • Um relacionamento negativo entre duas variáveis indica que os valores evoluem em direções contrárias, ou seja, se X aumenta, Y diminui.
  • Um relacionamento zero indica que os valores estão se anulando.

Palavra do Professor

Voltar ao topo