Exercícios sobre Análise de Regressão

June 24, 2017 | Autor: A. do Couto | Categoria: Political Science, Quantitative Methods
Share Embed


Descrição do Produto

UNIVERSIDADE FEDERAL DE PERNANBUCO CENTRO DE FILOSOFIA E CIÊNCIAS HUMANAS DEPARTAMENTO DE CIÊNCIA POLÍTICA PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA POLÍTICA DOUTORADO INTERINSTITUCIONAL EM CIÊNCIA POLÍTICA

TRABALHO SOBRE ANÁLISE DE REGRESSÃO

Disciplina: Estudos Avançados em Metodologia de Pesquisa Docente: Prof. Dr. Jorge Alexandre Neves Discente: André Valente do Couto

Nov / 2014

Primeira Questão: Na estimação de um modelo de regressão de MQO Log-Lin (Mínimos Quadrados Ordinários), tendo como variável dependente o logaritmo neperiano do tempo de trabalho de mulheres de 25 a 65 anos de idade, participantes da População Economicamente Ativa ocupada, e como variável independente os anos de escolaridade completados com sucesso, utilizando-se uma amostra probabilística, a função populacional de regressão é: Ln(T) = α + βE + ε Onde: T = o tempo de trabalho remunerado. E = anos de escolaridade completados com sucesso. Os resultados da estimação da referida função, a partir da amostra, foram: a = 2,50 b = 0,12 Baseado nesses resultados, interprete: a) A constante. b) O coeficiente de regressão. RESPOSTA DA PRIMEIRA QUESTÃO: a) A constante: A constante, identificada pela letra a, representa o valor da variável dependente quando a variável independente é igual a zero. Porém neste caso, a distribuição normal da variável dependente (tempo de trabalho de mulheres de 25 a 65 anos de idade) utilizada no modelo de regressão, foi normalizada com base no logarítmo neperiano. Deste modo sua interpretação depende da transformação do valor obtido (a=2,5) para o exponencial do valor neperiano que resultou em 12,18. Portanto, quando a variável independente (anos de escolaridade completados com sucesso) é igual a zero o valor da variável dependente (tempo de trabalho de mulheres de 25 a 65 anos de idade) é igual a 12,18. b) O coeficiente de regressão: O coeficiente de regressão neste caso é identificado por b com valor de 0,12, que representa o grau de correlação entre os valores da variável dependente em função dos valores da variável independente. Neste caso, cada incremento da variável independente (anos de escolaridade completados com sucesso) gerará aumento de 12% no valor da variável dependente (tempo de trabalho de mulheres de 25 a 65 anos de idade) Finalizando, o gráfico da função de explicação das variáveis (dependente e independente) é descrito abaixo como ilustração da explicação ora apresentada.

Segunda questão: Utilizando dados da PNAD, foi estimado um Modelo de Regressão de MQO que tem como variável dependente o índice socioeconômico da ocupação principal do entrevistado e como variáveis independentes: a) o número máximo de anos de escolaridade concluídos com sucesso pelo entrevistado e; b) o sexo (indicadora; feminino = 0 e masculino = 1) do entrevistado.

Foi ainda estimado um segundo modelo que tem a mesma variável dependente e, como variáveis independentes: a) o número máximo de anos de escolaridade concluídos com sucesso pelo entrevistado e; b) a raça do entrevistado (indicadora; negra = 0 e branca = 1). Os resultados dos dois modelos encontram-se abaixo. Tomando como base os resultados: I – Represente os dois modelos na forma de equações de regressão. II – Reporte os resultados dos modelos na forma em que você faria se estivesse escrevendo um artigo científico. III – Analise os resultados, considerando: a) os testes de hipóteses relevantes, incluindo a significância; b) a interpretação dos coeficientes de regressão. IV – Responda: Se você tivesse que escolher apenas um dos dois modelos, qual seria o mais indicado? O que sua resposta nos diz sobre a relevância das duas variáveis indicadoras (dummy)? Qual das duas é mais relevante para a explicação da variável resposta (dependente)?  Resultados do Modelo 1 Model Summary Model 1

R ,672a

R Square ,451

Adjusted R Square ,451

Std. Error of the Estimate 11,00589

a. Predictors: (Constant), sexo, anos de estudo

ANOVAb Model 1

Regression Residual Total

Sum of Squares 8102271 9854010 17956281

df 2 81351 81353

Mean Square 4051135,506 121,130

F 33444,652

Sig. ,000a

a. Predictors: (Constant), sexo, anos de estudo b. Dependent Variable: indice de ocupacoes

Coefficientsa

Model 1

(Constant) anos de estudo sexo

Unstandardized Coefficients B Std. Error 26,260 ,088 2,201 ,009 4,655 ,081

a. Dependent Variable: indice de ocupacoes

Standardized Coefficients Beta ,674 ,150

t 297,211 257,437 57,376

Sig. ,000 ,000 ,000

 Resultados do Modelo 2 Model Summary Model 1

R ,658a

R Square ,432

Adjusted R Square ,432

Std. Error of the Estimate 11,19194

a. Predictors: (Constant), raca dummy, anos de estudo

ANOVAb Model 1

Regression Residual Total

Sum of Squares 7763793 10187739 17951532

df 2 81333 81335

Mean Square 3881896,529 125,260

F 30990,810

Sig. ,000a

a. Predictors: (Constant), raca dummy, anos de estudo b. Dependent Variable: indice de ocupacoes

Coefficientsa

Model 1

(Constant) anos de estudo raca dummy

Unstandardized Coefficients B Std. Error 28,946 ,074 2,087 ,009 1,827 ,082

a. Dependent Variable: indice de ocupacoes

RESPOSTAS DA SEGUNDA QUESTÃO: Respostas do Item I:  MODELO I Ŷi = ß0 + ß1X1 + ß2X2 X1 = Anos de Escolaridade X2 = Sexo (F = 0; M = 1) FEMININO Ŷi = ß0 + ß1X1i + ß2X2i Ŷi = ß0 + ß1X1i + ß2 * 0 Ŷi = ß0 + ß1X1i Constante para o grupo feminino: ß0 MASCULINO Ŷi = ß0 + ß1X1i + ß2X2i Ŷi = ß0 + ß1X1i + ß2 * 1 Ŷi = ß0 + ß1X1i + ß2 Ŷi = (ß0 + ß2) + ß1X1i Constante para o grupo masculino: ß0+ß2

Standardized Coefficients Beta ,639 ,061

t 391,983 233,749 22,334

Sig. ,000 ,000 ,000

 MODELO II Ŷi = ß0 + ß1X1 + ß2X2 X1 = Anos de Escolaridade X2 = Cor (N = 0; B = 1) NEGRO Ŷi = ß0 + ß1X1i + ß2X2i Ŷi = ß0 + ß1X1i + ß2 * 0 Ŷi = ß0 + ß1X1i Constante para o grupo feminino: ß0 BRANCO Ŷi = ß0 + ß1X1i + ß2X2i Ŷi = ß0 + ß1X1i + ß2 * 1 Ŷi = ß0 + ß1X1i + ß2 Ŷi = (ß0 + ß2) + ß1X1i Constante para o grupo masculino: ß0+ß2 Respostas do Item II: A associação entre a variável critério e as expectativas é moderadamente forte (Múltiplo = 0,67). Juntos (anos de estudo e sexo) são responsáveis por 45% da variância do sucesso em testes (R2 ajustado). Tanto (anos de estudo e sexo) estão positivamente relacionados ao sucesso nos testes. O coeficiente de regressão para anos de estudo foi de 2,2 e para sexo foi de 4,65. Como os intervalos de confiança não incluíram um valor negativo, podemos concluir que os coeficientes de regressão populacionais tanto para anos de estudo (valor-t: 257,44; valor-p: 0,00 )quanto para sexo (valor-t: 57,38; valor-p: 0,00) são positivos. A associação entre a variável critério e as expectativas é moderadamente forte (Múltiplo = 0,66). Juntos (anos de estudo e raça) são responsáveis por 43% da variância do sucesso em testes (R2 ajustado). Tanto (anos de estudo e raça) estão positivamente relacionados ao sucesso nos testes. O coeficiente de regressão para anos de estudo foi de 2,1 e para raça foi de 1,83. Como os intervalos de confiança não incluíram um valor negativo, podemos concluir que os coeficientes de regressão populacionais tanto para anos de estudo (valor-t: 233,75; valor-p: 0,00 )quanto para raça (valor-t: 22,33; valor-p: 0,00) são positivos. Respostas do Item III: No modelo I, a hipótese nula Ho presume que não existe relação explicativa para a variável dependente (índice ocupação) com base nas variáveis independentes (anos de estudo e sexo) e na hipótese alternativa H1 que existe relação explicativa das variáveis independentes na variável dependente. O teste ANOVA, mostra que o plano de regressão para essas variáveis, parte significativamente de 0 – que dizer que podemos prever a VD a partir das VI. Na previsão do modelo 1, o (valor-F: 33444,65; valor-p; 0,000) demonstra que as chances de que o valor-F determinado, terem ocorrido por erro amostral, se a hipótese nula for verdadeira é de 0,000, portanto, pode-se descartar a hipótese nula e adotar a hipótese alternativa. No modelo II, a hipótese nula Ho presume que não existe relação explicativa para a variável dependente (índice ocupação) com base nas variáveis independentes (anos de estudo e raça) e na

hipótese alternativa H1 que existe relação explicativa das variáveis independentes na variável dependente. O teste ANOVA, mostra que o plano de regressão para essas variáveis, parte significativamente de 0 – que dizer que podemos prever a VD a partir das VI. Na previsão do modelo 2, o (valor-F: 30990,81; valor-p; 0,000) demonstra que as chances de que o valor-F determinado, terem ocorrido por erro amostral, se a hipótese nula for verdadeira é de 0,000, portanto, pode-se descartar a hipótese nula e adotar a hipótese alternativa. Respostas do Item IV: Tanto o modelo 1 quanto o modelo 2, tentam explicar a VD (índice ocupação) pela regressão das VI's (modelo 1- anos de estudo e sexo) e (modelo 2 - anos de estudo e raça). Os dois testes estatísticos demonstram que existe explicação da VD pelas VI's, portanto, adota-se a hipótese alternativa com a hipótese de trabalho em ambos os modelos, com base na significância que é abaixo de 0,05 (0,000 em ambos os modelos). No modelo 1 as VI's explicam em 45,1% os valores do (índice ocupação) enquanto que o modelo 2, a explicação ocorre em 43,2%, considerando-se os valores de R2 ajustado. Analisando a relevância das variáveis dummies sexo (modelo 1) e raça (modelo 2), pelos valores contidos nos coeficientes padronizados1 e não padronizados. Identifica-se nestes casos que, sexo (coef. Padr: 4,66; coef. não padr: 0,15) contribui mais significativamente para o incremento da VD (índice ocupação) do que raça (coef. Padr.:1,83; coef. não padr.: 0,06). Finalmente mesmo considerando que ambos os modelos são significativos e possuem diferenças explicativas pequenas à VD, conclui-se que o modelo 1 é mais determinante que o modelo 2.

1

O coeficiente padronizado neste caso pode ser considerado e comparado entre os modelos, pois os valores estão na mesma escala, considerando que a variável que diferencia as análises estatísticas (sexo e raça) são do tipo dummies (zero e um).

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.