Probabilidade condicionada.pdf

May 31, 2017 | Autor: G. André | Categoria: Mathematics, Aula
Share Embed


Descrição do Produto

Graciano Paulo André

Probabilidade condicionada Licenciatura em ensino de matemática com habilitações em informática

Universidade Pedagógica Lichinga 2016

2

Graciano Paulo André

Probabilidade condicionada

Trabalho de pesquisa científico apresentado ao Curso de Ensino Matemática, delegação do Niassa, para fins avaliativos desenvolvido na cadeira de Inferência Estatística. Leccionado pelo docente: Mestre: Abdul Remane Chafim

Universidade Pedagógica Lichinga 2016

Contacto: [email protected]

3

Índice Índice das figuras ............................................................................................................ 4 Introdução........................................................................................................................ 5 Probabilidade condicionada ............................................................................................ 6 Correlação e regressão linear .......................................................................................... 8 Diagrama de dispersão .................................................................................................... 9 Regressão - recta de regressão ........................................................................................ 9 Coeficiente de Correlação Linear (r) ............................................................................... 9 Distribuição normal ....................................................................................................... 15 Principais características ............................................................................................... 15 Teorema da aditividade ................................................................................................. 16 Distribuições amostrais ................................................................................................. 18 Distribuição da média amostral ..................................................................................... 18 Quando a variância é conhecida .................................................................................... 18 Quando a variância é desconhecida .............................................................................. 18 Teorema do Limite Central ........................................................................................... 19 Teorema de Moivre-Laplace: ........................................................................................ 21 Intervalos de confiança.................................................................................................. 25 Intervalo de confiança para media populacional quando a variância é conhecida ........ 25 Intervalo de confiança para media populacional quando a variância é desconhecida .. 26 Intervalo de confiança para variâncias .......................................................................... 27 Intervalo de confiança para proporção .......................................................................... 29 Teste de hipótese ........................................................................................................... 30 Erro nos testes de hipóteses ........................................................................................... 31 Nível de significância .................................................................................................... 32 Etapas de testes de hipóteses ......................................................................................... 33 Conclusão ...................................................................................................................... 36 Bibliografia.................................................................................................................... 37

Contacto: [email protected]

4

Índice das figuras

pág.

Tab.1 Urna de bolas……………………………………………………….5 Graf.1 Diagrama de dispersão……………………………………………..7 Graf.2 Correlação linear…………………………………………………...8 Graf.3 Correlação linear…………………….……………………………10 Graf.4 Correlação linear………………………………………………….11 Graf.5 Correlação linear………………………………………………….11 Graf.6 Função densidade…………………………………………………13 Graf.7 Função densidade…………………………………………………13 Graf.8 Função densidade…………………………………………………14 Graf.9 Tamanho de amostra……………………………………….……...17 Graf.10 Tamanho de amostra………………………………………....….18 Graf.11 Intervalo de confiança…………………………………...………23 Graf.12 Intervalo de confiança para media…………………..…………..24 Graf.13 Intervalo de confiança para media……………………………….25 Graf.14 Intervalo de confiança para variância…………………………...26 Graf.15 Intervalo de confiança para proporção……………….…………..27 Graf.16 Tipos de testes……………………………………….…………..29 Graf.17 Tipos de erro……………………………………………………..30 Graf.18 Região critica…………………………………….………………32

Contacto: [email protected]

5

Introdução O presente trabalho com o tema probabilidade condicional, cingindo nos conteúdos da cadeira de estatística descritiva tem como finalidade fazer uma abordagem em torno da estatística básica em geral. Os itens que o trabalho aborda são:  Probabilidade condicionada;  Correlação e regressão linear;  Distribuição Normal;  Distribuição amostral;  Intervalos de confiança; e  Teste de hipótese. Com vista a uma boa abordagem dos temas propostos, para cada item foram resolvidas três exemplos que serviram como exercícios resolvidos e também foram propostos três exercícios não resolvidos. O objectivo geral deste trabalho prende-se no âmbito de fazer trabalho convista a obtenção de uma nota de admissão aos exames da mesma cadeira e posteriormente a sua realização. Para se realizar o trabalho usou-se o método de leitura de fontes bibliográficas, consultas e resolução de exercícios.

Contacto: [email protected]

6

Probabilidade condicionada Definição: Dados os acontecimentos A e B, a probabilidade de A se realizar sabendo que B se realizou, ou a probabilidade de A condicionada por B, é definida por: 𝑃(𝐴/𝐵) =

𝑃(𝐴∩𝐵) 𝑃(𝐵)

se 𝑃(𝐵) > 0.

Invertendo a expressão acima, obtém a importante relação: 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴/𝐵) × 𝑃(𝐵) = 𝑃(𝐵/𝐴) × 𝑃(𝐴) 𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟏: Consideremos 250 alunos que cursam o primeiro ano de faculdade da UP-Niassa. Destes 100 são homens (H) e 150 são mulheres (M), 110 cursam matemática (MAT) e 140 frequentam o curso de Química (Q). a distribuição dos alunos é a seguinte tabela: Disciplina MAT

Q

TOTAL

H

40

60

100

M

70

80

150

TOTAL

110

140

250

Sexo

Um aluno é sorteado ao acaso. Qual é a probabilidade de que esteja cursando química, dado que é mulher? Resolução: 80

Pelo quadro vemos que esta probabilidade é de 150 e representamos: 80

𝑃(𝐴/𝐵) = 150 (Probabilidade de que o aluno curse química, condicionado ao facto de ser mulher) 80

150

Observamos, porem que 𝑃(𝑀 ∩ 𝑄) = 250 e 𝑃(𝑀) = 250. Para obtermos o resultado do problema basta considerar que: 𝑃(𝑄/𝑀) =

Contacto: [email protected]

𝑃(𝑀 ∩ 𝑄) 𝑃(𝑀)

7

80 80 250 𝑃(𝑄/𝑀) = = 150 150 250 𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟐: 1

3

11

2. Sendo 𝑃(𝐴) = 3, 𝑃(𝐵) = 4, e 𝑃(𝐴 ∪ 𝐵) = 12, calcular 𝑃(𝐴/𝐵). Resolução: Como 𝑃(𝐴/𝐵) =

𝑃(𝐴∩𝐵)

, Devemos calcular 𝑃(𝐴 ∩ 𝐵).

𝑃(𝐵)

Como 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵), temos: 11 1 3 2 1 = + − 𝑃(𝐴 ∩ 𝐵) → 𝑃(𝐴 ∩ 𝐵) = = 12 3 4 12 6 Logo, 𝑃(𝐴/𝐵) =

1 6 11 12

2

=9

𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟑: 3. Duas bolas vão ser retiradas de uma urna que contem 12 bolas brancas, 3 pretas e 4 verdes. Qual a probabilidade de que ambas a) Sejam verdes? b) Sejam da mesma cor? Resolução:

Urna de bolas. Fonte: apontamentos de introdução a estatística e a probabilidade vol. I 4 3

1

a) 𝑃(𝑉 ∩ 𝑉) = 𝑃(𝐴). 𝑃(𝑉/𝑉) = 9 . 8 = 6 b) 𝑃(𝑀𝐶) = 𝑃(𝐵 ∩ 𝐵) + 𝑃(𝑃 ∩ 𝑃) + 𝑃(𝑉 ∩ 𝑉) 𝑃(𝑀𝐶) =

Contacto: [email protected]

2 1 3 2 4 3 . + . + . 9 8 9 8 9 8

8

𝑃(𝑀𝐶) =

20 5 = 72 18

Exercícios propostos. 1. Numa fábrica, um certo tipo de chocolates é embalado em caixas e por uma das 3 linha de produção diferentes: M1, M2, e M3. Os registos mostram que uma pequena percentagem das caixas são embaladas em condições próprias para venda: 0,5% provem de M1, 0,8% de M2 e 1% de M3. Sabe-se que o volume diário de caixas embaladas por cada uma das linhas de produção é de 500, 100, 2000 unidades, respectivamente. a) Qual a probabilidade de uma caixa, escolhida ao acaso, não estar em condições para venda? b) Sabendo que uma caixa não esta em condições para venda, qual a probabilidade de ser proveniente de produção M2? 2. A urna A conte 3 fichas vermelhas e 2 azuis, e a urna B contem 2 vermelhas e 8 azuis. Joga-se uma moeda «honesta». Se a moeda der cara, extrai-se uma ficha da urna A; se der coroa, extrai-se uma ficha da urna B. uma ficha vermelha é extraída. Qual a probabilidade de ter saído cara no lançamento? 3. A caixa A tem 9 cartas numeradas de 1 a 9. A caixa B tem 5 cartas numeradas de 1 a 5. Uma caixa é escolhida ao acaso e uma carta é retirada. Se o numero é par. Qual a probabilidade de que a carta sorteada tenha vindo de A? Correlação e regressão linear Correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma linha. É uma linha de tendência, porque procura acompanhar a tendência da distribuição de pontos, que pode corresponder a uma reta ou a uma curva. Por outro lado, é, também, uma linha média, porque procura deixar a mesma quantidade de pontos abaixo e acima da linha.

Contacto: [email protected]

9

Diagrama de dispersão O diagrama de dispersão é um gráfico cartesiano em que cada um dos eixos corresponde às variáveis correlacionadas.

Gráfico 1. Diagrama de dispersão Fonte: apontamentos de introdução a estatística e a probabilidade vol. I

Regressão - recta de regressão Para poder avaliar melhor a correlação entre as variáveis, é interessante obter a equação da recta; essa recta é chamada de recta de regressão e a equação que a representa é a equação de regressão. A equação de recta de regressão é dada pela expressão: 𝑦 = 𝑎𝑥 + 𝑏 Onde: x é a variável independente; e y é a variável dependente; Sendo 𝑎 𝑒 𝑏 os parâmetros da equação da recta, esses podem ser calculados por meio das fórmulas: 𝑎=

𝑛 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∗ ∑ 𝑦𝑖 𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2 𝑦 = 𝑦̅ − 𝑎𝑥̅

Coeficiente de Correlação Linear (r) O coeficiente de correlação linear pode ser apresentado como uma medida de correlação, pois tem como objectivo indicar o nível de intensidade que ocorre na correlação entre as variáveis. O coeficiente de correlação linear pode ser positivo ou negativo.

Contacto: [email protected]

10

Temos r = o coeficiente de Pearson n = o número de observações xi = variável independente yi =variável dependente O valor do coeficiente de correlação r tem a variação entre +1 e –1, ou seja, está limitado entre os valores do Intervalo[-1,+1].  r = +1 (correlação positiva entre as variáveis);  r = - 1 (correlação perfeita negativa entre as variáveis);  r = 0 (não há correlação entre as variáveis ou, ainda, a correlação não é linear, caso exista). 𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟏: Uma pesquisa pretende verificar se há correlação significativa entre o peso total do lixo descartado, por dia, numa empresa com o peso do papel contido nesse lixo. Hotel

H1

H2

H3

H4

H5

H6

H7

Peso

10,47

19,85

21,25 24,36 27,38 58,09 33,61

H8

H9

H10

35,75

38,33

49,1

Total Peso do

4 2,43

5,12

6,88

6,22

8,84

8,76

7,54

papel

8,47

9,55

11,4 3

De acordo com os dados, fazemos a representação gráfica. Os pares ordenados formam o diagrama de dispersão.

Gráfico 2. Fonte: Apontamentos de introdução a estatística e a probabilidade vol. I

Contacto: [email protected]

11

Para se verificar o grau de correlação entre as duas variáveis, calcula-se o coeficiente de correlação linear pela formula do coeficiente de correlação de Person:

𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟐: 2. Seja dado as notas e o tempo de estudo (em horas) referente a turma de matemática do 2º Ano da Up-Niassa. Represente os dados no diagrama de dispersão e encontre o valor do coeficiente de correlação. Resolução: X: tempo de estudo em horas; Y: nota da prova

Contacto: [email protected]

12

Tempo (x)

3,0

7,0

2,0

1,5

12,0

Nota (y)

4,5

6,5

3,7

4,0

9,3

Representado no diagrama de dispersão, temos:

Gráfico 3. Fonte: Apontamentos de introdução a estatística e a probabilidade vol. I

Assim o coeficiente de correlação pode ser calculada por: Tempo (x)

Nota (y)

(𝑥 − 𝑥̅ )

(𝑦 − 𝑦̅)

(𝑥 − 𝑥̅ )(𝑦 − 𝑦̅)

3,0

4,5

-2,1

-1,1

2,31

7,0

6,5

1,9

0,9

1,71

2,0

3,7

-3,1

-1,9

5,89

1,5

4,0

-3,6

-1,6

5,76

12,0

9,3

6,9

3,7

25,53

25,5

28,0

0

0

41,2

𝑥̅ = 5,1 e 𝑦̅ = 5,6 𝑆𝑥2 = 19,55 e 𝑆𝑥 = 4,42 𝑆𝑦2 = 5,47 e 𝑆𝑦 = 2,34 Então, 𝑟=

41,2 = 0,9959 4.4,42.2,34

𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟑: Uma pesquisa foi feita acerca do consumo de cerveja e a temperatura. As vereáveis foram observadas em nove localidades com as mesmas características demográficas e socioeconómicas. A tabela seguinte mostra os resultados. a) Represente os dados num diagrama de dispersão e interprete. b) Encontre a recta de regressão para os dados. Contacto: [email protected]

13

Localidade Temperatura (x)

Consumo (y)

1

16

290

2

31

374

3

38

393

4

39

425

5

37

406

6

36

370

7

36

365

8

22

320

9

10

269

Resolução: a) O diagrama para estes dados será:

Gráfico 4. Fonte: Apontamentos de introdução a estatística e a probabilidade vol. I

b) A correlação entre x e y é 𝑟 = 0,962 A recta de regressão é 𝑦 = 217,37 + 4,74𝑥

Gráfico 5. Fonte: Apontamentos de introdução a estatística e a probabilidade vol. I

Interpretação: aumentando-se um grau de temperatura (x), o consumo de cerveja (y) aumenta, em media 4,74 litros por habitante.

Contacto: [email protected]

14

Exercícios propostos 1. No quadro seguinte, indicam-se os preços (x) dum bem alimentar (em unidades monetários) praticados durante 12 meses consecutivos e as suas quantidades vendidas (y). X

110

90

80

76

74

71

70

65

63

60

55

50

y

55

70

90

100

90

105

80

110

125

115

130

131

a) Represente graficamente a informação disponibilizada; b) Através da análise gráfica, parece-lhe existir uma correlação linear entre as duas variáveis? c) Calcule e interprete o valor do coeficiente de correlação linear . 2. Um grupo de pessoas fez uma avaliação do peso aparente de alguns objectos. Com o peso real e a media dos pesos aparentes, dados pelo grupo, obteve-se a tabela: Peso real

18

30

42

62

73

97

120

Peso aparente

10

23

33

60

91

98

159

a) Represente no diagrama de dispersão e calcule o índice de correlação.

3. Considere os resultados de dois testes x, y obtidos por um grupo de alunos da escola A:

Xi

11

14

19

19

22

28

30

31

34

37

yi

13

14

18

15

22

17

24

22

24

25

a. Verifique, pelo diagrama, se existe correlação linear; b. Em caso afirmativo, calcule o coeficiente de correlação; c. Escreva, em poucas linhas, as conclusões a que chegou sobre a relação entre essas variáveis.

Contacto: [email protected]

15

Distribuição normal Definição: A variável aleatória 𝑋 segue uma distribuição normal com media 𝜇 e desvio-padrão 𝜎 𝑖. 𝑒. 𝑋 ∩ 𝑁(𝜇, 𝜎), se a função densidade de probabilidade é: 1

1 𝑥−𝜇 2 ) 𝜎

𝑓(𝑥) = 𝜎√2𝜋 𝑥𝑒 −2(

, −∞ < 𝑥 < ∞ 𝜇 e 𝜎 são os parâmetros caracterizadores desta

distribuição. Principais características  A função densidade de probabilidade de uma variável aleatória com a distribuição normal tem a forma de sino, é simétrica em torno de 𝜇 e tem pontos de inflexão em 𝑋 =𝜇±𝜎.  A media 𝜇 localiza o centro da distribuição e o mede a variabilidade de 𝑋 em torno de 𝜇. Se 𝑋 ∩ 𝑁(𝜇, 𝜎), então 𝜇𝑥 = 𝐸(𝑥) = 𝜇 e 𝜎𝑥2 = 𝑉𝑎𝑟(𝑋) = 𝜎 2

Gráfico 6. Função densidade de probabilidade da normal para diferentes valores de 𝜇 𝑒 𝜎. Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.

Gráfico 7. Função densidade de probabilidade da normal para diferentes valores de 𝜎 e 𝜇 = 7. Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.

Contacto: [email protected]

16

Resultados importantes:  Se 𝑋 ∩ 𝑁(𝜇, 𝜎), então a variável aleatória estandardizada 𝑍 =

𝑥−𝜇 𝜎

∩ 𝑁(0, 1);

 A função de distribuição 𝐹(𝑧) da variável aleatória 𝑍 ∩ 𝑁(0, 1) é representada por 𝜙(𝑍) e esta tabulada;  𝜙(−𝑍) = 1 − 𝜙(𝑍) ;  𝜙(𝑍) =∝ → 𝜙1 (∝) Teorema da aditividade Se 𝑥𝑖 i = 1,2, … , n são variáveis aleatórias independentes e 𝑋𝑖 ∩ 𝑁(𝜇𝑖, 𝜎𝑖), então 𝑛

𝑛

𝑛

∑ 𝑎𝑖 𝑥𝑖 ∩ 𝑁 (∑ 𝑎𝑖 𝜇𝑖 √∑ 𝑎𝑖2 𝜎𝑖2 ) 𝑖=1

𝑖=1

𝑖=1

Corolários: Se i = 1,2, … , n são variáveis aleatórias e independentes 𝑋𝑖 ∩ 𝑁(𝜇, 𝜎), então:  ∑𝑛𝑖=1 𝑥𝑖 ∩ 𝑁(𝑛𝜇, 𝜎√𝑛); 1

 𝑥̅ = 2 ∑𝑛𝑖=1 𝑥𝑖 ∩ 𝑁(𝑛𝜇,

𝜎 √𝑛

).

𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟏: 1. Determine a probabilidade: 𝑃(−1,25 < 𝑍 < 0) A probabilidade procurada corresponde a parte hachurada da figura:

Gráfico 8. Função densidade de probabilidade da normal para 𝑃(−1,25 < 𝑍 < 0). Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.

Sabemos que: 𝑃(0 < 𝑍 < 1,25) = 0,3944 Pela simetria da curva, temos: 𝑃(−1,25 < 𝑍 < 0) = 𝑃(0 < 𝑍 < 1,25) = 0,3944 𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟐: 2. Uma empresa, monopolista no mercado de determinado produto, tem produção constante de 90 toneladas por mês. Sabe-se que a procura é uma variável aleatória

Contacto: [email protected]

17

com distribuição normal, com media 𝜇 = 80 𝑡𝑜𝑛. E desvio-padrão 𝜎 = 10 𝑡𝑜𝑛. Qual a probabilidade da média ser inferior a 78 toneladas?

Resolução: X – variável aleatória que representa a procura do produto da empresa 𝑋 ∩ 𝑁(𝜇 = 80 , 𝜎 = 10) Valor esperado: 𝐸(𝑥) = 80; Variância: 𝑉𝑎𝑟(𝑥) = 102 = 100 P(da procura ser inferior a 78 toneladas): 𝑥 − 𝜇 78 − 80 𝑃(𝑋 < 78) = 𝑃 ( < ) = 𝑃(𝑍 < −0,2) = 𝜙(−0,2) = 1 − 𝜙(0,2) 𝜎 10 = 1 − 0,5793 = 0,4207 𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟑: Usando os dados do exercício anterior, determine qual a produção mensal de forma que a probabilidade de ocorrer a procura execetaria seja 0,025? 𝑃(𝑋 > 𝑘) = 0,025 → 1 − 𝑃(𝑋 ≤ 𝑘) = 0,025 → 𝑃(𝑋 ≤ 𝑘) = 0,975 → 𝑃 (𝑍 ≤ 𝑘−80

𝑘−80

10

10

0,975 → 𝜙 (

) = 0,975 →

𝑘−80 10

)=

= 1,96 → 𝑘 = 99,6

Portanto, a empresa deve produzir 99,6 tonelada por mês. Exercícios propostos: 1. A percentagem de alunos de matemática que procuram resolver exercícios das aulas práticas de Estatística é de 15%. i.

Qual a probabilidade de numa turma com 20 alunos, pelo menos 2 alunos terem tentado resolver os exercícios?

ii.

Numa turma de 40 alunos, em media quantos deles tentaram resolver os exercícios? 2. Numa experiencia biológica, para a qual a escolha das cobaias é bastante dispendioso, verifica-se, que a experiencia é bem-sucedida em 40% dos casos.

i.

Se tiver 10 cobaias, qual a probabilidade de ter pelo menos duas experiencias bemsucedidas? 3. Os pesos de 600 estudantes são normalmente distribuídos com média 65,3 kg e desvio-padrão 5,5 kg. Determine os números que pesam:

I.

Entre 60 e 70 kg;

II.

Mais que 63,2 kg;

III.

Menos que 68 kg.

Contacto: [email protected]

18

Distribuições amostrais Definição: A variável aleatória (X1, X2,…,Xn) diz-se amostra aleatória (a, a) retirada de uma determinada população, se a sua função (densidade) de probabilidade conjunta dada por: 𝑛

𝑓(𝑋1, 𝑋2, … , 𝑋𝑛) = 𝑓(𝑋1). 𝑓(𝑋2) … . 𝑓(𝑋𝑛) = ∏ 𝑓(𝑋𝑖) 𝑖=1

Ou seja, X1, X2,…,Xn são independentes e identicamente distribuídas (i.i.d). Distribuição da média amostral Definição: Seja 𝑋1 , 𝑋2 … , 𝑋𝑛 uma amostra aleatória duma população com media 𝜇𝑥 e variância 𝜎𝑥2 . A media amostral é definida por: 𝑛

𝑋̅ = ∑ 𝑖=1

𝑋𝑖 𝑛

Quando a variância é conhecida Se a distribuição da população é Normal, então 𝑋𝑖 ∩ 𝑁(𝜇, 𝜎), ou seja, 𝑍=

𝑥−𝜇 ∩ 𝑁(0, 1) 𝜎

Se a distribuição da população não for normal, mas é de grande dimensão (𝑛 > 30), então, pelo teorema-Laplace, 𝑋𝑖 ∩ 𝑁(0, 1), ou seja, 𝑍 ∩ 𝑁(0, 1) Quando a variância é desconhecida Seja, X1, X2,…,Xn uma amostra aleatória de dimensão n duma população Normal, com media 𝜇 e desvio-padrao 𝜎 desconhecido, e aceitando a hipótese de independência das distribuições da media amostral e da variância corrigida da amostra, então, pelo teorema da distribuição T-Student, tem-se que

Contacto: [email protected]

19

𝑇=

𝑥−𝜇 ∩ 𝑡(𝑛−1) 𝑆 √𝑛

Teorema do Limite Central Seja 𝑋1 , 𝑋2 … , 𝑋𝑛 , uma amostra aleatória de demissão n, com E[𝑋𝑖 ] = 𝜇 e Var[𝑋𝑖 ] = 𝜎 2 para i= 1,2,…,n. Considere-se 𝑆𝑛 = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 . Para valores grandes de n tem-se que: 𝑆𝑛 − 𝐸[𝑆𝑛 ] √𝑉𝑎𝑟[𝑆𝑛 ]

=

𝑆𝑛 − 𝑛𝜇 √𝑛𝜎

~̇𝑁(0,1)

Nota B: Assume-se que n é grande quando n>30. Suponha que uma amostra aleatória simples (X1, . . . Xn) é retirada de uma população com média μ e variância σ2 . Então, temos que 𝑋̅ −𝜇 𝜎ǀ√𝑛

≈ 𝑁(0,1), Quando 𝑛 → ∞

 Em palavras o TLC garante que para n grande a distribuição da média amostral, devidamente padronizada, se comporta segundo um modelo Normal padronizado (Z).  Em casos onde a verdadeira distribuição dos dados é simétrica, boas aproximações são obtidas para n ao redor de 30. ̅ para  Um estudo de simulação descreve graficamente o comportamento de X diferentes situações. X~U(0,1), X~Bin(10,0,3)e X~Exp(1). Efeito do tamanho de amostra sobre a distribuição de ̅ X

Gráfico 9. Tamanho de amostra. Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.

Contacto: [email protected]

20

Gráfico 10 Tamanho de amostra. Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.

𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟏: Numa certa cidade, a duracao de conversas telefonicas em minutos, segue um modelo exponencial com parametro 3. Observando se uma amostra aleatoria dessas chamadas, qual sera a probabilidade de em media, a duracao de conversas telefonicas não ultrapassarem 4 minutos. Seja X: a duracao das chamadas, X~Exp(3). Logo E(x) = 3 e Var(x) = 9 Admitindo que n é o suficiente, podemos calcular a probabilidade desejada da seguinte forma: ℙ(𝑋̅ ≤ 4) = ℙ(

𝑋̅ − 3 √9 ̸50



4−3 √9 ̸50

≈ ℙ(𝑍 ≤ 2,36) = 0,99,09

̂) O caso da proporção amostral (𝐩 Colectamos uma aa (X1, . . . Xn) deX~Bernoulli(p), com o objectivo de estimarp. Definimos a proporção amostral (estimador de p) como sendo a fracção de indivíduos com a característica X , i.e., 𝑝̇ =

𝑁𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑣𝑒𝑖𝑠 𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟𝑖𝑠𝑡𝑖𝑐𝑎 𝑛

Contacto: [email protected]

21

Note que podemos escrever 𝑝̇ =

𝑋1 + 𝑋2 +, … , 𝑋𝑛 = 𝑋̅, 𝑛

𝑋𝑖 = {

1, 𝑠𝑢𝑐𝑒𝑠𝑠𝑜 0, 𝑓𝑟𝑎𝑐𝑎𝑠𝑠𝑜

Assim, temos que 𝐸(𝑝̇ ) =

𝐸(𝑋1 ) + 𝐸(𝑋2 )+, … , +𝐸(𝑋𝑛 ) 𝑛𝑝 = =𝑝 𝑛 𝑛

𝑉𝑎𝑟(𝑝) − 𝑉𝑎𝑟(

𝑋1 + 𝑋2 +, . . . , +𝑋𝑛 𝑛𝑝(1 − 𝑝 𝑝(1 − 𝑝) − − 𝑛 𝑛2 𝑛

Pelo TLC 𝑋̅ − 𝐸(𝑋̅) 𝑋̅ − 𝑝 𝑝̇ − 𝑝 = = ≈ 𝑁(0,1) 𝑉𝑎𝑟(𝑋̅) √𝑝(1 − 𝑃) ̸𝑛 √𝑝(1 − 𝑝) ̸𝑛 𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟐: A proporção de peças fora de especificação num lote é de 0,4. Numa amostra de tamanho 30, calcule a probabilidade de que a proporção de peças defeituosas seja menor do que 0,5. Seja p̂: a proporção de pecas defeituosas na amostra (proporção amostral). Então, como consequência do teorema do limite central, temos que: 𝑝̇ −𝑝 √𝑉𝑎𝑟(𝑝̇ )

=

𝑝̇

≈ 𝑁(0,1), quando n→ ∞

√𝑝(1−𝑝) ̸𝑛

𝑝̇ ~𝑁 (0,40,

0,40(0,6)

), assim,

30

P(𝑝̇ < 0,5)= 𝑃(

𝑝̇ −0,4 √0,40(0,6) 30

<

0,5−0,4

) ≈ 𝑃(𝑍 ≤ 1,12) = 0,8686

√0,40(0,6) 30

Teorema de Moivre-Laplace: Seja 𝑋1 , 𝑋2 , … , 𝑋𝑛 , uma amostra aleatória de demissão n, com E[𝑋𝑖 ] = 𝜇 e Var[𝑋𝑖 ] = 𝜎 2 para i= 1,2,…, n. Considere-se 𝑋̅ =

𝑆𝑛 𝑛

=

𝑋1 +𝑋2 +⋯+𝑋𝑛 𝑛

. Para valores grandes de n tem-se que:

𝑋̅ − 𝐸[𝑋̅]

𝑋̅ = 𝜎 ~̇𝑁(0,1) √𝑉𝑎𝑟[𝑋̅] √𝑛

Contacto: [email protected]

22

𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟑: Alguns casais preferem ter filhos do sexo feminino, porque as mães são portadoras de um distúrbio recessivo que é herdado por 50 % dos filhos, mas por nenhuma das filhas. O método Ericsson se selecção de sexo tem uma taxa admitida de 75% de sucesso. Suponha que 100 casais utilizam o método Ericsson com o resultado de que, dentre 100 recém nascido, há 75 meninas. a) Supondo que o método Ericsson não produza efeito e admitindo que menino e menina sejam igualmente prováveis, determine a média e o desvio padrão do número de meninas num grupo de 100 crianças. Resolução: X- número de meninas em 100 nascimentos. Supondo que o método não produza efeito e que as meninas e meninos sejam igualmente prováveis, tendo n = 100; p = 0,5 q = 0,5⇒μ = np = 50 σ = √𝑛𝑝𝑞 = 5 Resposta: Para grupos de 100 casais com um filho cada, o número médio de meninas é 50 com um desvio de 5. b) Interprete os resultados de a) para determinar se o resultado de 75 meninas em 100 bebés confirma a alegação de eficiência do método. Resolução: mínimo ≈ 𝑋 − 2σ = 50 − 2 × 5 = 40 máximo ≈ 𝑋 + 2σ = 50 + 2× 5 = 60 . Neste caso os resultados típicos estão entre 40 e 60. Resposta: 75 meninas não parece um resultado devido unicamente ao acaso ou 𝑧=

𝑥−µ 𝜎

=

75−50 5

= 5 , logo o resultado de 75 meninas não é usual. Pode-se concluir que o

método Ericsson é eficiente. 1. As maternidades do hospital Central A e do Hospital B, estão interessadas em controlar o absentismo ao serviço das senhoras grávidas. Abriu-se um ficheiro que continha vários dados referentes a dias de abstenção ao serviço para consultas com o ginecologista, o que produziu os dados constantes nas tabelas abaixo.

Contacto: [email protected]

23

Hospital A

Hospital B

25 28 63 70 42 33 46 79 85

15 18 43 92 74 73 61 63 84

14 89 98 56 75 28 56 48 91

75 76 94 82 76 84 83 91 87

85 76 42 81 93 45 41 86 98

87 79 78 96 94 92 83 84 54

78 95 84 20 53 40 80 60 70

56 58 59 52 57 53 55 84 61

75 43 51 61 81 72 94 83 54

60 63 68 69 62 67 64 85 71

86 75 43 61 68 59 72 47 41

73 74 77 76 84 79 81 80 82

78 45 76 84 73 51 48 92 85

91 90 80 70 75 76 84 73 94

76 87 92 43 57 86 75 84 91

84 71 84 71 24 28 27 39 37

73 84 91 42 86 75 10 14 11

29 34 81 46 48 47 45 41 90

Para as alíneas c) e d) devia-se calcular antes, as seguintes medidas: Hospital.

Hospital A

B

81

81

5228

5527

42772,10

31238,54

𝜇

64,54

390,48

𝜎2

534,65

68,23

𝜎

23,12

19,76

𝑁 ∑ 𝑋𝑖 ∑(𝑋𝑖 − 𝑋̅)2

a) Retire das duas populações amostras aleatórias de tamanho 14, usando a tabela de números aleatórios. Resolução: Hospital A: 92; 45; 86; 25; 75; 73; 28; 89; 98; 84; 84; 91; 86; 86. Hospital B: 84; 92; 28; 15; 47; 75; 84; 76; 94; 70; 34; 81; 73; 84. Diga qual é o hospital com maior variância em faltas? Resposta: É o hospital B. 𝑆 2 𝐻𝐶𝑀 =

∑(𝑋𝑖 −𝑋̅) 𝑛−1

=

7403,43 13

= 569,49 𝑆 2 𝑀𝐴𝐶𝐴𝑀𝑂 =

Contacto: [email protected]

∑(𝑋𝑖 −𝑋̅) 𝑛−1

=

8320,93 13

= 640,07

24

b) Determine a média de cada amostra Resolução: ∑ 𝑋𝑖 ∑ 𝑋𝑖 1024 937 𝑋̅𝐴 = 𝑛 = 14 = 74,4 𝑋̅𝐵 = 𝑛 = 14 = 66,9

c) Qual é a probabilidade de que uma senhora escolhida ao acaso tenha faltado mais de 61 dias relativamente aos dados do B Resolução: 𝑃(𝑋 > 6) = 𝑃 (𝑍 >

61 − 𝜇 ) = 𝑃(𝑍 > −0,366) = 0(0,366) = 0,6428 𝜎

d) Qual é a probabilidade de que o número de faltas esteja ente 25 e 50 para uma doente do Hospital A Resposta 25 − 64,54 50 − 64,54 𝑃(25 < 𝑋 < 50) = 𝑃 (
Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.