Elementos básicos de probabilidad y estadística matemática I

May 23, 2017 | Autor: John Moreno | Categoria: Social Sciences, Probability and statistics
Share Embed


Descrição do Produto

´ sicos de probabilidad y estad´ıstica Elementos ba ´ tica I matema Prof. John Freddy Moreno Trujillo Docente Investigador CIPE-ODEON Universidad Externado de Colombia

2014

´Indice general Pr´ ologo 1. Elementos b´ asicos 1.1. Sumatorias . . . . 1.1.1. Propiedades 1.2. Sumas dobles . . . 1.3. Productorias . . . 1.3.1. Propiedades 1.4. Logaritmaci´ on . . . 1.5. Ejercicios . . . . .

5

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

2. Estad´ıstica descriptiva 2.1. Definiciones b´ asicas . . . . . . 2.1.1. Tipos de muestreo . . 2.1.2. Tipos de datos . . . . 2.2. Representaciones gr´ aficas . . 2.3. Medidas de tendencia central 2.4. Medidas de posici´ on relativa . 2.5. Medidas de dispersi´ on . . . . 2.6. Gr´afico de caja y bigotes . . . 2.7. Medidas de forma . . . . . . . 2.8. Medidas de concentraci´ on . . 2.9. Ejercicios sugeridos . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

7 7 8 9 11 11 12 13

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

16 16 16 18 18 22 29 30 32 34 37 39

3. Probabilidad y variables aleatorias 3.1. Definiciones b´ asicas . . . . . . . . . . . . . . . . . 3.2. Probabilidad condicional . . . . . . . . . . . . . . 3.3. Ley de probabilidades totales y teorema de Bayes 3.3.1. Teorema de Bayes . . . . . . . . . . . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

45 45 48 49 50

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

1

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

3.4. Eventos independientes . . . . . . . . . . . . . . . . . 3.5. Variables aleatorias . . . . . . . . . . . . . . . . . . . . 3.5.1. Funci´ on de distribuci´ on de probabilidad fX (x) 3.5.2. Funci´ on de distribuci´ on acumulada FX (x) . . . 3.5.3. Valor esperado y Varianza . . . . . . . . . . . . 3.5.4. Algunas distribuciones b´asicas . . . . . . . . . 3.6. Ejercicios sugeridos . . . . . . . . . . . . . . . . . . . .

3

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

50 52 52 53 54 55 57

Pr´ ologo Las presentes notas se escriben con el a´nimo de servir como elemento de referencia en algunos de los cursos de posgrado que se dictan en la Facultad de Finanzas, Gobierno y Relaciones Internacionales de la Universidad Externado de Colombia. Si bien los conceptos aqu´ı presentados son resultados cl´asicos de la estad´ıstica y la probabilidad, contar con estos elementos en un documento referente corto y sencillo es de gran utilidad en muchos casos, como lo ha indicado mi experiencia al frente de varios de estos cursos durante los u ´ltimos a˜ nos. De igual forma, los ejemplos utilizados y los ejercicios sugeridos responden a una intencionalidad espec´ıfica de las asignaturas, de forma que estos muestran a los estudiantes la aplicabilidad de las herramientas estad´ısticas en sus programas de estudio y en temas de investigaci´on. Para lograr este fin, el documento se ha estructurado como sigue: en el cap´ıtulo 1 se presentan algunos elementos b´ asicos de matem´ aticas sobre notaci´on de sumatorias, productorias y logaritmaci´on con sus propiedades b´ asicas; en el cap´ıtulo 2 se describen resultados relevantes de la estad´ıstica descriptiva, y en el cap´ıtulo 3 se hace una introducci´on a los elementos b´asicos de la teor´ıa de probabilidad y al concepto de variable aleatoria. Tambi´en se presentan en este cap´ıtulo algunas distribuciones de probabilidad b´asicas. Si bien este documento solo cubre aspectos introductorios, esperamos sea una buena referencia, y que prontamente se pueda contar con una segunda parte que incluya aspectos de estad´ıstica inferencial y an´ alisis de datos cualitativos. John Freddy Moreno Trujillo Docente Investigador CIPE-ODEON Universidad Externado de Colombia

5

Cap´ıtulo 1

Elementos b´ asicos En este cap´ıtulo se presentan algunos elementos b´asicos sobre notaci´on de sumatorias y productorias, que ser´ an de utilidad m´ as adelante en el desarrollo de algunos conceptos estad´ısticos.

1.1.

Sumatorias

La notaci´ on sigma o notaci´ on de sumatoria es utilizada para representar de forma compacta la suma de cantidades indexadas en los enteros positivos, de forma que si x1 , x2 , ..., xn son un conjunto de observaciones, entonces: x1 + x2 + · · · + xn =

n X

xi

i=1

La letra que se utiliza para denotar las distintas observaciones es denominada ´ındice de la sumatoria y su aporte es solamente notacional, es decir: n X i=1

xi =

n X

xk =

n X

xj

j=1

k=1

El valor en el que inicia el ´ındice es denominado l´ımite inferior de la sumatoria y el u ´ltimo valor que toma es denominado l´ımite superior. De acuerdo con esto, el l´ımite inferior de la siguiente sumatoria es 5 y el l´ımite superior es 42. 42 X

xi

i=5

Cabe aclarar que el supuesto general sobre el ´ındice es que este se incrementa de 1 en 1 desde el l´ımite inferior hasta el l´ımite superior.

7

1.1.1.

Propiedades

Algunas propiedades de la sumatoria son: 1.

n X

cxi = cx1 + cx2 + · · · + cxn = c(x1 + x2 + · · · + xn ) = c

i=1

n X

xi

i=1

Si una constante est´ a multiplicando los t´erminos de la sumatoria, podemos sacarla de la misma por factorizaci´ on. 2.

n n n X X X (xi ± yi ) = xi ± yi i=1

i=1

i=1

La sumatoria de una suma o resta de t´erminos es igual a la suma o resta de las sumatorias de cada t´ermino. 3.

n X

c = nc

i=1

La sumatoria de una constante n-veces es igual a n-veces la constante, y en general: n X

c = (n − m + 1)c

i=m

4.

n X

xi =

i=1

p X

xi +

i=1

n X

xi

i=p+1

donde p es un valor entero positivo entre 1 y n.

Ejemplo 1 Utilicemos algunas de las propiedades enumeradas arriba para determinar el valor de la siguiente suma: 7 X

(5n − 2)

n=4

Tenemos que: 7 X

(5n − 2) =

n=4

7 X n=4

5n −

7 X n=4

2=5

7 X

n−

n=4

7 X n=4

8

2 = 5(4 + 5 + 6 + 7) + 2(4) = 118

Otro conjunto de resultados de gran utilidad son los siguientes: n X

n(n + 1) 2

i=

i=1 n X

i2 =

i=1 n X

n(n + 1)(2n + 1) 6

i3 =

i=1

n2 (n + 1)2 4

La demostraci´ on de estos resultados se realiza por inducci´on matem´atica, una t´ecnica de demostraci´ on en la cual se prueba que el resultado es v´ alido para un primer elemento, se supone v´alido para un k-´esimo elemento y se demuestra para el siguiente al k-´esimo. De esta forma, queda demostrado para todos los elementos. Ejemplo 2 Utilicemos los resultados anteriores para determinar el valor de la suma: 100 X

3k 2 − 2k + 4

k=1

Tenemos que: 100 X

3k 2 − 2k + 4 = 3

k=1

100 X

k2 − 2

k=1

100 X k=1

k+

100 X

4

k=1

100 · 101 100 · 101 · 201 −2 + 4(100) 6 2 = 1015050 − 10100 + 400 = 1005350 =3

1.2.

Sumas dobles

Es normal que en algunas situaciones, como por ejemplo, en el proceso descriptivo de alg´ un conjunto de datos, sea necesario realizar sumas sobre un conjunto de observaciones m´as de una vez, lo que nos lleva al concepto de suma doble. La suma doble se define como:

9

n X m X

xi yj =

i=1 j=1

n X

  m X  xi yj 

i=1

=

j=1

n X

(xi y1 + xi y2 + · · · + xi ym )

i=1

= (x1 y1 + x1 y2 + · · · + x1 ym ) + (x2 y1 + x2 y2 + · · · + x2 ym ) + · · · (xn y1 + xn y2 + · · · + xn ym )

Ejemplo 3 Determinar el valor de la siguiente suma doble: 2 X 3 X

(2i + j)

i=1 j=1

Tenemos que: 2 X i=1

 2 3 X X  (2i + j) = [(2i + 1) + (2i + 2) + (2i + 3)] 

i=1

j=1

= [(2(1) + 1) + (2(1) + 2) + (2(1) + 3)] + [(2(2) + 1) + (2(2) + 2) + (2(2) + 3)] = [3 + 4 + 5] + [5 + 6 + 7] = 12 + 18 = 30 Tambi´en se consideran sumas dobles al trabajar con cantidades que tienen asociados dos o m´as sub´ındices, como por ejemplo, las cantidades que forman una matriz y que se ubican dentro de la misma indicando la fila y la columna a la cual pertenecen. En este caso, la suma doble se define de forma an´aloga, n X m X

aij =

i=1 j=1

n X

m X

 i=1

=



n X

 aij 

j=1

(ai1 + ai2 + · · · + aim )

i=1

= (a11 + a12 + a13 + · · · + a1m ) + (a21 + a22 + a23 + · · · + a2m ) + · · · (an1 + an2 + an3 + · · · + anm )

En particular, las sumas dobles aparecen cuando se est´an considerando potencias de sumas, como por ejemplo:

10

n X

!2 xi

=

n X

i=1

n X n X

x2i + 2

i=1

xi xj

i=1 j=1

| {z } i>j

1.3.

Productorias

As´ı como en algunos casos resulta de inter´es la suma de una serie de t´erminos, en otros, la cantidad de inter´es es la multiplicaci´ on de una serie de t´erminos. Para denotar de forma compacta este tipo de operaci´ on, se utiliza la siguiente notaci´ on: x1 x2 x3 · · · xn =

n Y

xi

i=1

De forma an´ aloga a la sumatoria, la variable i se denomina ´ındice de la productoria y los valores 1 y n son los l´ımites inferior y superior respectivamente.

1.3.1.

Propiedades

Algunas propiedades de la productoria son: 1.

n Y

cxi = cn

i=1

n Y

xi

i=1

donde c es una constante. 2.

n Y

(xi yi zi ) =

i=1

3.

n Y

! xi

i=1

 n  Y xi i=1

para

Qn

i=1

yi

n Y

! yi

i=1

n Y

! zi

i=1

Qn xi = Qi=1 n i=1 yi

yi 6= 0.

4. M´ as adelante se estudia la funci´ on logaritmo, que es de much´ısima utilidad en diferentes contextos por sus propiedades. Una de estas es que el logaritmo transforma productos en sumas, es decir, ln(xy) = ln(x) + ln(y), que aplicada a productorias es: ln

n Y

! xi

i=1

=

n X i=1

11

ln(xi )

1.4.

Logaritmaci´ on

La multiplicaci´ on de una cantidad por ella misma un determinado n´ umero de veces puede denotarse en forma compacta mediante el uso de la potenciaci´ on. De esta forma, la expresi´on: xn = xxx | {z· · · x} = y n−veces

indica que el producto de la cantidad x (base) por ella misma n-veces (exponente), da como resultado y (potencia). Si se conocen la base y la potencia, y se busca determinar el exponente, la operaci´on que realiza este c´ alculo se conoce como logaritmaci´ on y se denota como: logx y = n interpretando este resultado como: logx y = n si y solo si xn = y. Como ejemplo, si se busca determinar el logaritmo en base 5 de 25, se tiene que: log5 25 = 2

52 = 25

ya que

Algunas propiedades importantes de la funci´on logaritmo son1 : 1. loga (xy) = loga (x) + loga (y) 2.

  x loga = loga (x) − loga (y) y

3. loga (xm ) = m loga (x) Como ejemplo del uso de estas propiedades, consideremos la expresi´on:  log4

2x3 y 4 7zw

5

Por la aplicaci´ on de las propiedades del logaritmo, esta expresi´on puede simplificarse en: 1

La demostraci´ on de estas propiedades est´ a basada en las propiedades de la potenciaci´ on. Por ejemplo, si en la primera propiedad denotamos por: z = loga (xy), por m = loga (x) y por n = loga (y), de la definici´ on de logaritmo se tiene que: az = xy, am = x y an = y. De esto se tiene que: az = xy = am an = am+n , y como la funci´ on exponencial es uno a uno, se debe tener que z = m + n, lo que completa la demostraci´ on.

12

 log4

2x3 y 4 7zw

5

 3 4 2x y = 5 log4 7zw   = 5 log4 (2x3 y 4 ) − log4 (7zw)   = 5 log4 (2x3 ) + log4 (y 4 ) − log4 (7) − log4 (z) − log4 (w) = 5 [3(log4 (2) + log4 (x)) + 4 log4 (y) − log4 (7) − log4 (z) − log4 (w)]

Se puede ver que el uso de las propiedades del logaritmo permite simplificar la expresi´on original hasta llegar a sumas y restas. Esta es precisamente una de las grandes ventajas de trabajar con logaritmos, y la raz´ on de que en muchas situaciones se apliquen transformaciones logar´ıtmicas sobre los datos que se est´ an considerando. Un logaritmo de uso muy com´ un es el logaritmo natural, denotado por ln(x) y que corresponde al logaritmo de un valor x en el cual la base del logaritmo es el n´ umero irracional e, es decir: ln(x) = loge (x). Este logaritmo se denomina natural por su constante presencia en muchas de las aplicaciones del logaritmo en diferentes ´ areas. Las propiedades de este logaritmo son las mismas que las enunciadas antes, y en adelante asumiremos que al considerar el logaritmo de alguna cantidad este se refiere al logaritmo natural.

1.5.

Ejercicios

1. Determine cu´ al es el ´ındice y los l´ımites de las siguientes sumatorias: b)

a) 17 X

450 X

(8t2 − 5t + 3)

(8m − 4)

m=3

i=12

2. Determine el resultado de las siguientes operaciones: c)

a) 7 X

9 X

6i

i=1

(10k + 16)

k=3

b)

d) 4 X

11 X

10p

p=0

(2n − 3)

n=7

3. Exprese las siguientes sumas en notaci´on de sumatoria: a) 36 + 37 + 38 + 39 + · · · + 60 b) 1 + 4 + 9 + 16 + 25

13

c) 53 + 54 + 55 + 56 + 57 + 58 d ) 10 + 100 + 1000 + · · · + 1000000000

4. Determine el valor de las siguientes sumas: a)

c)  n  X 1 5 n

100 X

k=1

5k 2 + 3k



k=1

b)

d) 100 X

100 X

10k

k=51

(k + 5)

2

k=1

5. Cu´ al es el resultado de: 100 200 X X

4

i=1 i=1

6. Cu´ al es el valor de M si: M = (1 + 2 + 3 + · · · + 100) + (100 + 99 + · · · + 1) 7. Debido a combates por control territorial se presenta un desplazamiento de poblaci´on del pa´ıs A hacia el pa´ıs B, iniciando con 15 personas y agregando una persona m´as cada d´ıa, con relaci´on al d´ıa anterior. Ante esto el presidente del pa´ıs B decide cerrar la frontera, de forma que el u ´ltimo d´ıa de paso libre lograron cruzar 53 personas. ¿Cu´antas personas pasaron en total? 8. La siguiente tabla recoge los valores de una variable x, indexada por dos ´ındices e y d: HH d HH e H 1 2 3 4 5

1

2

3

-4 1 6 0 -2

4 9 -3 6 7

-8 12 5 2 0

Determine a partir de la tabla el valor de las siguientes sumas: a) 5 X 3 X e=1 d=1

14

xed

b) 5 X X

xed

e=1 d 1, es decir, en el on. intervalo (µ − kσ, µ + kσ) est´ a el 100(1 − k12 ) % de los valores de la poblaci´ Al considerar algunos valores para k podemos establecer el porcentaje de la poblaci´on dentro de cada intervalo, para cada valor de k: k 100(1 −

1 k2 ) %

1.5 55.6 %

2 75 %

2.5 84 %

3 88.9 %

3.5 91.18 %

4 93.7 %

Coeficiente de variaci´ on de Pearson Este coeficiente permite comparar las dispersiones de dos conjuntos de observaciones, ya que no est´ a influenciado por la escala de los datos. CV =

2.6.

s x ¯

100 %

Gr´ afico de caja y bigotes

Este gr´ afico, propuesto por Tukey, permite representar informaci´on de los datos basado en cuartiles. Para realizar esta representaci´ on se deben seguir estos pasos: 1. Ordenar los datos de menor a mayor. 2. Hallar x ˜, Q1 y Q3 . 3. Hallar los l´ımites, donde RIC es el rango intercuartil. 2◦ l´ımite inferior = Q1 − 3(RIC). 1◦ l´ımite inferior = Q1 − 1,5(RIC). 1◦ l´ımite superior = Q3 + 1,5(RIC). 2◦ l´ımite superior = Q3 + 3(RIC). Las observaciones entre el primer y segundo l´ımite inferior o entre el primer y segundo l´ımite superior son outliers (datos at´ıpicos). Las observaciones por fuera de los segundos l´ımites son outliers severos. 4. Se traza una escala que cubra el rango de observaciones, y en esta se ubican x ˜, Q1 y Q3 . 5. Formar una caja cuyos lados vayan de Q1 a Q3 , y en su interior un segmento de recta que indique x ˜.

32

6. Partiendo de Q1 , trazar un segmento de recta (bigote) hasta el u ´ltimo dato dentro del primer l´ımite inferior. 7. Partiendo de Q3 , trazar un segmento de recta (bigote) hasta el u ´ltimo dato dentro del primer l´ımite superior. 8. Marcar los outliers (◦) y los outliers severos (*).

Figura 2.6: Gr´ afico de caja y bigotes. Fuente: Wikipedia

Ejemplo 17 Realizar el gr´ afico de caja y bigotes para el siguiente conjunto de observaciones: 104, 112, 134, 146, 155, 168, 179, 195, 246, 302, 338, 412, 678. Calculamos las cantidades necesarias para la construcci´ on del gr´ afico: Q1 = 140, Q3 = 302, x ˜ = 170, RIC = 156. El valor de los l´ımites es: 2◦ l´ımite inferior = Q1 − 3(RIC) = −322. 1◦ l´ımite inferior = Q1 − 1,5(RIC) = −88. 1◦ l´ımite superior = Q3 + 1,5(RIC) = 536. 2◦ l´ımite superior = Q3 + 3(RIC) = 770.

33

*

100

200

300

400

500

600

700

La forma del gr´ afico de cajas tambi´en nos permite inferir acerca de la forma de la distribuci´on de las observaciones, como lo muestra la figura anterior.

2.7.

Medidas de forma

Consideramos ahora medidas sobre la forma descrita por el conjunto de observaciones en relaci´on con su simetr´ıa y su apuntamiento o levantamiento respecto al eje horizontal. Iniciamos con el sesgo, definido como una medida del grado de simetr´ıa de la curva descrita por las observaciones con relaci´on a su media. Supongamos que la siguiente gr´ afica representa la curva descrita por un conjunto de datos.

x ¯=˜ x=moda En este caso podemos observar que la curva es sim´etrica respecto a su media, lo cual implica que la mediana y la moda coinciden con el valor de la media. Entonces decimos que los datos siguen una distribuci´ on sim´etrica unimodal. De igual forma, es posible considerar distribuciones que son sim´etricas pero multimodales. Por ejemplo, la siguiente gr´ afica representa el caso de una distribuci´on de observaciones que es sim´etrica bimodal:

Si consideramos ahora distribuciones de observaciones que no son sim´etricas, podemos encontrar distribuciones con sesgo a derecha, como la representada en la siguiente figura:

34

¯ ˜ x moda x o distribuciones con sesgo a izquierda, como la siguiente:

x ¯ x ˜ moda Para cuantificar el grado de asimetr´ıa de la distribuci´on de las observaciones podemos considerar: ´ Indice de asimetr´ıa de Yule-Bowley para variables ordinales Como su nombre lo indica, este ´ındice es aplicable para variables ordinales, y est´a basado en la distancia entre cuartiles. Se define como: AS =

Q1 + Q3 − 2Q2 (Q3 − Q2 ) − (Q2 − Q1 ) = (Q3 − Q1 ) (Q3 − Q1 )

;

−1 ≤ AS ≤ 1

En este caso se tiene que:   < 0 sesgo negativo o cola larga a izquierda. As = = 0 sesgo cero o simetr´ıa.   > 0 sesgo positivo o cola larga a derecha.

Coeficiente de asimetr´ıa de Pearson Dado un conjunto de observaciones unimodal, este coeficiente se define como: Ap =

x ¯ − moda s

y es clasificado como:   = 0 Ap = < 0   >0

sim´etrica sesgo negativo o a izquierda sesgo positivo o a derecha

35

Coeficiente de asimetr´ıa de Fisher Dado un conjunto de observaciones x1 , x2 , ..., xn , este coeficiente se define como: Pn g1 =

i=1 (xi − nS 3

x ¯)3

donde S denota la desviaci´ on est´ andar de las observaciones. Se clasifica en este caso como:   = 0 g1 = < 0   >0

sim´etrica sesgo negativo o a izquierda sesgo positivo o a derecha

En el caso de datos agrupados se tiene que: Pm g1 =

j=1 (Mi

−x ¯ ) 3 fj

nS 3

Consideramos ahora una medida para el apuntamiento de la curva con relaci´on al eje horizontal. Esta medida es llamada curtosis, y es una medida del grado de concentraci´on de los datos alrededor de la media, es decir, es una medida del grado en el que se acumulan observaciones en las colas de la distribuci´on. Se define como: Pn (xi − x ¯)4 Curtosis = i=1 4 nS Para dar un mayor sentido a esta medida se utiliza como referente la campana Gaussina o curva normal, la cual tiene una curtosis de 3, por lo que es com´ un trabajar con el exceso de curtosis, medida definida como: Pn (xi − x ¯ )4 −3 Exceso de curtosis = g2 = i=1 4 nS Para el caso del exceso de curtosis se define:   = 0 g2 = < 0   >0

Mesoc´ urtica. Platic´ urtica. Leptoc´ urtica

36

leptoc´ urtica mesoc´ urtica platic´ urtica

En algunos caso tambi´en se utiliza el coeficiente de apuntamiento (Ku ) definido como: Ku =

Q3 − Q1 2(P90 − P10 )

y en este caso:   = 0, 263 Ku = < 0, 263   > 0, 263

2.8.

Mesoc´ urtica. Platic´ urtica. Leptoc´ urtica

Medidas de concentraci´ on

El objetivo de este tipo de medidas es cuantificar el grado de desigualdad en la distribuci´on o el reparto de una magnitud (ventas, riqueza, beneficios,...), entre un n´ umero determinado de elementos receptores (individuos, familias, empresas,...). Al considerar estas situaciones, se puede tener: m´ınima concentraci´ on o m´ axima igualdad: caso en el cual a todos los integrantes del conjunto receptor se les asigna la misma cantidad. m´ axima concentraci´ on o m´ınima igualdad: un receptor recibe todo. Para la cuantificaci´ on de esta relaci´ on se considera el ´ındice de Gini y la curva de Lorenz. ´ Indice de Gini. Para el c´ alculo de este ´ındice: 1. Se ordena el conjunto de receptores de menor a mayor cantidad recibida (se denota por vi al valor recibido por el receptor i). v1 ≤ v1 ≤ · · · ≤ v n

37

2. Hallar las cantidades acumuladas del n´ umero de receptores y de valor recibido. 3. Hallar las proporciones correspondientes a las cantidades acumuladas. El cuadro 18 muestra el c´ alculo de estas cantidades.

Receptores 1◦ 2◦ 3◦ .. .

vi v1 v2 v3 .. .

Acumulado receptores (i) 1 2 3 .. .

Valor acumulado (ui ) u1 = v1 u2 = v1 + v2 u3 = v1 + v2 + v3 .. .

n◦

vn

n

un = v1 + · · · + vn

pi = p1 = p2 = p3 =

i n 100 1 n 100 2 n 100 3 n 100

.. . pn = 100

qi = q1 = q2 = q3 =

ui n 100 u1 un 100 u2 un 100 u3 un 100

.. . qn = 100

Se debe notar que en caso de reparto equilibrado pi = qi para todo i, y que en general la diferencia (pi − qi ) indica la concentraci´ on del reparto. Partiendo de lo anterior, se define el ´ındice de Gini como: Pn−1 IG =

(pi − qi ) Pn−1 i=1 pi

i=1

;

0 ≤ IG ≤ 1

y de esta definici´ on se tiene que: • IG = 0 implica m´ınima concentraci´on o m´axima igualdad. • IG = 1 implica m´ axima concentraci´on o m´ınima igualdad.

Ejemplo 18 La siguiente tabla de frecuencias describe los salarios mensuales recibidos por los empleados de una empresa en millones de pesos.

Salario 3.5 4.5 6 8 10 15 20

N◦ de empleados 10 12 8 5 3 1 1

Para de terminar el ´ındice de concentraci´ on en la distribuci´ on de salarios, construimos el cuadro 2.6, luego IG = 83,99 = 0,19. 435

38

Salario 3.5 4.5 6 8 10 15 25

fi 10 12 8 5 3 1 1

Fi 10 22 30 35 38 39 40

pi 25 55 75 87.5 95 97.5 100 435

vi = xi fi 35 54 48 40 30 15 25

ui 35 89 147 187 217 232 257

qi 13.6 34.6 57.2 72.8 84.4 90.3 100

(pi − qi ) 10.83 18.97 19.53 15.84 11.19 7.62 0 83.99

Cuadro 2.6: Curva de Lorenz. Es la representaci´on gr´afica de la concentraci´on. qi

100

(pi , qi ) pi 100 El ´ındice de Gini puede interpretarse como la raz´on entre el ´area del tri´angulo bajo la diagonal y el ´ area encerrada por la diagonal y la curva de Lorenz f (p). Z IG = 1 − 2

1

f (p)dp 0

2.9.

Ejercicios sugeridos

1. Los 21 estudiantes de un sal´ on de clase tienen una estatura promedio de 167 cent´ımetros. Si entra un estudiante m´ as, ¿qu´e estatura deber´ıa tener para que el promedio aumente un cent´ımetro? 2. Los porcentajes de incremento en el salario m´ınimo para 10 pa´ıses de un a˜ no a otro son los siguientes: 10.2; 3.1; 5.9; 7.0; 3.7; 2.9; 6.8; 7.3; 8.2; 4.3. Halle la media, la mediana, la varianza muestral, la desviaci´ on muestral, el rango y el rango intercuartil (el cual se define como el percentil 75 menos el percentil 25) de los porcentajes de incremento. Interprete sus respuestas.

39

3. El valor promedio de los salarios pagados a las mujeres con formaci´on profesional en determinado departamento de Colombia es de $1500000 con una desviaci´on de $300000. Encuentre un intervalo en el que se pueda garantizar que se encuentran por lo menos el 75 % de los salarios. 4. Considere las siguientes observaciones de la volatilidad del precio de una acci´on: 73.7; 36.6; 109.9; 4.4; 33.1; 66.7; 30.0; 81.5; 22.2, 40.4; 16.4. Determine el valor de la media y la mediana muestrales. ¿Qu´e puede concluir? 5. Los siguientes datos representan los salarios de 30 trabajadores: Salario Frecuencia

550 8

600 6

700 7

800 5

3000 4

a) Determine: la moda, la media aritm´etica, la media geom´etrica, el rango y el sesgo. b) ¿Cu´ al es el primer cuartil, el tercer cuartil y el sexto decil? c) Determine la desviaci´ on est´ andar y el rango intercuartil. 6. Los siguientes datos corresponden a la informaci´on hist´orica mensual en millones, de la inversi´ on realizada por el Estado en planes de formaci´on de deportistas: 122.2 127.5 130.4 131.8 132.7 133.2 134.0 134.7 135.2 135.7 135.9 136.6 137.8 138.4 139.1 140.9 143.6

124.2 127.9 130.8 132.3 132.9 133.3 134.0 134.7 135.2 135.8 136.0 136.8 137.8 138.4 139.5 140.9 143.8

124.3 128.6 131.3 132.4 133.0 133.3 134.0 134.7 135.3 135.8 136.0 136.9 137.8 138.4 139.6 141.2 143.8

125.6 128.8 131.4 132.4 133.1 133.5 134.1 134.8 135.3 135.8 136.1 136.9 137.9 138.5 139.8 141.4 143.9

126.3 129.0 131.4 132.5 133.1 133.5 134.2 134.8 135.4 135.8 136.2 137.0 137.9 138.5 139.8 141.5 144.1

126.5 129.2 131.5 132.5 133.1 133.5 134.3 134.8 135.5 135.8 136.2 137.1 138.2 138.6 140.0 141.6 144.5

126.5 129.4 131.6 132.5 133.1 133.8 134.4 134.9 135.5 135.9 136.3 137.2 138.2 138.7 140.0 142.9 144.5

127.2 129.6 131.6 132.5 133.2 133.9 134.4 134.9 135.6 135.9 136.4 137.6 138.3 138.7 140.7 143.4 147.7

127.3 130.2 131.8 132.6 133.2 134.0 134.6 135.2 135.6 135.9 136.4 137.6 138.3 139.0 140.7 143.5 147.7

Construya un histograma utilizando intervalos de clase de igual amplitud, donde el primer intervalo tiene un l´ımite inferior de 122 y un l´ımite superior de 124. Ubique en este gr´afico la media y la mediana muestrales. Comente acerca de cualquier caracter´ıstica interesante del histograma.

40

7. Un diagrama Pareto es una variaci´on de un histograma para datos categ´oricos que resultan de un estudio. Considere una situaci´on en la que cada categor´ıa representa un tipo diferente de producto que incumple con alguna especificaci´on. Las categor´ıas est´an ordenadas de modo que la que tiene la frecuencia m´ as grande aparezca en el extremo izquierdo, luego la categor´ıa de la segunda frecuencia m´ as grande y as´ı sucesivamente. Suponga que se obtiene la siguiente informaci´ on sobre discordancia en paquetes de circuitos: componentes con fallas, 126; componentes incorrectos, 210; soldadura insuficiente, 67; exceso de soldadura, 54; componentes faltantes, 131. Construya un diagrama de Pareto. 8. La frecuencia acumulada y la frecuencia relativa acumulada para un intervalo de clase particular son la suma de las frecuencias y frecuencias relativas, respectivamente, para ese intervalo y los intervalos que queden debajo de ´el. Si, por ejemplo, hay cuatro intervalos con frecuencias: 9, 16, 13 y 12, entonces las frecuencias acumuladas son: 9, 25, 38 y 50, y las frecuencias relativas acumuladas son 0.18; 0.50; 0.76 y 1. Calcule las frecuencias acumuladas y las frecuencias relativas acumuladas para los datos del ejercicio 6. 9. En un estudio realizado para investigar la distribuci´on de la riqueza en un determinado pa´ıs, se obtuvo el siguiente resumen de la distribuci´on: media = 535, mediana = 500, moda = 500, desviaci´ on est´ andar = 96, m´ınimo = 220, m´aximo = 925, percentil 5 = 400, percentil 10 = 430, percentil 90 = 640, percentil 95 = 720. ¿Qu´e se concluye en relaci´ on con la forma de histograma de estos datos? Explique su razonamiento. 10. De acuerdo con una revista de informes a consumidores, los precios cobrados por 40 compa˜ n´ıas de seguros por la venta de un seguro de vida a hombres de 35 a˜ nos de edad es: 82 92 99 105

85 93 99 105

86 94 100 106

87 95 100 107

87 95 101 107

89 95 101 107

89 95 103 109

90 95 103 110

91 97 103 110

91 98 104 111

a. Separe los datos por intervalos de clase. b. Determine la frecuencia relativa para cada uno de los intervalos. c. Realice una histograma de los datos. d. Calcule la frecuencia relativa acumulada de los datos. e. Trace la ojiva para estos datos (la ojiva es la representaci´on gr´afica de la frecuencia relativa acumulada). 11. Dada la siguiente distribuci´ on de frecuencias: x Frecuencia

0 2

hallar:

41

10 4

20 7

30 5

40 2

a) La media, moda, mediana, primer y tercer cuartil. b) Varianza, desviaci´ on, coeficiente de variaci´on, mediana de las desviaciones absolutas, rango y rango intercuartil. c) Coeficiente de asimetr´ıa y de curtosis. d ) ´Indice de concentraci´ on de Gini y curva de Lorenz. 12. Las ayudas concedidas, en millones de pesos, por el Fondo para el Desarrollo Regional a 62 proyectos, vienen reflejadas en la siguiente tabla: Importe de ayuda n◦ de proyectos

0-100 12

100-250 15

250-500 20

500-1000 15

a) Calcular la ayuda media y la desviaci´on est´andar. b) Representar el histograma pertinente. c) Calcular la ayuda m´ axima concedida al 60 % de los proyectos menos favorecidos en el reparto (ojiva). d ) Si para el a˜ no siguiente las ayudas aumentan un 5 % sobre el valor inicial, manteni´endose el criterio del reparto, ¿cu´ al ser´ a ahora la ayuda media y la desviaci´on? e) Supongamos que queremos contactar con el 15 % de las empresas a quienes han sido concedidas estas ayudas, pero no queremos que sean ni las empresas que m´as han recibido, ni las que menos, sino que queremos quedarnos con el 15 % central. ¿Entre qu´e valores se mueven las ayudas concedidas a este grupo de empresas? f ) Calcular la asimetr´ıa y la curtosis de esta distribuci´on. 13. En un barrio de una gran ciudad se ha constatado que las familias residentes se han distribuido, seg´ un su composici´ on, de la siguiente forma: Composici´on Familias

0-2 110

2-4 200

4-6 90

6-8 75

8-10 25

a) ¿Cu´ al es el n´ umero promedio de personas por familia? b) ¿Cu´ al es el tipo de familia m´ as usual? c) Si solo hubiera plazas de aparcamiento para el 50 % de las familias, y estas se atendieran de mayor a menor n´ umero de miembros, ¿cu´antos componentes deber´ıa tener una familia para entrar en el cupo? d ) Si el coeficiente de variaci´ on de Pearson de otro barrio de la misma ciudad es 1,8, ¿cu´al de los dos barrios puede ajustar mejor sus previsiones con base en el diferente n´ umero de miembros de las familias que lo habitan? e) Si el gobierno local concede una ayuda de 50.000 pesos fijos por familia, m´as 10.000 pesos por cada miembro de la unidad familiar, determinar el importe medio por familia y la desviaci´ on est´ andar.

42

f ) N´ umero de miembros que tienen como m´aximo el 85 % de las familias menos numerosas. 14. La distribuci´ on de acciones de una sociedad es: Acciones 0-50 50-100 100-150 150-200 200-250 250-300 300-350 350-400 400-500

Accionistas 23 72 62 48 19 8 14 7 7

a) Calcular el n´ umero medio de acciones que posee un accionista. b) N´ umero de acciones que m´ as frecuentemente posee un accionista. c) N´ umero de acciones que debe poseer un accionista para que la mitad de los restantes accionistas tengan menos acciones que ´el. d ) El ´ındice de concentraci´ on de Gini y la curva de Lorenz correspondiente. e) Asimetr´ıa y curtosis de esta distribuci´on. 15. La siguiente tabla corresponde a dos muestras representativas de los cr´editos concedidos, en millones de pesos, por dos agencias de una entidad bancaria en el u ´ltimo mes. Comparar la concentraci´ on de ambas distribuciones.

Valor del cr´edito 0-0,5 0,5-1 1-2 2-4 4-7 7-12 12-14 14-18 18-20

Agencia A N◦ de cr´editos 3 4 6 58 78 90 20 6 4

Agencia B N◦ de cr´editos 10 12 8 30 12 15 5 6 16

16. Dos empresas A y B emplean a mil trabajadores cada una, clasificados en tres categor´ıas: I, II y III. En un mes determinado han distribuido una misma masa salarial de cien millones de d´olares, como se muestra m´ as adelante: a) Calcule el ´ındice de concentraci´on de Gini para cada una de las empresas y dibuje en un mismo gr´ afico las dos curvas de Lorenz.

43

b) A la vista de los resultados del apartado anterior critique y compare la equidad en el reparto de la masa salarial entre los empleados de las dos empresas.

17. En el siguiente gr´ afico est´ an representados en el eje de abscisas las proporciones acumuladas del n´ umero de individuos entre los que se reparte cierta magnitud y en el eje de ordenadas las proporciones acumuladas de los valores repartidos. La funci´on f (p) representa una estimaci´on de la curva de Lorenz.

a) Defina el ´Indice de concentraci´ on de Gini. b) Enuncie su relaci´ on con la curva de Lorenz. c) Calcule el valor del ´Indice de Gini si la curva de Lorenz es: f (p) = p2

44

;

0≤p≤1

Cap´ıtulo 3

Probabilidad y variables aleatorias 3.1.

Definiciones b´ asicas

La probabilidad puede ser interpretada como una medida de la posible ocurrencia de un evento determinado, donde dicho evento es un subconjunto de lo que se denomina espacio muestral, que es el conjunto de todos los posibles resultados de un experimento aleatorio. Como ejemplo de estos conceptos, consideremos el experimento aleatorio consistente en lanzar un dado normal de seis caras una sola vez. El conjunto de posibles resultados del experimento, es decir, el espacio muestral, es Ω = {1, 2, 3, 4, 5, 6} y posibles eventos sobre este espacio son: A = el resultado del lanzamiento es primo y par. {2}. B = el resultado del lanzamiento es par. {2, 4, 6}. C = el resultado del lanzamiento mayor que 6. ∅. Los eventos en general, pueden ser clasificados en: eventos simples que son aquellos que est´an compuestos por un solo elemento, como el evento A del ejemplo anterior; los eventos compuestos que son aquellos conformados por dos o m´ as elementos, como el evento B del ejemplo anterior, y los eventos nulos que son aquellos que no cuentan con ning´ un elemento (son vac´ıos), como el evento C del ejemplo anterior. Podemos ver que los eventos son subconjuntos del conjunto Ω y, por tanto, es posible realizar sobre estos las operaciones b´ asicas entre conjuntos, como por ejemplo: Uni´on (∪), Intersecci´on (∩), Complemento (0 ) o diferencia sim´etrica (∆). El mayor inter´es sobre los posibles eventos en un espacio muestral es calcular su probabilidad, para lo cual recurriremos, en este texto, a su definici´on frecuentista, la cual nos dice que la probabilidad de un evento se puede calcular como un n´ umero ideal al que converge su frecuencia relativa cuando la frecuencia absoluta tiende a infinito. De esta forma, para calcular la frecuencia de un evento A utilizamos la definici´on:

45

P [A] =

|A| |Ω|

donde |A| denota el cardinal de A, es decir, el n´ umero de elementos en A y |Ω| denota el cardinal de Ω. De esta forma el c´ alculo de la probabilidad de un evento est´a determinada por el n´ umero de elementos que lo conforman y por el n´ umero de elementos en todo el espacio muestral. Como ejemplo, si consideramos de nuevo el experimento aleatorio de lanzar una dado normal de seis caras y los eventos definidos antes, tenemos que: P [A] =

1 6

;

P [B] =

3 6

;

P [C] = 0

Ejemplo 19 Consideremos ahora el experimento aleatorio consistente en lanzar dos dados normales de seis caras, uno rojo y uno verde. El conjunto de posibles resultados de este experimento aleatorio son las 36 posibles parejas: Ω : {(a, b)|a, b ∈ {1, 2, 3, 4, 5, 6}}. Sobre este espacio definimos los eventos: A = al menos uno de los dados cay´ o 6 = {(1, 6), (2, 6), (3, 6), (4, 6), (5, 6), (6, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5)}. B = la suma de los resultados es igual a 7 = {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}. C = los dos resultados son iguales = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}. Tenemos entonces que: P [A] =

11 36

;

P [B] =

6 36

;

P [C] =

6 36

;

y dado que: A ∩ B = {(1, 6), (6, 1)}

B∩C =∅

A ∩ C = {(6, 6)}

entonces: P [A ∩ B] =

2 36

;

P [B ∩ C] = 0

;

P [A ∩ C] =

1 36

Podemos anotar que en este caso los eventos B y C son disyuntos, es decir, eventos con intersecci´ on vac´ıa. A partir de esta definici´ on de probabilidad es f´acil deducir algunas propiedades importantes de la misma. Consideremos dos eventos A y B en Ω, entonces: P [Ω] = 1

46

P [A ∪ B] = P [A] + P [B] − P [A ∩ B] P [A0 ] = 1 − P [A] Ejemplo 20 Carlos se va a graduar al final del semestre. Despu´es de ser entrevistado en dos compa˜ n´ıas A y B, ´el eval´ ua que la probabilidad de obtener una oferta de la empresa A es de 0,8, y la probabilidad de obtener una oferta de la empresa B es 0,6. Si ´el cree que la probabilidad de que reciba ofertas de ambas compa˜ n´ıas es de 0,5, ¿cu´ al es la probabilidad de que reciba ofertas de al menos una de las compa˜ n´ıas?, ¿cu´ al es la probabilidad de que reciba oferta solamente de la compa˜ n´ıa A?, ¿solamente de la compa˜ n´ıa B?, ¿qu´e no reciba ofertas de ninguna compa˜ n´ıa? Los datos pueden representarse en un diagrama de Venn como el que se muestra a continuaci´ on. A

B

0.3

0.5

0.1

0.1 Tenemos entonces que las respuestas a las preguntas consideradas son: P [A ∪ B] = 0,9 = P [A] + P [B] − P [A ∩ B] P [A − B] = 0,3 P [B − A] = 0,1 0

P [(A ∪ B) ] = 0,1 Ejemplo 21 ¿Cu´ al es la probabilidad de obtener 7 u 11 al lanzar un par de dados? Si denotamos por A el evento de que la suma sea 7, y por B el evento de que la suma sea 11, tenemos que P [A] = 6/36 y P [B] = 2/36, luego: 2 8 6 + = 36 36 36 observemos que en este caso no consideramos la intersecci´ on ya que estos dos eventos son disyuntos. P [A ∪ B] = P [A] + P [B] =

Ejemplo 22 Si la probabilidad de los eventos disyuntos A, B y C es respectivamente 0.2; 0.4 y 0.1, 0 ¿cu´ al es la probabilidad de (A ∪ B ∪ C) ? Tenemos que: 0

P [(A ∪ B ∪ C) ] = 1 − P [A ∪ B ∪ C] = 1 − [0,2 + 0,4 + 0,1] = 0,3

47

3.2.

Probabilidad condicional

Un concepto muy importante dentro de la probabilidad es el de probabilidad condicional, en el cual, si consideramos dos eventos A y B en Ω, buscamos determinar la probabilidad del evento A dado que ya sabemos que ocurri´ o el evento B. Esto lo denotamos como P [A|B] y se define: P [A|B] =

P [A ∩ B] dado que P [B] > 0 P [B]

Ejemplo 23 Considere el espacio muestral conformado por todos los individuos de una peque˜ na ciudad que tienen titulo profesional, los cuales son clasificados por sexo y por su situaci´ on laboral seg´ un lo muestra la siguiente tabla.

Masculino Femenino Total

Empleado 460 140 600

Desempleado 40 260 300

Total 500 400 900

Uno de los individuos es seleccionado para realizar un viaje a trav´es del pa´ıs publicitando las ventajas de establecer nuevas industrias en las ciudades. Si consideramos los eventos: M = es seleccionado un hombre. E = el seleccionado tiene empleo. ¿Cu´ al es la probabilidad de que el seleccionado sea una hombre dado que tiene empleo? En la notaci´ on establecida, lo que buscamos calcular es: P [M |E], que de acuerdo con la definici´ on es: P [M |E] =

P [M ∩ E] 460/900 460 = = P [E] 600/900 600

Como podemos observar de los ejemplos anteriores, la probabilidad condicional es una probabilidad concentrada en el conjunto que impone la condici´on, de esta forma se tiene que: P [B|B] = 1 Ejemplo 24 La probabilidad de que un vuelo regular despegue de acuerdo con el itinerario es P (D) = 0,83; la probabilidad de que aterrice a tiempo es P (A) = 0,82; y la probabilidad de que despegue a tiempo y aterrice a tiempo es P [D ∩ A] = 0,78. Encuentre la probabilidad de que un vuelo regular: 1. Aterrice a tiempo, dado que despeg´ o a tiempo. 2. Despegue a tiempo dado que aterriz´ o a tiempo. En t´erminos de probabilidad de eventos, la primera probabilidad pedida es: P [A|D] =

P [D ∩ A] 0,78 = = 0,94 P [D] 0,83

48

y la segunda es: P [D|A] =

P [D ∩ A] 0,78 = = 0,95 P [A] 0,82

Cabe entonces destacar el papel de la probabilidad condicional ya que esta permite realizar c´alculos de probabilidad en los que se considera nueva informaci´on, estableciendo una expresi´on concreta para incorporar dicha informaci´ on. De igual forma, la probabilidad condicional permite establecer con claridad la idea de eventos independientes que ser´ a expuesta en la siguiente secci´on.

3.3.

Ley de probabilidades totales y teorema de Bayes

Para estudiar estos dos importantes resultados de la teor´ıa de probabilidad, necesitamos considerar primero el concepto de partici´ on de un espacio muestral Ω. Definici´ on 1 Una colecci´ on de eventos A1 , A2 , · · · , An se dice una partici´ on del espacio muestral Ω si se cumple que: Los eventos en la colecci´ on son mutuamente excluyentes, es decir, Ai ∩ Aj = ∅ para todo i 6= j. La uni´ on de todos los elementos en la colecci´ on da como resultado Ω. [

Ai = Ω

i

Una vez considerado el concepto de partici´on, la ley de probabilidades totales establece que si A1 , · · · , An es una partici´ on de Ω, y B es otro evento en Ω, entonces: P [B] =

n X

P [B|Ai ]P [Ai ]

k=1

La prueba de este resultado es directa de considerar que la probabilidad del evento B puede expresarse como la suma de las probabilidades de B interceptado con cada elemento de la partici´on y de la definici´ on de probabilidad condicional, es decir: P [B] =

n X

P [Ai ∩ B] =

i=1

n X

P [B|Ai ]P [Ai ]

k=1

Ejemplo 25 En una cierta planta de ensamblaje, tres m´ aquinas M1 , M2 y M3 hacen el 30, 45 y 25 % de los productos respectivamente. Por experiencia se sabe que 2, 3 y 2 % de los productos hechos en cada m´ aquina, respectivamente, son defectuosos. Si se selecciona un producto terminado de forma aleatoria, ¿cu´ al es la probabilidad de que tenga defectos? Si denotamos por D al evento en el cual el producto seleccionado tiene defectos, entonces:

49

P [D] = P (D|M1 )P [M1 ] + P (D|M2 )P [M2 ] + P (D|M3 )P [M3 ] = (0, 02)(0, 3) + (0, 03)(0, 45) + (0, 02)(0, 25) = 0, 0245 Consideramos ahora otro importante resultado conocido como regla de Bayes, que permite determinar la probabilidad de que se haya presentado un elemento de la partici´on, dado que ya se present´o el evento B, como se muestra a continuaci´ on.

3.3.1.

Teorema de Bayes

Sea A1 , · · · , An una partici´ on de Ω tal que P [Ai ] 6= 0 para todo i, y sea B otro evento en Ω tal que P [B] 6= 0. Entonces: P [B|Aj ]P [Aj ] P [Aj |B] = Pn i=1 P [B|Ai ]P [Ai ] La demostraci´ on de este resultado est´ a basada simplemente en la definici´on de probabilidad condicional y en la ley de probabilidades totales, ya que: P [Aj |B] =

P [B|Aj ]P [Aj ] P [Aj ∩ B] = Pn P [B] i=1 P [B|Ai ]P [Ai ]

Ejemplo 26 Continuando con el ejemplo anterior de la planta de ensamblaje y las tres m´ aquinas, supongamos ahora que el producto seleccionado al azar est´ a defectuoso, ¿cu´ al es la probabilidad de que provenga de la m´ aquina 3? P [M3 |D] =

3.4.

0,005 P [D|M3 ]P [M3 ] = P [D|M1 ]P [M1 ] + P [D|M2 ]P [M2 ] + P [D|M3 ]P [M3 ] 0,0245

Eventos independientes

Dos eventos A y B en el espacio muestral Ω se dicen estad´ısticamente independientes si y solo si P [A|B] = P [A], es decir, la probabilidad de que ocurra el evento A no se ve afectada por la ocurrencia o no del evento B, o de igual forma P [B|A] = P [B]. Si en las expresiones anteriores utilizamos la definici´on de probabilidad condicional, se tiene que: P [A|B] = P [A]



P [A ∩ B] = P [A] P [B]

50



P [A ∩ B] = P [A]P [B]

P [B|A] = P [B]

P [B ∩ A] = P [B] P [A]





P [B ∩ A] = P [B]P [A]

luego se considera en lo que sigue, que dos eventos A y B son independientes si se tiene que: P [A ∩ B] = P [A]P [B]

En general, si se consideran n eventos A1 , A2 , ..., An , estos se dicen estad´ısticamente independientes si y solo si: P [A1 ∩ A2 ∩ ... ∩ An ] = P [A1 ]P [A2 ] · · · P [An ] Ejemplo 27 Cada d´ıa de la semana, de lunes a viernes, un lote de alimentos llega de un proveedor A para ser inspeccionado por el departamento de salud. Dos d´ıas a la semana llega para inspecci´ on un lote de un proveedor B. 80 % de todos los lotes enviados por el proveedor A pasan la inspecci´ on, y el 90 % de lo enviado por el proveedor B la pasa. ¿Cu´ al es la probabilidad de que un d´ıa seleccionado al azar dos lotes pasen la inspecci´ on? Para responder a esta pregunta asumimos que los d´ıas en que los lotes son inspeccionados los resultados de la inspecci´ on son independientes entre s´ı.

1L 0.6 0.4

P

0.8

F

0.2 0.8

P

2L 0.2

F

P

0.9

F P

0.1 0.9

F

0.1

El gr´ afico de ´ arbol representa la situaci´ on y podemos observar que: P [2 pasen] = P [2 recibidos ∩ 2 Pasen] = P [2 Pasen|2 recibidos] · P [2 recibidos] = [(0,8)(0,9)](0,4) = 0,288

51

3.5.

Variables aleatorias

Una variable aleatoria es una funci´ on que asigna a los eventos del espacio muestral valores en los n´ umeros reales, es decir, si w ∈ Ω es un evento, entonces X[w] ∈ R es el valor que la variable aleatoria X[·] le asigna al evento w. Como ejemplo consideremos el experimento aleatorio que consiste en lanzar una moneda normal tres veces. Los elementos en Ω son: Ω = {(C, C, C), (C, C, S), (C, S, C), (C, S, S), (S, C, C), (S, C, S), (S, S, C), (S, S, S)} y definamos la variable aleatoria X= n´ umero de caras en los tres lanzamientos. De la definici´on de la variable vemos que, por ejemplo: X[(C, S, C)] = 2 o

X[(S, S, S)] = 0

En general, los valores que puede tomar la variable X son: x = {0, 1, 2, 3}. Las variables aleatorias se puede clasificar en: discretas, continuas y mixtas. Las variables discretas son aquellas que pueden tomar un n´ umero finito o infinito pero enumerable de valores. Como ejemplo de este tipo de variables podemos considerar la variable aleatoria X del ejemplo anterior. Las variables continuas son aquellas que pueden tomar valores infinitos no enumerables, es decir, este tipo de variables toma valores en intervalos. Las variables mixtas son aquellas que en algunos sectores de su dominio son continuas y en otros sectores discretas. Algunos ejemplos de variables aleatorias son: Y = El n´ umero de personas que votan por un determinado candidato en cierta region de un pa´ıs (variable discreta). T = Tiempo que le toma a una persona aprender a desarrollar una determinada tarea (variable continua). X= N´ umero de hijos en las familias de una regi´on rural de Colombia (variable discreta). P = Peso de una persona seleccionada al azar (variable continua). Para caracterizar una variable aleatoria se utilizan una serie de funciones que determinan la forma como se distribuye la probabilidad entre los posibles valores de la variable. Estas funciones son: la funci´on de distribuci´ on de probabilidad fX (x) (esta funci´on recibe el nombre de funci´on de densidad de probabilidad en el caso de variables continuas), la funci´ on de distribuci´on acumulada FX (x), la funci´on generadora de momentos mX (t) y la funci´ on caracter´ıstica φX (t).

3.5.1.

Funci´ on de distribuci´ on de probabilidad fX (x)

Dada una variable aleatoria X discreta, con posibles valores x1 , x2 ,...,xn , se define la funci´on de distribuci´ on de probabilidad (o funci´ on masa de probabilidad) fX (x) como: fX (xi ) = P [X = xi ]

52

Para el caso de la variable aleatoria X, definida como el n´ umero de caras en tres lanzamientos de una moneda, la funci´ on de distribuci´ on puede expresarse mediante la siguiente tabla: xi fX (xi ) = P [X = xi ]

0 1/8

1 3/8

2 3/8

3 1/8

Si consideramos ahora la variable Y , definida como el resultado de la suma de las caras al lanzar dos dados, tenemos que: yi fY (yi )

2 1/36

3 2/36

4 3/36

5 4/36

6 5/36

7 6/36

8 5/36

9 4/36

10 3/36

11 2/36

12 1/36

Dado que la funcion fX (xi ) describe la forma como se asigna probabilidad a los diversos valores de X, se tiene que: fX (xi ) ≥ 0 para todo xi . P xi fX (xi ) = 1.

3.5.2.

Funci´ on de distribuci´ on acumulada FX (x)

Si X es una variable aleatoria discreta con posibles valores x1 , x2 ,..., xn , la funci´on de distribuci´ on acumulada FX (xi ) se define como: X X FX (xi ) = P [X = y] = fX (y) y≤xi

y≤xi

es decir, la funci´ on de distribuci´ on acumulada de una variable X hasta el valor xi es la suma de las probabilidades de los valores de X menores o iguales a xi . Por ejemplo, la funci´on de distribuci´on acumulada de la variable X del ejemplo del n´ umero de caras en los tres lanzamientos es:   0 si xi < 0      1/8 si 0 ≤ xi < 1 FX (xi ) = 4/8 si 1 ≤ xi < 2    7/8 si 2 ≤ xi < 3    1 si xi ≥ 3 Algunas propiedades de la funci´ on de distribuci´on acumulada son: FX (xi ) es una funci´ on no decreciente de xi . l´ımxi →−∞ FX (xi ) = 0. l´ımxi →∞ FX (xi ) = 1.

53

3.5.3.

Valor esperado y Varianza

Al considerar variables aleatorias discretas o continuas, el valor esperado de la variable es una medida de tendencia central de la misma, es decir, el valor esperado (E[X]) de una variable aleatoria es el valor que se espera tome la variable al realizar el experimento aleatorio. Este valor se define para variables discretas como: X X E[X] = xi · P [X = xi ] = xi · fX (xi ) i

i

Por ejemplo si consideramos una variable aleatoria Y discreta, con una funci´on de distribuci´on dada por: yi fY (yi )

-1 0.3

2 0.05

4 0.45

5 0.2

el valor esperado de la variable es: E[Y ] = (−1)(0,3) + (2)(0,05) + (4)(0,45) + (5)(0,2) = 2,6

Algunas propiedades del valor esperado son: E[α] = α, donde α es una constante. E[αX] = αE[X], donde α es una constante y X es una variable aleatoria. E[X ± Y ] = E[X] ± E[Y ]. P E[h(X)] = i h(xi )P [X = xi ], donde h(·) es una funci´on. Utilizando estas propiedades del valor esperado, y considerando la variable Y del ejemplo anterior, podemos calcular el valor esperado de las siguientes expresiones: E[2Y + 3] = 2E[Y ] + 3 = 2(2,6) + 3 = 8,2 E[Y 2 ] = (−1)2 (0,3) + (2)2 (0,05) + (4)2 (0,45) + (5)2 (0,2) = 12,7 La varianza de una variable aleatoria es una medida de la dispersi´on de los valores que puede tomar la variable respecto a su valor esperado. Se define entonces la varianza como:   V [X] = E (X − E[X])2

Si se desarrolla el cuadrado y se utilizan las propiedades del valor esperado se puede ver f´acilmente que la varianza es igual a: V [X] = E[X 2 ] − (E[X])2

54

Considerando de nuevo la variable Y del u ´ltimo ejemplo tenemos que: V [Y ] = E[Y 2 ] − (E[Y ])2 = 12,7 − (2,6)2 = 5,94 Definida la varianza de una variable aleatoria, se define su desviaci´on est´andar σX como: p σX = V [X]

Algunas propiedades de la varianza son las siguientes: V [α] = 0, donde α es una constante. V [αX] = α2 X, donde α es constante y X es variable. V [X + α] = V [X], donde α es constante y X es variable. V [X + Y ] = V [X] + V [Y ] + 2Cov(X, Y ). En la u ´ltima propiedad la expresi´ on Cov(X, Y ) denota la covarianza entre X y Y , que es definida como: Cov(X, Y ) = E [(X − E[X])(Y − E[Y ])] = E[XY ] − E[X]E[Y ] La covarianza es una medida del grado de asociaci´on lineal entre las variables X y Y . Para medir de manera m´ as concreta dicho grado de asociaci´on lineal, se define el coeficiente de correlaci´ on entre las variables X, Y como: ρ(X, Y ) =

Cov(X, Y ) σX σY

Este coeficiente tiene la propiedad de estar siempre entre −1 y 1 de forma que entre m´as cercano a 1 es m´ as fuerte la relaci´ on lineal entre las variables y esta relaci´on es directa (Si una variable aumenta la otra tambi´en). Por otro lado, si el valor es cercano a -1 la relaci´on lineal entre las variables es fuerte pero es inversa (mientras una variable aumenta la otra disminuye). Si el valor del coeficiente es cero se tiene que las variables son linealmente independientes, es decir, no hay relaci´ on de car´ acter lineal entre ellas, pero pueden estar relacionadas de forma no lineal.

3.5.4.

Algunas distribuciones b´ asicas

Las funciones de distribuci´ on de probabilidad son formas espec´ıficas que se le han dado a la funci´on fX (x) dependiendo de la forma como est´e definida la variable. Consideremos algunas de estas funciones.

55

Distribuci´ on Bernulli y binomial. Una variable aleatoria se dice de tipo Bernulli cuando solamente puede tomar dos valores 1 o 0, los cuales regularmente se asocian con ´exito o fracaso. Para este tipo de variables si p es la probabilidad de ´exito, es decir la probabilidad de que la variable tome el valor 1, y 1 − p la probabilidad de fracaso, es decir la probabilidad de que la variable tome el valor 0, se tiene que: fX (x) = px (1 − p)1−x

;

x = 0, 1.

El valor esperado en este caso es E[X] = p y la varianza V [X] = p(1 − p). Una variable aleatoria X sigue una distribuci´ on binomial si esta cuenta el n´ umero de ´exitos en n repeticiones de un experimento Bernulli, en donde la probabilidad de ´exito es constante entre las distintas repeticiones y los resultados de cada repetici´on son independientes de los dem´as. Para caracterizar este tipo de variables es necesario conocer el n´ umero de repeticiones n, y la probabilidad de ´exito en cada repetici´ on p. Se tiene entonces que si una variable sigue una distribuci´ on binomial con par´ ametros n y p, lo cual se denota por X ∼ Bin(n, p), entonces:   n x fX (x) = p (1 − p)n−x x

;

  n n! = x!(n − x)! x

y los posibles valores de x son 0, 1, 2, ..., n. Para esta distribuci´ on se tiene que: E[X] = np

;

V [X] = np(1 − p)

Distribuci´ on Poisson Una variable aleatoria X sigue una distribuci´on Poisson con par´ametro λ si lo que hace es contar el n´ umero de eventos ocurridos por unidad de tiempo, ´area o volumen. Lo que denominamos eventos en este caso es definido por el investigador y el par´ametro λ es el promedio hist´orico de observaciones realizadas por unidad de tiempo, ´ area o volumen. La funci´ on de distribuci´ on de una variable de tipo Poisson con par´ametro Λ, lo que denotamos por X ∼ P (λ), es: fX (x) =

e−λ λx x!

y el valor esperado E[X] = λ y V [X] = λ.

56

;

x = 0, 1, 2, ...

Distribuci´ on normal La funci´ on de distribuci´ on continua m´as utilizada en la estad´ıstica es la distribuci´ on normal. Una variable aleatoria X sigue una distribuci´on normal si puede tomar valores en el eje real, asignando mayor probabilidad a un valor µ con una desviaci´on est´andar σ. La representaci´on gr´afica de esta distribuci´ on es la campana Gaussina centrada en µ. Si la variable X sigue una distribuci´ on normal con media µ y varianza σ 2 , lo que denotamos por X ∼ N (µ, σ 2 ) la funci´ on de densidad de probabilidad de la variable es: fX (x) = √

(x−µ)2 1 e− 2σ2 2πσ

El valor esperado de la variable es µ y la varianza es σ 2 . Un tipo particular de distribuci´ on normal es aquella en la cual la media es igual a cero y la varianza es igual a uno. En este caso decimos que la distribuci´on es normal est´ andar y es costumbre denotar a las variables normales est´ andar con la letra Z, (Z ∼ N (0, 1)). El proceso que permite transformar una variable normal X ∼ N (µ, σ 2 ) en una normal est´andar Z ∼ N (0, 1), se conoce como estandarizaci´ on y consiste en: Z=

X −µ σ

Los siguientes ejercicios se presentan en ingl´es, con el ´animo de fortalecer la lectura t´ecnica en este idioma entre los estudiantes.

3.6.

Ejercicios sugeridos

1. Classify each of the following random variables as either continuous or discrete: The lifelength of the battery in a smoke alarm. The number of rain delays during the month of March in Bogot´a. The amount of medication prescribed to a patient having high blood pressure. The speed at which a major league baseball player throws a baseball. 2. The running of red lights by drivers is a serious problem in many cities. A police officer is stationed near a major intersection to observe the traffic for several days. Is the number of cars running a red light during a given light cycle a discrete or continuous random variable? Is the time between the light turning red and the last car passing through the intersection a discrete or continuous random variable?

57

Are the brands of cars running a red light a discrete or continuous random variable? 3. Every semester, students are given a questionnaire to evaluate their instructor teaching. The question that is of greatest interest to administrators is, Do you agree with the following statement: overall the instructor was a good teacher. The possible responses are Strongly agree, Agree, No opinion, Disagree, and Strongly disagree. Are the number of students in class responding Strongly agree a continuous or discrete random variable? Are the percent of students in class responding Strongly agree a continuous or discrete random variable? 4. An appliance store has the following probabilities for y, the number of major appliances sold on a given day: y 0 1 2 3 4 5 6 7 8 9 10

P (y) .100 .150 .250 .140 .090 .080 .060 .050 .040 .025 .015

Construct a graph of P (y). Find P [Y ≤ 3] Find P [Y ≥ 8] Finf P [5 ≤ Y < 9] 5. The number of daily requests for emergency assistance at a fire station in a medium-sized city has the probability distribution shown here.

58

y 0 1 2 3 4 5 6 7 8 9 10

P (y) .06 .14 .16 .14 .12 .10 .08 .07 .06 .04 .03

What is the probability that four or more requests will be made in a particular day? What is the probability that the requests for assistance will be at least four but no more than six? Suppose the fire station must call for additional equipment from a neighboring city whenever the number of requests for assistance exceeds eight in a given day. The neighboring city then charges for its equipment. What is the probability the city will call for additional equipment on a given day? 6. The probability distribution of X, the number of imperfections per 10 meters of a synthetic fabric in continuous rolls of uniform width, is given by: x fX (x)

0 0.41

1 0.37

2 0.16

3 0.05

4 0.01

Construct the cumulative distribution function of X. 7. A shipment of 7 television sets contains 2 defective sets. A hotel makes a random purchase of 3 of the sets. If x is the number of defective sets purchased by the hotel, find the probability distribution of X. 8. Find the cumulative distribution function of the random variable X representing the number of defectives in the prvious Exercise. Then using FX (x), find: a) P (X = 1). b) P (0 < X ≤ 2). 9. A coin is biased such that a head is three times as likely to occur as a tail. Find the expected number of tails when this coin is tossed twice. 10. The probability distribution of X, the number of imperfections per 10 meters of a synthetic fabric in continuous rolls of uniform width, is given by:

59

x fX (x)

0 0.41

1 0.37

2 0.16

3 0.05

4 0.01

Find the average number of imperfections per 10 meters of this fabric. Find de the varianceof this random variable. 11. Let y be a normal random variable with µ = 500 and σ= 100. Find the following probabilities: P [500 < y < 665] P [y > 665] P [304 < y < 665] k tal que P [500 − k < y < 500 + k] = 0,6 12. Suppose that y is a normal random variable with mu= 100 and σ= 15. Show that y < 115 is equivalent to z < 1. Convert y < 85 to the z-score equivalent. 13. Find the probability of observing a value of z greater than these values. 1.96 2.21 -2.86 -0.73 14. Records maintained by the office of budget in a particular state indicate that the amount of time elapsed between the submission of travel vouchers and the final reimbursement of funds has approximately a normal distribution with a mean of 39 days and a standard deviation of 6 days. What is the probability that the elapsed time between submission and reimbursement will exceed 50 days? If you had a travel voucher submitted more than 55 days ago, what might you conclude? 15. The College Boards, which are administered each year to many thousands of high school students, are scored so as to yield a mean of 500 and a standard deviation of 100. These scores are close to being normally distributed. What percentage of the scores can be expected to satisfy each condition? Greater than 600 Greater than 700 Less than 450 Between 450 and 600 16. According to Consumer Digest (July/August 1996), the probable location of personal computers (PC) in the home is as follows

60

Adult bedroom: 0.03 Child bedroom: 0.15 Other bedroom: 0.14 Office or den: 0.40 Other rooms: 0.28 a) What is the probability that a PC is in a bedroom? b) What is the probability that it is not in a bedroom? c) Suppose a household is selected at random from households with a PC; in what room would you expect to find a PC? 17. A pair of fair dice is tossed. Find the probability of getting: a) a total of 8; b) at most a total of 5. 18. In the senior year of a high school graduating class of 100 students, 42 studied mathematics, 68 studied psychology, 54 studied history, 22 studied both mathematics and history, 25 studied both mathematics and psychology, 7 studied history but neither mathematics nor psychology, 10 studied all three subjects, and 8 did not take any of the three. Randomly select a student from the class and find the probabilities of the following events. a) A person enrolled in psychology takes all three subjects. b) A person not taking psychology is taking both history and mathematics. 19. For married couples living in a certain suburb, the probability that the husband will vote on a bond referendum is 0.21, the probability that the wife will vote on the referendum is 0.28, and the probability that both the husband and the wife will vote is 0.15. What is the probability that: a) at least one member of a married couple will vote? b) a wife will vote, given that her husband will vote? c) a husband will vote, given that his wife will not vote? 20. Police plan to enforce speed limits by using radar traps at four different locations within the city limits. The radar traps at each of the locations L1, L2, L3, and L4 will be operated 40 %, 30 %, 20 %, and 30 % of the time. If a person who is speeding on her way to work has probabilities of 0.2, 0.1, 0.5, and 0.2, respectively, of passing through these locations, what is the probability that she will receive a speeding ticket? 21. Denote by A, B, and C the events that a grand prize is behind doors A, B, and C, respectively. Suppose you randomly picked a door, say A. The game host opened a door, say B, and showed there was no prize behind it. Now the host offers you the option of either staying at the door that you picked (A) or switching to the remaining unopened door (C). Use probability to explain whether you should switch or not.

61

22. Suppose that the four inspectors at a film factory are supposed to stamp the expiration date on each package of film at the end of the assembly line. John, who stamps 20 % of the packages, fails to stamp the expiration date once in every 200 packages; Tom, who stamps 60 % of the packages, fails to stamp the expiration date once in every 100 packages; Jeff, who stamps 15 % of the packages, fails to stamp the expiration date once in every 90 packages; and Pat, who stamps 5 % of the packages, fails to stamp the expiration date once in every 200 packages. If a customer complains that her package of film does not show the expiration date, what is the probability that it was inspected by John? 23. A truth serum has the property that 90 % of the guilty suspects are properly judged while, of course, 10 % of the guilty suspects are improperly found innocent. On the other hand, innocent suspects are misjudged 1 % of the time. If the suspect was selected from a group of suspects of which only 5 % have ever committed a crime, and the serum indicates that he is guilty, what is the probability that he is innocent? 24. A large industrial firm uses three local motels to provide overnight accommodations for its clients. From past experience it is known that 20 % of the clients are assigned rooms at the Ramada Inn, 50 % at the Sheraton, and 30 % at the Lakeview Motor Lodge. If the plumbing is faulty in 5 % of the rooms at the Ramada Inn, in 4 % of the rooms at the Sheraton, and in 8 % of the rooms at the Lakeview Motor Lodge, what is the probability that a) a client will be assigned a room with faulty plumbing? b) a person with a room having faulty plumbing was assigned accommodations at the Lakeview Motor Lodge? 25. An industrial plant is conducting a study to determine how quickly injured workers are back on the job following injury. Records show that 10 % of all injured workers are admitted to the hospital for treatment and 15 % are back on the job the next day. In addition, studies show that 2 % are both admitted for hospital treatment and back on the job the next day. If a worker is injured, what is the probability that the worker will either be admitted to a hospital or be back on the job the next day or both?

62

Bibliograf´ıa [1] David Anderson, Dennis Sweeney, Thomas Williams, Jeffrey Camm, and James Cochran. Quantitative methods for business. Cengage Learning, 2012. [2] Liliana Blanco. Probabilidad. Universidad Nacional de Colombia. Unibiblos Bogot´a, 2004. [3] Paolo Brandimarte. Quantitative methods: an introduction for business management. John Wiley & Sons, 2012. [4] Jay Devore. Probability and Statistics for Engineering and the Sciences. Cengage Learning, 2015. [5] R. Lyman Ott and Micheal T. Longnecker. An Introduction to Statistical Methods and Data analysis, 4th. New York: Duxbury Press, 1993. [6] Richard L. Scheaffer, William Mendenhall, and Lyman Ott. Elementos de muestreo. Editorial Paraninfo, 2007. [7] Donald Waters and C. Donald J Waters. Quantitative methods for business. Pearson Education, 2008.

63

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.