Pruebas de hipótesis con dos muestras y varias muestras con datos categóricos

June 1, 2017 | Autor: Giselle Aylin | Categoria: Estadistica descriptiva e inferencial
Share Embed


Descrição do Produto

19






TECNOLÓGICO NACIONAL DE MÉXICO
Instituto Tecnológico de Tijuana















"Pruebas de hipótesis con dos muestras y varias muestras con datos categóricos"












Tijuana, B.C., 30 de Mayo de 2016


Índice
Pruebas de hipótesis con dos muestras y varias muestras con datos categóricos
Introducción 3
5.1 Prueba Z para la diferencia entre dos proporciones 4
5.2 Prueba para la diferencia entre dos proporciones 15
5.3 Prueba para la diferencia en n proporciones Z 19
5.4 Prueba de independencia (ji-cuadrada) 32
5.5 Pruebas de contingencia (ji-cuadrada) 43
5.6 Pruebas de bondad de ajuste 49
Conclusión 51
Bibliografía/Referencias 51







Introducción

En esta investigación se revisan las particularidades de cada una de estas pruebas de hipótesis, estas se realizan comparando las frecuencias observadas y las frecuencias esperadas.
A su vez, estas pruebas con frecuencias observadas y esperadas se muestran como las pruebas x2 son equivalentes a las pruebas con el estadístico normal Z, las cuales se han estudiado en unidades anteriores.
El análisis de datos categóricos con propósito de toma de decisiones es de vital importancia en la investigación financiera, médica y de las ciencias sociales. Al efectuar una encuesta, por ejemplo, las preguntas se redactan, a menudo, de manera que se den respuestas categóricas en lugar de numéricas.
Varios estudios resultan en datos que son categóricos o cualitativos antes que cuantitativos y que admiten más de dos resultados posibles








5.1 Prueba Z para la diferencia entre dos proporciones
Cuando se desea probar una hipótesis sobre la diferencia entre 2 proporciones puede emplearse la distribución Z si se tienen tamaños de muestra lo suficientemente grandes

z P1-P2Pc(1-Pc)(1n1+1n2)

z=P1-P2Pc(1-Pc)(1n1+1n2)

P1 = proporción de éxitos en la muestra 1
P2= proporción de éxitos en la muestra 2
n1= número de elementos en la muestra 1
n2= numero de elementos en la muestra 2
Pc= es la combinación de las 2 proporciones dado que la hipótesis nula supone que son iguales.

Pc=X1+X2n1+n2

X1= número de casos de éxitos en la muestra 1
X2= número de casos de éxitos en la muestra 2
P1=X1n1 P2=X2n2









Ejercicios
Se desea probar si existe diferencia entre las proporciones de aficionados al futbol que tienen estudios universitarios. Se encontró que 56 de ellos son aficionados a ese deporte. Otra muestra de 150 personas que no tienen estudios refleja que 90 manifiestan ser aficionados. Compruebe con una significancia del 0.05 si existe diferencia entre las proporciones de aficionados de ambas poblaciones.

Ho= π1=π2
H1= π1 π2
α=0.05
α2=0.025
P-1.960.9335=0.1762
Se acepa Ho, no hay evidencia suficiente para concluir que el nuevo medicamento es más efectivo.


Una comunidad urbana quiere demostrar que la incidencia de cáncer de mama es mayor en ella que en la de una rural vecina si se encuentra que 20 de 200 mujeres adultas en la comunidad urbana tienen cáncer de mama contra 10 de 150 mujeres adultas en la comunidad rural. ¿Se podría concluir con un nivel de significancia del 5% que este tipo de cáncer prevalece más en la comunidad urbana?


Ho= π1=π2
H1= π1>π2
α=1.645
Pc=X1+X2n1+n2=20+10200+150=0.0857
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.1-0.060.0857 (0.9143)(1200+1150)=1.10

1.10>1.645
Se acepa Ho, pues no hay la suficiente evidencia de que este tipo de cáncer prevalece más en la comunidad urbana.



En un proceso de producción se encontraron 35 artículos defectuosos en una muestra aleatoria de 500 y se encontraron que 20 defectuosos en otra muestra de 400 artículos provenientes de otro proceso similar que se lleva a cabo en otra fábrica. Pruebe la hipótesis de que los productos producen la misma proporción de artículos defectuosos, con un nivel de significancia de 1%

Ho= π1=π2
H1= π1 π2
α=2.575
Pc=X1+X2n1+n2=35+20500+400=0.0061
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.07-0.050.0061 (0.939)(1500+1400)=1.2457

Debido a que la z calculada es mayor que -2.575 y menor que 2.575 se acepta la hipótesis nula y se concluye que los dos procesos producen la misma proporción de artículos defectuosos.






Oficina 1
Oficina 2
n1= 250
n2= 300
Declaraciones con errores= 35
Declaraciones con errores= 27
Una empresa que se dedica a elaborar declaraciones de impuestos desea comparar la calidad del trabajo que se realiza en dos de sus oficinas regionales. Con muestras aleatorias de las declaraciones de impuestos elaboradas en dichas oficinas y verificando la exactitud de los reportes, la empresa podrá estimar la proporción de las declaraciones con errores en que incurrió cada una de estas oficinas. Suponga que esta realiza una prueba de hipótesis para determinar si las proporciones de errores en las dos oficinas son diferentes. Para esto se requiere una prueba de dos colas. La hipótesis nula y alternativa son las siguientes:

Ho= π1-π2=0
H1= π1-π2 0
α=10%
Pc=X1+X2n1+n2=35+27250+300=0.1127
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.14-0.090.1127(0.8873)(1250+1300)=1.8463

Se rechaza la Ho para un nivel de significancia del 10%. La empresa concluye que las proporciones de errores de las dos oficinas difieren. La conclusión de esta prueba de hipótesis es consistente con los resultados de la estimación por intervalo calculada antes, los cuales indicaban la diferencia entre las proporciones poblacionales de errores en las dos oficinas estaba entre 0.005 y 0.095, siendo la oficina 1 la que arrojaba una mayor tasa de errores.


Considere la prueba de hipótesis:
¿Cuál es el valor de Pc?
Usando una significancia del 5%, ¿Cuál es la conclusión en esta prueba de hipótesis?

Muestra 1
Muestra 2
n1= 200
n2= 300
P1=0.22
P2=0.16
Ho= π1-π2 0
H1= π1-π2>0
α=0.05
Pc=X1+X2n1+n2=200(0.22)+300(0.16)200+300=0.1840
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.22-0.160.1840(0.816)(1200+1300)=1.70


Valor P= 1.0000-0.9554=0.0446
Se rechaza Ho

En un estudio de la Asociación Estadounidense de Automovilistas (AAA, por sus siglas en inglés) se investigó si era más probable que los conductores de género masculino o femenino se detuvieran para solicitar indicaciones sobre cómo llegar a una dirección. Se preguntaba a los conductores "Si usted y su conyugue van en su automóvil y se pierden, ¿se detiene para preguntar por el domicilio que busca?" En una muestra representativa se encontró que 300 de 811 mujeres dijeron que si se detenían para preguntar, mientras que 255 de 750 hombres dijeron que también lo hacían.
Pruebe la hipótesis usando una significancia del 5%, ¿cuál es la conclusión a la que se esperaría que llegara AAA?

Ho= π1 π2
H1= π1>π2
α=5%=1.645
Pc=X1+X2n1+n2=300+255811+750=0.3555
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.3699-0.340.3555(0.6445)(1811+1750)=1.2330


Debido a que la z calculada, 1.2330 es menor que 1.645 se acepta la hipótesis nula; no se puede concluir que las mujeres sean más propensas a preguntar por un domicilio.



Suponga que es el gerente de T.C Resort Properties, un conjunto de cinco hoteles de gran prestigio localizados en dos islas. En una de las islas T.C Resort tiene dos hoteles, el Beachcomber y Windsurfer. Al tabular las respuestas para la única pregunta ¿Elegiría venir a este hotel nuevamente? , 163 de 227 huéspedes del hotel Beachcomber respondieron SI, y 164 de 262 huéspedes del Windsurfer respondieron sí. Con un nivel de significancia de 0.05, ¿Existe evidencia para una diferencia significativa en la satisfacción de los huéspedes entre los dos hoteles?

Ho= π1=π2
H1= π1 π2
α=5%=1.645
Pc=X1+X2n1+n2=163+164227+262=0.648
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.718+0.5880.648(0.352)(1227+1262)=30.1573

Con un nivel de significancia de 0.05, se rechaza la hipótesis nula puesto que Z=30.1573>1.645 El valor calculado de p es 0.0026. Existe evidencia para concluir que los dos hoteles son significativamente diferentes con respecto a la satisfacción de los huéspedes.


Se ponen a prueba la enseñanza de la Estadística empleando Excel y Winstats. Para determinar si los estudiantes difieren en términos de estar a favor de la nueva enseñanza se toma una muestra de 20 estudiantes de dos paralelos. De paralelo A 18 están a favor, en tanto que del paralelo B están a favor 14. ¿Es posible concluir con un nivel de significación de 0,05 que los estudiantes que están a favor de la nueva enseñanza de la Estadística es la misma en los dos paralelos?

Ho= π1=π2
H1= π1 π2
α=5%=1.645
Pc=X1+X2n1+n2=18+1420+20=0.8
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.9-0.70.8(0.2)(120+120)=1.5811

La hipótesis nula es aceptada, ya que Z=1.5811 está en la zona de aceptación de la región critica 1.96, por lo tanto la proporción de los estudiantes a favor de la nueva enseñanza estadística es la misma en los dos paralelos.


Un estudio de mercadotecnia refleja mediante una muestra aleatoria que 35 de 50 niños de Tijuana y 32 de 50 de Puebla, prefieren videojuegos de una marca específica. Pruebe la hipótesis de que estas proporciones son iguales con un nivel de significancia de 0.025.

Ho= π1=π2
H1= π1 π2
α=0.025=1.96
Pc=X1+X2n1+n2=35+3250+50=0.67
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.7-0.640.67(0.33)(150+150)=0.6380

Debido a que la z calculada, 0.6380 es menor que 1.96 se acepta la hipótesis nula; de que las proporciones son iguales.












Un empresario tomo una muestra aleatoria de 100 empleados del área administrativa y otra de 500 de la operativa. Encontró que 8 y 25, respectivamente, no están cumpliendo con su trabajo. Determine con un nivel de significancia de 1% si la hipótesis de que las proporciones de trabajadores con esta características es la misma en las 2 áreas.


Ho= π1=π2
H1= π1 π2
α=0.10=1.285
Pc=X1+X2n1+n2=8+25100+500=0.055
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.08-0.050.055(0.945)(1100+1500)=1.2012

Debido a que la z calculada, 1.2012 es menor que 1.285 se acepta la hipótesis nula; de que las proporciones de los trabajadores con esta característica es la misma en las 2 áreas.

Una empresa de telecomunicaciones toma una muestra aleatoria de 70 llamadas locales, de las cuales 20 tienen una duración superior a 15 minutos. Otra muestra aleatoria de 50 llamadas internacionales refleja que solo 15 rebasan este tiempo. Tomando en cuenta con un nivel de significancia de 5% pruebe la hipótesis de que la proporción de llamadas que duran más de 15 minutos entre locales e internacionales es la misma.

Ho= π1=π2
H1= π1 π2
α=0.05=1.645
Pc=X1+X2n1+n2=20+1570+50=0.2916
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.2857-0.30.2916(0.7084)(170+150)=0.1699

Debido a que la z calculada0.1699 es menor que 1.645 se rechaza la hipótesis nula; y se concluye que la proporción de llamadas que duran más de 15 minutos entre locales e internacionales es diferente.









Un laboratorio toma una muestra aleatoria de 150 pacientes hombres y 200 pacientes mujeres a quienes se les aplico un tratamiento. Al cabo de 10 días 100 hombres y 180 mujeres muestran mejoría gracias al tratamiento. Con un nivel de significación de 1% determine si la proporción es la misma para hombres y mujeres que tuvieron una buena reacción.

Ho= π1=π2
H1= π1 π2
α=0.01=2.575
Pc=X1+X2n1+n2=100+180150+200=0.8
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.6666-0.90.8(0.20)(1150+1200)=5.4021

Debido a que la z calculada 5.4021 es mayor que 2.575, se acepta la hipótesis nula; y se concluye que la proporción de hombres y mujeres que tuvieron una buena reacción es la misma.

Un banco compara 2 sucursales esperando que la proporción de transacciones que generan comisión alta sea la misma. De una muestra aleatoria de 600 transacciones de la sucursal 1, 270 generan una comisión alta; de otra muestra aleatoria de 720 transacciones de la sucursal 2, 340 cumplen con esta característica. Pruebe con un nivel de significación de 0.05% la hipótesis de que esta proporción es la misma en las 2 sucursales.

Ho= π1=π2
H1= π1 π2
α=0.05=1.645
Pc=X1+X2n1+n2=270+340600+720=0.4621
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.45-0.47220.4621(0.5379)(1600+1720)=0.8055

Debido a que la z calculada 0.8055 es menor r que el valor z de tablas 1.645, se rechaza la hipótesis nula; y se concluye que la proporción de transacciones que generan comisión alta es diferente.








Una estética toma una muestra aleatoria de 100 clientas de las cuales 25 prefieren el gelish. Otra muestra aleatoria de 100 clientas de las cuales 50 prefieren las uñas de acrílico. Con un nivel de significación de 1% determine si la proporción es la misma de las que prefieren gelish a las que prefieren uñas de acrílico.

Ho= π1=π2
H1= π1 π2
α=0.01=2.575
Pc=X1+X2n1+n2=25+50100+100=0.375
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.25-0.50.375(0.625)(1100+1100)=-3.6515


Debido a que la z calculada -3.6515 es menor que el valor z de tablas 2.575, se rechaza la hipótesis nula; y se concluye que la proporción de las que prefieren gelish y uñas acrílicas es diferente.

Un laboratorio toma una muestra aleatoria de 500 pacientes hombres y 450 pacientes mujeres a quienes se les aplico un tratamiento. Al cabo de 25 días 100 hombres y 180 mujeres muestran mejoría gracias al tratamiento. Con un nivel de significación de 5% determine si la proporción es la misma para hombres y mujeres que tuvieron una buena reacción.

Ho= π1=π2
H1= π1 π2
α=0.05=1.645
Pc=X1+X2n1+n2=100+180500+450=0.2947
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.2-0.40.2947(0.7053)(1500+1450)=-6.7512

Debido a que la z calculada -6.7512 es menor que el valor z de tablas 1.645, se rechaza la hipótesis nula; y se concluye que la proporción de hombres y mujeres que tuvieron una buena reacción es diferente.










Un estudio de mercadotecnia refleja mediante una muestra aleatoria que 200 de 500 niños de San Diego y 250 de 550 de Florida, prefieren las hamburguesas de una marca específica. Pruebe la hipótesis de que estas proporciones son iguales con un nivel de significancia de 0.025.

Ho= π1=π2
H1= π1 π2
α=0.025=1.96
Pc=X1+X2n1+n2=200+250500+550=0.4285
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.4-0.450.4285(0.5715)(1500+1550)=-1.6351

Debido a que la z calculada, -1.6351 es menor que 1.96 se acepta la hipótesis nula; de que las proporciones son iguales.


Un ejecutivo de Deloitte tomo una muestra aleatoria de 300 empleados del área administrativa y otra de 500 de la operativa. Encontró que 50 y 45, respectivamente, no están cumpliendo con su trabajo. Determine con un nivel de significancia de 1% si la hipótesis de que las proporciones de trabajadores con esta características es la misma en las 2 áreas.


Ho= π1=π2
H1= π1 π2
α=0.10=1.285
Pc=X1+X2n1+n2=50+45300+500=0.1187
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.16-0.090.1187(0.8813)(1300+1500)=2.9635

Debido a que la z calculada, 2.9635 es mayor que 1.285 se rechaza la hipótesis nula; de que las proporciones de los trabajadores con esta característica es la misma en las 2 áreas y se concluye que son diferentes.










Una firma de abogados toma una muestra aleatoria de 50 empleados del área penal y otra de 60 del área familiar. Encontró que 10 y 20, respectivamente, no están llegando a su trabajo puntualmente. Determine con un nivel de significancia de 10% si la hipótesis de que las proporciones de los abogados con esta característica es la misma en las 2 áreas.


Ho= π1=π2
H1= π1 π2
α=0.10=1.285
Pc=X1+X2n1+n2=10+2050+60=0.2727
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.2-0.330.2727(0.7273)(150+160)=-1.5244

Debido a que la z calculada, -1.5244 es menor que 1.285 se acepta la hipótesis nula; de que las proporciones de los trabajadores con esta característica es la misma en las 2 áreas.

La directora del plantel toma muestra aleatoria de 100 niños de segundo de primaria y otra de 80 de tercero de primaria.Encontró que 45 y 65, respectivamente, no están desayunando correctamente en sus casas. Determine con un nivel de significancia de 1% si la hipótesis de que las proporciones de alumnos con esta características es la misma en los dos grados.


Ho= π1=π2
H1= π1 π2
α=0.10=1.285
Pc=X1+X2n1+n2=45+65100+80=0.6111
z=P1-P2Pc(1-Pc)(1n1+1n2)=0.45-0.810.611(0.389)(1100+180)=-4.9228

Debido a que la z calculada, -4.9228 es menor que 1.285 se acepta la hipótesis nula; de que las proporciones de los alumnos con esta característica es la misma en en los dos grados.





5.2 Prueba para la diferencia entre dos proporciones
Las pruebas de hipótesis a partir de proporciones se realizan casi en la misma forma utilizada cuando nos referimos a las medias, cuando se cumplen las suposiciones necesarias para cada caso. Pueden utilizarse pruebas unilaterales o bilaterales dependiendo de la situación particular.
En caso de que la muestra sea grande n>30, el estadígrafo de prueba es: se distribuye normal estándar.
Regla de decisión: se determina de acuerdo a la hipótesis alternativa (si es bilateral o unilateral. En el caso de muestras pequeñas se utiliza la distribución Binomial. No lo abordaremos por ser complicado y poco frecuente su uso.

En un proceso de producción se encontraron 35 artículos defectuosos en una muestra aleatoria de 500 y se encontraron que 20 defectuosos en otra muestra de 400 artículos provenientes de otro proceso similar que se lleva a cabo en otra fábrica. Pruebe la hipótesis de que los productos producen la misma proporción de artículos defectuosos, con un nivel de significancia de 1%


Ho= π1=π2
H1= π1 π2

Px2 3.84gl=1=0.05
gl=2-12-1=1


×2=f-fe2fe=1.5528
P=×2 3.8411 , gl=1=0.05
P=×2 6.635 , gl=1=0.01





Debido a que el valor calculado de Chi2 igual a 1.5528 es menor que el valor crítico, no puede rechazarse la hipótesis nula. Se concluye que los dos procesos tienen la misma proporción de artículos defectuosos.

Una empresa realiza evaluaciones a sus dos productos más vendidos. Con una muestra aleatoria de 250 artículos del producto A y 200 del B, se obtiene que: 230 y 190 pasan las pruebas de acuerdo con las normas de producción respectivamente. El jefe de operaciones mantiene la hipótesis de que las dos líneas de producción tienen la misma proporción de artículos que cumplen con la norma. Compruébelo con un nivel de significancia de 5%.

X2=f-fe2fe=1.6086

Una compañía tiene dos fundidoras de tamaños similares y dedicados a las mismas operaciones de producción. Se implanta un programa de seguridad experimental en una de ellas. Antes de emplear el programa a la otra los administradores desean comparar la proporción de trabajadores lesionados durante el periodo de prueba en el sitio experimental contra el de la otra planta. Se piensa que el programa es rentable si las proporciones difieren en más de 0.05




H0:π1-π2=0.05
Ha: π1-π2>0.05

Pc=24+5263+250=0.565
PX2 6.635,gl=1=0.01
X2=f-fe2fe=12.2415
12.2415>6.635



La siguiente tabla muestra las frecuencias observadas y las frecuencias esperadas al lanzar un dado 60 veces. Contrastar la hipótesis de que el dado es bueno, con un nivel de significación de 0,01.

H0:Todas las proporciones de la población son iguales
Ha:No todas las proporciones de la población son iguales

gl=2-16-1=5
Xtabla2=15.086
X2=6-10210+8-10210+9-10210+15-10210+14-10210+8-10210
X2=6.6

Se acepta la hipótesis nula, ya que X2=6.6 es menor que X tabla 15.086, por lo tanto se concluye que todas las proporciones de la población son iguales.


Se realiza un estudio sobre el cáncer de piel en ancianos y su relación con el hábito de fumar. Suponemos que hubo 15 casos de cáncer en un total de 35 fumadores y 10 casos de cáncer entre un total de 50 no fumadores.

H0:πfumadores=πno fumadores
Ha: πfumadores πno fumadores



25-10,3 =14.7 no fumadores con cáncer
35-10,3 =24.7 fumadores sin cáncer
60-24,7 =35.3 no fumadores sin cáncer
X2=15-10.3210.3+10-14.7214.7+20-24.7224.7+40-35.3235.3
X2=5.16
gl=2-12-1=1

Como conclusión, podemos afirmar que la diferencia es estadísticamente significativa y tenemos evidencias para rechazar la hipótesis nula ya que le corresponde un valor p 5.99 se rechaza Ho. Si hay diferencias significativas entre el consumo de cigarros por causa del estrés entre hombres y mujeres que trabajan.

El consumo de cigarros por causa del estrés entre hombres y mujeres que trabajan, se debe a factores del azar.
















5.3 Prueba para la diferencia en n proporciones Z

El procedimiento de prueba de hipótesis de la diferencia entre dos proporciones se puede extender a cualquier número de proporciones
Una distribución poblacional representa la distribución de valores de una población y una distribución muestral representa la distribución de los valores de una muestra. En contraste con las distribuciones de mediciones individuales, una distribución muestral es una distribución de probabilidad que se aplica a los valores posibles de una estadística muestral.

Así, la distribución muestral de la media es la distribución de probabilidad de los valores posibles de la media muestral con base en un determinado tamaño de muestra.
Para cualquier tamaño de muestra dado n, tomado de una población con media, los valores de la media muestral varían de una muestra a otra. Esta variabilidad sirve de base para la distribución muestral. La distribución muestral de la media se describe determinando el valor esperado o la media de la distribución y la desviación estándar de la distribución de las medias, como esta desviación estándar indica la precisión de la media muestral como estimador puntual, por lo general se denomina erro estándar de la media.


Ejercicios
En una facultad universitaria se presenta una propuesta para cambiar el plan de estudios y se desea saber si los estudiantes de cada grado tienen la misma opinión sobre la propuesta. Para ello, se toman muestras aleatorias de 100 estudiantes de cada uno de los 4 niveles que se cursan. Los resultados se presentan en la siguiente tabla:

Ho= π1=π2=π3=π4
H1= cuando menos una de las igualdades anteriores no se cumple

gl=4-12-1=3
Px2 11.45;gl=3=0.01
Px2 7.815 ;gl=3=0.05

x2=(fo-fe)2fe=3.9828+0.6618=4.6443
El valor crítico calculado es menor que el valor critico por lo tanto no es posible rechazar la Ho y se concluye que las proporciones de los estudiantes de los diferentes niveles que están a favor al cambio en el plan de estudios son iguales.

Para evaluar si el nivel educativo está relacionado con las preferencias políticas se tomó una muestra de ciudadanos en edad de votar a fin de preguntarles sobre sus preferencias en términos de partidos políticos. Se obtuvieron los siguientes resultados:



Pruebe si estas dos variables son independientes a un nivel de significancia de 0.05
Ho= Las variables son independientes
H1= Las variables son dependientes

gl=5-12-1=4
Px2 9.488;gl=4=0.05

x2=(fo-fe)2fe=6.7081+319.8381=326.5461
El valor crítico calculado, 326.5461, es mayor que el valor crítico, 9.488 por lo tanto se rechaza la hipótesis nula y se concluye que el nivel educativo no está relacionado con las preferencias políticas.

Una agencia de medios desea determinar si existen diferencias en las proporciones de personas que recuerdan un anuncio de servicios financieros publicitados en 3 medios diferentes: Televisión, radio y prensa. Los resultados de un estudio de mercado son los siguientes:
Compruebe la hipótesis de que son iguales las 3 proporciones de personas que recordaron el auncio, con un nivel de significancia de 0.05.

Ho= π1=π2=π3=π4
H1= cuando menos una de las igualdades anteriores no se cumple

gl=2-13-1=2
Px2 5.991;gl=2=0.05

x2=(fo-fe)2fe=10.7606+0.6792+5.3578=16.7975



El valor crítico calculado, 16.7995, es mayor que el valor crítico, 5.991 por lo tanto se rechaza la hipótesis nula y se concluye que no existe diferencia entre las proporciones de personas que recuerdan e anuncio de servicios financieros publicitados en los 3 medios diferentes.



Una universidad desea probar la hipótesis de que son iguales las proporciones de estudiantes de varias licenciaturas que tienen acceso a internet en su casa. Para realizar la prueba se obtienen muestras de estudiantes a quienes se les pregunto si tienen acceso a internet en su vivienda. Los resultados son los siguientes:


Compruebe la hipótesis con un nivel de significancia de 0.025
Ho= π1=π2=π3=π4
H1= cuando menos una de las igualdades anteriores no se cumple

gl=2-13-1=2
Px2 7.378;gl=2=0.025

x2=(fo-fe)2fe=0.9333+0.1875+0.1956=1.3164
El valor crítico calculado, 1.3164, es menor que el valor crítico, 7.378 por lo tanto se acepta la hipótesis nula y se concluye que cuando menos una de las igualdades anteriores no se cumple.

Una empresa distribuidora de artículos de consumo percederos está interesada en saber si la renovación de sus productos en los anaqueles se lleva a cabo con la frecuencia adecuada. Para saberlo, toma muestra de expendios ubicados en 3 de sus regiones de distribución y obtienen los resultados que se muestran en la tabla siguiente:


Utilice un nivel de significancia de 1% para probar la hipótesis de que son iguales las proporciones de los expendios en las 4 regiones donde la renovación de los artículos es adecuada.

Ho= π1=π2=π3=π4
H1= cuando menos una de las igualdades anteriores no se cumple

gl=2-13-1=2
Px2 9.210;gl=2=0.01

x2=(fo-fe)2fe=0.2155+1.3867+0.5141=2.1162

El valor crítico calculado, 2.1162, es menor que el valor crítico, 9.210 por lo tanto se acepta la hipótesis nula y se concluye que cuando menos una de las igualdades anteriores no se cumple.

En un estudio de mercado se preguntó a muestras independientes de 120 hombres, 100 mujeres y 100 niños si les agradaba o no el sabor de la nueva pasta dental en proceso de desarrollo, los resultados se muestran a continuación:


Compruebe la hipótesis de que las proporciones de hombres, mujeres y niños a los que les gusta la pasta dental son iguales, con un nivel de significación de 1%

Ho= π1=π2=π3=π4
H1= cuando menos una de las igualdades anteriores no se cumple

gl=2-13-1=2
Px2 9.210;gl=2=0.01

x2=(fo-fe)2fe=0.9305+0.8666+0.0158=1.8129

El valor crítico calculado, 1.8129, es menor que el valor crítico, 9.210 por lo tanto se acepta la hipótesis nula y se concluye que cuando menos una de las igualdades anteriores no se cumple.

Las matemáticas son una asignatura obligatoria en las 3 licenciaturas que imparten en la Facultad de Administración. Se toma una muestra aleatoria para evaluar si la calificación de los alumnos en el curso básico es independiente de la licenciatura que han elegido Los resultados son los siguientes:


Pruebe si estas dos variables son independientes, con un nivel de significancia de 1%
Ho= La calificación de los alumnos es independiente de la licenciatura que han elegido
H1= La calificacion de los alumnos es dependiente de la licenciatura que han elegido

gl=2-13-1=2
Px2 9.210;gl=2=0.01

x2=(fo-fe)2fe=1.3568+2.0513+0.4615=3.8696
El valor crítico calculado, 3.8696, es menor que el valor crítico, 9.210 por lo tanto se acepta la hipótesis nula y se concluye que la calificación de los alumnos es dependiente de la licenciatura que han elegido.






Se realizó una encuesta para determinar si la edad está relacionada con la opinión de los ciudadanos sobre el tipo de seguridad social para los trabajadores, y se obtuvieron los siguientes resultados:



Pruebe si estas 2 variables son independientes con un nivel de significancia de 0.05

Ho= La edad es independiente de la opinion de los ciudadanos sobre el tipo de seguridad social
H1=La edad es dependiente de la opinion de los ciudadanos sobre el tipo de seguridad social

gl=2-13-1=2
Px2 5.991;gl=2=0.05

x2=(fo-fe)2fe=0.7856+0.4076+0.0056=1.1988
El valor crítico calculado, 1.1988, es menor que el valor crítico, 5.991 por lo tanto se acepta la hipótesis nula y se concluye que la edad es independiente de la opinión de los ciudadanos sobre el tipo de seguridad social.

Con los datos siguientes, pruebe si el estado civil es independiente de la edad con un nivel de significancia de 0.05

Ho= El estado civil es independiente de la edad
H1=El estado civil es dependiente de la edad

gl=2-13-1=2
Px2 5.991;gl=2=0.05

x2=(fo-fe)2fe=16.3798+0.0447+8.9542=25.3778
El valor crítico calculado, 25.3778, es mayor que el valor crítico, 5.991 por lo tanto se rechaza la hipótesis nula y se concluye que el estado civil es dependiente de la edad.













Con los datos siguientes, pruebe si la puntualidad es independiente de las horas que duermen los trabajadores con un nivel de significancia del 5%

Ho= La puntualidad es independiente a las hrs que duermen los trabajadores
H1=La puntuaidad es dependiente a las hrs que duermen los trabajadores

gl=2-13-1=2
Px2 5.991;gl=2=0.05

x2=(fo-fe)2fe=0.0293+3.2059+1.3943=4.6295
El valor crítico calculado, 4.6295, es menor que el valor crítico, 5.991 por lo tanto se acepta la hipótesis nula y se concluye la puntualidad es independiente a las hrs que duermen los trabajadores.

Con los datos siguientes, pruebe si los hábitos alimenticios dependen de la edad, con un nivel de significancia del 10%


Ho= Los habitos alimenticios dependen de la edad
H1=Los habitos alimenticios son independientes a la edad

gl=2-13-1=2
Px2 4.605;gl=2=0.10

x2=(fo-fe)2fe=12.7011+6.4834+5.3705=24.5549
El valor crítico calculado, 24.5549, es mayor que el valor crítico, 4.605 por lo tanto se rechaza la hipótesis nula y se concluye que los hábitos alimenticios son independientes a la edad.

















En un gimnasio se quiere probar que las nuevas inscripciones dependen de las vacaciones de sus socios, pruebe con un nivel de significancia del 0.005

Ho= Las nuevas inscripciones dependen de las vacaciones de sus socios
H1=Las nuevas insripciones son independientes a las vacacines de sus socios

gl=2-13-1=2
Px2 10.597;gl=2=0.005

x2=(fo-fe)2fe=16.2338+13.7671+0.1959=30.1968
El valor crítico calculado, 30.1968, es mayor que el valor crítico, 10.597 por lo tanto se rechaza la hipótesis nula y se concluye que las nuevas inscripciones son independientes a las vacaciones de sus socios.

En un restaurante se quiere probar que las propinas hacia sus meseros dependen del consumo de los clientes, pruebe con un nivel de significancia del 1%


Ho= Las propinas hacia sus meseros dependen del consumo de los clientes
H1=Las propinas hacia sus meseros dependen del consumo de los clientes

gl=2-13-1=2
Px2 9.210;gl=2=0.01

x2=(fo-fe)2fe=7.5089+1.5750+0.7619=9.8458
El valor crítico calculado, 9.8458, es menor que el valor crítico, 9.210 por lo tanto se acepta la hipótesis nula y se concluye las propinas hacia sus meseros dependen del consumo de sus clientes.

Una secundaria quiere probar que los alumnos que reprueban matemáticas es dependiente al uso excesivo de los videojuegos, internet u otros, con un nivel de significancia del 0.005.

Ho= Los alumnos que reprueban matematicas es dependiente al uso excesivo
H1=Los alumnos que reprueban matematicas es independiente al uso excesivo

gl=2-13-1=2
Px210.597;gl=2=0.005
x2=(fo-fe)2fe=2.0631+0.8336+11.9858=14.8825


El valor crítico calculado, 14.8825, es mayor que el valor crítico, 10.597 por lo tanto se rechaza la hipótesis nula y se concluye los alumnos que reprueban matemáticas es independiente al uso excesivo de videojuegos, internet u otros.

Una compañía de teléfonos desea saber si la preferencia de sus dos planes depende de la ciudad donde se contrata, con un nivel de significancia del 0.005.

Ho=La preferencia de sus dos planes depende de la ciudad donde se contrata
H1=La preferencia de sus dos planes depende de la ciudad donde se contrata

gl=2-13-1=2
Px210.597;gl=2=0.005
x2=(fo-fe)2fe=10+2+4=16
El valor crítico calculado, 16, es mayor que el valor crítico, 10.597 por lo tanto se rechaza la hipótesis nula y se concluye que la preferencia de sus dos planes depende de la ciudad donde se contrata

Una marca reconocida de zapatos deportivos desea saber si la preferencia de su producto depende de la edad de sus consumidores, con un nivel de significancia del 0.025

Ho=La preferencia de sus zapatos deportivos depende de la edad de sus consumidores
H1=La preferencia de sus zapatos deportivos depende de la edad de sus consumidores

gl=2-13-1=2
Px27.378;gl=2=0.05
x2=fo-fe2fe=20.7692+22.2236+0.6731=43.6659
El valor crítico calculado, 43.6659, es mayor que el valor crítico, 7.378 por lo tanto se rechaza la hipótesis nula y se concluye que la preferencia de sus zapatos deportivos depende de la edad de sus consumidores.














Una marca de detergente desea saber si la preferencia de sus dos presentaciones es dependiente de su ocupación con un nivel de significancia del 1%

Ho=La preferencia de la presentacion del detergente es dependiente a su ocupacion
H1=La preferencia de la presentacion del detergente es dependiente a su ocupacion

gl=2-13-1=2
Px26.635;gl=2=0.01
x2=fo-fe2fe=22.8023+79.3052+25.1209=127.2284
El valor crítico calculado, 127.2284, es mayor que el valor crítico, 6.635 por lo tanto se rechaza la hipótesis nula y se concluye que la preferencia es independiente de su ocupación.

Una marca de maquillaje desea saber si la preferencia del color de los labiales es dependiente a la estación del año con un nivel de significancia del 10%

Ho=La preferencia del color de los labiales es dependiente a la estacion del año
H1=La preferencia del color de los labiales es independiente a la estacion del año

gl=2-13-1=2
Px24.605;gl=2=0.1
x2=fo-fe2fe=43.1876+2.5521+9.7547=55.4944
El valor crítico calculado, 55.4944, es mayor que el valor crítico, 4.605 por lo tanto se rechaza la hipótesis nula y se concluye que la preferencia del color de los labiales es independiente de la estación del año.

La secretaria de salud desea saber si los litros consumidos de agua son dependientes a la ocupación de la población con un nivel de significancia de 0.005


Ho=Los litros de agua consumidos son dependientes a la ocupacion de la poblacion
H1=Los litros de agua consumidos son dependientes a la ocupacion de la poblacion

gl=2-13-1=2
Px210.597;gl=2=0.005
x2=fo-fe2fe=7.5938+5.0417+22.2315=34.8669
El valor crítico calculado, 34.8669, es mayor que el valor crítico, 10.597 por lo tanto se rechaza la hipótesis nula y se concluye que la preferencia del color de los labiales es independiente de la estación del año.


Una agencia de viajes desea probar la hipótesis de que el desempeño de sus agentes de ventas es dependiente a la experiencia que tienen en el área de ventas, con un nivel de significancia del 5%.


Ho=El desempeño de sus agentes de ventas depende de la experiencia en el area
H1=El desempeño de sus agentes de ventas independe de la experiencia en el area

gl=2-13-1=2
Px25.991;gl=2=0.05
x2=fo-fe2fe=0.0130+1.3807+1.7376=3.1313
El valor crítico calculado, 3.1313, es menor que el valor crítico, 5.991 por lo tanto se acepta la hipótesis nula y se concluye que el desempeño de sus agentes de ventas es independiente a la experiencia en el área.

Un estudio realizado por el ITT desea saber si exsite dependencia del banco que usan los estudiantes de la institución con respecto a la edad de los mismos, con un nivel de significancia del 0.50.

Ho=El banco que usan los estudiantes depende de su edad
H1=El banco que usan los estudiantes es independiente a su edad

gl=2-13-1=2
Px21.386;gl=2=0.50
x2=fo-fe2fe=0.2888+0.3143+0.0059=0.6090
El valor crítico calculado, 0.6090, es menor que el valor crítico, 1.386 por lo tanto se acepta la hipótesis nula y se concluye que el banco que usan los estudiantes del ITT si depende de la edad de los mismos.

Una empresa de cerveza artesanal desea saber si la edad de sus consumidores es dependiente a la bebida que desean tomar, con un nivel de significancia del 0.005

Ho=La edad de sus consumidores es dependiente de la bebida que prefieren tomar
H1=La edad de sus consumidores es independiente de la bebida que prefieren tomar
gl=2-13-1=2
Px210.597;gl=2=0.005
x2=fo-fe2fe=2.5855+6.3516+22.5723=31.5095


El valor crítico calculado, 31.5095, es mayor que el valor crítico, 10.597 por lo tanto se rechaza la hipótesis nula y se concluye que la edad de sus consumidores es dependiente de la bebida que prefieren tomar.

23. El profesor que imparte Ing. Económica desea saber si las calificaciones de su grupo son dependientes a las horas de estudio que ellos dedican antes del examen, con un nivel de significancia del 5%

Ho=Las calificaciones de su grupo son dependientes a las hrs de estudio
H1=Las calificaciones de su grupo son independientes a las hrs de estudio
gl=2-13-1=2
P5.991;gl=2=0.05
x2=fo-fe2fe=0.0275+1.4066+0.9423=2.3764


El valor crítico calculado, 2.3764, es menor que el valor crítico, 5.991 por lo tanto se acepta la hipótesis nula y se concluye que las calificaciones de su grupo son dependientes a las hrs de estudio que ellos dedican antes del examen.


En una encuesta pre electoral realizada a 200 personas se obtuvo la siguiente tabla:

Pruebe la hipótesis de que la intención del voto es independiente a la edad de las personas con un nivel de significancia del 0.05%

Ho=La intencion del voto es independiente a la edad de las personas
H1=La intencion del voto es dependiente a la edad de las personas
gl=2-13-1=2
P5.991;gl=2=0.05
x2=fo-fe2fe=15.1629+2.0995+6.0652=23.3275


El valor crítico calculado, 23.3275, es mayor que el valor crítico, 5.991 por lo tanto se rechaza la hipótesis nula y se concluye que la intención del voto es dependiente a la edad de las personas.










El gerente de un centro comercial quería saber si hay diferencias en la proporción de mujeres compradoras a diversas horas durante diversos días de la semana. Se seleccionaron muestras aleatorias de 300 clientes en el día, 300 en la noche y 400 compradores en los fines de semana; obteniéndose los siguientes resultados:

Pruebe la hipótesis con un nivel de significancia del 0.005
Ho= No existe diferencia en las proporciones
H1= Existe diferencia en las proporciones
gl=2-13-1=2
P10.597;gl=2=0.005
x2=fo-fe2fe=12.50+0.3472+6.5104=19.3576

El valor crítico calculado, 19.3576, es menor que el valor crítico, 10.597 por lo tanto se acepta la hipótesis nula y se concluye si hay diferencia en la proporción de mujeres compradoras a diversas hrs durante diversos días de la semana.

Una tienda de souvenirs desea saber si la proporción de sus ventas es dependiente al mes del año, con un nivel de significancia del 0.05%

Ho= La proporción de sus ventas es dependiente al mes del año
H1= La proporción de sus ventas es independiente al mes del año
gl=2-13-1=2
P5.991;gl=2=0.05
x2=fo-fe2fe=39.0950+3.1060+26.2629=19.3576

El valor crítico calculado, 19.3576, es mayor que el valor crítico, 5.991 por lo tanto se rechaza la hipótesis nula y se concluye que la proporción de sus ventas es independiente al mes del año.

Una universidad desea saber si el número de alumnos que sufren algún tipo de accidente es dependiente al semestre que están cursando. Pruebe con un nivel de significancia del 5%

Ho= El número de alumnos que sufren algún tipo de accidente es dependiente al semestre que cursan
H1= El número de alumnos que sufren algún tipo de accidente es independiente al semestre que cursan
gl=2-13-1=2
P5.991;gl=2=0.05
x2=fo-fe2fe=10.6734+3.0415+1.3824=15.0973



El valor crítico calculado, 15.0973, es menor que el valor crítico, 5.991 por lo tanto se acepta la hipótesis nula y se concluye el número de alumnos que sufren algún tipo de accidente es dependiente al semestre que cursan.

La cervecería Moctezuma desea saber si la proporción de sus consumidores es dependiente a la carrera que estudian, con un nivel de significancia del 5%

Ho= La proporción de sus consumidores es dependiente a la carrera que estudian
H1= La proporción de sus consumidores es independiente a la carrera que estudian
gl=2-13-1=2
P5.991;gl=2=0.05
x2=fo-fe2fe=1.6667+0.3846+4.50=6.5513

El valor crítico calculado, 6.5513, es menor que el valor crítico, 5.991 por lo tanto se acepta la hipótesis nula y se concluye; La proporción de sus consumidores es dependiente a la carrera que estudian.

Una papelería escolar desea saber si la proporción de las calculadoras que vende depende de la carrera que estudian sus clientes. Compruebe la hipótesis con un nivel de significancia del 5%


Ho= La proporción de las calculadoras que vende depende de la carrera que estudian sus clientes
H1= La proporción de las calculadoras que vende es independiente de la carrera que estudian sus clientes
gl=2-13-1=2
P5.991;gl=2=0.05
x2=fo-fe2fe=4.1220+4.5844+4.8139=13.5003

El valor crítico calculado, 13.5003, es menor que el valor crítico, 5.991 por lo tanto se rechaza la hipótesis nula y se concluye; la proporción de las calculadoras que vende es independiente de la carrera que estudian sus clientes.














Una papelería escolar desea saber si la marca de plumas que vende depende de la edad de sus clientes. Compruebe la hipótesis con un nivel de significancia del 5%


Ho= La proporción de la marca de plumas depende de la edad de sus clientes
H1= La proporción de la marca de plumas depende de la edad de sus clientes
gl=2-13-1=2
P5.991;gl=2=0.05
x2=fo-fe2fe=3.7220+9.6240+6.5691=19.9151

El valor crítico calculado, 19.9151, es menor que el valor crítico, 5.991 por lo tanto se acepta la hipótesis nula y se concluye; que la proporción de la marca de plumas depende de la edad de sus clientes.


























5.4 Prueba de independencia (ji-cuadrada)
Es importante distinguir una característica sobre estos casos; se trata de una muestra se trata de una muestra de elementos clasificados de acuerdo con 2 variables y 2 criterios. Por ejemplo, saber si la orientación política es independiente del nivel educativo; si la calidad de cierto artículo es independiente del turno en el que se fabrica (matutino, vespertino, mixto); si el nivel de ingresos es independiente de la puntualidad o morosidad en los pagos de créditos.

No debe ignorase que estas pruebas de independencia se realizan con datos agrupados en tablas de contingencias, como las que se utilizaron para las pruebas sobre proporciones sin embargo en estas solo había dos renglones. En tanto que para las pruebas de independencia el número de categorías suele ser de más de 2 para ambas variables de clasificación.

El procedimiento de x2 para la bondad de ajuste también se puede usar para probar la hipótesis de independencia de dos variables de clasificación.

Ejercicios
Una empresa de investigación de mercados desea saber si la marca de ciertos automóviles depende de la zona en la que habitan sus propietarios. Para investigarlo, toma una muestra aleatoria de 600 propietarios con sus autos e identifica que marca poseen y en qué zona de la ciudad habitan. En la siguiente tabla se muestran los resultados. La empresa decide realizar la prueba con un nivel de significación del 0.01



Ho=La marca de auto que possen los propietarios es independiente de la zona de la ciudad que habitan
H1= La marca de auto que poseen los propietarios si depende de la zona de la ciudad en la que habitan
α=0.01
gl=4
x2=13.277
Px2 13.277gl=4=0.01
3.0172+2.6160+10.5776=16.2107

La suma de los cuadrados de las diferencias entre las frecuencias observadas y esperadas, divididas entre las esperadas da un total de 16.2107 que es el valor calculado del estadístico de prueba x2. Este valor calculado es mayor que el valor crítico, 13.277, así que se rechaza la hipótesis nula, y se concluye que, efectivamente, la marca de auto que poseen los propietarios de automóviles de esas ciudad si depende de la zona en que habitan.




Se desea probar si el tipo de defecto observado en las unidades producidas en una planta manufacturera es independiente del turno en el que se fabrican. Se toma una muestra de productos de los diferentes turnos y se obtienen los siguientes resultados que se muestran en la tabla:
Pruebe la hipótesis con un nivel de significancia del 0.01


Ho=El tipo de defecto observado en las unidades es independiente del turno en que se fabrican
H1= El tipo de defecto observado en las unidades si depende del turno en que se fabrican
α=0.01
gl=4-13-1=6
x2=16.812
Px2 13.277gl=4=0.01
3.0172+2.6160+10.5776=16.2107

La suma de los cuadrados de las diferencias entre las frecuencias observadas y esperadas, divididas entre las esperadas da un total de 12.6069 que es el valor calculado del estadístico de prueba x2. Este valor calculado es menor que el valor crítico, 16.2107, así que se acepta la hipótesis nula, y se concluye que, efectivamente, el tipo de defecto observado en las unidades producidas en una planta manufacturera es independiente del turno en el que se fabrican.

Para saber si la calidad de la educación primaria depende de la ubicación de la escuela, se tomó una muestra de escuelas que arrojo los siguientes resultados:
Pruebe la hipótesis de independencia con un nivel de significancia de 0.05



Ho=La calidad de la educacion primaria es independiente de la ubicacion de la escuela
H1= La calidad de la educacion primaria si depende de la ubicacion de la escuela
α=0.05
gl=3-14-1=6
x2=12.592
Px2
Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.