Técnicas de Análisis

June 1, 2017 | Autor: C. Galván Tavera | Categoria: Análisis Factorial, Correlación De Spearman, Análisis De Conglomerados, Regresión Lineal
Share Embed


Descrição do Produto

Facultad de Administración.

Sistemas de Información de Mercados Módulo 2. Técnicas Avanzadas De Análisis De La Información Mtro. Carlos Alberto Galván Tavera

Página 1

1.- Análisis De Correlación. Facultad de Administración.

Introducción. En todos los campos de negocios, identificar y estudiar las relaciones entre variables puede proporcionar información sobre las formas de elevar las ganancias, métodos para reducir costos o variables para predecir la demanda. Ejemplos de relaciones entre dos variables.  Cantidad que gasta una empresa por mes en publicidad contra sus ventas mensuales.  En eficiencia de combustible, relación entre millas por galón contra el peso del auto.  Número de horas de estudio de los alumnos contra la calificación obtenida. En este módulo desarrollaremos medidas numéricas para expresar la relación entre dos variables. Para comenzar con el estudio de las relaciones entre variables, veremos el significado de un análisis de correlación. Desarrollaremos una ecuación matemática que permite estimar el valor de una variable con base en el valor de otra variable, procedimiento que se conoce como análisis de regresión. Página 2 Mtro. Carlos Alberto Galván Tavera

1.- Análisis De Correlación. Facultad de Administración.

Análisis de correlación. Grupo de técnicas para medir la asociación entre dos variables. Para este estudio los pasos son:  Es usual comenzar con un diagrama de dispersión, el cual proporciona una representación visual de la relación entre las variables.  Se calcula el coeficiente de correlación, que brinda una medida cuantitativa de la fuerza de la relación entre dos variables.

Ejemplo. Suponga que el gerente de ventas de Copier Sales, desea determinar si hay alguna relación entre el número de llamadas de ventas en un mes y el número de copiadoras que se vendieron en el mes. El gerente selecciona una muestra aleatoria de 10 vendedores y determina el número de llamadas de ventas que cada uno hizo el mes pasado y el número de copiadoras que vendió.

Mtro. Carlos Alberto Galván Tavera

Página 3

1.- Análisis De Correlación. Facultad de Administración.

Al revisar la tabla parece haber una relación entre el número de llamadas y las ventas. Es decir, los vendedores que más llamaron más vendieron.

Tabla 3.1 Número de llamadas de ventas y copiadoras vendidas por cada empleado.

Sin embargo la relación no es perfecta, ya que Soni Jones hizo menos llamadas que Jeff Hall, pero vendió más unidades. A continuación veremos el diagrama de dispersión el cual se obtuvo de la tabla 3.1.

Mtro. Carlos Alberto Galván Tavera

Página 4

1.- Análisis De Correlación. Facultad de Administración.

Gráfica 3.1 Diagrama de dispersión que representa las llamadas y las copiadoras vendidas.

Conforme aumenta el número de llamadas de venta, parece que el número de copiadoras vendidas también lo hace. De este modo, el número de llamadas de ventas se considera variable independiente, y el de copiadoras vendidas, variable dependiente. La variable dependiente es la que se desea predecir o estimar. Es práctica común situar la variable dependiente (copiadoras vendidas) en el eje vertical o Y, y la variable independiente (número de llamadas de ventas) en el eje horizontal o X. Página 5 Mtro. Carlos Alberto Galván Tavera

1.- Análisis De Correlación. Facultad de Administración.

El diagrama de dispersión muestra en forma gráfica que los vendedores que hacen más llamadas tienden a vender más copiadoras.

Observe que, aunque parece haber una relación positiva entre las dos variables, no todos los puntos se encuentran en una recta. A continuación mediremos la fuerza y la dirección de esta relación entre dos variables, para determinar el coeficiente de relación.

Mtro. Carlos Alberto Galván Tavera

Página 6

1.- Análisis De Correlación. Facultad de Administración.

Coeficiente de correlación. Describe la fuerza de la relación entre dos conjuntos de variables en escala de intervalo o razón. Se designa con la letra r, y con frecuencia se le conoce como r de Pearson y coeficiente de correlación producto-momento. Puede adoptar cualquier valor -1.00 a +1.00, inclusive. Un coeficiente de correlación de -1.00 o bien de +1.00 indica una correlación perfecta.

Gráfica 3.2 Diagramas de dispersión con correlación negativa perfecta y correlación positiva perfecta.

Mtro. Carlos Alberto Galván Tavera

Página 7

1.- Análisis De Correlación. Facultad de Administración.

Coeficiente de correlación. Si no hay ninguna relación entre los dos conjuntos de variables, la r de Pearson es cero. Un coeficiente de correlación cercano a 0 (sea 0.08) indica que la relación lineal es muy débil. Se llega a la misma conclusión si r = -0.08. Los coeficientes de -0.91 y +0.91 tienen una fuerza igual, los dos indican una correlación muy fuerte entre las dos variables. Por lo tanto, la fuerza de la correlación no depende de la dirección (ya sea – o bien +).

Mtro. Carlos Alberto Galván Tavera

Página 8

1.- Análisis De Correlación. Facultad de Administración.

Coeficiente de correlación. En la siguiente gráfica se muestran los diagramas de dispersión cuando r = 0, una r débil (sea -0.23), y una r fuerte (sea +0.87).

Mtro. Carlos Alberto Galván Tavera

Página 9

1.- Análisis De Correlación. Facultad de Administración.

Coeficiente de correlación.

Gráfica 3.3 Diagramas de dispersión que representan una correlación cero, débil y fuerte.

Mtro. Carlos Alberto Galván Tavera

Página 10

1.- Análisis De Correlación. Facultad de Administración.

Coeficiente de correlación. Para determinar el coeficiente de correlación, usaremos los datos de Copier Sales.

Mtro. Carlos Alberto Galván Tavera

Página 11

1.- Análisis De Correlación. Facultad de Administración.

Coeficiente de correlación. Usamos el diagrama de dispersión sobre el cual trazamos una recta vertical con los valores de datos en la media de los valores X y una recta horizontal en la media de los valores Y.

En la gráfica se agregó una recta en 22.0 llamadas y una recta horizontal en 45 copiadoras. Estas rectas pasar por el “centro” de los datos y dividen el diagrama de dispersión en cuatro cuadrantes.

Considere mover el origen de (0,0) a (22,45).

Mtro. Carlos Alberto Galván Tavera

Página 12

1.- Análisis De Correlación. Facultad de Administración.

Coeficiente de correlación. Dos variables tienen una relación positiva cuando el número de copiadoras vendidas está por arriba de la media y el número de llamadas de ventas también se encuentra arriba de la media. Estos puntos aparecen en el cuadrante superior derecho (cuadrante I). De manera similar, cuando el número de copiadoras vendidas es menor que la media también lo es el número de llamadas de ventas. Estos puntos se encuentran en el cuadrante inferior izquierdo de la gráfica (cuadrante III).

Mtro. Carlos Alberto Galván Tavera

Página 13

1.- Análisis De Correlación. Facultad de Administración.

Coeficiente de correlación. La fórmula para obtener el coeficiente de correlación es:

𝑟=

𝑋−𝑋 𝑌−𝑌 𝑛 − 1 𝑠𝑥 𝑠𝑦

Para lo cual se desarrolla la siguiente tabla: Vendedor Llamadas X Ventas Y Tom Keller 20 30 Jeff Hall 40 60 Brian Virost 20 40 Greg Fish 30 60 Susan Welch 10 30 Carlos Ramírez 10 40 Rich Niles 20 40 Mike Kiel 20 50 Mark Reynolds 20 30 Soni Jones 30 70 Total 220 450

𝑿

𝒀

𝑿−𝑿

𝒀−𝒀

𝑿−𝑿 𝒀−𝒀

𝑿−𝑿

22 22 22 22 22 22 22 22 22 22

45 45 45 45 45 45 45 45 45 45

-2 18 -2 8 -12 -12 -2 -2 -2 8

-15 15 -5 15 -15 -5 -5 5 -15 25

30 270 10 120 180 60 10 -10 30 200 900

4 324 4 64 144 144 4 4 4 64 760

Mtro. Carlos Alberto Galván Tavera

𝟐

𝒀−𝒀

225 225 25 225 225 25 25 25 225 625 1850 Página 14

𝟐

1.- Análisis De Correlación. Facultad de Administración.

Coeficiente de correlación. Obtenemos las desviaciones estándar para cada variable. 2

𝑠𝑋 =

𝑋−𝑋 𝑛−1

2

𝑠𝑌 =

𝑌−𝑌 𝑛−1

=

760 = 𝟗. 𝟏𝟖𝟗 9

=

1850 = 𝟏𝟒. 𝟑𝟑𝟕 9

Ahora sustituimos los valores en la ecuación para obtener r.

𝑟=

𝑋−𝑋 𝑌−𝑌 900 = = 𝟎. 𝟕𝟓𝟗 𝑛 − 1 𝑠𝑥 𝑠𝑦 9 9.189 14.337

Mtro. Carlos Alberto Galván Tavera

Página 15

1.- Análisis De Correlación. Facultad de Administración.

¿Cómo se interpreta una correlación de 0.759?  Es positiva, por lo que se observa una relación directa entre el número de llamadas y el número de ventas.  El valor está muy cercano a 1.00, por lo cual se concluye que la asociación es fuerte. Debe tener mucho cuidado con la interpretación. La correlación de 0.759 indica una asociación positiva fuerte entre las variables. La gerente acierta al motivar a su personal de ventas para hacer llamadas adicionales, debido a que el número de llamadas se relaciona con el número de copiadoras que vende. Sin embargo, ¿más llamadas de ventas ocasionan más ventas? No, aquí no se ha demostrado la causa y efecto.

Mtro. Carlos Alberto Galván Tavera

Página 16

Tarea 3. Facultad de Administración.

Coeficiente de correlación.

Archivo: Tarea 03 Coeficiente correlacion.

Mtro. Carlos Alberto Galván Tavera

Página 17

2.- Análisis De Regresión. Facultad de Administración.

Análisis de regresión. En esta sección se elabora una ecuación para expresar la relación lineal entre dos variables. Además se desea estimar el valor de la variable dependiente Y con base en un valor seleccionado de la variable independiente X. La técnica para desarrollar la ecuación y proporcionar las estimaciones se denomina análisis de regresión. Del ejemplo de Copier Sales, recuerde que probamos la significancia del coeficiente de correlación (r = 0.759) y concluimos que existe una relación significativa entre ambas variables.

Ahora se busca desarrollar una ecuación lineal que exprese la relación entre el número de llamadas de ventas, la variable independiente, y el número de unidades vendidas, la variable dependiente. A la ecuación de la recta para estimar Y con base en X se le denomina ecuación de regresión. Mtro. Carlos Alberto Galván Tavera

Página 18

2.- Análisis De Regresión. Facultad de Administración.

Ecuación de regresión. Ecuación que expresa la relación lineal entre dos variables. Principio de mínimos cuadrados. En el análisis de regresión, el objetivo es utilizar los datos para trazar una línea que represente mejor la relación entre las dos variables. Nuestro primer enfoque es utilizar un diagrama de dispersión para visualizar la posición de la línea. En la gráfica se reproduce el diagrama de dispersión, con una recta que une los puntos para ilustrar que una recta probablemente ajustaría los datos. Sin embargo la recta trazada tiene una desventaja: en parte, su posición se basa en el criterio de la persona que traza la recta. Mtro. Carlos Alberto Galván Tavera

Página 19

2.- Análisis De Regresión. Facultad de Administración.

Para evitar lo anterior, es preferible utilizar un método que resulte en una sola y mejor línea de regresión. Este método, se denomina principio de los mínimos cuadrados, proporciona lo que comúnmente se conoce como recta del “mejor ajuste”. Principio De Los Mínimos Cuadrados: Determina una ecuación de regresión al minimizar la suma de los cuadrados de las distancias verticales entre los valores reales de Y y los valores pronosticados de Y.

Mtro. Carlos Alberto Galván Tavera

Página 20

2.- Análisis De Regresión. Facultad de Administración.

Trazo de la recta de regresión. La ecuación de mínimos cuadrados 𝑌 = 18.9476 + 1.1842𝑋, se traza en el diagrama de dispersión.

El primer vendedor es Tom Keller, hizo 20 llamadas. Su número estimado de ventas es: 𝑌 = 18.9476 + 1.1842 20 = 42.6316

Mtro. Carlos Alberto Galván Tavera

Página 21

2.- Análisis De Regresión. Facultad de Administración.

La recta de regresión por mínimos cuadrados tiene algunas características interesantes y particulares. Primero siempre pasa por el punto 𝑋, 𝑌 . Para demostrar lo anterior recordamos que 𝑋 = 22 y 𝑌 = 45. Para probar que pasa por el punto 𝑋, 𝑌 , sustituimos el valor de X por 22 y mediante la ecuación de mínimos cuadrados calculamos 𝑌.

𝑌 = 18.9476 + 1.1842 22 = 45 Segundo, no hay otra recta que pase por los datos donde la suma de las 2

desviaciones al cuadrado es menor. En otras palabras el término 𝑌 − 𝑌 es menor cuando se aplica la ecuación de regresión por mínimos cuadrados. Para demostrar lo anterior usaremos Excel.

Mtro. Carlos Alberto Galván Tavera

Página 22

2.- Análisis De Regresión. Facultad de Administración.

Columna E. Se calcularon los residuales, o los valores de error. Es la diferencia entre los valores reales y los pronosticados. Columna F. Se elevan al cuadrado los residuales y se suman. El total es 784.2105. Esta es la suma de las diferencias al cuadrado o valor de los mínimos cuadrados. No hay otra recta que pase por estos 10 puntos de datos donde la suma de las diferencias al cuadrado sea menor. Página 23 Mtro. Carlos Alberto Galván Tavera

2.- Análisis De Regresión. Facultad de Administración.

Columna G. Se utilizó la ecuación Y* = 19 + 1.2X para determinar el valor pronosticado. Ecuación similar a la de mínimos cuadrados. Columna H. Se elevan al cuadrado los residuales y se suman, dando 786 como resultado, el cual es mayor que 784.2105. Mtro. Carlos Alberto Galván Tavera

Página 24

2.- Análisis De Regresión. Facultad de Administración.

Columna I. Se utilizó la ecuación Y** = 20 + X para determinar el valor pronosticado. Ecuación similar a la de mínimos cuadrados. Columna J. Se elevan al cuadrado los residuales y se suman, dando 900 como resultado, el cual también es mayor que 784.2105. 2 Con lo anterior se demuestra que la suma de los residuales al cuadrado 𝑌 − 𝑌 de la ecuación de mínimos cuadrados es menor que las demás. Página 25 Mtro. Carlos Alberto Galván Tavera

2.- Análisis De Regresión. Facultad de Administración.

𝑭𝒐𝒓𝒎𝒂 𝑮𝒆𝒏𝒆𝒓𝒂𝒍 𝒅𝒆 𝒍𝒂 𝒆𝒄𝒖𝒂𝒄𝒊ó𝒏 𝒅𝒆 𝒓𝒆𝒈𝒓𝒆𝒔𝒊ó𝒏 𝒍𝒊𝒏𝒆𝒂𝒍

𝒀 = 𝒂 + 𝒃𝑿

Donde: 𝑌 es el valor de la estimación de la variable Y para un valor X seleccionado. a: es la intersección de Y, cruza el eje X por lo cual X es cero. b: es la pendiente de la recta. X: Cualquier valor de la variable independiente que se seleccione.

𝑷𝒆𝒏𝒅𝒊𝒆𝒏𝒕𝒆 𝒅𝒆 𝒍𝒂 𝒓𝒆𝒄𝒕𝒂 𝒅𝒆 𝒓𝒆𝒈𝒓𝒆𝒔𝒊ó𝒏

𝒔𝒚 𝒃=𝒓 𝒔𝒙

Donde: r es el coeficiente de correlación Sy es la desviación estándar de Y. Sx es la desviación estándar de X.

Mtro. Carlos Alberto Galván Tavera

Página 26

2.- Análisis De Regresión. Facultad de Administración.

𝑰𝒏𝒕𝒆𝒓𝒔𝒆𝒄𝒄𝒊ó𝒏 𝒄𝒐𝒏 𝒆𝒍 𝒆𝒋𝒆 𝒀

𝒂 = 𝒀 − 𝒃𝑿

Donde: 𝑌 es la media de Y y 𝑋 es la media de X.

Ejemplo. Volviendo a la empresa de Copier Sales, nos piden determinar la ecuación lineal que exprese la relación entre ambas variables. Además desea saber el número esperado de copiadoras vendidas de un vendedor que hizo 20 llamadas. Calculamos b.

Con r = 0.759, sx=9.189, sy= 14.337. 𝒃=𝒓

Calculamos a.

𝒔𝒚 = 𝟎. 𝟕𝟓𝟗 𝒔𝒙

𝟏𝟒. 𝟑𝟑𝟕 = 𝟏. 𝟏𝟖𝟒𝟐 𝟗. 𝟏𝟖𝟗

Con 𝑋 = 22 𝑦 𝑌 = 45 𝒂 = 𝒀 − 𝒃𝑿 = 𝟒𝟓 − 𝟏. 𝟏𝟖𝟒𝟐 𝟐𝟐 = 𝟏𝟖. 𝟗𝟒𝟕𝟔

Mtro. Carlos Alberto Galván Tavera

Página 27

2.- Análisis De Regresión. Facultad de Administración.

Calculamos la ecuación de regresión. 𝒀 = 𝒂 + 𝒃𝑿

𝒀 = 𝟏𝟖. 𝟗𝟒𝟕𝟔 + 𝟏. 𝟏𝟖𝟒𝟐𝑿

Si deseamos conocer cuantas ventas haría un vendedor al realizar 20 llamadas, sustituimos X por 20 en la ecuación anterior, obteniendo: 𝑌 = 18.9476 + 1.1842𝑋 = 18.9476 + 1.1842 20 = 𝟒𝟐. 𝟔𝟑𝟏𝟔 𝒄𝒐𝒑𝒊𝒂𝒅𝒐𝒓𝒂𝒔

Mtro. Carlos Alberto Galván Tavera

Página 28

Tarea 4. Facultad de Administración.

Análisis de regresión.

Archivos: Tarea 04 Análisis regresión. Utilizando el software estadístico SPSS se resolverán las siguientes tareas. Tarea 04.1 Correlación y regresión múltiple. Tarea 04.2 Correlación y regresión múltiple Nike. Tarea 04.3 Correlación y regresión múltiple Nike. Tarea 04.4 Correlación y regresión múltiple Nike 2.

Mtro. Carlos Alberto Galván Tavera

Página 29

3.- Análisis De Conglomerados. Facultad de Administración.

Definición. Es una técnica usada para clasificar objetos o casos en grupos relativamente homogéneos llamados conglomerados. Los objetos de cada conglomerado tienden a ser similares entre sí y diferentes de los objetos de otros conglomerados. Estudiaremos los procedimientos de conglomeración que asignan cada objeto a uno y sólo un conglomerado.

Mtro. Carlos Alberto Galván Tavera

Página 30

3.- Análisis De Conglomerados. Facultad de Administración.

La siguiente figura muestra una situación ideal de conglomeración, en la cual los conglomerados se separan de forma clara en dos variables: conciencia de calidad (variable 1) y sensibilidad a los precios (variable 2). Advierta que no existen áreas de traslape.

Mtro. Carlos Alberto Galván Tavera

Página 31

3.- Análisis De Conglomerados. Facultad de Administración.

Por otro lado, la siguiente figura presenta una situación de conglomeración que es más probable encontrar en la práctica. En esta figura los límites de algunos conglomerados no están bien definidos y la clasificación de algunos consumidores no es tan evidente, ya que muchos de ellos pueden agruparse en un conglomerado u otro.

Mtro. Carlos Alberto Galván Tavera

Página 32

3.- Análisis De Conglomerados. Facultad de Administración.

El análisis de conglomerados se ha usado en marketing con diversos propósitos, entre los que se encuentran:  Segmentación del mercado: por ejemplo, puede agruparse a los consumidores según los beneficios que buscan en la compra de un producto.

 Entender la conducta de los compradores: el análisis de conglomerados puede usarse para identificar grupos homogéneos de compradores.  Identificar oportunidades de nuevos productos: al agrupar marcas y productos, es posible determinar conjuntos competitivos dentro del mercado. Las marcas del mismo conglomerado compiten mucho más entre sí que con las marcas de otros conglomerados.  Elegir mercados de prueba: al agrupar ciudades en conglomerados homogéneos, es posible elegir ciudades comparables para probar diversas estrategias de marketing.

Mtro. Carlos Alberto Galván Tavera

Página 33

3.- Análisis De Conglomerados. Facultad de Administración.

Estadísticos asociados con el análisis de conglomerados. Los siguientes estadísticos y conceptos se asocian con el análisis de conglomerados.  Calendario de aglomeración: este programa brinda información sobre objetos o casos que se combinan en cada etapa del proceso de conglomeración jerárquica.  Centroide del conglomerado: es la media de los valores de las variables de todos los objetos o casos de un conglomerado particular.

 Centros del conglomerado: son el punto de partida en la conglomeración no jerárquica. Los conglomerados se construyen en torno a estos centros o semillas.  Pertenencia al conglomerado: indica el conglomerado al que corresponde cada objeto o caso.

Mtro. Carlos Alberto Galván Tavera

Página 34

3.- Análisis De Conglomerados. Facultad de Administración.

Estadísticos asociados con el análisis de conglomerados. Los siguientes estadísticos y conceptos se asocian con el análisis de conglomerados.  Dendrograma: conocido como gráfica de árbol, es un medio gráfico para presentar los resultados de la conglomeración. Las líneas verticales representan conglomerados que están unidos. La posición de la línea en la escala indica las distancias en las que se unen los conglomerados. El dendrograma se lee de izquierda a derecha. La figura 20.8 es un ejemplo de dendrograma.

 Distancias entre los centros de los conglomerados: estas distancias indican qué tan separados están los pares individuales de conglomerados. Los que están muy separados son distintos y, por lo tanto, son deseables.

Mtro. Carlos Alberto Galván Tavera

Página 35

3.- Análisis De Conglomerados. Facultad de Administración.

Estadísticos asociados con el análisis de conglomerados. Los siguientes estadísticos y conceptos se asocian con el análisis de conglomerados.  Diagrama de carámbanos: es una representación gráfica de los resultados de la conglomeración, recibe ese nombre porque parece una fi la de carámbanos que cuelgan del tejado de una casa. Las columnas corresponden a los objetos que se conglomeran; y las filas, al número de conglomerados. Un diagrama de carámbanos se lee de abajo hacia arriba.  Matriz de coeficientes de semejanza y distancia: es una matriz de triángulo inferior que contiene distancias entre pares de objetos o casos.

Mtro. Carlos Alberto Galván Tavera

Página 36

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Los pasos para realizar un conglomerado son los siguientes. 1. 2. 3. 4. 5. 6.

Plantear el problema. Elegir una medida de distancia. Elegir un procedimiento de conglomeración. Decidir el número de conglomerados. Interpretar y describir los conglomerados. Evaluar la validez de la conglomeración.

Mtro. Carlos Alberto Galván Tavera

Página 37

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. 1.

El primer paso es el planteamiento del problema de agrupamiento definiendo las variables en las que se basará la conglomeración.

2.

En seguida debe elegirse una medida adecuada de distancia. Esta distancia determina qué tan parecidos o diferentes son los objetos agrupados.

3.

Se han desarrollado muchos procedimientos de conglomeración y el investigador debe elegir el que sea apropiado para el problema tratado.

4.

La decisión sobre el número de conglomerados requiere del juicio del investigador.

5.

Los conglomerados derivados deben interpretarse en términos de las variables usadas para generarlos y describirse en términos de otras variables destacadas.

6.

Por último, el investigador debe evaluar la validez del proceso de conglomeración. Mtro. Carlos Alberto Galván Tavera

Página 38

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. 1.- Planteamiento del problema. Quizá la parte más importante del planteamiento del problema de conglomeración sea la elección de las variables en que se basará el agrupamiento. Aun la inclusión de una o dos variables irrelevantes distorsionaría una solución de agrupamiento, que de otra manera podría ser útil. En esencia, el conjunto de las variables elegidas debe describir la semejanza entre los objetos en términos relevantes para el problema de investigación de mercados. Para ilustrar, consideramos el agrupamiento de los consumidores con base en sus actitudes hacia ir de compras. A partir de la investigación previa, se identificaron seis variables de actitud.

Mtro. Carlos Alberto Galván Tavera

Página 39

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. 1.- Planteamiento del problema. Variables de actitud. V1: ir de compras es divertido. V2: ir de compras es malo para el presupuesto. V3: cuando voy de compras aprovecho para comer fuera. V4: cuando voy de compras busco las mejores ofertas. V5: no me interesa ir de compras. V6: puede ahorrar mucho dinero si se compara precios.

Mtro. Carlos Alberto Galván Tavera

Página 40

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de conglomerados.

un

análisis

de

1.- Planteamiento del problema. En la siguiente tabla se presentan los datos obtenidos de un pretest aplicado a una muestra de 20 encuestados. Observe que en realidad, los conglomerados se forman con muestras mucho mayores de 100 o más. Se utilizó una muestra chica para ilustrar el proceso de conglomeración.

Caso No.

V1

V2

V3

V4

V5

V6

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

6 2 7 4 1 6 5 7 2 3 1 5 2 4 6 3 4 3 4 2

4 3 2 6 3 4 3 3 4 5 3 4 2 6 5 5 4 7 6 3

7 1 6 4 2 6 6 7 3 3 2 5 1 4 4 4 7 2 3 2

3 4 4 5 2 3 3 4 3 6 3 4 5 6 2 6 2 6 7 4

2 5 1 3 6 3 3 1 6 4 5 2 4 4 1 4 2 4 2 7

3 4 3 6 4 4 4 4 3 6 3 4 4 7 4 7 5 3 7 2

Mtro. Carlos Alberto Galván Tavera

Página 41

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Elección de una medida de distancia o semejanza. Dado que el objetivo de la conglomeración es agrupar objetos similares, se necesita alguna medida para evaluar qué tan semejantes o diferentes son dichos objetos. El enfoque más común consiste en medir la semejanza en términos de la distancia entre pares de objetos. Los objetos separados por una distancia menor son más similares entre sí, que aquellos que tienen distancias mayores. Hay diversas formas de calcular la distancia entre dos objetos. La medida de semejanza de uso más común es la distancia euclidiana o su cuadrado. La distancia euclidiana es la raíz cuadrada de la suma de diferencias elevadas al cuadrado en los valores de cada variable. Para nuestro ejemplo, usaremos el cuadrado de la distancia euclidiana.

Mtro. Carlos Alberto Galván Tavera

Página 42

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Selección de un procedimiento de conglomeración. La conglomeración por aglomeración comienza con cada objeto en un conglomerado separado. Los conglomerados se forman al agrupar objetos en conglomerados cada vez más grandes; este procedimiento continúa hasta que todos los objetos son miembros de un solo conglomerado.

Mtro. Carlos Alberto Galván Tavera

Página 43

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Selección de un procedimiento de conglomeración.

Los procedimientos de enlace incluyen enlace único, enlace completo y enlace promedio.

Mtro. Carlos Alberto Galván Tavera

Página 44

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. En la tabla siguiente se presenta la salida obtenida al agrupar los datos de la tabla que usamos de ejemplo.

Mtro. Carlos Alberto Galván Tavera

Página 45

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. El calendario de aglomeración contiene información útil que muestra el número de casos o conglomerados que se combinan en cada etapa. La primera línea representa la etapa 1, con 19 conglomerados. Los encuestados 14 y 16 se combinan en esta etapa, como se indica en la columna denominada “conglomerados combinados”. En la columna de “coeficientes” se presenta el cuadrado de la distancia euclidiana entre estos dos encuestados. La columna “etapa en la que aparece el primer conglomerado” indica la etapa en que se forma el primer conglomerado.

Mtro. Carlos Alberto Galván Tavera

Página 46

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Para ilustrarlo, una entrada de 1 en la etapa 6 indica que el encuestado 14 fue quien se agrupó primero en la etapa 1. La última columna, “etapa siguiente”, indica la etapa en que se combina con este otro caso (encuestado) o conglomerado. Puesto que el número en la primera línea de la última columna es 6, vemos que en la etapa 6, el encuestado 10 se combina con los encuestados 14 y 16 para formar un conglomerado único. De manera similar, la segunda línea representa la etapa 2 con 18 conglomerados. En la etapa 2, se agruparon los encuestados 6 y 7.

Mtro. Carlos Alberto Galván Tavera

Página 47

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Se muestra el calendario completo.

Mtro. Carlos Alberto Galván Tavera

Página 48

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Otra parte importante de la salida se encuentra en el diagrama de carámbanos de la figura siguiente. Las columnas corresponden a los objetos que se están conglomerando, en este caso los encuestados designados 1 a 20. Las filas corresponden al número de conglomerados. Esta figura se lee de abajo hacia arriba. Al principio, todos los casos se consideran conglomerados individuales.

Como hay 20 encuestados, existen 20 conglomerados iniciales.

Mtro. Carlos Alberto Galván Tavera

Página 49

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Caso No. de conglomerados 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

18

19

16

14

10

4

20

9

11

5

X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

13 X X X X X

X X X X X X X X X X X X X X X X X X X

2 X X X X X X X X X X X X X X X X X

8

3

X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

Mtro. Carlos Alberto Galván Tavera

15 X X X X

X X X X X X X X X X X X X X X X X X X

17 X X X X X X

X X X X X X X X X X X X X X X X X X X

12 X X X X X X X

X X X X X X X X X X X X X X X X X X X

7 X X X X X X X X X X X X X

X X X X X X X X X X X X X X X X X X X

6 X X X X X X X X X X X X X X X X X X

X X X X X X X X X X X X X X X X X X X

1 X X X X X X X X X X

X X X X X X X X X X X X X X X X X X X

Página 50

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. En la primera etapa, se combinan los dos objetos más cercanos, lo cual da como resultado 19 conglomerados. La última línea de la figura muestra estos 19 conglomerados.

Los dos casos combinados en esta etapa, los encuestados 14 y 16, tienen entre sí todas las X en las filas 1 a 19.

Mtro. Carlos Alberto Galván Tavera

Página 51

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Caso No. de conglomerados 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

18

19

16

14

10

4

20

9

11

5

X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

13 X X X X X

X X X X X X X X X X X X X X X X X X X

2 X X X X X X X X X X X X X X X X X

8

3

X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

Mtro. Carlos Alberto Galván Tavera

15 X X X X

X X X X X X X X X X X X X X X X X X X

17 X X X X X X

X X X X X X X X X X X X X X X X X X X

12 X X X X X X X

X X X X X X X X X X X X X X X X X X X

7 X X X X X X X X X X X X X

X X X X X X X X X X X X X X X X X X X

6 X X X X X X X X X X X X X X X X X X

X X X X X X X X X X X X X X X X X X X

1 X X X X X X X X X X

X X X X X X X X X X X X X X X X X X X

Página 52

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. La fila número 18 corresponde a la siguiente etapa, con 18 conglomerados. En esta etapa se agruparon los encuestados 6 y 7. La columna de X entre los encuestados 6 y 7 tiene un espacio vacío en la fila 19.

De modo que en esta etapa hay 18 conglomerados: 16 formados por encuestados individuales y dos que contienen dos encuestados cada uno.

Mtro. Carlos Alberto Galván Tavera

Página 53

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Caso No. de conglomerados 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

18

19

16

14

10

4

20

9

11

5

X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

13 X X X X X

X X X X X X X X X X X X X X X X X X X

2 X X X X X X X X X X X X X X X X X

8

3

X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

Mtro. Carlos Alberto Galván Tavera

15 X X X X

X X X X X X X X X X X X X X X X X X X

17 X X X X X X

X X X X X X X X X X X X X X X X X X X

12 X X X X X X X

X X X X X X X X X X X X X X X X X X X

7 X X X X X X X X X X X X X

X X X X X X X X X X X X X X X X X X X

6 X X X X X X X X X X X X X X X X X X

X X X X X X X X X X X X X X X X X X X

1 X X X X X X X X X X

X X X X X X X X X X X X X X X X X X X

Página 54

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Cada etapa sucesiva lleva a la formación de un nuevo conglomerado en una de tres maneras: 1.

dos casos individuales se agrupan;

2.

un caso se une a un conglomerado ya existente,

3.

se agrupan dos conglomerados.

Mtro. Carlos Alberto Galván Tavera

Página 55

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Caso No. de conglomerados 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

18

19

16

14

10

4

20

9

11

5

X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

13 X X X X X

X X X X X X X X X X X X X X X X X X X

2 X X X X X X X X X X X X X X X X X

8

3

X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

Mtro. Carlos Alberto Galván Tavera

15 X X X X

X X X X X X X X X X X X X X X X X X X

17 X X X X X X

X X X X X X X X X X X X X X X X X X X

12 X X X X X X X

X X X X X X X X X X X X X X X X X X X

7 X X X X X X X X X X X X X

X X X X X X X X X X X X X X X X X X X

6 X X X X X X X X X X X X X X X X X X

X X X X X X X X X X X X X X X X X X X

1 X X X X X X X X X X

X X X X X X X X X X X X X X X X X X X

Página 56

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. El dendograma es otro recurso gráfico que es útil para exponer los resultados de la conglomeración. El dendrograma se lee de izquierda a derecha. Las líneas verticales representan los conglomerados que se unieron.

La posición de la línea en la escala indica las distancias en las que se unieron los conglomerados. Dado que en las primeras etapas muchas de las distancias son de una magnitud similar, resulta difícil indicar la secuencia en que se formaron algunos de los primeros conglomerados. Sin embargo, queda claro que en las últimas dos etapas, las distancias en las que se combinaron los conglomerados son grandes. Esta información resulta útil para decidir el número de conglomerados.

Mtro. Carlos Alberto Galván Tavera

Página 57

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados.

Mtro. Carlos Alberto Galván Tavera

Página 58

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Decisión sobre el número de conglomerados. Un tema importante en el análisis de conglomerados es decidir su número. Aunque no hay reglas exactas ni rápidas, existen algunos lineamientos:

1.

Las consideraciones teóricas, conceptuales o prácticas pueden sugerir un cierto número de conglomerados. Por ejemplo, si el propósito del agrupamiento es identificar los segmentos del mercado, tal vez la gerencia desee un número de conglomerados específico.

2.

En los procedimientos de conglomeración jerárquica, pueden usarse como criterios las distancias en las que se combinan los conglomerados. Esta información puede obtenerse del calendario de aglomeración o del dendrograma.

Mtro. Carlos Alberto Galván Tavera

Página 59

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Decisión sobre el número de conglomerados. Un tema importante en el análisis de conglomerados es decidir su número. Aunque no hay reglas exactas ni rápidas, existen algunos lineamientos:

3.

Los tamaños relativos de los conglomerados deberían ser significativos. En la tabla anterior, al hacer un simple conteo de las frecuencias de pertenencia al conglomerado, vemos que la solución de tres conglomerados da como resultado conglomerados con ocho, seis y seis elementos. No obstante, si vamos a la solución de cuatro conglomerados, los tamaños de los conglomerados son ocho, seis, cinco y uno. No tiene sentido formar un conglomerado con un solo caso, así que en esta situación es preferible la solución de tres conglomerados.

Mtro. Carlos Alberto Galván Tavera

Página 60

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Interpretación y descripción de los conglomerados. Interpretar y describir los conglomerados implica examinar sus centroides, los cuales representan los valores promedio de los objetos contenidos en el conglomerado en cada una de las variables. Los centroides nos permiten describir cada conglomerado al asignarle un nombre o etiqueta. La tabla siguiente proporciona los centroides o valores promedio de cada conglomerado de nuestro ejemplo.

Mtro. Carlos Alberto Galván Tavera

Página 61

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Interpretación y descripción de los conglomerados. El conglomerado 1 tiene valores relativamente altos en las variables V1 (ir de compras es divertido) y V3 (cuando voy de compras aprovecho para comer fuera). También tiene un valor bajo en V5 (no me interesa ir de compras). De modo que al conglomerado 1 se le puede etiquetar como “compradores divertidos e interesados”. Este conglomerado consta de los casos 1, 3, 6, 7, 8, 12, 15 y 17.

Mtro. Carlos Alberto Galván Tavera

Página 62

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Interpretación y descripción de los conglomerados. El conglomerado 2 es justo el contrario, con valores bajos en V1 y V3, y valor alto en V5, por lo que este conglomerado puede etiquetarse “compradores apáticos”. Los miembros del conglomerado 2 son los casos 2, 5, 9, 11, 13 y 20.

Mtro. Carlos Alberto Galván Tavera

Página 63

3.- Análisis De Conglomerados. Facultad de Administración.

Realización de un análisis de conglomerados. Interpretación y descripción de los conglomerados. El conglomerado 3 tiene valores altos en V2 (las compras desequilibran mi presupuesto), V4 (trato de encontrar las mejores ofertas cuando voy de compras) y V6 (puede ahorrarse mucho dinero si se comparan precios). Por lo que este conglomerado puede etiquetarse como “compradores ahorrativos”. El conglomerado 3 abarca los casos 4, 10, 14, 16, 18 y 19.

Mtro. Carlos Alberto Galván Tavera

Página 64

Tarea 5. Facultad de Administración.

Análisis de conglomerados.

Archivos: Tarea 05 Conglomerados. Tarea 05.1 Conglomerados Nike 1. Tarea 05.2 Conglomerados Nike 2.

Mtro. Carlos Alberto Galván Tavera

Página 65

4.- Análisis factorial. Facultad de Administración.

Concepto básico. Análisis factorial. Definición: Clase de procedimientos que se usan sobre todo para reducir y resumir los datos.

En la investigación de mercados puede haber una gran cantidad de variables, que en su mayoría están correlacionadas y deben reducirse a un nivel manejable. En el análisis de varianza, la regresión múltiple y el análisis discriminante se considera una variable como dependiente o de criterio, y a las otras como variables predictivas o independientes. Sin embargo, en el análisis factorial no se hace dicha distinción. El análisis factorial es más bien una técnica de interdependencia, en la cual se examina el conjunto completo de relaciones interdependientes.

Mtro. Carlos Alberto Galván Tavera

Página 66

4.- Análisis factorial. Facultad de Administración.

Circunstancias del análisis factorial. 1.

Para identificar las dimensiones subyacentes, o factores, que explican las correlaciones entre un conjunto de variables. Por ejemplo, puede emplearse un conjunto de enunciados acerca del estilo de vida para medir el perfil psicográfico de los consumidores.

Mtro. Carlos Alberto Galván Tavera

Página 67

4.- Análisis factorial. Facultad de Administración.

Circunstancias del análisis factorial. 1.

Estos enunciados se someten luego a un análisis factorial para identificar los factores psicográficos subyacentes, como se ilustra en el ejemplo de la tienda departamental y en la figura siguiente, donde las siete variables psicográficas se representan usando dos factores. En esta figura, el factor 1 se interpreta como hogareño frente a persona bien conocida en la sociedad; mientras que el factor 2 puede interpretarse como deportes frente a cines y juegos.

Mtro. Carlos Alberto Galván Tavera

Página 68

4.- Análisis factorial. Facultad de Administración.

Circunstancias del análisis factorial. 2.

Para identificar un conjunto nuevo y más reducido de variables no correlacionadas que reemplacen al conjunto original de variables correlacionadas en el análisis multivariado posterior (regresión o análisis discriminante). Por ejemplo, los factores psicográficos identificados pueden utilizarse como variables independientes, al explicar las diferencias entre los consumidores leales y los no leales. De esta manera, en el análisis posterior, en vez de las siete variables psicográficas correlacionadas de la figura anterior, pueden usarse dos factores no correlacionados.

Mtro. Carlos Alberto Galván Tavera

Página 69

4.- Análisis factorial. Facultad de Administración.

Circunstancias del análisis factorial. 3.

Identificar un conjunto más reducido de variables que sobresalen en un conjunto mayor para utilizar luego en el análisis multivariado. Por ejemplo, algunos de los enunciados originales sobre el estilo de vida que tenían una elevada correlación con los factores identificados pueden usarse como variables independientes, para explicar las diferencias entre los consumidores leales y los no leales.

Mtro. Carlos Alberto Galván Tavera

Página 70

4.- Análisis factorial. Facultad de Administración.

Aplicaciones del análisis factorial en la investigación de mercados. 

Es útil en la segmentación del mercado para identificar las variables subyacentes en que se agrupan los clientes. Los compradores de automóviles nuevos pueden agruparse de acuerdo con la importancia relativa que le den a la economía, la conveniencia, el desempeño, la comodidad y el lujo. Esto daría como resultado cinco segmentos: buscadores de economía, buscadores de conveniencia, buscadores de desempeño, buscadores de comodidad y buscadores de lujo.



En la investigación del producto, el análisis factorial sirve para determinar los atributos de la marca que influyen en la elección del consumidor. Las marcas de dentífricos pueden evaluarse en términos de protección contra la caries, blancura de los dientes, sabor, aliento fresco y precio.

Mtro. Carlos Alberto Galván Tavera

Página 71

4.- Análisis factorial. Facultad de Administración.

Aplicaciones del análisis factorial en la investigación de mercados. 

En estudios sobre publicidad, se utiliza el análisis factorial para entender los hábitos de consumo de medios de comunicación, por parte del mercado meta. Los consumidores de alimentos congelados pueden ver mucha televisión por cable, ir al cine con frecuencia y escuchar música country.



El análisis factorial se emplea en estudios de asignación de precios para identificar las características de los consumidores sensibles a los precios. Por ejemplo, estos consumidores pueden ser metódicos, cuidadosos de la economía y hogareños.

Mtro. Carlos Alberto Galván Tavera

Página 72

4.- Análisis factorial. Facultad de Administración.

Estadísticos asociados con el análisis factorial. Prueba de esfericidad de Bartlett. Es una prueba estadística que se utiliza para examinar la hipótesis de que las variables no están correlacionadas en la población. En otras palabras, la matriz de correlación de la población es una matriz de identidad; cada variable tiene una correlación perfecta consigo misma (r=1), pero no se correlaciona con las demás variables (r=0). Matriz de correlación. Es una matriz triangular inferior que muestra las correlaciones simples, r, entre todos los pares posibles de variables incluidas en el análisis. Por lo regular, se omiten los elementos de la diagonal que son todos iguales a 1. Medida de lo apropiado del muestreo de Kaiser-Meyer-Olkin (KMO). Es un indicador que sirve para examinar si el análisis factorial es adecuado. Los valores altos (entre 0.5 y 1.0) indican que el análisis factorial es apropiado. Valores inferiores a 0.5 implican que el análisis factorial quizá no sea adecuado.

Mtro. Carlos Alberto Galván Tavera

Página 73

4.- Análisis factorial. Facultad de Administración.

Realización de un análisis factorial.

Mtro. Carlos Alberto Galván Tavera

Página 74

4.- Análisis factorial. Facultad de Administración.

Planteamiento del problema. El planteamiento del problema incluye varias tareas. Primero, deben identificarse los objetivos del análisis factorial y especificarse las variables que se incluirán de acuerdo con investigaciones previas, la teoría y el juicio del investigador. Es importante que las variables se midan en forma apropiada en una de escala de intervalo o de razón. El tamaño de la muestra tiene que ser adecuado; como guía general, el número de observaciones (tamaño de la muestra) debería ser al menos cuatro o cinco veces mayor que el número de variables. En muchos casos de investigación de mercados, el tamaño de la muestra es pequeño y esta razón es mucho menor. En situaciones así, se requiere que los resultados se interpreten con cautela.

Mtro. Carlos Alberto Galván Tavera

Página 75

4.- Análisis factorial. Facultad de Administración.

Planteamiento del problema. Para ilustrar el análisis factorial, suponga que el investigador desea determinar qué beneficios buscan los consumidores al comprar un dentífrico. En centros comerciales se entrevistó a una muestra de 30 individuos. Se solicitó a los encuestados que utilizaran una escala de 7 puntos (1=muy en desacuerdo, 7=muy de acuerdo), para expresar su grado de acuerdo o desacuerdo con los siguientes enunciados: V1: Es importante comprar dentífricos que prevengan las caries V2: Me gustan los dentífricos que dejan los dientes brillantes V3: Un dentífrico tiene que fortalecer las encías V4: Prefiero un dentífrico que refresque el aliento V5: La prevención de las caries no es un beneficio importante ofrecido por los dentífricos V6: La consideración más importante al comprar un dentífrico son los dientes bellos Mtro. Carlos Alberto Galván Tavera

Página 76

4.- Análisis factorial. Facultad de Administración.

Planteamiento del problema. En la tabla siguiente se presentan los datos obtenidos. Para propósitos de ilustración, sólo se considera un número pequeño de observaciones. En la práctica real, el análisis factorial se realiza en muestras mucho mayores.

RESP 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

V1 7 1 6 4 1 6 5 6 3 2 6 2 7 4 1 6 5 7 2 3 1 5 2 4 6 3 4 3 4 2

Mtro. Carlos Alberto Galván Tavera

V2 3 3 2 5 2 3 3 4 4 6 4 3 2 6 3 4 3 3 4 5 3 4 2 6 5 5 4 7 6 3

V3 6 2 7 4 2 6 6 7 2 2 7 1 6 4 2 6 6 7 3 3 2 5 1 4 4 4 7 2 3 2

V4 4 4 4 6 3 4 3 4 3 6 3 4 4 5 2 3 3 4 3 6 3 4 5 6 2 6 2 6 7 4

V5 2 5 1 2 6 2 4 1 6 7 2 5 1 3 6 3 3 1 6 4 5 2 4 4 1 4 2 4 2 7

V6 4 4 3 5 2 4 3 4 3 6 3 4 3 6 4 4 4 4 3 6 3 4 4 7 4 7 5 3 7 2

Página 77

4.- Análisis factorial. Facultad de Administración.

Planteamiento del problema. Si las correlaciones entre todas las variables son pequeñas, el análisis factorial quizá no sea apropiado. También se espera que las variables con una elevada correlación entre sí tengan además una alta correlación con el mismo factor o los mismos factores.

Mtro. Carlos Alberto Galván Tavera

Página 78

4.- Análisis factorial. Facultad de Administración.

Planteamiento del problema. En la tabla siguiente se muestra la matriz de correlación elaborada a partir de los datos obtenidos para entender los beneficios de los dentífricos (véase la tabla inicial). Aquí las correlaciones entre V1 (prevención de las caries), V3 (encías fuertes) y V5 (debilitamiento de los dientes) son relativamente elevadas, por lo que se esperaría que dichas variables se correlacionen con el mismo conjunto de factores.

Mtro. Carlos Alberto Galván Tavera

Página 79

4.- Análisis factorial. Facultad de Administración.

Planteamiento del problema. Asimismo, se observan correlaciones relativamente altas entre V2 (dientes brillantes), V4 (aliento fresco) y V6 (dientes bellos), por lo que se espera que también estas variables se correlacionen con los mismos factores.

Mtro. Carlos Alberto Galván Tavera

Página 80

4.- Análisis factorial. Facultad de Administración.

Planteamiento del problema. En la tabla siguiente se presentan los resultados del análisis factorial. La prueba de esfericidad de Bartlett rechaza la hipótesis nula de que la matriz de correlación de la población es una matriz de identidad. La chi cuadrada aproximada es de 111.314 con 15 grados de libertad, lo cual es significativo a un nivel de 0.05. El valor del estadístico de KMO (0.660) también es alto (>0.5). Por ende, puede considerarse que el análisis factorial es una técnica apropiada para analizar la matriz de correlación de la tabla anterior.

Mtro. Carlos Alberto Galván Tavera

Página 81

4.- Análisis factorial. Facultad de Administración.

Determinación del procedimiento de análisis factorial. Una vez que se determina que el análisis factorial es una técnica adecuada para analizar los datos, debe elegirse un procedimiento adecuado. Los diferentes tipos de análisis factorial se distinguen en el procedimiento que usan para derivar los pesos o los coeficientes de las puntuaciones de los factores. Los dos enfoques básicos son el análisis de los componentes principales y el análisis de los factores comunes. En el análisis de los componentes principales se considera la varianza total de los datos. La diagonal de la matriz de correlación consta de unidades y la varianza total se incluye en la matriz factorial. En el análisis de los factores comunes, los factores se calculan a partir únicamente de la varianza común. Las contribuciones comunes se introducen en la diagonal de la matriz de correlación.

Mtro. Carlos Alberto Galván Tavera

Página 82

4.- Análisis factorial. Facultad de Administración.

Determinación del procedimiento de análisis factorial. La tabla siguiente muestra la aplicación del análisis de los componentes principales al ejemplo del dentífrico. En la sección de “Contribuciones comunes”, en la columna “Inicial” se observa que las contribuciones comunes para cada variable, V1 a V6, son 1.0 conforme las unidades se insertaron en la diagonal de la matriz de correlación.

Mtro. Carlos Alberto Galván Tavera

Página 83

4.- Análisis factorial. Facultad de Administración.

Determinación del procedimiento de análisis factorial. Los valores propios se indican en la tabla con la etiqueta “Valores propios iniciales”. Como se esperaba, los valores propios de los factores aparecen en orden de magnitud decreciente conforme se pasa del factor 1 al 6. El valor propio de un factor indica la varianza total que se le atribuye. La varianza total explicada por los seis factores es 6.00, que es igual al número de variables. El factor 1 explica la varianza de 2.731, es decir (2.731/6) o 45.52 por ciento de la varianza total. De igual manera, el segundo factor explica (2.218/6) o 36.97 por ciento de la varianza total, de manera que los dos primeros factores combinados explican el 82.49 por ciento de la varianza total.

Mtro. Carlos Alberto Galván Tavera

Página 84

4.- Análisis factorial. Facultad de Administración.

Determinación del número de factores. Es posible calcular tantos componentes principales como variables haya, aunque no se gane mucho con ello. Para resumir la información contenida en las variables originales, debería extraerse un número menor de factores. La pregunta es ¿cuántos? Para determinar el número de factores, se sugieren varios procedimientos:  Determinación a priori. Hay ocasiones en que el investigador sabe, gracias a la información previa, cuántos factores debe esperar, lo cual le permite especificar de antemano el número de factores que hay que extraer.

 Determinación basada en valores propios. En este método sólo se conservan los factores cuyo valor propio es mayor de 1.0; los otros factores no se incluyen en el modelo.

Mtro. Carlos Alberto Galván Tavera

Página 85

4.- Análisis factorial. Facultad de Administración.

Determinación del número de factores.  Determinación basada en una gráfica de sedimentación. La gráfica de sedimentación diagrama los valores propios contra el número de factores en orden de extracción. La forma de la gráfica se usa para determinar el número de factores. Por lo general, la gráfica indica una separación notable entre la pendiente pronunciada de los factores con valores propios grandes y un desvanecimiento gradual asociado con el resto de los factores, lo cual se conoce como sedimentación.  Determinación basada en el porcentaje de la varianza. En este enfoque, el número de factores extraído se determina de modo tal que el porcentaje acumulado de varianza extraído por los factores alcance un nivel satisfactorio. El nivel satisfactorio de varianza depende del problema. Sin embargo, es recomendable que los factores extraídos expliquen por lo menos el 60 por ciento de la varianza.

Mtro. Carlos Alberto Galván Tavera

Página 86

4.- Análisis factorial. Facultad de Administración.

Determinación del número de factores.  Determinación basada en la confiabilidad de división en mitades. La muestra se divide en mitades y cada mitad se somete al análisis factorial. Sólo se conservan los factores con una alta correspondencia con las cargas de los factores en las dos submuestras.  Determinación basada en pruebas de significancia. Es posible determinar la significancia estadística de los valores propios separados y conservar sólo los factores que sean estadísticamente significativos.

Mtro. Carlos Alberto Galván Tavera

Página 87

4.- Análisis factorial. Facultad de Administración.

Determinación del número de factores. En la tabla de valores propios iniciales, vemos que el valor propio mayor de 1.0 (opción predeterminada) da como resultado la extracción de dos factores. Nuestro conocimiento a priori nos indica que hay dos razones principales para comprar dentífricos.

Mtro. Carlos Alberto Galván Tavera

Página 88

4.- Análisis factorial. Facultad de Administración.

Determinación factores.

del

número

de

En la figura siguiente se presenta la gráfica de sedimentación asociada con este análisis; esa gráfica muestra una clara separación en tres factores.

Mtro. Carlos Alberto Galván Tavera

Página 89

4.- Análisis factorial. Facultad de Administración.

Determinación del número de factores. Por último, a partir del porcentaje acumulado de varianza explicada, se observa que los primeros dos factores explican el 82.49 por ciento de la varianza, y que es marginal la ganancia obtenida al pasar a tres factores. Además, la confiabilidad de la división en mitades también indica que dos factores son apropiados. De manera que en tal situación parece razonable contar con dos factores.

Mtro. Carlos Alberto Galván Tavera

Página 90

4.- Análisis factorial. Facultad de Administración.

Rotación de factores. Un resultado importante del análisis factorial es la matriz factorial, también llamada matriz de patrones factoriales. La matriz factorial contiene los coeficientes que expresan las variables estandarizadas en términos de los factores. Estos coeficientes, las cargas factoriales, representan las correlaciones entre los factores y las variables. Un coeficiente con un valor absoluto grande indica una estrecha relación entre el factor y la variable. Los coeficientes de la matriz factorial sirven para interpretar los factores.

Mtro. Carlos Alberto Galván Tavera

Página 91

4.- Análisis factorial. Facultad de Administración.

Rotación de factores. Aunque la matriz factorial inicial o no rotada indica la relación entre los factores y las variables individuales, es raro que dé como resultado factores que puedan interpretarse, ya que los factores están correlacionados con muchas variables. Por ejemplo, en la tabla anterior, el factor 1 tiene al menos cierta correlación con cinco de las seis variables (valor absoluto de la carga factorial mayor que 0.3). De igual manera, el factor 2 tiene al menos alguna correlación con cuatro de las seis variables. Por otro lado, las variables 2, 4 y 5 ponen al menos alguna carga en ambos factores. Esto se presenta en la figura siguiente. ¿Cómo deberían interpretarse estos factores?

Mtro. Carlos Alberto Galván Tavera

Página 92

4.- Análisis factorial. Facultad de Administración.

Rotación de factores. En una matriz tan compleja es difícil interpretar los factores. Por ende, la rotación transforma la matriz factorial en una matriz más sencilla y más fácil de interpretar.

Al rotar los factores, nos gustaría que cada factor tuviera cargas o coeficientes significativos (diferentes de cero) sólo con algunas variables. Asimismo, nos gustaría que cada variable tuviera cargas significativas (diferentes de cero) sólo con algunos factores, de ser posible sólo con uno.

Mtro. Carlos Alberto Galván Tavera

Página 93

4.- Análisis factorial. Facultad de Administración.

Rotación de factores. En la tabla siguiente, al comparar la matriz factorial con rotación con la matriz no rotada (conocida como matriz factorial), se observa la manera en que la rotación logra la simplicidad y mejora la posibilidad de interpretación. Mientras que en la matriz no rotada hay cinco variables correlacionadas con el factor 1, después de la rotación sólo las variables V1, V3 y V5 se correlacionan con el factor 1. Las variables restantes V2, V4 y V6 tienen una correlación alta con el factor 2. Además, ninguna variable mantiene una correlación elevada con ambos factores.

Mtro. Carlos Alberto Galván Tavera

Página 94

4.- Análisis factorial. Facultad de Administración.

Rotación de factores. Lo anterior puede verse con claridad en la figura siguiente. La matriz factorial rotada es la base para la interpretación de los factores.

Mtro. Carlos Alberto Galván Tavera

Página 95

4.- Análisis factorial. Facultad de Administración.

Interpretación de los factores. La interpretación se facilita al identificar las variables que tienen cargas altas sobre el mismo factor. En la matriz factorial rotada de la tabla 19.3, el factor 1 tiene coeficientes altos para las variables V1 (prevención de caries) y V3 (encías fuertes), y un coeficiente negativo para V5 (la prevención del debilitamiento de los dientes no es importante). Por lo tanto, este factor puede etiquetarse como factor benéfico para la salud. Advierta que un coeficiente negativo para una variable negativa (V5) conduce a una interpretación positiva de que es importante prevenir el debilitamiento de los dientes.

Mtro. Carlos Alberto Galván Tavera

Página 96

4.- Análisis factorial. Facultad de Administración.

Interpretación de los factores. El factor 2 tiene una elevada relación con las variables V2 (dientes brillantes), V4 (aliento fresco) y V6 (dientes bellos). Por ende, el factor 2 puede recibir la etiqueta de factor de beneficio social.

Mtro. Carlos Alberto Galván Tavera

Página 97

4.- Análisis factorial. Facultad de Administración.

Interpretación de los factores. La gráfica de las cargas factoriales, que se presenta en la figura siguiente, confirma esta interpretación. Las variables V1, V3 y V5 (denotadas con 1, 3 y 5, respectivamente) se encuentran en los extremos del eje horizontal (factor 1), con V5 en el extremo opuesto a V1 y V3, mientras que las variables V2, V4 y V6 (denotadas como 2, 4 y 6) se encuentran en el extremo del eje vertical (factor 2). Los datos pueden resumirse en la afirmación de que los consumidores parecen buscar dos tipos importantes de beneficios en un dentífrico: beneficios para la salud y beneficios sociales.

Mtro. Carlos Alberto Galván Tavera

Página 98

Tarea 6. Facultad de Administración.

Análisis factorial.

Archivos: Tarea 06 Factorial. Tarea 06.1 Factorial.

Mtro. Carlos Alberto Galván Tavera

Página 99

5.- Series de tiempo. Facultad de Administración.

Introducción. En esta sección se efectúa el análisis y la proyección de las series de tiempo. Una serie de tiempo es un grupo de datos registrados durante un periodo semanal, trimestral o anual. Dos ejemplos de las series de tiempo son las ventas de Microsoft por trimestre desde 1985, y la producción anual de ácido sulfúrico desde 1970. Un análisis de la historia, que es una serie de tiempo, es útil para que la administración tome decisiones hoy y planee con base en una predicción o pronóstico de largo plazo. En general, se supone que los patrones pasados continuarán en el futuro. Este módulo trata del uso de los datos para proyectar eventos futuros. Primero se analizan los componentes de una serie de tiempo, luego, algunas técnicas para analizar los datos y, por último, se proyectan eventos futuros.

Mtro. Carlos Alberto Galván Tavera

Página 100

5.- Series de tiempo. Facultad de Administración.

Componentes de una serie de tiempo. Consta de cuatro componentes. 1. Tendencia. 2. Variación cíclica. 3. Variación estacional. 4. Variación irregular. 1.- Tendencia. Dirección uniforme de una serie de tiempo de largo plazo. Las tendencias de largo plazo de las ventas, el empleo, los precios accionarios y de otras series de negocios y económicas siguen varios patrones. Algunas se mueven hacia arriba en forma uniforme, otras declinan y otras más permanecen iguales con el paso del tiempo.

Mtro. Carlos Alberto Galván Tavera

Página 101

5.- Series de tiempo. Facultad de Administración.

Ejemplo. Home Depot se fundó en 1978. En la gráfica se muestra el número de empleados. Se observa que este número aumentó con rapidez en los últimos 15 años. En 1993 había poco más de 50,000 empleados, mientras que en 2006 el número aumentó a más de 364,000. Desde entonces, el número de asociados ha disminuido a 317,000 en 2010.

Mtro. Carlos Alberto Galván Tavera

Página 102

5.- Series de tiempo. Facultad de Administración.

Ejemplo. El número de casas prefabricadas enviadas a EU presentó un aumento uniforme de 1990 a 1996, luego permaneció casi igual hasta 1999, cuando el número empezó a declinar. En 2002, el número era menor al de 1990 y continuó declinando hasta 2009.

Mtro. Carlos Alberto Galván Tavera

Página 103

5.- Series de tiempo. Facultad de Administración.

2.- Variación cíclica. Aumento y reducción de una serie de tiempo durante periodos mayores de un año. Este es el segundo componente de una serie de tiempo. Un ciclo de negocios habitual consiste en un periodo de prosperidad, seguido por periodos de recesión, depresión y luego recuperación. Ejemplo. En la siguiente figura se presentan las ventas anuales de baterías que vendió la empresa Battery Retailers, Inc.

Mtro. Carlos Alberto Galván Tavera

Página 104

5.- Series de tiempo. Facultad de Administración.

3.- Variación estacional. Patrones de cambio en una serie de tiempo en un año. Estos patrones tienden a repetirse cada año. Este es el tercer componente de una serie de tiempo. Muchas series de ventas, producción y de otro tipo fluctúan de acuerdo con las temporadas. La unidad de tiempo se reporta por trimestre o mes.

Ejemplo. En la siguiente figura aparecen las ventas trimestrales en millones de dólares, de Hercher Sporting Goods, Inc. Compañía de artículos de beisbol y softbol que vende a preparatorias, universidades y ligas juveniles. Mtro. Carlos Alberto Galván Tavera

Página 105

5.- Series de tiempo. Facultad de Administración.

4.- Variación irregular. Muchos analistas prefieren subdividir la variación irregular en variaciones episódicas y residuales. Variaciones episódicas. Son impredecibles, sin embargo es posible identificarlas, por ejemplo, el efecto inicial de una huelga o de una guerra. Después de eliminarlas fluctuaciones episódicas, la variación restante se denomina variación residual, éstas son impredecibles y no se pueden predecir.

Por supuesto no es posible proyectar a futuro ni la variación episódica ni la residual.

Mtro. Carlos Alberto Galván Tavera

Página 106

5.- Series de tiempo. Facultad de Administración.

Tendencia Lineal. La tendencia de largo plazo en muchas series de negocios, como ventas, exportaciones y producción, con frecuencia se aproxima a una recta. En este caso, la ecuación para describir este crecimiento es: Donde: a es la intersección con el eje Y. Valor estimado de Y cuanto t = 0. b es la pendiente de la recta. t es cualquier valor de tiempo seleccionado.

Mtro. Carlos Alberto Galván Tavera

Página 107

5.- Series de tiempo. Facultad de Administración.

Para ilustrar el significado de 𝑌, a, b, y t en un problema de serie de tiempo, en la gráfica se traza una recta para representar la tendencia habitual de las ventas. Suponga que esta compañía inició sus operaciones en 2001. Este año inicial (2001) se designa de manera arbitraria como año 1. Observe que las ventas aumentaron $2 millones en promedio cada año; es decir, con base en la recta trazada por los datos de ventas, éstas aumentaron de $3 millones en 2001 a $5 millones en 2002, a $7 millones en 2003, a $9 millones en 2004 y así sucesivamente.

Mtro. Carlos Alberto Galván Tavera

Página 108

5.- Series de tiempo. Facultad de Administración.

Por lo tanto, la pendiente, o b, es 2. Además, observe que la recta interseca el eje Y (cuando t = 0) en $1 millón. Este punto es a, Otra manera de determinar b es ubicar el punto de partida de la recta en el año 1, que en este problema es 3 para 2001. Luego se ubica el valor en la recta del último año, que para 2009 es 19. Las ventas se incrementaron $19 millones - $3 millones = $ 16 millones, en ocho años (de 2001 a 2009). Por lo tanto, 16 / 8 = 2, que es la pendiente de la recta, o b.

Mtro. Carlos Alberto Galván Tavera

Página 109

5.- Series de tiempo. Facultad de Administración.

La ecuación de la recta de la gráfica es: 𝒀 = 𝟏 + 𝟐𝒕

A continuación veremos como trazar la recta de tendencia mediante el método de los mínimos cuadrados.

Mtro. Carlos Alberto Galván Tavera

Página 110

5.- Series de tiempo. Facultad de Administración.

Método de los mínimos cuadrados. En el análisis de una regresión simple, en el módulo 3, se mostró el método de los mínimos cuadrados para determinar la mejor relación lineal entre dos variables. En los métodos de proyección, el tiempo es la variable independiente, y el valor de la serie de tiempo, la dependiente. Además con frecuencia se codifica la variable independiente (tiempo), para facilitar la interpretación de las ecuaciones. En otras palabras, se hace que t sea 1 en el primer año, 2 en el segundo y así en lo sucesivo. Ejemplo. Las ventas de Jensen Foods, desde el 2005 se muestran en la tabla. Determine la ecuación de regresión. ¿Cuál es el incremento anual de las ventas? ¿Cuál es la proyección de ventas para 2012?

Mtro. Carlos Alberto Galván Tavera

Página 111

5.- Series de tiempo. Facultad de Administración.

Solución. Para determinar la ecuación de la tendencia puede utilizar las siguientes 𝒔𝒚 fórmulas: 𝒂 = 𝒀 − 𝒃𝑿 𝒃=𝒓 𝒔𝒙

para encontrar la pendiente, o valor de b, y la intersección, o valor de a. Se sustituye t, los valores codificados del año, por X en estas ecuaciones. Otra opción es emplear un paquete de software como Minitab. En la siguiente gráfica aparece la captura de pantalla de Minitab.

Mtro. Carlos Alberto Galván Tavera

Página 112

5.- Series de tiempo. Facultad de Administración.

Solución. La ecuación de tendencia es: 𝒀 = 𝟔. 𝟏 + 𝟏. 𝟑𝒕 ¿Cómo se interpreta la ecuación? Las ventas están en millones de dólares, por lo tanto, el valor 1.3 indica que las ventas aumentaron a una tasa de 1.3 millones de dólares por año. El valor 6.1 es el valor estimado de las ventas en el año 0, es decir, la estimación de 2004, el cual se denomina año base. Por ejemplo para determinar el punto de la recta en 2008, se sustituye el valor de t por 4 en la ecuación. Entonces: 𝒀 = 𝟔. 𝟏 + 𝟏. 𝟑 𝟒 = 𝟏𝟏. 𝟑

Mtro. Carlos Alberto Galván Tavera

Página 113

5.- Series de tiempo. Facultad de Administración.

Solución. Para obtener la proyección de ventas para 2012, se sustituye a t por 8, quedando la ecuación: 𝒀 = 𝟔. 𝟏 + 𝟏. 𝟑 𝟖 = 𝟏𝟔. 𝟓

Para resolver el problema con las fórmulas se tendrían que desarrollar las siguientes operaciones: Año Código X Ventas Y 2005 1 7 2006 2 10 2007 3 9 2008 4 11 2009 5 13 15 50

𝑿

𝒀

𝑿−𝑿

𝒀−𝒀

𝑿−𝑿 𝒀−𝒀

𝑿−𝑿

3 3 3 3 3

10 10 10 10 10

-2 -1 0 1 2

-3 0 -1 1 3

6 0 0 1 6 13

4 1 0 1 4 10

Varianza Desviación Est. Correlación b a

X 2.50 1.58 0.92 1.30 6.10

𝟐

𝒀−𝒀

𝟐

9 0 1 1 9 20

Y 5.00 2.24

Mtro. Carlos Alberto Galván Tavera

Página 114

5.- Series de tiempo. Facultad de Administración.

Tarea.

Tarea 07 Series De Tiempo.

Mtro. Carlos Alberto Galván Tavera

Página 115

Tarea 7. Facultad de Administración.

Series de tiempo.

Archivo: Tarea 07 Series de tiempo.

Mtro. Carlos Alberto Galván Tavera

Página 116

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.