Diseño experimental

June 24, 2017 | Autor: M. Ruiz Hinojosa | Categoria: Experimental Design, Ingenieria Quimica, Ingeniería química, Diseño Experimental
Share Embed


Descrição do Produto

María Gabriela Ruiz Hinojosa
Ingeniería Química





Conceptos básicos – Estadística
Estadística
La estadística consiste en el procesamiento de datos experimentales, para poner a punto determinados procesos, por ejemplo. Los datos como números no sirven, de modo que se debe procesarlos con la herramienta estadística, la cual los organiza en forma de tablas y gráficos.
La estadística es una ciencia, pues se desarrolla con métodos científicos que ayudan a procesar los datos. Además, proporciona técnicas para recoger los datos, organizarlos y resumirlos. La media es un valor que permite resumir un grupo de datos.
Luego de recoger, organizar y resumir los datos, se los analiza. Esto permite obtener conclusiones válidas (válidas porque precisamente resultan de las herramientas que proporcionan la estadística). Todo lo que se hace es en base a objetivos, y en base a las conclusiones obtenidas se toman decisiones.
En el diseño experimental se toma una muestra representativa (que representa a la población) para estudiarla, y mediante el uso de la estadística se va a proceder con una inferencia de las conclusiones obtenidas en la muestra hacia la población.
Variables
Es la cantidad o carácter que puede ser medido y se hallan sujetos a variación. "Cantidad" porque es medible, mientras que "carácter" igualmente se refiere a una característica que puede ser medida, pero no es una cantidad. Se identifican variables del proceso y variables del producto, registrándose dentro de éstas últimas las características del producto. Por ejemplo, en el proceso de obtención de tequila, las variables de proceso que se manejan son:
Cultivo de agave
Características de riego
Características del fertilizante
Tipo de suelo
Cantidad de luz
Temperatura
Tipo de cultivo
Tiempo de cosecha
Corte
Altura de aplicación del corte
Material del corte
Velocidad del corte
Operador (habilidad)
Molienda
Tamaño de partícula
Humedad
Tiempo de molienda
Tipo de molienda
Velocidad de giro
Cocción
Temperatura
Tiempo
Presión
Características del equipo
Fermentación
Tiempo
Temperatura
Tipo de microorganismo
Cantidad de microorganismo
Agitación
pH
Concentración del sustrato
Destilación
Presión
Temperatura
Altura de la columna
Equipo de destilación
Añejamiento
Tiempo
Material del barril
Temperatura
Humedad
Filtrado
Tipo de filtro
Tamaño del poro
Temperatura
Envasado
Viscosidad y densidad del producto
Características de la maquinaria
En cambio, para cambiar la alimentación de un ganado, las variables de proceso que se deben tomar en cuenta son:
Tipo de ganado (leche o carne)
Raza
Edad
Sexo
Estado fisiológico
Características de alimentación anterior y de la actual
Tipos de variables
Los tipos de variables que se conocen son:
Cualitativa: Mide cualidades o características. Por ejemplo, color, aroma, sabor.
Cuantitativa: Se definen con números. Pueden ser:
Continua: Es aquella que puede tomar todos los valores posibles dentro de un rango. Por ejemplo, altura, peso, longitud, calificaciones.
Discreta: Es aquella que toma valores puntuales. Por ejemplo, el número de estudiantes en una clase, el número de cabezas de ganado en una región, el número de flotas de aviones de una aerolínea.
Observación
Son elementos o atributos de información. Es la materia prima con la que trabaja el investigador. Para ser analizados, deben estar en forma de números, mediante la medición de datos que normalmente presentan variación y variabilidad.
El diseño experimental permite trabajar con una cantidad necesaria de datos de una forma válida y sencilla. Siempre se debe aplicar el diseño experimental más sencillo, no sólo porque es práctico, sino también porque implica menos costos.
Población
Son todos los valores posibles dentro de una variable. Pueden ser finitas e infinitas.
La muestra es la porción de la población sobre la que se va a realizar el experimento, y las conclusiones obtenidas en una muestra se van a inferir a su población. Por eso, la muestra tiene que ser representativa. Obtener una muestra representativa es una de las partes más importantes de un proyecto.
Muestreo
Es importante, ya que la calidad de las conclusiones obtenidas depende de cómo se realiza el muestreo. El muestreo es un plan que especifica cómo se seleccionará la muestra que se extraerá de la población. Estudiar la población es ideal, pero es costoso y requiere mucho tiempo.
Existen varios tipos de muestreo, y para seleccionar uno hay que tomar en cuenta el tipo de población, la información deseada y el tiempo y dinero disponibles. Sin embargo, independientemente del tipo, todos los muestreos deben ser desarrollados al azar.
El tipo de muestro más utilizado es el aleatorio (al azar), el cual se caracteriza por una carencia aparente de propósito, causa u orden. Es sinónimo de propiedades estadísticas medibles: carencia de tendencia o correlación. Así, todos los miembros de la población tienen la misma probabilidad de ser escogidos, es decir, cada individuo tiene igual oportunidad de ser incluido en los datos. Para este tipo de muestreo, se dispone de métodos mecánicos (por ejemplo, en los libros de estadística se tienen tablas de números aleatorios).
El muestreo aleatorio simple requiere un cuidadoso diseño y ejecución para asegurar la independencia de las observaciones. Si los datos no son independientes, hay tendencia. Funciona para poblaciones pequeñas y bien definidas.
Para el muestreo estratificado, la población se divide en subpoblaciones, con la condición de que existan diferencias entre sus medidas. En la subpoblación debe haber homogeneidad entre los individuos que la conforman, y para escoger su amplitud, se debe determinar la proporción de la subpoblación en la población. Así, los tamaños de la muestra deben tener la misma proporción que en la población. Identificadas las subpoblaciones y su amplitud, se selecciona la muestra al azar dentro de cada estrato o categoría.
El muestreo sistemático consiste en un sistema. Para desarrollarlo, primero se ordena la población, luego se elije a uno de ellos al azar (obteniéndose el primer individuo), y a intervalos constantes se va seleccionando el siguiente integrante de la muestra (mediante la aplicación de un algoritmo). Sin embargo, este tipo de muestreo no es aleatorio.
En el muestreo por áreas se usa especialmente en encuestas sociológicas, y es adecuado para encuestas a nivel nacional. Se lo llama también muestreo por conglomerados (barrios, parroquias, cantones, entre otros), y la ventaja que presenta es que se puede aumentar el tamaño de la muestra sin problema, conservando siempre una proporción.
En el muestreo dirigido, la validez de la información obtenida o la calificación de buena o mala para la muestra dependen del criterio (producto de la experiencia) de la persona encargada del muestreo. Sin embargo, para que la muestra sea representativa, el muestreo debe tener su componente aleatorio.
El muestreo por cuotas se caracteriza porque las cuotas se finan en base a determinados criterios. El entrevistador puede seleccionar libremente dentro de cada grupo, siempre y cuando se ajuste a las cuotas señaladas.
Medidas de tendencia central y dispersión
Medidas de tendencia central
Media
Un grupo de datos se suele caracterizar con una medida de tendencia central, siendo la media aritmética la más conocida. Respecto a ésta, hay media muestral y media poblacional, que se diferencian por el denominador en el cálculo de la media.
x=xinMuestraμ=xiN-1Población
La media es el valor que representa a todos los datos de una muestra. Resume en un valor las características de una variable, tomando en cuenta a todos los datos. Se define para variables cuantitativas.
La media es una medida que sirve para procedimientos estadísticos, ya que el tratamiento (o prueba) de un fenómeno genera un conjunto de datos, y para analizarlo se comparan las medias de cada prueba.
El problema que se presenta con la media es que al considerar a todos los valores, también se toman en cuenta a los valores atípicos (datos muy extremos u OutLlers), que pueden afectar la interpretación.
Mediana
Otra medida de tendencia central es la mediana, que divide al grupo de datos en dos. Es un valor de la variable que deja por debajo de sí a la mitad de los datos. Para determinarla, se cuenta el número de datos, se los ordena en orden ascendente y se toma el valor de la mitad (cuando el número de datos es impar) o el promedio de los dos valores centrales (cuando el número de datos es par).
La ventaja de utilizar la mediana es que los valores extremos no le afectan, además de que puede hallarse la mediana de datos cualitativos. Los procedimientos estadísticos con la mediana son mucho más complejos.
Moda
La moda es el valor que se repite más. De ahí que puede ser bimodal o multimodal, cuando el conjunto de datos tiene más de una moda (más de un dato se repite el mayor número de veces y el mismo número de veces).
Medidas de dispersión
Las medidas de dispersión indican la variabilidad que presenta una distribución, como la desviación estándar: a mayor valor de esta medida de dispersión, la variabilidad es mayor. Por tanto, representa la homogeneidad de la muestra. Siempre que se debe comparar datos, se debe reportar una medida de tendencia central y una medida de dispersión.
Para afirmar que un conjunto de medidas son diferentes, se debe hacer un análisis estadístico y a partir de éste asegurar si los datos son iguales o diferentes. Dentro de este análisis estadístico se incluye la medida de dispersión, de modo que si las medidas de tendencia central numéricamente son iguales no implica que los datos sean iguales. Lo que sucede es que la medida de dispersión recoge todas las diferencias del conjunto de datos. Los datos obtenidos pueden ser exactos y/o precisos, y estas desviaciones involucran la media.
Las medidas de dispersión más utilizadas en los proyectos de titulación son:
Rango estadístico
Varianza
Desviación típica
Rango estadístico
El rango es la diferencia entre los límites superior e inferior del conjunto de datos ordenados (valores más alto y bajo del conjunto de datos). Indica el grado de variación de los datos: rango en los que varía el resultado.
Varianza y Desviación estándar
Varianza es la medida estadística de la dispersión respecto a un valor central. La desviación estándar es igual a la raíz cuadrada de la varianza, la cual se calcula como:
s2=xi-x2n-1Muestraσ2=xi-μ2NPoblación
Hay que tener mucho cuidado con el cálculo de la desviación estándar en Microsoft Excel, ya que hay seis tipos. La función que se utiliza para el análisis de la desviación estándar de una muestra (s) es DESVEST.

Diseño Experimental
El diseño de experimentos nació en el área agrícola, pero actualmente se aplica a todas las áreas, pues el progreso en distintos campos se basa en la investigación. Todos los productos del mercado resultan de investigaciones que se fundamentan en la experimentación, la cual tiene varias etapas:
Planificación, se hace con un grupo multidisciplinario. En el campo de la experimentación, la planificación consiste en:
Identificar el problema.
Enunciar el problema.
Formular hipótesis.
Seleccionar el procedimiento experimental (tamaño, proceso y características del procesamiento). Se plantean los diseños experimentales para ejecutar el procedimiento (¿cómo voy a realizar el experimento para encontrar las respuestas que necesito?). Así, el diseño experimental se desarrolla antes de la ejecución, no después.
Diseño del muestreo.
En este punto también se establecen los preliminares, que permiten encontrar las variables, para definir el diseño final. Obtenido el diseño final, viene:
Ejecución
Procesamiento de datos en base al procedimiento planteado.
Se aplica procesos estadísticos a los resultados.
Análisis estadístico de los resultados.
Análisis económico.
Conclusiones
Recomendaciones
El diseño experimental se utiliza típicamente para:
Caracterizar nuevos materiales.
Comparar dos o más materiales, para encontrar el más adecuado para determinada aplicación. Involucra diseñar un experimento para probarlos.
Comparar varios instrumentos de medición, en cuanto a la medición y exactitud
Determinar los factores vitales de un proceso que tienen impacto sobre un producto final, por ejemplo encontrar la mejor temperatura o el mejor pH.
Encontrar las condiciones de operación.
Reducir el tiempo de ciclo de un proceso.
Hacer del proceso robusto a oscilaciones de variables ambientales.
Definiciones básicas del diseño experimental
Experimento: Es todo cambio de condiciones a algo que está establecido. Es un cambio en las condiciones de operación de un sistema o proceso, a fin de saber qué efecto tendrá ese cambio en el proceso, en las variables de salida o en las propiedades del producto obtenido. La experimentación se debe seguir al pie de la letra en cuanto a lo planificado.
Unidad experimental: Muestra que se analiza, sobre la cual se va a experimentar. Es la muestra que se utiliza para generar un valor que sea representativo del resultado del experimento. Es una muestra de artículos que es necesario producir bajo las mismas condiciones para obtener una medición o dato representativo.
ProcesoProductoMateria primaVariables de respuesta DependientesFactores controlables
Variables de diseño
IndependientesFactores incontrolablesProcesoProductoMateria primaVariables de respuesta DependientesFactores controlables
Variables de diseño
IndependientesFactores incontrolables
Proceso
Producto
Materia prima
Variables de respuesta Dependientes
Factores controlables
Variables de diseño
Independientes
Factores incontrolables
Proceso
Producto
Materia prima
Variables de respuesta Dependientes
Factores controlables
Variables de diseño
Independientes
Factores incontrolables
En un proceso hay factores que se pueden controlar, convirtiéndose en variables que se van a utilizar para hacer diseños experimentales (variables de diseño), y factores que no se pueden controlar, o son muy difíciles de controlar, como por ejemplo las condiciones ambientales o el estado de ánimo de los obreros. Estos factores no controlables van a influir en la variabilidad de los datos, pero se pueden minimizar o contrarrestar sus efectos.
En el producto se encuentran variables de respuesta, las cuales son dependientes (variables dependientes) de los factores controlables (variables independientes). Por eso, para determinar factores de diseño hay que escoger las variables de respuesta que dependan de los factores controlables. La clave de un diseño es plantear los factores de diseño y las variables de salida.
Encontrar las variables de salida que están directamente relacionadas con las propiedades que se requieren analizar y que representen el efecto del cambio implementado no es tan sencillo. Debe existir una dependencia entre la variable de salida de respuesta y la variable de diseño.
Variable de respuesta: Permiten conocer el efecto o los resultados de cada prueba (generalmente rendimiento) respecto a lo que se desea obtener del proceso. No necesariamente una variable de entrada debe tener una sola variable de respuesta, pues puede tener varias, sólo que siempre deben estar relacionadas.
Factores controlables: Variables de proceso o características de los materiales experimentales que se pueden fijar a un nivel dado, y que se pueden convertir en variables de diseño. Antes de definirlos, siempre se debe pensar en cómo afectan a la variable de salida.
Factores no controlables o de ruido: No se pueden controlar durante el experimento, o es muy difícil hacerlo, pero se puede minimizar sus efectos.
Niveles: Son los diferentes valores que se asignan a cada factor controlable estudiado (variable de diseño o entrada). Cada vez que se prueba un nivel, se efectúa un tratamiento.
Ejercicio
Se quiere evaluar el desempeño de un automóvil y encontrar los factores que más influyen en su rendimiento.
¿Cuáles serían las variables de diseño o de entrada (factores controlables)?
Marca del auto
¿Cuáles son los niveles?
Marca de auto 1
Marca de auto 2
Marca de auto 3
¿Cuáles serían las variables de respuesta?
Consumo de gasolina (no el kilometraje, pues éste se fija para poder comparar las distintas marcas)
¿Cuáles son los factores no controlables o de ruido?
Estado de la pista en las que se van a desarrollar las pruebas
Estado de las ruedas
¿Cuáles son las unidades experimentales?
Cada uno de los autos empleados en las pruebas
Se desea controlar los efectos del alcohol en la realización de operaciones matemáticas sencillas (sumas). Para ello se eligen 20 personas que se dividirán en 4 grupos de 5 y a los que se les aplica cuatro tratamientos distintos:
T1 (sin alcohol)
T2 (dosis baja de alcohol)
T3 (dosis media de alcohol)
T4 (dosis alta de alcohol)
¿Cuáles serían las variables de diseño o de entrada?
Dosis de alcohol
¿Cuáles son los niveles?
T1 (sin alcohol)
T2 (dosis baja de alcohol)
T3 (dosis media de alcohol)
T4 (dosis alta de alcohol)
¿Cuáles serían las variables de respuesta?
Tiempo que le toma a cada persona terminar las pruebas.
Calificación de cada persona en las pruebas.
¿Cuáles son los factores no controlables o de ruido?
Asimilación de las personas sobre las que se efectúa la prueba.
¿Cuáles son las unidades experimentales?
Blanco (persona sobre la que se efectúa la prueba sin alcohol)
Grupos de 5 personas (pues el tratamiento se va a hacer sobre cada grupo)
A un agricultor le ofrecen cuatro tipos de fertilizantes para sus cultivos de remolacha. El tiene 10 parcelas de terreno y anota los kilogramos recolectados al final de cada temporada.
¿Cuáles serían las variables de diseño o de entrada?
Tipo de fertilizante
¿Cuáles son los niveles?
Cuatro fertilizantes a probarse
¿Cuáles serían las variables de respuesta?
Rendimiento (kg por parcela)
¿Cuáles son los factores no controlables o de ruido?
Condiciones ambientales
Estado del suelo
Luz del sol
¿Cuáles son las unidades experimentales?
10 parcelas de terreno
Análisis de varianza (ADEVA)
Analiza la variabilidad de los datos, mediante una tabla en la que se identifican las fuentes de variabilidad, pues descompone la varianza en sus fuentes. Generalmente, la primera fuente de variabilidad de los datos se debe al tratamiento que se les aplica. Otra fuente de variabilidad, y que siempre está presente, es el error.
Fuente de
variabilidad
Suma de
cuadrados (SC)
Grados de
libertad (GL)
Cuadrados
medios (SC/GL)
Fo
p – value
Tratamiento
SCTr
k – 1
CMTr
CMTr/ CME
F > Fo
Error
SCE
N – k
CME


Total
SCT
N – 1



La prueba ANOVA consiste en:
Plantear una hipótesis nula (Hn) y una hipótesis alternativa (Ha). La primera plantea que las medias de cada tratamiento son iguales, mientras que la hipótesis alternativa indica que por lo menos una pareja de medias es diferente.
Hnμ1=μ2=…=μnHaμ1 μ2
Seleccionar el nivel de significancia o de confianza. Significancia es el porcentaje de confianza respecto al experimento, 95% generalmente. En diseño experimental se recomienda trabajar al 99% de confianza únicamente cuando la obtención de los datos es extremadamente costoso.
Determinar el factor estadístico Fo. Si Fo > F, se rechaza la hipótesis nula y se acepta la hipótesis alternativa, de modo que al menos una pareja de medias es distinta, y los resultados son estadísticamente diferentes. Por el contrario, si Fo < F, se rechaza la hipótesis alternativa y se acepta la hipótesis nula, es decir, se afirma que los resultados son estadísticamente iguales (o que no existe diferencia estadísticamente significativa).
Fo se calcula y F se encuentra en tablas, en función del número de grados de libertad en el tratamiento (numerador) y en el error experimental (denominador). Los grados de libertad se relacionan con el número de tratamientos (k) y el número total de datos (N).
SCTotal=x2-x2N
SCTratamientos=TC2nC-x2NTCi=xjTratamiento i
SCError=SCTratamientos-SCTotal
Donde TC es la suma de las réplicas de cada tratamiento (x1+x2+…+xnC) y nC es el número de réplicas (número de veces que se repite cada tratamiento); N es el número total de datos y x son las observaciones (cada uno de los datos). SCError es el error experimental, y a éste nunca se lo puede eliminar (es sospechoso cuando un resultado se reporta con ±0). Para disminuir el error experimental, simplemente se aumenta el número de réplicas.
La suma de cuadrados total representa las desviaciones de todas las observaciones respecto a la media global. La suma de cuadrados de los tratamientos mide la desviación de cada uno de sus datos respecto a la media de cada tratamiento.
Todo esto puede desarrollarse en el programa StatGraphics. Para esto (aplicándolo al ejemplo de las pruebas con alcohol):
Improve
Experimental Design Creation
Create New Design
Single Factor Categorical
No. of Response Variables: 1 (en este caso)
OK. Entonces aparecerá la siguiente ventana:

Name: Dosis de alcohol Primer factor (el único en este caso)
No. of levels: 4 Número de tratamientos
Units or comment: (mL) Unidades del factor
OK. Entonces aparecerá la siguiente ventana:

Name: Tiempo Primera variable de respuesta (la única en este caso)
Units or comment: (s) Unidades de la variable
OK. Entonces aparecerá la siguiente ventana:

Replicate Design: 4 Número de réplicas menos uno, ya que para el programa uno de los datos en cada tratamiento no es réplica sino testigo.
Desactivar la casilla de verificación de Randomize.
OK. Entonces aparecerá la siguiente ventana:

Cabe indicar que normalmente, antes de ejecutar el experimento, se lo aleatoriza, a fin de disminuir el error experimental, evitar fuentes de variabilidad adicionales y hacer que los datos sean independientes entre sí. Es decir, no se debe correr en orden los tratamientos, y lo mismo respecto a las repeticiones. Randomize permite aleatorizar los resultados, pero la obtención de los mismos debió resultar previamente de un procedimiento aleatorio.
Entonces, en la ventana se ingresan los datos de cada tratamiento. Posteriormente se ordena al programa que desarrolle el análisis ADEVA, para lo cual:
Experimental Design Analysis
Analyze Design

Data: Tiempo
OK. Entonces aparecerá la siguiente ventana, con los resultados:

Diseños con un solo factor de diseño
Diseño completamente al azar con un solo factor
Diseño de un solo factor que sirve para comparar dos o más tratamientos. Normalmente cuando se tiene más de dos tratamientos se procede con la prueba estadística "T de Student", pero se debe desarrollar sobre cada pareja de tratamientos (y en todas las combinaciones). Para evitar esto, se procede con un modelo estadístico del diseño.
En los diseños de un solo factor se tiene dos fuentes de variabilidad:
Tratamientos
Error experimental
En el diseño completamente al azar con un solo factor, el modelo estadístico del diseño indica que la observación es igual a la media global más las fuentes de variabilidad. Así, se logra un modelo estadístico matemático para ajustar los resultados y encontrar qué responde mejor a los mismos. Se debe aclarar que el diseño experimental no sirve para analizar datos (la estadística es la herramienta que hace esto), sino ayuda a planificar el experimento y, según éste, obtener datos a ser analizados por la estadística.
Si la variabilidad debida al tratamiento es igual a la variabilidad debida al error, el tratamiento no tiene efecto. Si la variabilidad debida al tratamiento es mucho mayor a la variabilidad debida al error (que siempre va a presentarse), entonces se considera que el error debido al tratamiento es estadísticamente significativo. Esto se comprueba por medio de la aplicación del análisis ADEVA.
El objetivo del análisis de varianza (ADEVA) es probar la hipótesis de igualdad de los tratamientos. Para esto, se trabaja sobre la hipótesis alternativa y la hipótesis nula, explicadas anteriormente, pero aplicadas a tratamientos.
Se investiga el efecto de cuatro métodos de ensamble (A, B, C y D) sobre el tiempo de ensamble en minutos. Se obtuvieron los siguientes resultados:
Repetición
Método

A
B
C
D
1
6
7
11
10
2
8
9
16
12
3
7
10
11
11
4
8
8
13
9
Factor: Métodos de ensamble
Variable de salida: Tiempo de ensamble en min (La variable ayuda a medir el efecto)
Ingresando los datos en el programa StatGraphics, se obtienen los siguientes resultados:
Tabla 1. Resultados del ADEVA
Source
Sum of Squares
Df
Mean Square
F-Ratio
P-Value
Between groups
69,5
3
23,1667
9,42
0,0018
Within groups
29,5
12
2,45833


Total (Corr.)
99,0
15



Como se trabaja a 95% de confianza, valores P menores a 0,05 indican significancia estadística o diferencia estadísticamente significativa: se rechaza la hipótesis nula y se acepta la hipótesis alternativa, es decir, sí son diferentes los tratamientos. Si se trabajara a 99% de confianza, el valor de P debe ser mayor a 0,01 para aceptar la hipótesis nula.
En este caso, P es menor a 0,05, de modo que se acepta la hipótesis alternativa que dice que existe una diferencia estadísticamente significativa en la variable de salida debido a los tratamientos. Por lo tanto, en este caso se concluye que los métodos tienen efectos significativos sobre la variabilidad de los datos o existe una diferencia estadísticamente significativa en el tiempo (variable de salida) debida al método de ensamble (tratamiento).
El gráfico de caja y bigotes es una apreciación visual del comportamiento de los datos respecto a su distribución, pero no indica nada estadísticamente. Con este gráfico se puede comprobar qué tratamiento tiene mayor variabilidad, es decir, los datos más dispersos. También permite identificar valores atípicos.

StatGraphics, > Ícono Graphs > Box – and – Whisker Plot
Este gráfico adicionalmente da una idea general acerca de qué tratamientos son iguales y cuáles son diferentes, pues los tratamientos iguales se traslapan (comparten un área). Por ejemplo, en este caso se puede pensar que los tratamientos 1 y 2 son estadísticamente iguales, pues tienes áreas en común. Sin embargo, no se puede concluir nada estadísticamente, ya que únicamente es una apreciación visual.
Para identificar realmente que tratamientos son estadísticamente iguales (o estadísticamente diferentes) se procede con pruebas estadísticas.

StatGraphics, > Ícono Graphs > Means Plot
A partir de este gráfico, que está construido con pruebas estadísticas, se puede hacer inferencias estadísticas. Tratamientos que se traslapan son estadísticamente iguales, y tratamientos que no tienen ninguna área en común son estadísticamente diferentes. Asimismo, se puede discriminar cuál es el mejor tratamiento (el que implica el menor tiempo de ensamblaje, por ejemplo). En este caso, los tratamientos 1 y 2 son estadísticamente iguales, de modo que si el método 1 implica el menor tiempo de ensamblaje, sucede lo mismo para el 2 (pese a que aparentemente el método 2 implica un tiempo mayor).
Entre los métodos 3 y 4 la zona de traslape es bastante pequeña, por lo tanto no hay demasiada seguridad respecto a su igualdad estadística. Cuando eso sucede, se corren otras pruebas para mejorar esa zona, o se acude a la tabla "Multiple Range Tests" (del ícono Tables), en la que se indican qué par de tratamientos son estadísticamente diferentes (las que tienen asterisco rojo) o estadísticamente iguales (sin asterisco).
Tabla 2. Multiple Range Tests for Tiempo by Métodos de ensamble
Método LSD
Contrast
Sig.
Difference
+/- Limits
1 – 2

-1,25
2,41561
1 – 3
*
-5,5
2,41561
1 – 4
*
-3,25
2,41561
2 – 3
*
-4,25
2,41561
2 – 4

-2,0
2,41561
3 – 4

2,25
2,41561
* Estadísticamente diferentes
Para la comparación entre parejas de tratamientos, en base a la media de cada tratamiento, se procede con un contraste de rangos múltiples. El número de parejas de medias que se deben comparar se aplica la fórmula:
kk-12
Es decir, 6 parejas en el caso de los métodos de ensamblaje.
1 – 2, 1 – 3, 1 – 4, 2 – 3, 2 – 4, 3 – 4
Para proceder con el contraste de rangos múltiples, primero se calcula la diferencia entre las medias de cada par de tratamiento.
Tabla 3. Medias de cada tratamiento



Stnd. error


Level
Count
Mean
(pooled s)
Lower limit
Upper limit
1
4
7,25
0,783954
6,0422
8,4578
2
4
8,5
0,783954
7,2922
9,7078
3
4
12,75
0,783954
11,5422
13,9578
4
4
10,5
0,783954
9,2922
11,7078
Total
16
9,75



1-21-3 =-1,25 =-5,51-42-3 =-3,25 =-4,252-43-4 =-2,0 =2,25
Una vez que se ha determinado que los tratamientos son diferentes (rechazo de hipótesis nula en el ADEVA), se procede con el método LSD (Diferencia Media Significativa), para lo cual se saca el valor absoluto de cada diferencia en los pares de tratamientos y se lo compara con el valor mínimo para que la diferencia sea significativa, el cual se calcula con la siguiente fórmula:
LSD=tα2;GLE 2 CMEn
Donde α es el grado de significancia del error (0,05), n es el número de repeticiones, GLE es el número de grados de libertad del error y CME es el cuadrado medio del error (Source Within groups).
t0,025;12=2,178
LSD=2,178 2 2,458334 LSD=2,4147
Si el valor absoluto de la diferencia entre las medias del par de tratamientos es menor al LSD, se afirma que los valores son iguales, caso contrario son diferentes (marcados con asteriscos rojos en la Multiple Range Tests). En base a estos resultados, se construye la gráfica de medias, y por eso se pueden obtener conclusiones estadísticas de la tabla de medias.
Cuando el diseño es no balanceado (es decir, que no se ha desarrollado el mismo número de repeticiones para cada tratamiento), se utiliza otra fórmula para calcular el LSD.
El método de Tukey es otro método de contraste de rangos múltiples. Consiste en comparar las diferencias entre medias con un valor mínimo. Este método es más conservador, pero de menor potencia que la LSD, pues no detecta diferencias pequeñas, de modo que siempre se debe utilizar un método de mayor potencia para discriminar entre diferencias pequeñas (LSD y el método de Duncan).
Tabla 4. Multiple Range Tests for Tiempo by Métodos de ensamble
Método Tukey HSD
Contrast
Sig.
Difference
+/- Limits
1 – 2

-1,25
3,30159
1 – 3
*
-5,5
3,30159
1 – 4

-3,25
3,30159
2 – 3
*
-4,25
3,30159
2 – 4

-2,0
3,30159
3 – 4

2,25
3,30159
* Estadísticamente diferentes
Clic derecho > Pane Options (Multiple Range Test Options) > Tukey HSD
Diseño de bloques (o de bloqueo) completamente al azar
Cuando se tiene factores adicionales al factor de diseño, que se conoce que posiblemente generan variabilidad y que no se pueden controlar (factores no controlables), entonces aparece el diseño de bloqueo, siendo el factor no controlable el factor de bloqueo. En este caso, nuevamente se tiene un único factor de diseño. Cabe indicar que todos los factores tienen que ser medibles.
Por ejemplo, en los experimentos con animales, factores de bloqueo son las características del animal, los proveedores, los turnos, el lote, el tipo de material, las líneas de producción, el operador, la máquina, los días (desarrollar una prueba en distintos días), el método de trabajo, entre otros. Cuando no se puede hacer nada al respecto con estos factores, entonces se los bloquea. El sexo y la edad son algunos factores de bloqueo en el ejercicio de las dosis de alcohol.
Hay un sinnúmero de acciones para disminuir el efecto de los factores no controlables, pero generalmente no son prácticos. Por ejemplo, si se tiene cuatro máquinas que trabajan de la misma forma pero son manejadas por cuatro operadores que trabajan de distinta forma, se puede minimizar la variabilidad en los datos automatizando los equipos, haciendo que el mejor de los trabajadores maneje la misma máquina, entre otras.
En este contexto, la estadística surge como una herramienta para verificar si un factor de bloqueo le imprime variabilidad a los resultados. Por eso, es mejor incluir a la fuente adicional de variabilidad en el análisis. Así, las conclusiones que se saquen del experimento van a incluir esa fuente de variabilidad, de modo que el ejemplo no importa si se cambia a los operarios. También es recomendable incluir el factor de bloqueo día en el análisis.
El modelo estadístico del diseño de bloqueo es el modelo al que se ajustan los diseños anteriores, sólo que en este caso se introduce un nuevo factor que genera variabilidad. De este modo, en la ecuación se va a tener un nuevo término que considera el efecto debido al bloqueo. Así, a veces se efectúan diseños de bloqueo (o de bloques) para comprobar si el modelo está o no correctamente planteado.
Normalmente, un diseño de bloques no se puede aleatorizar. Sólo basta con pensar en el factor día, el cual obviamente no se puede aleatorizar (el jueves es el jueves, y no es posible asignar el dato del jueves al viernes). Lo que se hace más bien es fijar cada bloque, y aleatorizar los valores dentro de cada bloque. Es decir, el diseño completo no se puede aleatorizar.
En el diseño de bloques también se manejan las hipótesis nula y alternativa. Pero hay dos hipótesis adicionales que tienen que ver con el factor de bloqueo: hipótesis nula (el efecto por el factor de bloqueo es igual a cero) o hipótesis alternativa (sí hay efecto por el factor de bloqueo). Cabe indicar que éste es un diseño de un solo factor, que es el de interés, y no de dos o más. Únicamente se están añadiendo fuentes de variabilidad.
En StatGraphics se especifica que se va a bloquear un factor cuando se decide el tipo de diseño (en la opción crear diseño). Para eso, se procede de la siguiente manera:
Improve Experimental Design Creation Create New Design
Single factor categorical OK
En Single Factor Categorical Design Options (Desing Type), seleccionar:
Randomize block (1 blocking factor)
Desactivar la casilla de verificación de Randomize
Number of blocks: Número de opciones para el bloque
OK

Se sospecha que, además del método de ensamble, los operarios le imprimen variabilidad a los datos: tiempo que toma ensamblar las piezas.
Método
Operador

1
2
3
4
A
6
9
7
8
B
7
10
11
8
C
10
16
11
14
D
10
13
11
9
Aplicando el diseño de bloques completamente al azar al ejercicio del método de ensamble, y considerando como factor de bloqueo al operador, determinar si este factor influye en los resultados.
En este caso, cada bloque es cada operario, de modo que se tienen cuatro bloques (Number of blocks: 4). Por otro lado, se tiene una réplica en cada caso, pues si cada operador va a aplicar un método una vez, el experimento se repite una sola vez.

Cuando se analiza el diseño, en el ANOVA aparece una nueva fuente de variabilidad: el bloque (Block), además del método (en este caso).
Tabla 5. Analysis of Variance for Tiempo - Type III Sums of Squares
Source
Sum of Squares
Df
Mean Square
F-Ratio
P-Value
MAIN EFFECTS





A:Método
61,5
3
20,5
10,25
0,0029
B:BLOCK
28,5
3
9,5
4,75
0,0298
RESIDUAL
18,0
9
2,0


TOTAL (CORRECTED)
108,0
15



En este caso, P – Value es menor a 0,05 para el factor de diseño (método), de modo que se rechaza hipótesis nula, se acepta la hipótesis alternativa y se concluye que sí existe efecto estadísticamente significativo del método que se está utilizando. Respecto al bloque, P – Value también es menor a 0,05, de modo que el factor operario está generando variabilidad en los resultados, es decir, el operador sí provee de datos estadísticamente diferentes.
Respecto a F – Ratio, el que tiene el mayor valor siempre es el factor más importante a analizar. En este caso, la variabilidad es mayor debido al método que al operario, a pesar de que el segundo sí genera variabilidad. Es decir, el método es el más importante.

En el gráfico de medias debido al método se observa que el método 1 es el mejor. Pero éste es estadísticamente igual al método 2, de modo que el método 1 y el método 2 son los mejores. y para seleccionar entre éstos se deberán considerar otros factores como el precio, la factibilidad tecnológica, entre otros.
En Pane Options (click derecho sobre el gráfico) se selecciona BLOCK, en Factor, y se obtiene el gráfico de medias del factor que se bloqueó. Entonces, en este caso, se puede saber cuál es el operario que está causando problemas.


En este ejemplo, el operario 2 es el que se demora más tiempo, mientras que el operario 1 es el mejor. Así, las gráficas de medias permiten descubrir falencias y encontrar soluciones, además de ser bastante útiles para un control de calidad. En este caso, es necesario capacitar o reentrenar al operario 2, que es el que está fallando.
En cuanto a la prueba de contraste de rangos múltiples, se obtuvieron los siguientes resultados:
Tabla 6. Multiple Range Tests for Tiempo by Método
Method: 95,0 percent LSD
Método
Count
LS Mean
LS Sigma
Homogeneous Groups
1
4
7,5
0,707107
X
2
4
9,0
0,707107
XX
4
4
10,75
0,707107
XX
3
4
12,75
0,707107
X
Contrast
Sig.
Difference
+/- Limits
1 - 2

-1,5
2,26216
1 - 3
*
-5,25
2,26216
1 - 4
*
-3,25
2,26216
2 - 3
*
-3,75
2,26216
2 - 4

-1,75
2,26216
3 - 4

2,0
2,26216
* denotes a statistically significant difference
Este análisis, a diferencia del anterior, ya incluye la posible fuente de variabilidad bloqueada. Así, se puede comprobar si el factor que se sospechaba que imprimía variabilidad a los resultados en realidad está haciendo eso. Luego se puede analizar a los datos sin considerar al factor bloqueado, en caso de que no constituya una fuente de variabilidad.
El factor de bloqueo es un factor secundario que puede estar generando variabilidad en los datos. Es un factor secundario porque no está influyendo directamente en el proceso, no es un factor del proceso. Puede ser la variabilidad de la materia prima.
Diseño de bloques de Cuadro latino
Tiene dos factores de bloqueo. Es decir, sigue teniéndose un solo factor de diseño pero dos fuentes de variabilidad. Se llama "cuadro" porque para este diseño debe haber el mismo número de niveles para cada factor, pues se va a construir un cuadrado, y "latino" porque se utilizan letras latinas para simbolizar cada tratamiento.
Estos cuadros latinos ya vienen estandarizados, ya que la distribución debe estar totalmente aleatorizada. Entonces, en éstos solo se completa la matriz, según lo que se indica.
En el cuadro de diálogo de Single Factor Categorical Design Options de StatGraphics se selecciona Latin square (2 blocking factors) para proceder con el análisis por cuadro latino.

Entonces se definen los dos factores de bloqueo (B y C). La opción de número de niveles está bloqueada, ya que como se indicó anteriormente éstos deben ser iguales al número del factor de diseño.

StatGraphics genera automáticamente el cuadrado latino normalizado. Sin embargo, para ingresar los datos normalmente el programa utiliza otra nomenclatura, además de que a veces el cuadro latino del ejercicio es distinto al que se genera en StatGraphics. En ese caso, el cuadro latino que se modifica es el de StatGraphics.
A – 1 B – 2 C – 3
I – 1 II – 2 III – 3
1 – 1 2 – 2 3 – 3
Se tiene tres proveedores de cierto material: A, B y C. Se comprueba el peso de este material, para lo cual se pone tres inspectores que toman el peso de muestras al azar de cada lote, a fin de asegurar que el proveedor está vendiendo la cantidad que él indica. Para esto se tiene tres diferentes balanzas. El experimento se lleva a cabo con el siguiente cuadro latino:
Factor de diseño: Proveedor
Unidad experimental: Muestras de sacos que se van a tomar para pesar
Variable de salida: Peso
Número de réplicas: 1 (0 en StatGraphics)
Como se tienen tres inspectores con tres balanzas distintas, los factores de bloqueo son los inspectores y las balanzas, ya que se sospecha que éstos están generando variabilidad en los resultados.

Balanza
Inspector
1
2
3
I
A = 16
B = 10
C = 11
II
B = 15
C = 9
A = 14
III
C = 13
A = 11
B = 13
¿Hay diferencia entre los proveedores?
¿Hay diferencia entre los inspectores y las escales?

Tabla 7. Analysis of Variance for Peso - Type III Sums of Squares
Source
Sum of Squares
Df
Mean Square
F-Ratio
P-Value
MAIN EFFECTS





A:Proveedor
10,8889
2
5,44444
49,00
0,0200
B:Inspector
0,222222
2
0,111111
1,00
0,5000
C:Balanza
32,8889
2
16,4444
148,00
0,0067
RESIDUAL
0,222222
2
0,111111


TOTAL (CORRECTED)
44,2222
8



El valor P para los proveedores es menor a 0,05, de modo que sí hay diferencia estadísticamente significativa para éstos, lo que implica que sí hay variabilidad en la masa de producto recibida en función de los proveedores. El valor P de los inspectores no es menor a 0,05, de modo que no hay diferencia estadísticamente significativa entre los inspectores y, por lo tanto, éstos no proporcionan variabilidad. En cuanto a las balanzas, P es menor a 0,05, de modo que éstas son estadísticamente distintas y por tanto no están entregando datos iguales. Según F – Ratio, de todos estos factores, la balanza es la más importante.

En cuanto al gráfico de medias, se observa que los proveedores 1 y 2 son estadísticamente iguales. Considerando que el peso entregado debe ser 15 g, y que los proveedores 1 y 2 son iguales, ya que no hay diferencia estadísticamente significativa entre ellos, el mejor proveedor son A o B con un 95% de confianza (y no solamente A). El peor proveedor es el proveedor C, el cual está vendiendo en promedio 11 g.
Tabla 8. Multiple Range Tests for Peso by Proveedor
Method: 95,0 percent LSD
Proveedor
Count
LS Mean
LS Sigma
Homogeneous Groups
3
3
11,0
0,19245
X
2
3
12,6667
0,19245
X
1
3
13,6667
0,19245
X
Contrast
Sig.
Difference
+/- Limits
1 - 2

1,0
1,17103
1 - 3
*
2,66667
1,17103
2 - 3
*
1,66667
1,17103
Cuando uno de los factores de bloque no es significativo, se lo elimina y se repite el análisis correspondiente, eliminando dicho factor de bloqueo.
Para visualizar resultados respecto a otros factores, en el gráfico de medias se hace click derecho y se selecciona Pane options. Lo mismo en la ventana de Multiple Range Tests.


Así, se conoce que la mejor balanza es la número 1.
Tabla 9. Multiple Range Tests for Peso by Balanza
Method: 95,0 percent LSD
Balanza
Count
LS Mean
LS Sigma
Homogeneous Groups
2
3
10,0
0,19245
X
3
3
12,6667
0,19245
X
1
3
14,6667
0,19245
X
Contrast
Sig.
Difference
+/- Limits
1 - 2
*
4,66667
1,17103
1 - 3
*
2,0
1,17103
2 - 3
*
-2,66667
1,17103
La mejor balanza es la 1, pues es la única que está trabajando dentro del rango. Las balanzas 2 y 3 deben mandarse a calibrar, pues están reportando valores muy bajos.

Balanza
Inspector
1
2
3
I
A = 16
B = 10
C = 11
II
B = 15
C = 9
A = 14
III
C = 13
A = 11
B = 13
Repitiendo el análisis, pero eliminando el factor de bloqueo inspector, se tiene lo siguiente:
Número de réplicas: 0
Número de bloques: 3 (balanza 1, balanza 2 y balanza 3)

Proveedor
Balanza
A
B
C
1
16
15
13
2
11
10
9
3
14
13
11

Tabla 10. Analysis of Variance for Peso - Type III Sums of Squares
Source
Sum of Squares
Df
Mean Square
F-Ratio
P-Value
MAIN EFFECTS





A:Proveedor
10,8889
2
5,44444
49,00
0,0015
B:BLOCK
32,8889
2
16,4444
148,00
0,0002
RESIDUAL
0,444444
4
0,111111


TOTAL (CORRECTED)
44,2222
8



Por lo tanto, eliminado el factor inspector, se observa una diferencia estadísticamente significativa entre los proveedores A y B. El mejor proveedor es el proveedor 1 (A), con una media de 13,6667.
Tabla 11. Table of Least Squares Means for Peso with 95,0% Confidence Intervals



Stnd.
Lower
Upper
Level
Count
Mean
Error
Limit
Limit
GRAND MEAN
9
12,4444



Proveedor





1
3
13,6667
0,19245
13,1323
14,201
2
3
12,6667
0,19245
12,1323
13,201
3
3
11,0
0,19245
10,4657
11,5343
BLOCK





1
3
14,6667
0,19245
14,1323
15,201
2
3
10,0
0,19245
9,46567
10,5343
3
3
12,6667
0,19245
12,1323
13,201
Se quiere comparar dietas (A, B, C) a base de proteína de origen vegetal utilizando 18 ratas de laboratorio de una misma camada (garantiza la edad). Primero se observa por un tiempo el apetito para formar tres grupos de seis ratas, según su voracidad, y cada uno de estos grupos se clasifica a su vez en tres grupos de dos ratas, de acuerdo a su peso inicial. Se plantea un experimento donde la variable de respuesta es el peso en gramos ganados por las ratas de cierto período, con los siguientes resultados:
Apetito
Peso inicial
A1
A2
A3
P1
67 (C)
105 (A)
95 (B)

72
112
86
P2
85 (A)
75 (B)
88 (C)

98
67
110
P3
66 (B)
68 (C)
108 (A)

47
91
120
Factor: Dieta
Unidades experimentales: Grupos de ratas
Variable de salida: Ganancia del peso de las ratas
Factores de bloqueo: Voracidad de las ratas y peso inicial
¿Cuáles son los factores que influyen? Es decir, determinar si hay diferencia estadísticamente significativa entre los datos debido a los distintos factores.
Primero, siempre iniciar con un análisis ANOVA, a fin de determinar si hay diferencia estadísticamente significativa, y a partir de ahí proceder con el análisis de las gráficas. Pero si no hay diferencia estadísticamente significativa, no tiene sentido continuar.
Tabla 12. Analysis of Variance for Aumento en el peso - Type III Sums of Squares
Source
Sum of Squares
Df
Mean Square
F-Ratio
P-Value
MAIN EFFECTS





A:Dieta
3216,0
2
1608,0
17,95
0,0003
B:Apetito
2466,33
2
1233,17
13,77
0,0010
C:Peso inicial
116,333
2
58,1667
0,65
0,5413
RESIDUAL
985,333
11
89,5758


TOTAL (CORRECTED)
6784,0
17



En este caso, no coincide el cuadro latino generado en el ejercicio con el presentado en StatGraphics. En ese caso, se modifica el de StatGraphics (ya que no se puede modificar el experimento desarrollado).
RéplicaRéplica
Réplica
Réplica
Según el análisis estadístico, los factores que tiene influencia estadísticamente significativa en el peso ganado por las ratas son: la dieta y el apetito. O dicho de otro modo: de acuerdo al análisis estadístico, los factores que tienen influencia estadísticamente significativa son la dieta y la voracidad. También del análisis estadístico se deduce que el factor peso inicial no tiene una influencia estadísticamente significativo en la ganancia de peso de las ratas.

Tabla 13. Multiple Range Tests for Aumento en el peso by Dieta
Method: 95,0 percent LSD
Dieta
Count
LS Mean
LS Sigma
Homogeneous Groups
2
6
72,6667
3,86384
X
3
6
82,6667
3,86384
X
1
6
104,667
3,86384
X
Contrast
Sig.
Difference
+/- Limits
1 - 2
*
32,0
12,0269
1 - 3
*
22,0
12,0269
2 - 3

-10,0
12,0269
Del gráfico de medias se observa que la dieta que produce la mayor ganancia de peso en las rayas es la dieta A.
Apetito
Dieta

A
B
C
A1
67
66
67

72
47
72
A2
68
75
68

91
67
91
A3
88
95
88

110
86
110
Diseño de bloques de Cuadro grecolatino
Cuando se trata de tres factores de bloqueo, se tiene un cuadro grecolatino, conocido así porque se utilizan letras griegas para los factores del tercer nivel de bloqueo, y letras latinas para los factores del segundo nivel de bloqueo.
Una compañía distribuidora está interesada en estudiar la diferencia en costos (tiempo y gasolina) entre las cuatro rutas que llevan a la zona comercial más importante para ellos en el otro extremo de la ciudad. Decide correr un experimento considerando los siguientes factores de bloqueo: chofer, marca del vehículo, y día de la semana. El experimento se repite dos semanas diferentes en las cuales no hay días festivos ni quincenas. Los costos observados se muestran en la siguiente tabla:
Chofer/Día
Lunes
Martes
Miércoles
Jueves
Carlos
(D, α)
825, 750
(C, χ)
585, 610
(B, β)
550, 580
(A, δ)
580, 650
Enrique
(A, χ)
650, 725
(B, α)
540, 560
(C, δ)
580, 635
(D, β)
850, 770
Genaro
(C, β)
700, 675
(D, δ)
650, 740
(A, α)
635, 540
(B, χ)
450, 550
Luis
(B, δ)
475, 480
(A, β)
560, 615
(D, χ)
650, 725
(C, α)
670, 730
Variable de respuesta: Costo
Factor de diseño: Ruta
Niveles: 4 niveles: Ruta A, Ruta B, Ruta C, Ruta D
Nomenclatura utilizada para el cuadro grecolatino:
A – 1 Carlos – 1 α – 1 Lunes – 1
B – 2 Enrique – 2 β – 2 Martes – 2
C – 3 Genaro – 3 χ – 3 Miércoles – 3
D – 4 Luis – 4 δ – 4 Jueves – 4

En StatGraphics no importa el orden de los factores de bloqueo. Igualmente, cuando StatGraphics crea el cuadro grecolatino, no necesariamente éste coincide con el cuadro en el que se reportan los resultados. Por eso, se lo debe modificar.
Tabla 14. Analysis of Variance for Costo - Type III Sums of Squares
Source
Sum of Squares
Df
Mean Square
F-Ratio
P-Value
MAIN EFFECTS





A:Ruta
200221,
3
66740,4
29,20
0,0000
B:Chofer
13164,8
3
4388,28
1,92
0,1607
C:Día
18902,3
3
6300,78
2,76
0,0708
D:Marca del auto
22414,8
3
7471,61
3,27
0,0439
RESIDUAL
43433,6
19
2285,98


TOTAL (CORRECTED)
298137,
31



El P – Value de la Tabla ANOVA es menor a 0,05 para la ruta, de modo que sí existe diferencia estadísticamente significativa para el factor ruta. Es decir, la ruta seleccionada sí influye en el costo que implica el transporte de las mercancías entre la compañía distribuidora y la zona comercial más importante. En conclusión: sí hay diferencia entre las rutas.
De los factores de bloqueo, la marca del auto tiene influencia en el costo, pues hay diferencia estadísticamente significativa para este factor. Entre los choferes no hay diferencia significativa estadísticamente, ya que el valor P es mayor a 0,05.
Por lo tanto, la ruta que más conviene es la 2. Cabe indicar que ésta no es la ruta más óptima, sino la mejor entre las opciones que se están comparando. La mejor es la ruta B porque es la más económica. La peor ruta es la 4, pues es la que más dinero le cuesta a la empresa según la gráfica de medias.

Tabla 15. Multiple Range Tests for Costo by Ruta
Method: 95,0 percent LSD
Ruta
Count
LS Mean
LS Sigma
Homogeneous Groups
2
8
523,125
16,9041
X
1
8
619,375
16,9041
X
3
8
648,125
16,9041
X
4
8
745,0
16,9041
X
Contrast
Sig.
Difference
+/- Limits
1 – 2
*
96,25
50,0358
1 – 3

-28,75
50,0358
1 – 4
*
-125,625
50,0358
2 – 3
*
-125,0
50,0358
2 – 4
*
-221,875
50,0358
3 – 4
*
-96,875
50,0358

Las rutas 1 y 3 son estadísticamente iguales.

Tabla 16. Multiple Range Tests for Costo by Marca del auto
Method: 95,0 percent LSD
Marca del auto
Count
LS Mean
LS Sigma
Homogeneous Groups
4
8
598,75
16,9041
X
3
8
618,125
16,9041
XX
1
8
656,25
16,9041
X
2
8
662,5
16,9041
X
Contrast
Sig.
Difference
+/- Limits
1 – 2

-6,25
50,0358
1 – 3

38,125
50,0358
1 – 4
*
57,5
50,0358
2 – 3

44,375
50,0358
2 – 4
*
63,75
50,0358
3 – 4

19,375
50,0358
En el caso del vehículo, no se puede saber cuál es el peor, ya que aparentemente hay una zona de traslape entre los cuatro vehículos. Los factores de bloque que valió la pena tomar en el experimento son los significativos, es decir, la marca del vehículo.
Se impidieron días festivos y quincenas en el experimento a fin de evitar imprimir variabilidad en el experimento, introduciendo valores extremos. En estos días, el costo va a ser mayor, ya que el tráfico aumenta y por tanto el gasto de combustible.
Recodar que las etapas de un diseño experimental son las siguientes:
Planificación
Identificación del problema
Planteamiento del problema
Formulación de hipótesis
Selección y diseño del procedimiento experimental
Tamaño
Proceso
Características del procesamiento
Diseño experimental para ejecutar el procedimiento
Diseño del muestreo
Establecimiento de preliminares (Variables a considerar)
Ejecución
Procesamiento
Conclusiones
Recomendaciones
Diseños factoriales
Hasta el momento se han visto diseños de un solo factor, con hasta tres factores de bloqueo. En el diseño factorial se pueden tener más de un factor. Se aconseja siempre seleccionar el modelo más sencillo, de modo que en base a revisión bibliográfica eliminar la mayor cantidad de factores posibles. Mientras más grande es el diseño, más repeticiones, más tiempo y más dinero.
En el caso de los diseño factoriales se debe considerar la posible interacción entre los factores. Estos diseños sirven para encontrar o determinar la combinación óptima de niveles cuando se tienen diseños factoriales para optimizar. No todos los diseños factoriales se optimizan, ya que determinar las mejores condiciones no implica optimizar.
En este caso se busca la mejor combinación de factores para optimizar el proceso. Existen modelos específicos para esto.
Los factores y variables utilizadas en diseños factoriales son de los tipos que se han visto hasta el momento: cuantitativas y cualitativas. En el diseño factorial se puede ver el efecto individual de cada factor. Efecto principal es el efecto que cada una de las variables de diseño tiene sobre cada una de las variables de respuesta al cambiar el nivel. Dado que hay factores que pueden interactuar, se evalúa el efecto de interacción, que resulta de la combinación de los dos parámetros de diseño, y se evalúa cómo interactúan los factores entre sí para tener un efecto en la variable de salida.
Cada uno de los factores tiene diferentes niveles, y el número de tratamientos se obtiene al multiplicar el número de niveles de cada uno de los factores (a × b tratamientos, donde a es el número de niveles del factor A y b el número de niveles del factor B). Lo mismo para diseños con más de dos factores.
Cuando el diseño factorial es de dos factores se llama "diseño factorial A × B". Si el número de niveles de los factores A y B son iguales, el diseño se denota como el número de niveles tanto del factor A como el factor B elevado al número de factores (2 en este caso). El número total de tratamientos se calcula a partir del nombre de diseño, y en este valor no se considera el número de repeticiones. Así, el número total de tratamientos es en realidad el producto de los niveles de todos los factores por el número de réplicas. Dado que se está hablando de funciones exponenciales, se nota la importancia de trabajar con el diseño más sencillo. Cabe indicar que todos los tratamientos deben desarrollarse aleatoriamente, para no tener tendencia en los resultados.
Si el número de niveles de un diseño factorial A × B × C es dos para cada factor, el diseño se llama "diseño factorial 23", y si es tres para cada factor, el diseño se llama "diseño factorial 33". Es decir, la base es el número de niveles y el exponente es el número de factores
Cuando se representa un factor en función del otro (diseño factorial A × B), cada uno de los puntos representa un tratamiento porque son todas las combinaciones posibles. Existen diseños experimentales en los que se puede correr el punto central tres veces en lugar de los tratamientos que lo rodean. "Diseño factorial 33 con puntual centro". Si el punto central sale bien, es decir reproducible, está bien la repetición. Un diseño experimental con puntual centro indica que se corre tres veces el punto central, y ya no se tiene que repetir tres veces los tratamientos que rodean a dicho punto central.
Para el modelo estadístico, se debe considerar el efecto del factor A, el efecto del factor B y la interacción entre estos factores. Igualmente para el error. Así, el modelo estadístico del diseño experimental factorial A × B es:
yij=μ+αi+βj+αβij+εij εiεj
Variable de salida igual a la medida más la variabilidad debida a cada uno de los factores más la variabilidad debido a las todas interacciones posibles y más el error experimental. Así, para un diseño experimental de tres factores se tiene que:
yijk=μ+αi+βj+γk+αβij+αγik+βγjk+αβγijk+εijk εiεjεk
Los datos recogidos en la siguiente tabla corresponden al tiempo de supervivencia (variable de salida) de animales a los que se sometió a tres venenos y cuatro antídotos. Se pretende estudiar qué antídoto es el adecuado para cada veneno (factores: veneno A y antídoto, B): diseño factorial 3 × 4.
Número de repeticiones: Cuatro
Variable de salida: Tiempo
Variables de diseño: Veneno (I, II, III) y antídoto (A, B, C, D)

Tiempo (h)
Veneno
Antídoto

A
B
C
D
I
3,1
4,5
4,6
4,3
8,2
11,0
8,8
7,2
4,3
4,5
6,3
7,6
4,5
7,1
6,6
6,2
II
3,6
2,9
4,0
2,3
9,2
6,1
4,9
12,4
4,4
3,5
3,1
4,0
5,6
10,2
7,1
3,8
III
2,2
2,1
1,8
2,3
3,0
3,7
3,8
2,9
2,3
2,5
2,4
2,2
3,0
3,6
3,1
3,3
Hay el multinivel factorial y el multifactor categórico, el último cuanto se tiene baribales discretas o variables cualitativas.
Se ingresa el número de factores, y luego se definen los factores.


Se ingresa la variable de salida.

Luego el número de repeticiones, se desactiva randomize, y listo.

Entonces saldrá un cuatro con el resumen de la información obtenida, en la ventana de Multi – factor Categorical Design Attributes.
Base Design
Number of experimental factors: 2
Number of responses: 1
Number of runs: 48
Error degrees of freedom: 36
Randomized: No
Factors
Levels
Units
Veneno
3

Antídotos
4

Se procede con el análisis ANOVA como se ha hecho hasta el momento, obteniéndose:
Tabla 17. Analysis of Variance for Tiempo - Type III Sums of Squares
Source
Sum of Squares
Df
Mean Square
F-Ratio
P-Value
MAIN EFFECTS





A:Veneno
103,301
2
51,6506
23,22
0,0000
B:Antídotos
92,1206
3
30,7069
13,81
0,0000
INTERACTIONS





AB
25,0138
6
4,16896
1,87
0,1123
RESIDUAL
80,0725
36
2,22424


TOTAL (CORRECTED)
300,508
47



Por lo tanto, el factor veneno es estadísticamente significativo. Adicionalmente, se observa que no hay interacción entre los factores veneno y antídoto, de modo que no se puede encontrar la mejor combinación, es decir qué antídoto será mejor para determinado antídoto. Para analizarlos de mejor manera qué factor es el mejor, se grafica una gráfica de interacción, en la que se representa el valor de la variable de salida en función de los factores, y permite ver qué pasa cuando cambia el nivel de cada uno de los factores.


Por lo tanto, el veneno 3 es el más fuerte, el más potente, pues tiene siempre los menores tiempos de supervivencia.
En las gráficas se dice que hay interacción cuando la pendiente cambia bruscamente de un nivel a otro.
Para obtener la gráfica en función de factor Antídotos, se selecciona este factor en "Plot on Axis" de la ventana de Pane Options, que aparece cuando se da clic derecho sobre la gráfica.


El peor antídoto es el 1, pues para éste se tienen los menores tiempos de supervivencia siempre, es decir, este antídoto no funciona para ninguno de los venenos.
Se prueba tres tipos de materiales con tres tipos de temperaturas distintas (para que éstos soporten temperaturas extremas). Diseño factorial 32

Tiempo de duración efectiva de las baterías (h)
Temperatura
Material

A
B
C
-10
130
155
180
74
150
126
159
188
138
110
168
160
20
34
80
40
75
122
126
115
106
150
174
120
139
50
70
82
20
58
70
25
58
45
60
96
104
62
Base Design
Number of experimental factors: 2
Number of responses: 1
Number of runs: 36
Error degrees of freedom: 27
Randomized: No
Tabla 18. Multi-factor Categorical Design Attributes
Factors
Levels
Units
Temperatura
3
ºC
Material
3

Analysis of Variance for Tiempo de duración efectiva - Type III Sums of Squares
Source
Sum of Squares
Df
Mean Square
F-Ratio
P-Value
MAIN EFFECTS





A:Temperatura
40748,7
2
20374,4
29,86
0,0000
B:Material
9862,06
2
4931,03
7,23
0,0031
INTERACTIONS





AB
9422,11
4
2355,53
3,45
0,0211
RESIDUAL
18420,8
27
682,25


TOTAL (CORRECTED)
78453,6
35



Todo esto es estadísticamente significativo: el material, la temperatura y la interacción, de modo que al fabricante sí se le puede recomendar qué material es mejor para temperaturas altas, cuál para temperaturas medias y cuál para temperaturas altas.

Por lo tanto, para temperaturas bajas es mejor el material 2. Para la temperatura ambiente, es el mejor el material 3, mientras que para temperaturas bajar ningún material es bueno.

En la gráfica de medias, se observa que los materiales 2 y 3 son estadísticamente diferentes, de modo que se podría elegir indistintamente entre los materiales 2 y 3, en función de otros factores como el costo. (Como el material se puso como factor B, para tener los datos referentes al material se debe hacer clic derecho ya sea en la gráfica o en la venta de la tabla de rangos múltiples, ir a Pane Option y seleccionar Material).

Tabla 19. Multiple Range Tests for Tiempo de duración efectiva by Material
Method: 95,0 percent LSD
Material
Count
LS Mean
LS Sigma
Homogeneous Groups
1
12
83,1667
7,54017
X
2
12
107,5
7,54017
X
3
12
123,417
7,54017
X
Contrast
Sig.
Difference
+/- Limits
1 - 2
*
-24,3333
21,8796
1 - 3
*
-40,25
21,8796
2 - 3

-15,9167
21,8796
Por lo tanto, los materiales 2 y 3 son estadísticamente iguales.
Verificación de los supuestos del modelo
Cuando se hace el análisis de varianza se parte del supuesto de que los datos se ajustan a una distribución normal, y por tanto se debe verificar el cumplimiento de estos supuestos. Para evitar el incumplimiento de estos supuestos se deben aleatorizar los tratamientos.
Supuestos:
Normalidad: Ajusta a una distribución normal
Varianza constante: Igual varianza de los tratamientos
Independencia: para esto aleatorizamos nuestros experimentos, si no se cumple se debe sospechar que no se siguieron las instrucciones, se las hizo como quiso.
Esto es la respuesta (y) se debe distribuir de manera normal con la misma varianza y las mediciones deben ser independientes.
La gráfica debe estar completamente mal para poder decir que no se cumple el supuesto.
Principios básicos del diseño experimental
Prevenir que se violen los supuestos
REPETICIÓN
ALEATORIZACIÓN (independencia)
BLOQUEO



En StatGrapihcs, hay tres tipos de gráficos:

Residuos versus predichos (Residuals versus Predicted): sirven para ver varianza constante. Todos los puntos deben estar ubicados aleatoriamente, y en ese caso se afirma que el diseño cumple el supuesto de varianza constante. Si se observa un patrón, dicho supuesto no se cumple. Cuando no se cumple

Niveles y residuos (Residual versus Factor Levels): No debe observarse una tendencia en los datos, y en ese caso se cumple el supuesto de varianza constante.


Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.