Diseño Experimental Cria43
1
COMITÉ DIRECTIVO Jaime Alberto Leal Afanador Rector Roberto Salazar Ramos Vicerrector Académico
HERNAN MAURICIO PULIDO Decano Facultad de Ciencias Básicas e Ingeniería
Celia del Carmen López Secretaria Académica Facultad de Ciencias Básicas e Ingeniería
Primera Edición Copy Rigth Universidad Nacional Abierta y a Distancia ISBN 2005 Centro Nacional de Medios para el aprendizaje
Diseño Experimental Cria43
2
PROGRAMA DE INGENIERÍA DE ALIMENTOS
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA BOGOTÁ 2005
Campo Elías Riaño Luna Ing. Químico. MSc.
Diseño Experimental Cria43
3
CONTENIDO Algo de historia del diseño experimental OBJETIVOS DEL MODULO ¿ES IMPORTANTE EL DISEÑO EXPERIMENTAL EN LAS CIENCIAS APLICADAS? ¿COMO SE EVALUARA EL CURSO DE DISEÑO EXPERIMENTAL? UNIDAD PRIMERA: Fundamentos del diseño experimental
Algunas citas de interés Para no olvidar Cuando se inicia el diseño experimental? CAPITULO PRIMERO:La investigación y el diseño experimental Preguntas de repaso y evaluación. 1.1. Introducción al diseño de experimentos 1.1.1. Propósitos de la investigación. 1.2.El proyecto de investigación. 1.3. Anteproyecto de investigación. 1.4. Investigación científica. 1.5. Investigación aplicada. 1.6. Diseño de investigación. 1.7. El método científico. 1.8. Métodos de investigación. 1.9. Estilo de trabajo investigativo 1.9.1. Método Inductivo 1.9.2. Método Deductivo 1.9.3. Método Hipotético- deductivo. 1.10. Niveles de investigación 1.11. Etapas de un trabajo de investigación 1.12. Fundamentos de la experimentación. 1.13. Que es la observación 1.14. ¿Que es analizar? CAPITULO DOS: Definiciones básicas en el diseño de experimentos 2.1. Diseño de experimentos en la investigación. 2.2. Necesidad de diseñar experimentos. 2.3. Objetivos de un diseño de experimentos. 2.4. El diseño de experimentos en la industria. 2.5. Diseño experimental 2.6. Utilidad del Diseño Estadístico de Experimentos. 2.7. Experimento 2.8. Experimento aleatorio 2.9. Unidad experimental 2.11. Repetitividad (precisión) de un experimento 2.12. Reproducibilidad de un experimento CAPITULO TRES: Repaso a conceptos estadísticos 3.1. Variable. 3.2. Variable independiente. 3.3. Variable dependiente. 3.4. Ejemplo de variables independiente y dependiente Diseño Experimental Cria43
4
3.5. Variable de respuesta. 3.6. Factores 3.7. Nivel. 3.8. Niveles de variables 3.9. Tratamiento. 3.10.Testigo 3.11. Replica 3.12. Aleatorización. Tabla 1. Ejemplo de unidades experimentales a aleatorizar 3.13. Actividades a desarrollar 3.14. Respuesta a las preguntas CAPITULO CUARTO: Definiciones y herramientas estadísticas aplicadas a los diseños experimentales. 4.1. Población y muestra. 4.2. Población 4.2.1. Tipos de poblaciones 4.3. Individuos o elementos 4.5.Tipos de muestreo 4.5.1. Muestreo aleatorio simple 4.5.1. Muestreo estratificado 4.6.Datos obtenidos 4.7. Elección de la muestra. 4.8. Parámetro 4.12. Estimación puntual y por intervalo. 4.13. La media aritmética. 4.14. Cálculo de la media a partir de datos no agrupados. 4.15. Cálculo de la media de datos agrupados. 4.16. Varianza de una población. 4.17. Desviación estándar de una población 4.18. Significancia estadística p. 4.8. Tamaño de la muestra 4.9. Ejemplo de determinación de número de muestras. 4.9. Recomendaciones para la elección y tamaño de muestra. 4.19. Hipótesis 4.20. Planteamiento de una hipótesis estadística 4.21. Formulación y prueba de hipótesis 4.22. Estadístico de prueba. 4.23. Análisis de datos. 4.24. Ppruebas de hipótesis. 4.25. Pruebas de hipótesis Z para una media poblacional ( σ conocida) 4.26. Ejemplo y procedimiento a desarrollar para una prueba de hipótesis propiamente dicha. 4.27. Prueba de t. 4.28. Suposiciones de la prueba de t con una muestra. 4.29. Prueba de z para la diferencia entre dos medias. 4.30. Prueba de t para la diferencia entre dos medias 4.31. Grados de libertad. 4.32. Análisis de la varianza. 4.33. Bases del análisis de la varianza. 4.34. Diferencia mínima significativa Diseño Experimental Cria43
5
4.35. Error experimental 4.36. Errores tipo I y tipo II. 4.37. Las modalidades más recomendadas para disminuir el error 4.38. Modelo estadístico. 4.39. Análisis de Covarianza. 4.40. Recomendaciones 4.41. Software estadísticos para la solución de problemas. 4.42. Ejercicio desarrollado 4.43. Ejercicios y actividades UNIDAD SEGUNDA: Diseños experimentales aplicados a la ingeniería de alimentos CAPITULO QUINTO: Clasificación y selección de los diseños experimentales. 5.1. Características de los diseños experimentales. 5.2. Aspectos influyentes en la selección de un diseño experimental. 5.3. Clasificación de los diseños experimentales acorde con su utilización. 5.4. Experimentos con un solo factor (análisis de varianza) 5.4. 1. Experimentos de una variable 5.5. Diseñó de experimentos sin bloquear. 5.6. Procedimiento estadístico para la comprobación de hipótesis en un diseño al azar. 5.7. Modelo estadístico para un diseño al azar. 5.8. Ejemplo de un diseño de experimentos sin bloquear CAPITULO SEIS: Diseño en bloques 6.1. Diseño de bloques completos al azar. 6.1.1. Características. 6.1.2. Fuentes de variabilidad. 6.1.3. Ventajas 6.1.4. Aleatorizacion. 6.2. Procedimiento estadístico para la comprobación de hipótesis en un diseño de bloques completos al azar. 6.3. Arreglo de los datos en un diseño de DBCA. 6.4. Modelo estadístico para un DBCA 6.5. Hipótesis a probar 6.6. ANOVA para un diseño en bloques completos al azar (DBCA) 6.7. Comparación de medias de tratamiento en el diseño de bloques completos al azar (BCA) 6.8. Ejemplo de bloques completos al azar (BCA) 6.9. Ejercicio para realizar como actividad de grupo: 6.10. Ejercicio propuesto CAPITULO SIETE: Diseño en cuadro latino 7.1. Diseño en cuadro latino 7.2. Formación y tabulación de los datos experimentales en un cuadrado latino. 7.3. Arreglo de los datos en un diseño de Cuadro latino. 7.4. Procedimiento estadístico para la comprobación de hipótesis en un diseño de bloques en cuadro latino. 7.5. Análisis del diseño de Cuadro latino 1.19.2 Hipótesis a probar 7.6. ANAVA para el diseño de cuadro latino. 7.7. Ejemplo para el diseño de cuadro latino.. Diseño Experimental Cria43
6
7.8. Ejercicio propuestos CAPITULO OCHO: Diseño en cuadro grecolatino 8.1. Diseño en cuadro greco latino. 8.2. Formación y tabulación de los datos experimentales en un cuadrado greco latino. 8.3. Procedimiento estadístico para la comprobación de hipótesis en un diseño de bloques en cuadro greco latino. 8.5. Hipótesis a probar para el diseño greco latino 8.6. ANAVA para el diseño grecolatino. 8.7. Ejemplo para el diseño grecolatino. CAPITULO NUEVE: Diseños factoriales 9.1. Diseños factoriales 9.2. Ventajas de los Experimentos Factoriales 9.3. Desventajas de los diseños factoriales 9.4. Arreglo factorial 9.5. Modelo estadístico para un diseño factorial 9.6. Hipótesis a probar 9.7. ANOVA para el diseño factorial (a x b) o de dos factores 9.8. Ejemplo de un diseño factorial 9.9. Experimentos factoriales de dos vías 9.10. Factor en el diseño de dos vías. 9.11. Tratamiento en el diseño de dos vías. 9.12. Interacción en el diseño de dos vías. 9.13. Pasos para llegar al ANOVA en un diseño experimental. CAPITULO DIEZ: Diseños factoriales 2k 10.1. Codificación de las variables 10.2. El diseño factorial completo 2k 10.3. Efecto de un factor en un diseño 22 10.4. Análisis de residuos 10.5. ANOVA para un diseño factorial 22 10.6. Ejemplo de un diseño experimental factorial 22 10.7. Factores y dominio experimental CAPITULO ONCE: Diseños factoriales de tres factores 11.1. Diseño factorial de tres factores con dos niveles cada uno. Tabla 38. Combinación de los tratamientos para un diseño 23 11.2. Efecto de un factor en un diseño 23 11.3. Análisis de varianza para un diseño factorial 23 11.4. Coeficientes de determinación 11.5. Ejemplo de un diseño factorial 23 11.6. Presentación de resultados. 11.7. Metodología de la superficie de respuesta. Varios autores. 11.8. Región experimental 11.9. Región de operabilidad 11.10. Polinomio ortogonal. CAPITULO DOCE: Análisis de regresión 12.1. Análisis de regresión. 12.2. Regresión lineal simple. 12.3. Coeficientes de correlación. 12.4. Otros modelos de regresión lineal simple. 12.5. Regresión lineal múltiple. Diseño Experimental Cria43
7
12.6. Correlación múltiple. 12.7. Transformación de datos. 12.8. Correlación múltiple. 12.9. Análisis de Covarianza. 12.10. Los objetivos del análisis de covarianza son: 12.11. Software estadístico para la solución de problemas. CAPITULO TRECE: Otros diseños 13.1. Diseños no experimentales. Varios autores 13.2. Recomendaciones 13.3. Ejercicios propuestos 13.4. Actividades a realizar para el capitulo primero de la unidad segunda APENDICE REFERENCIAS YBIBLIOGRAFIA Direcciones de las paginas Web.
Diseño Experimental Cria43
8
INDICE DE TABLAS Y FIGURAS Figura 1. Red semántica para el diseño experimental en ingeniería de alimentos. Figura.2. sir Ronald Fisher. Cuadro 1. Contenidos del capitulo primero de la unidad primera Tabla 1. Ejemplo de unidades experimentales a aleatorizar Tabla 2. Actividades a desarrollar para los capítulos uno a tres de la primera unidad Figura 3. Ejemplo de una unidad experimental u observacional. Tabla 4. Ejemplo de un análisis de varianza Figura 4. ANOVA toma de decisión. Figura 5. Portada del programa Statgraphics. Figura 6. Hoja de cálculo de excell *. Tabla 5. Producción de canastillas de uchuva en seis veredas Figura 7.Varianza entre las diferentes fincas productoras de uchuvas. Tabla 6. Resumen estadístico de los datos totales recolectados de la producción de uchuvas en cinco municipios de Cundinamarca. Tabla 7. Resumen estadístico de los datos recolectados por mes de la producción de uchuvas en cinco municipios de Cundinamarca. Figura 8. Grafico de la producción anual de uchuvas. Figura 9. Grafico de cajas y bigotes de la producción mensual de uchuvas. Figura 10. Grafico de medias e intervalos para la producción de uchuvas por finca. Tabla 8. Análisis de varianza (ANAVA) par el ejemplo de las fincas productoras de uchuva. UNIDAD SEGUNDA: Diseños experimentales aplicados a la ingeniería de alimentos Tabla 9. Procedimiento estadístico para la comprobación de hipótesis Tabla 10. Análisis de varianza para los tratamientos con un solo factor, en un diseño totalmente aleatorizado o completamente al azar. Tabla 11. Recopilación y presentación de los resultados de los tratamientos, en un diseño totalmente aleatorizado o completamente al azar. Figura 12. Diagrama de flujo para la producción de rosquillas a partir de una masa estandarizada. Tabla 12. De aleatorización para el ejemplo de las rosquillas Tabla 13. Datos obtenidos en la determinación de la dureza para el ejemplo de las rosquillas. Tabla 14. Análisis de varianza para evaluar el efecto de los aditivos en la elaboración de rosquillas. Tabla 15. Análisis de homogeneidad y contraste de las rosquillas. Tabla 16. Recopilación y presentación de los resultados de los tratamientos, en un diseño de bloques completos al azar. Tabla 17. Arreglo de los datos en un diseño de bloques completos al azar. Tabla 18. ANOVA para un diseño en bloques completos al azar Tabla 19. Datos obtenidos en la determinación del contenido de sólidos para el ejemplo de concentración del jugo de tomate. Tabla 20. Procesamiento de los datos obtenidos en la determinación del contenido de sólidos para el ejemplo de concentración del jugo de tomate.
Diseño Experimental Cria43
9
Tabla 21. ANAVA para los datos obtenidos en la determinación del contenido de sólidos para el ejemplo de concentración del jugo de tomate. Tabla 22. Recopilación y presentación de los resultados de los tratamientos, en cuadro latino. Tabla 23. Arreglo de los resultados de los tratamientos, en cuadro latino. Tabla 24. ANOVA para el diseño de cuadro latino* Tabla 25. Datos recolectados por los tecnólogos Tabla 26. Calculo de los tratamientos (3eros o letras) Tabla 27. ANOVA para el diseño de cuadro latino del ejemplo perdida de peso Tabla 28. Arreglo de los resultados de los tratamientos, en cuadro GrecoLatino. Tabla 29. ANOVA para el diseño de cuadro greco latino* Tabla 30. ANOVA para el ejemplo de diseño de cuadro greco latino* Tabla 30. ANOVA para el ejemplo de cuadro greco latino* Figura 11.Un experimento factorial Figura 12.Un experimento factorial Tabla 31. ANOVA para el diseño factorial a x b Tabla 32. Resultados del ensayo NOVA para el diseño factorial a x b Tabla 33. ANOVA para el ejemplo de diseño factorial a x b Tabla 34. Signos algebraicos para calcular los efectos en un diseño 22 Tabla 35. ANOVA para un diseño factorial 22 Tabla 36. Respuestas para el ejemplo de diseño factorial 22 Tabla 37. Matriz para el ejemplo de diseño factorial 22 Tabla 38. Análisis de varianza para el ejemplo de diseño factorial 22 Tabla 38. Combinación de los tratamientos para un diseño 23 Tabla 39. Signos algebraicos para calcular los efectos en un diseño 23 Tabla 40. Calculo del Análisis de varianza para un diseño factorial 23 Tabla 41. Datos de la viscosidad de la bebida desarrollada. Tabla 42. Promedio y factores calculados para el ejemplo de la viscosidad Figura 13. Pasos para calcular el ANOVA en un diseño 2k Tabla 43. Análisis de la varianza para la viscosidad de bebida desarrollada. Tabla 44. Coeficientes de regresión de la ecuación de los datos de viscosidad de la bebida desarrollada en el ejemplo anterior. Tabla 45. Valores para el r2 , el error estándar para el ejemplo de la viscosidad de la bebida desarrollada. Tabla 46. Resultados estimados para los datos de viscosidad con la ecuación de regresión encontrada para el ejemplo anterior. Figura 16. Efectos medios para el ejemplo de la viscosidad. Figura 17. Interacciones para el ejemplo de la viscosidad. Figura 18. Interacciones para el ejemplo de la viscosidad. Tabla 48. Ecuaciones para el estimativo de una regresión lineal simple Tabla 49. Grado de asociación de los coeficientes de correlación para un conjunto de datos. (varios autores) Tabla 50. Modelos de regresión lineal simple Tabla 51. Transformaciones usadas para datos Tabla 47. Actividades a desarrollar en el semestre académico.
Diseño Experimental Cria43
10
Diseño Experimental Cria43
11
UNIDAD PRIMERA: Fundamentos del diseño experimental
Definir
Planear Trabajo de campoLaboratorio
Datos
Diseño Experimental Cria43
12
Algo de historia del diseño experimental
El Diseño de Experimentos tuvo su inicio teórico a partir de 1935 por Sir Ronald A. Fisher, quién sentó la base de la teoría del Diseño Experimental y que a la fecha se encuentra bastante desarrollada y ampliada. Actualmente las aplicaciones son múltiples, especialmente en la investigación de las ciencias naturales, ingeniería, laboratorios y casi todas las ramas de las ciencias sociales. La experimentación proporciona los datos experimentales, en contraste con los datos de la observación; los datos de la observación se representan como su nombre indica por observaciones de las unidades elementales de una población o de una muestra, y no deben ser cambiados ni modificados por ningún intento de parte de un investigador en el curso de la observación.
Diseño Experimental Cria43
13
DISEÑO EXPERIMENTAL PARA INGENIERÍA DE ALIMENTOS Tiene como fín Aplicar correctamente la terminología y conceptos utilizados en los procesos investigativos
comprende Comceptos metodologicos investigación di i li
de
Conocimientos de los tipos de diseño experimental de utilidad en su disciplina
Conocimientos de técnicas y herramientas analíticas y estadisticas
de
Con el fin de
Claridad procesos
Conformados por
comprende
Con el fin de
Con el fin de
Buen de una Diseñodiseño apropiado de investigación una investigación
los
Con el fin de
Utilización razonable de recursos en los trabajos de grado
Con el fin de Con el fin de
Buen diseño de una investigación Formando pprofesionales con
Concepción critica de la investigación en la solución de problemas propios de la disciplina.
COMUNIDADES ACADEMICAS Y LOCALES
RED SEMÁNTICA PARA EL DISEÑO EXPERIMENTAL EN INGENIERÍA DE ALIM Figura 1. Red semántica para el diseño experimental en ingeniería de alimentos.
Diseño Experimental Cria43
14
OBJETIVOS DEL MODULO La UNAD y la Facultad de Ciencias Básicas e ingeniería a través de este modulo suministrara los elementos esenciales para que el alumno que se encuentra cursando los semestres octavo, noveno y décimo del ciclo de ingeniería conozca el proceso que requiere la elaboración de un trabajo de investigación respaldado por un estudio estadístico, aplicado a una recogida y toma de datos experimentales productos de una metodología debidamente planificada, con interpretación de resultados hasta su posterior análisis y conclusiones. Finalmente se pretende que el alumno sea capaz de planificar y elaborar, por sí mismo, estudios con aplicación de la estadística, relacionados con los obtenidos por medio de la búsqueda de documentación en bibliotecas, en los laboratorio, en centros especializados en diversos estudios, en analizar tendencias poblacionales, etc., y el uso y manejo de algún paquete de software estadístico adecuado.
Diseño Experimental Cria43
15
¿ES IMPORTANTE EL DISEÑO EXPERIMENTAL EN LAS CIENCIAS APLICADAS? Pregunta que ha sido respondida por los siguientes autores: "El diseño es fundamental en el experimento. La idea expresada en la hipótesis tiene que ser convertida en experimentable a través del diseño. Para Plutchik, "los diseños experimentales se consideran como formas de disponer las condiciones de un experimento de tal manera que se logren las respuestas a las preguntas del caso". Por eso, Kirk asegura que un diseño consiste en el papel conforme al cual s asignan o distribuyen los sujetos a las diferente condiciones experimentales. Al preparar el diseño, el experimentador establece con qué variable actuará, cuáles son las variables dependientes que espera relacionar con la VI, señala cómo anular la influencia negativa de las VE. Asimismo, establece, con cuántos sujetos se realizará el experimento y decide la manera de su selección." L. Gildomero Arista, Metodología de la investigación (p. 169)
Diseño Experimental Cria43
16
¿COMO SE EVALUARA EL CURSO DE DISEÑO EXPERIMENTAL? -A través de pruebas escritas de contenido teórico-práctico, en las que se valorará la claridad conceptual, la capacidad de relacionar conceptos, la justificación adecuada de los procedimientos estadísticos utilizados, la coherencia en el desarrollo de resolución de problemas y ejercicios prácticos y la corrección y adecuación de la interpretación de los resultados obtenidos. - Mediante la realización de trabajos en grupos y ejercicios prácticos.
Diseño Experimental Cria43
17
Algunas citas de interés
"Experimentar – dice Robert Plutchik – significa "ensayar" o "poner a prueba" (Fundamentos de la investigación, 1975). Lo que se pone a prueba, en este caso, es una hipótesis, una probable solución o respuesta transitoria de un problema planteado en la ciencia... Escuchemos al respecto, la palabra de Claude Bernard, un clásico del método experimental" se da el nombre de observador – dice- a aquél que aplica los procedimientos de investigación simples o complejos, para hacer que los fenómenos que nos hace variar y que, por consiguiente, recoge tales como se los ofrece la Naturaleza. Se da el nombre de experimentador, al que emplea los procedimientos de investigación, simples o complejos, para hacer que los fenómenos naturales varíen o se modifiquen con un fin cualquiera, y así hacerlos aparecer en circunstancias o condiciones en que no los presente la Naturaleza. En este sentido, la observación es la investigación de un fenómeno natural, y la experiencia es la investigación de un fenómeno modificado por el que investiga" (Introducción al estudio de la medicina experimental, 1960).
Diseño Experimental Cria43
18
Para no olvidar Los métodos experimentales son ampliamente usados en la investigación básica y aplicada pero con propósitos muy diferentes. La meta primaria en la investigación científica normalmente es mostrar la importancia estadística de un efecto que un factor particular ejerce en la variable dependiente de interés En la industria, la meta primaria es extraer la cantidad máxima de información imparcial con respecto a los factores que afectan un proceso, la producción y la calidad del producto terminado. El propósito de un diseño experimental es proporcionar métodos que permitan obtener la mayor cantidad de información válida acerca de una investigación, teniendo en cuenta el factor costo y el uso adecuado del material disponible mediante métodos que permitan disminuir el error experimental.
Diseño Experimental Cria43
19
¿Cuando se inicia el diseño experimental? El Diseño de Experimentos tuvo su inicio teórico a partir de 1935 por Sir Ronald Aymer Fisher, matemático ingles nacido en Londres el 17 de febrero de 1890 y fallecido en Adelaida, Australia, el 29 de julio de 1962. Desde 1919 y hasta 1933, trabajo para la Rothamsted Experimental Station, cerca de Harpenden, Inglaterra en la aplicación de un exhaustivo análisis estadístico a los datos de investigaciones agrícolas que el personal había recolectado. Ejercicio que le permitió desarrollar y consolidar los principios básicos del diseño y análisis experimental que hasta la fecha son prácticas necesarias para llegar a resultados de investigación válidos. Estudiando y analizando estadísticamente experimentos relativos a los cultivos de trigo, desarrolló el análisis de varianza y unificó sus ideas básicas sobre los principios del diseño de experimentos. Figura..2. sir Ronald Fisher. Su primera obra el artículo "The Arrangement of Field Experiments" lo publico en, 1926; en ese importante artículo describió tres componentes fundamentales de los experimentos en el área de pruebas agrícolas: control local de las condiciones de campo para reducir el error experimental, replicación como un medio para estimar la varianza del error experimental y la aleatorizacion para obtener una estimación valida de esa varianza. Fue quién sentó la base de la teoría del Diseño Experimental y que a la fecha se encuentra bastante desarrollada y ampliada. Actualmente las aplicaciones son múltiples, especialmente en la investigación de las ciencias naturales, ingeniería, laboratorios y casi todas las ramas de las ciencias sociales.(20) La experimentación proporciona los datos experimentales, en contraste con los datos de la observación; los datos de la observación se representan como su nombre indica por observaciones de las unidades elementales de una población o de una muestra, y no deben ser cambiados ni modificados por ningún intento de parte de un investigador en el curso de la observación. (30). Ningún otro investigador ha tenido tanto impacto en los principios estadísticos del diseño de experimentos en su tiempo como Ronald A. Fisher.
Diseño Experimental Cria43
20
Preguntas de repaso y evaluación. ¿Qué se entiende por investigación? ¿Cómo se define la investigación científica? ¿Qué es un diseño de investigación? ¿Qué es un experimento? ¿Qué tipo de estudio son las investigaciones experimentales? ¿En experimentación que significa repetitividad?
Diseño Experimental Cria43
21
Capitulo 1.La investigación y el diseño experimental 1.1. Introducción al diseño de experimentos La experimentación juega un papel fundamental en todos los campos de la investigación y el desarrollo. El objetivo de la experimentación es obtener información de calidad y confiable. Información que debe permitir el desarrollo de nuevos productos y procesos, comprender mejor un sistema y tomar decisiones sobre como optimizarlo además el de comprobar hipótesis científicas, etc. Obviamente la experimentación se debe planificar (diseñar) cuidadosamente para que proporcione la información buscada. Dicha planificación debe considerar dos aspectos importantes relacionados con toda experimentación: 1.1.2. Propósitos de la investigación. La investigación debe cumplir con dos propósitos fundamentales: ⌧ Producir conocimientos y teorías, entonces se habla de una investigación básica o pura. ⌧ Resolver problemas prácticos, mediante la aplicación del conocimiento, entonces se habla de la investigación “aplicada” o “empírica”. Este debe ser el campo de investigación para las escuelas de la UNAD, por lo tanto la política será fortalecer y desarrollar la investigación aplicada. 1.2.El proyecto de investigación. Es un documento que elabora el investigador para especificar las características de la indagación que va a realizar, generalmente va antecedido de un anteproyecto. En un proyecto es preciso completar mucho más la información, profundizando y definiendo mejor lo tratado en el anteproyecto y agregándole lo relativo al diseño de la investigación, así como un marco teórico que haga comprensible el sentido de lo que se proyecta. (28). 1.3. Anteproyecto de investigación. Es un documento similar pero menos preciso que se elabora al comenzar la investigación, apenas se hayan definido sus características principales. En un anteproyecto deben exponerse las características del problema, su justificación, los objetivos de la investigación y (si las hubiere) las hipótesis a verificar. 1.4. Investigación científica. Este tipo de investigación esta basada en la aplicación del método científico para la obtención de un nuevo saber que en la mayoría de los casos pretende mover las fronteras de la ciencia. 1.5. Investigación aplicada. Este tipo de investigación esta basada en la aplicación de las metodologías propias del desarrollo de cada una de las ingenierías.. Diseño Experimental Cria43
22
1.6. Diseño de investigación. Realizar el diseño de una investigación significa llevar a la práctica los postulados generales del método científico, planificando una serie de actividades sucesivas y organizadas donde se encuentran las pruebas que se han de efectuar y las técnicas que se van a utilizar para recolectar y analizar los datos. 1.7. El método científico. El método científico es el procedimiento o conjunto de procedimientos que se utilizan para obtener conocimientos científicos, el modelo de trabajo o pauta general que orienta la investigación. Tanto la investigación científica, básica como la aplicada, implica un proceso que comprende varias etapas fundamentales a saber: ⌧ Selección, planteamiento y análisis del problema que se va a investigar. Delimitación del tema. ⌧ Formulación del marco teórico (conceptos – antecedentes – referentes bibliográficos). ⌧ Presentación de la hipótesis explicativa. ⌧ Diseño metodológico. ⌧ Recolección de datos. ⌧ Procesamiento, análisis e interpretación de los datos. ⌧ Confrontación con la hipótesis. ⌧ Presentación del informe final de la investigación. El estudio del método - o de los métodos, si se quiere dar al concepto un alcance más general - se denomina metodología, y abarca la justificación y la discusión de su lógica interior, el análisis de los diversos procedimientos concretos que se emplean en las investigaciones y la discusión acerca de sus características, cualidades y debilidades 1.8. Métodos de investigación. “ La palabra método se deriva del griego META: a lo largo y ADOS: Camino “ El método es la manera de proceder en cualquier dominio, ordenando la actividad a un fin lógico, es un método. El diseño de un método específico, una serie de actividades sucesivas y organizadas, que deben adaptarse a las particularidades de cada investigación y que nos indican las pruebas a efectuar y las técnicas a utilizar para recolectar y analizar los datos. El método científico se fundamenta en observar algunos fenómenos característicos para descubrir las leyes que los rigen. La observación y generalización método científico.
Diseño Experimental Cria43
son los elementos más importantes del
23
Para dar estructura y fundamentación a la construcción del cimiento teórico de toda ciencia, la investigación recurre a los métodos, por pertenecer a los principios básicos de nuestra manera de pensar e investigar, y son comunes a todas las ciencias y que sin modificar su forma o naturaleza son aplicables a diferentes materias: 1.9. Estilo de trabajo investigativo Los estilos de trabajo son métodos peculiares de cada disciplina (por ejemplo: "el método antropológico") y las formas particulares de investigación que se utilizan para resolver problemas específicos de indagación, como cuando se habla del "método cualitativo", el "método experimental" o el "método estadístico". No existe un único método de la ciencia, ya que no investigan del mismo modo el astrónomo, el fisico y el economista, el historiador y el químico, el antropólogo y el bioquímico, el sicologo y el ingeniero. La experiencia histórica muestra, además, que los procedimientos de la ciencia cambian, porque son distintos los problemas que se van planteando y los instrumentos de ayuda estan en continua evolucion. 1.9.1. Método Inductivo Variante del método científico en la que el investigador parte de la información recogida mediante sucesivas observaciones para, mediante la generalización, establecer una ley del ámbito lo más universal posible. (Ortiz, Uribe. Diccionario de investigación. Noriega editores)
1.9.2. Método Deductivo Otro elemento del proceder científico es el uso sistemático de la inferencia, o razonamiento deductivo. Inferir significa sacar consecuencias de un principio o supuesto. La inferencia opera durante la investigación y, por lo general, de la siguiente manera: una vez formulada una hipótesis se deducen de ella posibles consecuencias prácticas, que luego son sometidas, a su vez, a verificación.(28). 1.9.3. Método Hipotético- deductivo. Procedimiento que consiste en desarrollar una teoría empezando por formular sus puntos de partida o hipótesis básicas y deduciendo luego sus consecuencias con la ayuda de las subyacentes teorías formales. (Ortiz) 1.10. Niveles de investigación Existen diferentes niveles de investigación, según el grado de profundización, del rigor y exactitud y del método empleado, a saber: ⌧ Nivel descriptivo: Responde a las preguntas ¿qué es esto?, ¿cómo se comporta? Describe, las propiedades o características del objeto en estudio. ⌧ Nivel clasificatorio: existe una sistematización de los datos obtenidos de acuerdo a un criterio previamente definido. ⌧ Nivel aplicativo: Se busca la causa de un fenómeno o problema, teniendo en cuenta el contexto práctico y teórico. 1.11. Etapas de un trabajo de investigación Diseño Experimental Cria43
24
Las etapas de todo trabajo de investigación se pueden resumir de la siguiente manera: a) Enunciado del problema. b) Objetivos generales y específicos. c) Formulación de hipótesis. d) Selección del procedimiento y diseño experimentales. e) Realización del experimento. f) Aplicación de los métodos estadísticos a los resultados. g) Interpretación de resultados h) Análisis económico y su utilidad práctica para la comunidad. 1.12. Fundamentos de la experimentación. La experimentación tiene como finalidad: a) El estudio de la variación de una población de seres vivos. b) La comparación entre poblaciones y muestras para juzgar su semejanza. e) La interpretación de resultados de experimentos biológicos, agropecuarios y de ingeniería, en donde se comparan poblaciones o muestras sometidas a diferentes estudios o pertenecientes a diferentes variedades o razas. d) La determinación de la relación entre dos o más variedades (correlación y regresión). e) La aplicación de métodos para reducir las fuentes de error en la correlación de datos. f) Y en poblaciones segregadas la separación de la variación atribuible a la selección de los genes debido al medio, en estudios de herencia cuantitativa. 1.13. Que es la observación Es la recolección de los datos necesarios para un estudio. La observación es un método clásico de investigación científica; además, es la manera básica por medio de la cual obtenemos información acerca del mundo que nos rodea. Se fundamenta en los siguientes principios básicos: ⌧ Debe tener un propósito específico. ⌧ Debe ser planeada cuidadosa y sistemáticamente. ⌧ Debe llevarse, por escrito, un control cuidadoso de la misma. ⌧ Debe especificarse su duración y frecuencia. ⌧ Debe seguir los principios básicos de confiabilidad y validez. 1.14. ¿Que es analizar? Después que el investigador realiza las pruebas o ensayos propuestos toma datos de la variable dependiente seguidamente procede a categorizarlos, ordenarlos y resumirlo en una forma tal que le de respuesta a las preguntas planteadas en ella. En resumen es la operación intelectual que considera por separado las partes de un todo.
Diseño Experimental Cria43
25
Capitulo 2. Definiciones básicas en el diseño de experimentos 2.1. Diseño de experimentos en la investigación. Diseñar un experimento significa planear un experimento de modo que reúna la información pertinente al problema bajo investigación. El diseño de un experimento es la secuencia completa de pasos tomados de antemano para asegurar que los datos apropiados se obtendrán de modo de modo que permitan un análisis objetivo que conduzca a deducciones válidas con respecto al problema establecido. 2.2. Necesidad de diseñar experimentos. Esta surge de la necesidad de responder a preguntas como: ¿Cómo se va a medir el efecto? ó ¿Cuáles son las características a analizar? ¿Qué factores afectan las características que se van a analizar? ¿Cuáles son los factores que se estudiaran en esta investigación? ¿Cuántas veces deberá ejecutarse el experimento? ¿Cuál será la forma de análisis? ¿A partir de que valores se considera importante el efecto? El diseño de experimentos es una herramienta que nos ayuda a hacerlo de forma sistemática. 2.3. Objetivos de un diseño de experimentos. Entre los muchos objetivos se encuentran: • Proporcionar la máxima cantidad de información pertinente al problema bajo investigación. • El diseño, plan o programa debe ser tan simple como sea posible. • La investigación debe efectuarse lo más eficientemente posible; ahorrar tiempo, dinero, personal y material experimental. "Proporcionar la máxima cantidad de información al mínimo costo" 2.4. El diseño de experimentos en la industria. En el caso de la ingeniería es fundamental conocer el comportamiento de un sistema, determinar las variables que tienen incidencia en un proceso, optimizar los procesos y sus productos para la reducción de los costos. El diseño de experimentos es una herramienta que ayuda a hacerlo de forma sistemática. En las ciencias agrarias igualmente colabora con los profesionales de la disciplina en la planeación, ejecución, análisis y conclusión de los experimentos realizados para determinar el comportamiento de una raza de semovientes a una dieta. 2.5. Diseño experimental Se entiende por diseño experimental, el proceso de planeamiento de un experimento, tal que se tomen datos apropiados con la mayor realidad posible, los cuales deben ser analizados mediante métodos estadísticos que deriven conclusiones válidas y objetivas. Podemos decir que la filosofía del diseño Diseño Experimental Cria43
26
experimental es la obtención de información con una alta fidelidad sobre el mensaje de la naturaleza a un costo mínimo. Es el ordenamiento de las unidades experimentales para controlar y minimizar el error experimental. 2.6. Utilidad del Diseño Estadístico de Experimentos. El método tradicional de experimentación, el que quizás surge de forma más intuitiva y acorde con la experiencia del experimentador como por ejemplo variar-un-factor-cada-vez fijado a partir de unas condiciones iniciales y en donde se realizan experimentos en los cuales todos los factores se mantienen constantes excepto el que está estudio. De este modo, la variación de la respuesta (Y) se puede atribuir a la variación del factor, y, por tanto, revela el efecto de ese factor. El procedimiento se repite para los otros factores. Método que presenta inconvenientes importantes cuando existe interacción entre factores. La solución, por lo tanto, debe consistir en variar más de un factor simultáneamente al realizar un nuevo experimento soluciòn conocida como Diseño Estadístico de Experimentos (DEE), universalmente denominado diseño experimental, como la metodología basada en ayudas matemáticas y estadísticas cuyo objetivo es ayudar al investigador a: 1. Seleccionar la estrategia experimental óptima que permita obtener la información buscada con el mínimo coste. 2. Evaluar los resultados experimentales obtenidos, garantizando la máxima fiabilidad en las conclusiones que se obtengan. 2.7. Experimento Conjunto de reglas usadas para obtener una muestra de la población y al concluir el ensayo obtener información acerca de la población. Un experimento es un procedimiento mediante el cual se trata de comprobar (confirmar o verificar) una o varias hipótesis relacionadas con un determinado fenómeno, mediante la observación y medición de las variables que influyen en el mismo. Por ejemplo todas las pruebas de laboratorio y las pruebas de campo que realices para desarrollar tu trabajo de grado. Es un cambio en las condiciones de operación de un sistema o proceso para obtener una muestra de la población y al concluir el ensayo obtener información acerca de la población o del producto obtenido. Por ejemplo variar las condiciones de operación (temperatura, presión, velocidad de agitación de un proceso, las raciones para semovientes, dosis de agroquímicos). O la utilización de diferentes proporciones de materias primas y aditivos para mejorar la condición de un producto de consumo masivo. Diseño Experimental Cria43
27
La experimentación constituye uno de los pasos del método científico. Ejemplos de sistemas experimentales son: - Una reacción química y/o bioquímica, cuyo rendimiento (Y) puede ser función, entre otros, del tiempo de reacción (t1), la temperatura de la reacción (T2) y el tipo de microorganismo (Mo1) utilizado. Otras variables que pueden influir son, por ejemplo, la presentación de los sustratos, la velocidad de agitación,.... 2.8. Experimento aleatorio Actividad que tiene como resultado o que produce un evento. Prueba donde existen dos o más resultados posibles, y no se pude anticipar cuál de ellos va a ocurrir. Cuando en tus ensayos que vienes realizando no puedes controlar completamente todas las variables intervinientes en el proceso como variaciones internas de una dieta alimenticia, materia prima, temperatura del ambiente, metabolismo de los animales que intervienen en el experimento.. 2.9. Unidad experimenta1 10 Es el material experimental al que se le aplica un tratamiento de manera uniforme. Es la variable que el experimentador manipula o unidad de análisis, se caracteriza por unos atributos que la diferencia unas de otras parcial o totalmente; pueden someterse a ordenación de acuerdo con algún criterio. Unidad experimental es el material (objeto del experimento)al que se aplica un tratamiento de manera uniforme. También es la unidad de observación, es la entidad (p.ej el alimento, la parcela,el semoviente, el catador) sobre la que se mide una o varias características de interés. Por ejemplo: Puede ser un producto a mejorar, un conjunto de materias primas (frutas, hortalizas, tejidos musculares), un lote de un producto, un tubo de ensayo, etcétera. Un producto de panadería, una variedad de productos del agro (maiz, harina de trigo), frutas de una región, tejidos musculares, un sustrato para ensayos biotecnológicos. 2.10. Selección del material experimental. (8) El muestreo, o selección de las unidades experimentales que van a componer la muestra a analizar, debe diseñarse de modo que esta muestra sea representativa del fenómeno o la población estudiada, de manera que los resultados obtenidos se puedan extrapolar a situaciones diferentes de las que se van a medir.
Diseño Experimental Cria43
28
Los principales problemas que comprometen dicha representatividad son la falta de independencia de las muestras y el efecto de factores no controlados que puedan estar afectando los resultados. La elección de las unidades es de importancia; por ejemplo en la planeación de experimentos de campo, se han hecho numerosos estudios de la variabilidad entre los rendimientos de materias primas provenientes de cultivos en parcelas de diferentes tamaños formas y de compañías o marcas, bajo tratamiento uniforme. Si los resultados del experimento van a ser aplicados a material no seleccionado, estos tipos de especialización tienen desventajas potenciales. Las respuestas obtenidas para tratamientos sobre material experimental altamente seleccionado, pueden no ser las mismas que se obtienen de material no seleccionado. Es importante definir el criterio de uniformidad el cual se refiere al tratamiento; al material experimental y la técnica. La cantidad de muestra debe ser la suficiente para permitir al experimentador realizar medidas auxiliares. 2.11. Repetitividad (precisión) de un experimento Es la variación en las mediciones hechas por un solo operador en la misma unidad y con el mismo instrumento o equipo de medición. Se define como la variación alrededor de la media. Esta variación debe ser pequeña con respecto a las especificaciones y o la variación del proceso. 2.12. Reproducibilidad de un experimento Variación entre las medias de las mediciones hechas por varios analistas con las mismas unidades experimentales y con el mismo instrumento de medición.
Capitulo 3.Repaso a conceptos estadísticos 3.1. Variable. Se pueden definir como todo aquello que vamos a medir, controlar y estudiar en una investigación o estudio. Son propiedades que se manipulan, miden y controlan en el transcurso de una investigación difieren entre si en muchos aspectos siendo el más importante el papel que desempeñan en una investigación y en el tipo de medición que se aplica. También se puede definir como variable a todo aquello que puede asumir diferentes valores, desde el punto de vista cuantitativo o cualitativo. Por lo tanto, es importante, antes de iniciar una investigación, que sepamos cuáles son las variables que vamos a medir y la manera en que lo haremos. Es decir, todas las variables que intervienen en la experimentación deben ser susceptibles de medición.
Diseño Experimental Cria43
29
Por ejemplo el tiempo es considerado siempre una variable, el diámetro que define el tamaño de un producto agrícola, una temperatura de proceso, una sustancia a adicionar en una formulación o racion, el tipo de soporte a utilizar para inmovilizar una enzima, un abono; etc. Cubillos, Munca, José Miguel. Estadistica 1 Módulo Autoformativo. Escuela Superior de Administración Pública Programa de Administración Pública Territorial.2002.
3.2. Variable independiente. Una variable independiente es aquella que, dentro de la relación establecida, no depende de ninguna otra, aunque pudiera estar dependiente si estudiáramos otro problema. Son las condiciones manipuladas por el investigador a fin de producir ciertos efectos. Es el valor de verdad que se le da a una hipótesis en relación con la causa, 3.3. Variable dependiente. (29 y otros) La variable independiente es aquella propiedad de un fenómeno a la que se le va a evaluar su capacidad para influir, incidir o afectar a otras variables. Es el factor que el investigador observa o mide para determinar el efecto de la variable independiente. La variable dependiente es la variable respuesta o variable salida. 3.4. Ejemplo de variables independiente y dependiente Por ejemplo, si el ingeniero investigador va a probar la hipótesis de que al suministrar una cantidad (%)determinada levadura a un amasijo, el grado de dureza del producto final se incrementa. En este caso, la variable independiente estará representada por la cantidad de levadura manipulada por el experimentador, y la variable dependiente será el grado de dureza de los productos obtenidos. 3.5. Variable de respuesta. Es una variable que el experimentador mide después de llevar a cabo los tratamientos para ver cómo es afectada por la variable experimental. Por ejemplo al suministrar una ración a una cría de conejos y cuantificar después de dos meses la ganancia en peso de cada uno de ellos.. 3.6. Factores Son las variables de proceso en una investigación, que se pueden medir en una escala continua. Por ejemplo presión, temperatura, peso, concentración. 3.7. Nivel. Un valor específico dentro de una escala ya sea cualitativo o cuantitativo que toma la variable experimental seleccionada para el estudio.. 3.8. Niveles de variables Son los diferentes valores (manipulados acorde con lo deseado) que se asignan a cada factor estudiado(variable independiente) en un diseño experimental.
Diseño Experimental Cria43
30
La variación (manipulación) de una variable independiente puede realizarse en dos o más grados. Los niveles pueden ser tomados de una escala de medida universal como por ejemplo dos grados Celsius,10 gramos o en %; etc. El grupo con ausencia de manipulación se denomina de control y el grupo con la presencia de la variable independiente es el grupo experimental. En otros experimentos la variable independiente se puede manipular en más de dos grados; por ejemplo cuando se utilizan tres niveles y se representan asi: X1 = concentración permisible de un preservante ( para pures, emulsiones carnicas, salsas, raciones, agroquímicos; etc) X2 = concentración intermedia del mismo preservante. X2 = concentración maxima del mismo preservante. X0 = ausencia de preservante o los purés, emulsiones carnicas, salsas, etc, en su estado natural. Una combinación de todos los factores se llama tratamiento. 3.9. Tratamiento. Los tratamientos vienen a constituir los diferentes procedimientos, procesos, factores o materiales y cuyos efectos van a ser medidos y comparados. El tratamiento establece un conjunto de condiciones experimentales que deben imponerse a una unidad experimental dentro de los confines del diseño seleccionado. En un experimento de una variable, cada tratamiento es un nivel de la variable experimental. Ejemplo: Dosis de acidificante, de proteína, proporción de estabilizante, procedencia de las productos provenientes del agro, variedades de un cultivo determinado. La Dosis suministrada (%) de una sustancia para mejorar las condiciones de un alimento; el sustrato aplicado (difrentes % s de nutrientes) en un proceso biotecnológico; la velocidad de enfriamiento (refrigeración); las variedades de un producto agrícola (naranja tangelo, valencia, mangoss, etc); la composición de una atmósfera de almacenamiento (% de los gases), etc. En un experimento se puede considerar una combinación de varios factores simples por ejemplo la composición, la temperatura, la presión, el tiempo, etc. 3.10. Testigo El testigo es el tratamiento de comparación adicional, que no debe faltar en un experimento; por ejemplo, si se usan cinco tratamientos con acidulante, el Diseño Experimental Cria43
31
testigo puede ser aquel tratamiento que no incluye acidulante. La elección del tratamiento testigo es de gran importancia en cualquier investigación, este se constituye como referencial del experimento y sirve para la comparación de los tratamientos en prueba. El es el tratamiento de comparación adicional, que no debe faltar en un experimento. Por ejemplo, si se quiere probar en una mermelada el grado de gelificación al agregar una nueva pectina, el rendimiento de extracción de un jugo de naranja al utilizar una nueva técnica de extracción; se planeará el ensayo de tal manera que se incluya una mermelada con una pectina tradicional ampliamente conocida y en la extracción se incluirá la técnica tradicional que se venia utilizando. 3.11. Replica A cada repetición de un tratamiento se le llama réplica. Una repetición completa de un tratamiento es una réplica. La réplica produce los siguientes efectos: 1. Por lo general, el promedio de varias réplicas de un tratamiento se acerca más que cualquier prueba sola al "verdadero" efecto de ese tratamiento. 2. Observando la variación entre réplicas del mismo tratamiento, es posible estimar la magnitud del error experimental. Esto permite determinar si las diferencias observadas entre tratamientos en una variable de respuesta, realmente son causadas por los tratamientos o sólo se deben a las variables de interferencia. 3. Si se asigna de manera aleatoria material experimental a las diferentes réplicas, es posible reducir los sesgos que podrían producir resultados engañosos. 3.12. Aleatorización. (8) Es una técnica dentro del diseño experimental la cual tiene como fin primordial asignar al material experimental un orden para realizar las corridas o ensayos individuales del experimento este orden se realiza al azar. Ayuda a sacar del promedio los efectos de factores extraños que pudieran estar presentes. Si el número de unidades no excede de 16 pueden usarse las tablas de los libros de estadística. Por ejemplo supongamos que hay 3 tratamientos, 2 de los cuales tienen 4 repeticiones y el tercero 8. En cualquier orden conveniente, se asignan los números del 1 al 16 a las unidades.
Diseño Experimental Cria43
32
Y acorde con las TABLA 1. del capitulo uno de la unidad uno ( Permutaciones al azar), permutaciones de: 5 para una permutación al azar seleccionamos; por ejemplo: la columna ( ) que tiene el siguiente orden: 4 3 9 2 9 (para las primeras cinco columnas resaltadas y por ejemplo para las U12 - U16 9 6 9 8 1 Y comenzamos a dar estos códigos a las unidades iniciando con la U1 y asi hasta finalizar con la U16 Tabla 1. Ejemplo de unidades experimentales a aleatorizar U1 U9
U2 U10
U3 U11
U4 U12
U5 U13
U6 U14
U7 U15
U8 U16
*** Por ejemplo, podría hacerse un experimento para averiguar cómo los distintos tipos de azúcares afectan la textura o cómo las temperaturas del procesamiento afectan el contenido de humedad de un producto. La información obtenida hace posible manipular una o varias variables a fin de controlar otras.
3.14. Respuesta a las preguntas ¿Qué es investigación? Según Enrique Biermann, la investigación obedece a diferentes conceptos, entre los cuales se resumen los siguientes: “Es el proceso por el cual el hombre, partiendo de preguntas de diverso orden e importancia, busca obtener respuestas, para obtener diferentes objetivos” “Es un proceso de conocimiento y aprendizaje teórico - práctico, que se desarrolla en diferentes fases, mediante el empleo de diferentes instrumentos o herramientas” ¿Qué es investigación? Según Enrique Biermann, la investigación obedece a diferentes conceptos, entre los cuales se resumen los siguientes: “Es el proceso por el cual el hombre, partiendo de preguntas de diverso orden e importancia, busca obtener respuestas, para obtener diferentes objetivos” “Es un proceso de conocimiento y aprendizaje teórico - práctico, que se desarrolla en diferentes fases, mediante el empleo de diferentes instrumentos o herramientas” En síntesis se puede decir que: “investigar es buscar respuestas a diferentes incógnitas que se plantean ante cualquier suceso o problema” pero, que en la medida que encontramos respuestas se presentan otras incógnitas, que nos obliga a seguir indagando. Entonces, ¿qué es investigación científica? La investigación científica se puede definir, como un tipo de investigación “sistemática, controlada, empírica y crítica, de proposiciones hipotéticas, sobre las presumidas relaciones entre fenómenos naturales”. Sistemática y controlada implica, que tiene un método y que los hechos no se dejan a la causalidad; “empírica” que se basa en fenómenos observables de la realidad y “crítica” que los hechos se plantean de manera objetiva, dejando a un lado las preferencias personales o juicios de valor.
Diseño Experimental Cria43
33
TABLA 2. Actividades a desarrollar en el capitulo tres
Actividades
Actividades N°1
Actividades
Fecha de entrega
Cada estudiante debe en una serie de propuestas de investigación identificar quién es la población, la muestra e identificar de qué tipo son las variables que se incluyen.
Acorde con la programación la convenida con el tutor
Para un trabajo de grado desarrollado en el ciclo profesional realice una investigación estadística sobre las características de las materias primas utilizadas.
Acorde con la programación la convenida con el tutor
Y acorde con la tabla de permutaciones como realizaría la estabilización de un producto desarrollado en el PEDT? *** O de una practica que hallas realizado en un curso tomado en la profesión que estudias.
Acorde con la programación la convenida con el tutor
Trabajo a realizar
Trabajo para realizar por los estudiantes
Actividades N°2
Ejercicio practico de estudio, reflexión y análisis. Numeral 2.37
Actividades N°3 Trabajo para realizar por los estudiantes
Diseño Experimental Cria43
Ejercicio propuesto por el docente del curso
Fase de aprendizaje
Reconocimiento
Profundización
Acorde con la programación la convenida con el tutor Transferencia
34
Capitulo cuarto:
Definiciones y herramientas aplicadas a los diseños
experimentales 4.1. Población y muestra. Población o universo es cualquier conjunto de unidades o elementos como personas, fincas, producto agrícola, producto terminado, etc., claramente definidos para el que se calculan las estimaciones o se busca la información. En todo diseño experimental deben estar definidas las unidades, su contenido y extensión. Cuando es imposible obtener datos de todo el universo es conveniente extraer una muestra, subconjunto del universo, que sea representativa. En todo proyecto se debe especificar el tamaño y tipo de muestreo a utilizar: 4.2. Población Se encuentran varias definiciones para una población transcribiremos algunas de ellas: Es el conjunto formado por todas las unidades objeto de un estudio estadístico. También lo podemos definir como el conjunto de individuos o elementos que cumplen ciertas propiedades comunes. O como la colección de todos los elementos que se están estudiando y sobre los cuales intentamos llegar a unas conclusiones. 4.2.1. Tipos de poblaciones En relación al tamaño de la población, ésta puede ser: •
•
Finita, como es el caso del número de personas que integran una escuela, un panel de degustación, los arboles de una finca, las reses de una granja experimental: etc.. También todos los productos obtenidos en un día de proceso(tres turnos). Infinita, si por ejemplo estudiamos el mecanismo aleatorio que describe la secuencia de caras y sellos obtenida en el lanzamiento repetido de una moneda al aire, las reses que se puedan conseguir a nivel mundial, la producción de un metabolito por determinados microorganismos de la selva amazonica.
Consideremos que se va a realizar una degustación sensorial de un nuevo alimento en la población formada por todos los estudiantes de la escuela (alimentos+sistemas+básicas+regencia de farmacia) o población finita. 4.3. Individuos o elementos
Diseño Experimental Cria43
35
Personas u objetos que contienen cierta información que se desea estudiar. Por ejemplo todos los embutidos provenientes de un turno laboral al que se le han modificado algunas etapas de elaboración. 4.4. Muestra Subconjunto
representativo
de
una
población.
Puede ser el embutido(s) tomado(s) de una producción para análisis sensorial y fisicoquímico.
Unidad experimental
Unidad observacional
Bordura Un semoviente de un hato, una codorniz de una avícola. Figura 3. Ejemplo de una unidad experimental uobservacional. 4.5. Tipos de muestreo 4.5.1. Muestreo aleatorio simple En este tipo de muestreo cada elemento tiene la misma probalbilidad de ser elegido y todas las combinaciones son igualmente probables. La población se supone probable. La selección se puede hacer con reemplazamiento o sin reemplazamiento; en el primer caso cada elemento puede seleccionarse mas de una vez mientras que en segundo puede seleccionarse solo una vez. Con reemplazamiento cuando en un estudio de almacenamiento de un comestible se toma la muestra empacada (una libra) se le realizan pruebas y se regresa la muestra al sitio de almacenamiento. 4.5.1. Muestreo estratificado En este caso la población puede divirse en en grupos o en categorías(estratos). Por ejemplo se tiene una población integrada por 200 reses para un estudio de parasitismo, para su estudio se clasifican acorde con las razas ( 20 normando, 30 santa getrudis, 100 holstein, 50 yersey), las edades y algún otro criterio que los investigadores consideren importante Después de divididas las muestras pasa a ser un muestreo aleatorio simple.
Diseño Experimental Cria43
36
4.6.Datos obtenidos Son los reportes que se obtienen producto de la actividad investigativa y dan conocimiento a la variabilidad de las observaciones del experimento. Estos usualmente son los reportados como Yi.. ; etc. En todos los ejercicios que se realizaran en el modulo. 4.7. Elección de la muestra. (Varios autores) Para que una muestra resulte representativa de toda la población, debe ser lo suficientemente grande como para reflejar la variación dentro de la misma. Por ejemplo, para evaluar el rendimiento en jugo por hectárea de una producción de naranjas tangelo sembrada en una superficie de 30 hectáreas, se podría medir el rendimiento de una hectárea y multiplicarlo por el número de hectáreas del sitio de donde provienen. Sin embargo, el rendimiento entre árboles difiere considerablemente; sin duda se obtendrá una estimación más exacta midiendo el rendimiento en jugo, por ejemplo, de 10 hectáreas y obteniendo un resultado, más verosímil y más cercano al que se obtendría con la medición de todas las plantas. 4.8. Parámetro Este es un termino empleado por los estadísticos para describir las características de las poblaciones y las muestras, se denominan así las mediciones de tendencia central y variación, como la media y la desviación estándar, de las características fijas e invariables de las poblaciones. Es decir es una función definida sobre los valores numéricos de características medibles de una población. 4.9. Estadístico Es una función definida sobre los valores numéricos(observaciones) de una muestra. Puede ser la media, la varianza, etc. Tabla3. 4.12. Estimación puntual y por intervalo. 30 Un estimador puntual de un parámetro desconocido, es un estadístico que genera un valor numérico simple que se utiliza para hacer una estimación del valor del parámetro desconocido. Por ejemplo, tres parámetros relacionados con las características de calidad de un proceso, sobre los que frecuentemente se desea hacer inferencia, son: La media del proceso (población), la varianza a2 o desviación estándar a del proceso. 4.13. La media aritmética. Es la resultante promedio de un conjunto de valores de los cuales algunos tienen más frecuencia representativa. Cuando nos referimos al "promedio" de algo, estamos hablando de la media aritmética.
Diseño Experimental Cria43
37
Para encontrar la media aritmética, sumamos los valores y el resultado lo dividimos entre el número de observaciones. La media de una población se simboliza con µ (letra griega miu). El número de elementos de una población se denota con la letra mayúscula cursiva N. Por lo general, estadísticamente se utilizan letras del alfabeto latino para simbolizar la información sobre las muestras y letras del griego para referirnos a la información sobre poblaciones.
Tabla 3. Símbolos para los parámetros y estadísticos
CARACTERISTICA
Media Desviación estandar
SIMBOLO DEL PARAMETRO
SIMBOLO ESTADISTICO
μ σ
σ ρ π
2
Varianza
Correlación Proporción
x SD S2
r p
4.14. Cálculo de la media a partir de datos no agrupados. (2, 3, 7) Media de la población: µ=x/N X =x/n
Ecuación 1 Ecuación 2
Para calcular esta media, sumamos todas las observaciones. Los estadísticos se refieren a este tipo de datos como datos no agrupados. 4.15. Cálculo de la media de datos agrupados. Para calcular este estadístico se deben tener en cuenta las siguientes consideraciones: ⌧ Una distribución de frecuencias consta de datos agrupados en clases. Diseño Experimental Cria43
38
⌧ Cada valor de una observación cae dentro de alguna de las clases. ⌧ No sabemos el valor individual de cada observación. ⌧ A partir de la información de la tabla, podemos calcular fácilmente una estimación del valor de la media de estos datos agrupados. ⌧ Para encontrar la media aritmética de datos agrupados, primero calculamos el punto medio de cada clase. ⌧ Para lograr que los puntos medios queden en cifras cerradas, redondeamos las cantidades. ⌧ Después, multiplicamos cada punto medio por la frecuencia de las observaciones de dicha clase, sumamos todos los resultados y dividimos esta suma entre el número total de observaciones de la muestra. X = ∑ ( fX / n) Ecuación 3
f = frecuencia de observaciones de cada clase x= punto medio de cada clase de la muestra n = número de observaciones de la muestra 4.16. Varianza de una población. (2, 3, 7 y varios autores) Es igual a la suma de los cuadrados de las diferencias alrededor de la media de población μ , dividida entre el tamaño de la población.
N
σ 2 = ∑ ( X i − μ)2
N
Ecuación 4
i =1
N
∑(X i =1
i
− μ ) 2 = Suma
de los cuadrados de las diferencias entre los valores X i y μ
Ecuación 5
N = tamaño de la población 4.17. Desviación estándar de una población La desviación estándar de la población es:
σ=
N
[∑ ( X i − μ ) 2
N ] Ecuación 6
i =1
4.18. Significancia estadística p. El valor p o de significación observado de una prueba estadística es el valor mas pequeño de α ] con el cual puede rechazarse H0. Es el riesgo real de cometer un error tipo I, si se rechaza H0 con base en el valor observado del
Diseño Experimental Cria43
39
estadístico de prueba.en otras palabras el valor p mide la fuerza de la evidencia contra H0 En la experimentación, se acostumbra usar niveles de significancia del 5 y del 1 por ciento. Si el valor p es menor que un nivel de significación α ] preasignado, entoces puede rechazarse la hipótesis nula, e informar que los resultados son estadísticamente significativos en el nivel α ] . Cuando la hipótesis nula es cierta, entonces se dice que la diferencia es significativa. Al informar acerca de la significación estadística muchos investigadores escriben ( p<0,05), para indicar que el valor p de la prueba era menor que 0,05, haciendo os resultados significativos en el nivel de 5%. En las revistas de que publican trabajos de investigación esto se expresa como significativos (p<0,05) y el valor del criterio de la prueba se marca con un asterisco *. Si un valor del criterio de prueba tiene una probabilidad menor que el 1 por ciento cuando la hipótesis nula es verdadera, se dice que la diferencia es altamente significativa y el valor calculado del criterio de prueba se señala con dos asteriscos **. 4.8. Tamaño de la muestra En un experimento tomar una muestra más pequeña de la necesaria naturalmente será menos costosa pero conducirá a resultados sin utilidad práctica puesto que el error estándar se incrementa a niveles inadmisibles. Una amplia variedad de fórmulas se emplean para calcular cuál es el tamaño requerido de una muestra mientras que diversos programas de cómputo hacen los cálculos de tamaños de las muestras para un gran número de diseños de estudios y de métodos estadísticos. Lerman (1996) hizo una descripción avanzada acerca de la lógica para calcular el tamaño de una muestra para investigación en ingeniería. En cualquier diseño experimental se debe decidir el numero de replicas que se realizara por cada tratamiento. Este numero de replicas determina el tamaño de la muestra. Por ejemplo si se espera que se hallen pequeñas diferencias en la respuesta final el número de muestra debe ser el mayor posible para detectar diferencias significativas. Y al contrario si las diferencias son grandes. Y por el contrario si son varios tratamientos se deben reducir las replicas. También es muy importante considerar el costo, el material disponible y la disponibilidad de los equipos a utilizar. De allí que es muy importante tener criterios para calcular, así sea aproximadamente, el tamaño de la muestra. Para ello se usan fórmulas Diseño Experimental Cria43
40
basadas en las propiedades de la distribución normal y el error estándar que permiten calcular los intervalos de confianza para obtener una determinada probabilidad P. Para determinar el tamaño de la muestra se deben considerar la confiabilidad, la probabilidad y el error muestral.
μ
Por ejemplo sea la media de una poblacion y ancho del intervalo esta definido como;
x ,la media muestral el
__
Ancho del int ervalo = μ − X
Ecuación 7
__
o sea la desviación de X población).
μ − X = (ZS ) / n
(media muestra/) con respecto a
μ (media de la
Ecuación 8
__
L μ − X = d S, se puede decir que
Si Si __
d=Z S
n Ecuación 9
n =Z S
d Ecuación 10
n=Z S d Entre las muchas formulas propuestas por los estadísticos para calcular el tamaño de una muestra se consigue la siguiente si el investigador tiene pensado realizar el muestreo con reemplazamiento o de una población infinita el numero de muestra a considerar es: 2
2
2
n = Z2 S2N / d2 (N-1)+Z2 S2 Ecuación 11 N = Tamaño de la población
S = Recorrido de la variable (R.V) /6 = { [Valor máximo de la Variable - valor mínimo de laVariable ] / 6} Ecuación 12 Donde Z = Coeficiente de confiabilidad y depende de la probabilidad deseada o valor critico correspondiente a un área de (1- α )/2 desde el centro de una distribución normal. S= Desviación estándar de la muestra. n = Tamaño de la muestra.
La fórmula anterior requiere que se conozca la desviación estándar la cual no se conoce y debe estimarse para lo cual se pueden utilizar los siguientes procedimientos: Diseño Experimental Cria43
41
- Se toma una muestra piloto de la población. La varianza de esta muestra se usa como una estimación de S2. - Si existen datos de estudios similares anteriores puede usarse como estimación uno de ,ellos. 4.9. Ejemplo de determinación de número de muestras. a) Población infinita En una fabrica de conservas se establece una muestra de 700 mermeladas y una probabilidad de que algunas presenten histeresis (lloronas) en un 30%, con una confiabilidad del 95%, encontrar el error muestral. Como no se conoce la varianza supongamos que se toman al azar una serie de muestras (20 frascos) en dos turnos de proceso y se determina que tienen una desviación estándar de S2 = 10 El siguiente paso es calcular el coeficiente de confiabilidad Z asociado a la confiabilidad del 95% Z = (1- α )/2 = (1-5)/2= 2 Aplicando la formula
n = Z2 S2N / d2 (N-1)+Z2 S2
¿De que orden seria el tamaño de la muestra a tomar? ¿Y el error muestral si se hubieran tomado solo 10 frascos? b) Calcular el tamaño de la muestra para el mismo producto (memelada) con una confiabilidad del 96% , un error del 1.5%, y una probabilidad de que el fenómeno acurra estimada en el 60%. n = Z02 PQ / E2 n = 9 (60)(40)/ 2.25 = 864 frascos 4.9. Recomendaciones para la elección y tamaño de muestra. (8 y varios autores)
Los investigadores deben conocer qué tan grande se necesita la muestra antes de comenzar una investigación, porque de otra manera no podrán determinar la significancia cuando se presente o se requiera. Para calcular el tamaño de la muestra a utilizar en una investigación que requiere una media se debe responder a las siguientes cuatro preguntas: 1. ¿Qué grado de significancia (grado α o valor de p) requiere en relación con la hipótesis de nulidad? 2. ¿Cuál es el grado de la potencia (igual a 1 o valor de r2 ) que desea? 3. ¿ Qué tan grande debe ser la diferencia ente la media y el valor estándar o norma para que la diferencia tenga importancia desde la ingeniería de alimentos?
Diseño Experimental Cria43
42
4. ¿Cuál es una estimación suficiente de la desviación estándar en la población? 4.19. Hipótesis Etimológicamente es la suposición de una verdad que debe ser verificada o rechazada. Es una explicación que al comienzo de una investigación se le da a un hecho, es una conjetura a la realidad. Y sirve para orientar al investigador en el encuentro de una verdad.(Ver modulo de trabajo de grado ciclo tecnológico y ciclo profesional del mismo compilador)
4.20. Planteamiento de una hipótesis estadística Una hipótesis estadística es una afirmación sobre los valores de los parámetros de una población o proceso, que es susceptible de probarse a partir de la información contenida en una muestra representativa obtenida de una población. Por ejemplo, la afirmación "este proceso produce menos del 6% de defectuosos" se puede plantear estadísticamente, en términos de, proporción p desconocida de artículos defectuosos que genera el proceso. Ho : p =0.06 (la proporción de defectuosos es 0.06) HA: p < 0.06 (la proporción es menor a 0.06) 4.21. Formulación y prueba de hipótesis Una hipótesis es una afirmación acerca de algo. En estadística, puede ser una suposición acerca del valor de un parámetro desconocido. La prueba es el medio de verificación para saber si algo es verdadero o falso y hasta que grado podemos decir que sea verdadero o falso. Pasos en la prueba de hipótesis: ⌧ ⌧ ⌧ ⌧ ⌧ ⌧
Definir la hipótesis nula: suponer una hipótesis acerca de una población. Formular una hipótesis alternativa: es una contra-hipótesis. Definir un criterio de decisión para rechazar o no la hipótesis nula. Inspeccionar los datos de la muestra. Calcular una estadística de muestra. Utilizar la estadística de muestra para evaluar la hipótesis.
Recomendación se debe hablar de "no rechazar" una hipótesis en lugar de "aceptar", ya que las pruebas no son concluyentes. 4.22. Estadístico de prueba. Una vez planteada la hipótesis, se toma una muestra aleatoria (o se obtienen datos mediante un experimento planeado de acuerdo a la hipótesis de la población en estudio). El estadístico de prueba es un número calculado a partir de los datos y la hipótesis nula, cuya magnitud permite discernir si se rechaza o Diseño Experimental Cria43
43
se acepta la hipótesis nula Ho Al conjunto de posibles valores del estadístico de prueba que llevan a rechazar Ho,se le llama región o interur de rechazo para la prueba, y a los posibles valores donde no se rechaza Hl les llama región o intervalo de aceptación. Por ejemplo, para las hipótesis planteadas el estadístico de prueba está dado por 0.08 Zo = vlO.08(1- 0.08) / n' 4.23. Análisis de datos. (2, 3, 7 y varios autores) El análisis depende del nivel de medición de las variables, de la manera como se hayan formulado las hipótesis, el interés del investigador en el problema que este investigando. Podemos usar una serie de números conocidos como estadística sumaria para describir las características del conjunto de datos. Dos de estas características son de particular importancia para los responsables de tomar decisiones: la de tendencia central y la de dispersión, entre los cuales tenemos la mediana, la moda, medidas de tendencia central, desviación media, la dispersión, sesgo en curvas y graficas, curtosis, la media aritmética, la mediana, la moda, la dispersión, distribución de frecuencias, histogramas, la varianza de una población, puntuaciones Z, razones y tazas, análisis de varianza. 4.24. Pruebas de hipótesis. (2, 3, 7 y varios autores) En general una prueba de hipótesis comienza con una teoría o aseveración relativa a cierto parámetro de una población para lo cual se definen dos hipótesis conocidas como: • •
La Hipótesis nula Ho la cual es la hipótesis que se prueba siempre. Y la Hipótesis alternativa H1 que se establece como el opuesto a la hipótesis nula y representa la conclusión que se apoya si la hipótesis nula se rechaza.
En lo que se conoce como metodología de prueba de hipótesis clásica, se recomiendan los siguientes puntos a tener en cuenta: •
La Hipótesis nula Ho siempre se refiere a un valor especifico del parámetro de población (como μ ) , no al estadístico maestral ( como −
X) A partir de este numeral se deben consultar las tablas que se encuentran e textos de estadística como las tablas T-Student, de distribución F, comparación de medias de Duncan, etc. 4.25. Pruebas de hipótesis Z para una media poblacional (
Z = X −μ
Diseño Experimental Cria43
(σ
σ conocida)
n ) Ecuación 13
44
X = Media muestral observada; μ = media hipotética
El denominador representa el error estándar. σ 2 = Varianza de la poblacion 4.26. Ejemplo y procedimiento a desarrollar para una prueba de hipótesis propiamente dicha. Una organización de consumidores esta interesada en determinar si existe diferencia en el peso entre diferentes marcas de cajas de 500 gramos de cereales para el desayuno, para lo cual acepta una varianza de 10 gramos. Para el efecto el estudiante ( de ser posible) recopilara 25 datos, los almacenara en una tabla y los analizara; se aconseja trabajar con una significancía del 5%. Los pasos a seguir para la prueba de hipótesis son los siguientes: 1. Establezca la hipótesis nula Ho. Ésta debe expresarse en términos estadísticos. Por ejemplo: Al probar si la cantidad promedio de llenado es 500 gramos, la hipótesis nula asegura que ( μ ) es igual a 500gramos. 2. Establezca la hipótesis alternativa H1. También debe expresarse en términos estadísticos. Al probar si la cantidad promedio de llenado es de 500 gramos, la hipótesis alternativa asegura que ( μ ) es inferior a 500 gramos. 3. Elija el nivel de significancia α . Éste se determina después de tomar en cuenta los riesgos especificados de cometer errores tipo I y tipo II en una situación particular. La compañia eligió α = 0.05. 4. Elija el tamaño de la muestra n. Éste se determina después de tomar en cuenta los riesgos especificados de cometer errores tipo I y tipo II ( es decir, los niveles seleccionados de a α y β y de considerar las restricciones de presupuesto al realizar el estudio. En este caso se pesaron 25 cajas de cereal seleccionadas al azar. 5. Determine la técnica estadística adecuada y la estadística de prueba correspondiente que se usará. Dado que si σ se conoce por que la compañía especificó que eran 15 gramos, se eligió una prueba Z. 6. Establezca los valores críticos que dividen las regiones de rechazo y no rechazo. Una vez especificadas las hipótesis nula y alternativa y determinados el nivel de significancia y el tamaño de la muestra, se pueden encontrar los Diseño Experimental Cria43
45
valores críticos para la distribución estadística adecuada, de manera que se puedan indicar las regiones de rechazo y no rechazo. Para el caso se utilizaran los valores + 1.96 Y - 1 .96 para definir las regiones porque el estadístico Z se refiere a la distribución normal estándar. 7. Recopile los datos y calcule el valor muestral del estadístico de prueba adecuado. Realice una toma de datos (determinación) y calcule la gramos, entonces y obtenga el valor Z = + ...........
X media = .......
8. Determine si el estadístico de prueba está en la región de rechazo o de no rechazo. El valor calculado del estadístico de prueba se compara con los valores críticos de la distribución muestral apropiada para determinar en qué región se encuentra. En este caso, . Z= +...... esta en la región de rechazo o no rechazo porque 1.96 < Z == +.... < + 1 .96. 9.Tome una decisión estadística. Si el estadístico dé prueba está en la región de no rechazo, la hipótesis nula, Ho no se puede rechazar; si el estadístico de prueba está en la región de rechazo, la hipótesis nula se rechaza. 10. Exprese la decisión estadística en términos de una situación particular. De ser afirmativa la diferencia entre las cantidades, que acción correctiva propondrías y aplicarías? 4.27. Prueba de t. (12) La prueba de t es conocida a veces como prueba de t de Student, por recibir el nombre de la persona que la estudió primero, en 1890. Student en realidad era un matemático llamado William Gosset, empleado por la Cervecería Guiness, quien se vio obligado a usar el pseudónimo de Student, debido a que por política de la compañía se tenía prohibido a los empleados publicar sus investigaciones. Gosset descubrió que cuando una observación procede de una distribución normal, las medias se distribuyen de manera normal, sólo sí se conoce la verdadera desviación estándar de la población. La prueba de t se emplea mucho en todas las áreas de la ciencia. La distribución de t, es similar a la distribución de z la cual se explicó en numeral anterior y, uno de sus mayores usos, es responder a interrogantes de investigación sobre medias y cuando se desconoce la verdadera desviación estándar.
t = X −μ
Diseño Experimental Cria43
(S
n ) Ecuación 14
46
S, es la desviación estándar calculada por: n
S = [∑ (X i − X )2
n − 1] Ecuación 15
i =1
4.28. Suposiciones de la prueba de t con una muestra. (2) Para usar una prueba t con una muestra, se supone que los datos numéricos se obtienen de una manera independiente y representan una muestra aleatoria de una población que sigue una distribución normal. En la práctica, se ha encontrado que siempre que la muestra no es muy pequeña y la población no tenga un sesgo grande, la distribución t proporciona una aproximación a la distribución muestral de la media cuando (sigma) no se conoce.
σ
4.29. Prueba de z para la diferencia entre dos medias. (2, 3, 7, 12 y varios autores)
Z = (X 1 − X 2
) − (μ1 − μ2 )
(σ
2 1
X = Media de la muestra de la
n1 ) + (σ 2
2
n2
)
Ecuación 16
poblacion 1 ;
μ1 2 = Media de la poblacion 1 σ 1 2 = Varianza de la poblacion 1 ; n1 = tamaño de la muestra tomada de la población 1
X2
= Media
de la muestra de la poblacion 2 ;
μ 2 2 = Media de la poblacion 2 σ 2 2 = Varianza de la poblacion 2 ; n2 = tamaño de la muestra tomada de la población 2
El estadístico de prueba sigue una distribución normal estándar.
H o : μ1 = μ 2
H 1 : μ1 # μ 2
Diseño Experimental Cria43
μ1 − μ 2 = 0
μ1 − μ 2 #0
47
4.30. Prueba de t para la diferencia entre dos medias El cálculo de la prueba de t para la diferencia entre dos medias se realiza con:
(
t = X1 − X 2
) − (μ 1 − μ 2 )
S = (n1 − 1) S12 + (n 2 − 1) S 22
(Sp{(1
n1
(n1 −1) + (n 2 − 1)
) + (1
n2 )}
Ecuación 17
Ecuación 18
S2p = varianza combinada X1,2 = medias de la muestra tomadas de las poblaciones respectivamente S1,2 = varianzas de la muestra tomadas de las poblaciones respectivamente 4.31. Grados de libertad. Es el número de observaciones tomadas en exceso para estimar un parámetro. (Lipson y Sheth 1973).
O el numero de variables menos el numero de relaciones lineales ( restricción). 4.32. Análisis de la varianza. (3, 7, 8, 27 y varios autores) El análisis de varianza fue ideado por Sir Ronald Fisher en 1925, de gran aplicación cuando en una investigación se tiene el propósito de corrobar por medio del análisis estadístico los efectos de uno o más factores sobre el comportamiento de una característica o variable dependiente. El como Anova (Analysis of variance) o Anava; es una técnica estadística que sirve para analizar la variación total de los resultados experimentales de un diseño en particular, descomponiéndolo en fuentes de variación independientes atribuibles a cada uno de los efectos en que constituye el diseño experimental, compara dos o más medias. Esta técnica tiene como objetivo identificar la importancia de los diferentes factores ó tratamientos en estudio y determinar como interactúan entre sí. El ANOVA es una prueba semejante a la prueba t de Student, en cuanto a la práctica, pero la comparación entre grupos no es a través de la media y su desviación estándar, sino a través de la varianza de la variable numérica “y”, en cada grupo de la variable categórica “x”. Básicamente el análisis de Varianza, se utiliza para corroborar si la significación de diferencias entre medias de dos o mas grupos, son o no debidas al azar. La cifra estadística obtenida con el Anova es la razón F. Suponiendo que se analizan 2 grupos, el Anova, analiza las variaciones entre los dos grupos (inter-grupal) y la compara con la variación dentro de cada
Diseño Experimental Cria43
48
grupo (intra-grupal), para obtener mediante una suma de cuadrados el valor de F. Si las diferencias de varianza entre cada grupo son mayores que las intragrupales, seguramente existen diferencias significativas entre los grupos que no son debidas al azar. Los grupos se definen como en la prueba t eligiendo una variable categórica. La variable a analizar debe ser numérica y de distribución simétrica. 4.33. Bases del análisis de la varianza. Supónganse k muestras aleatorias independientes, de tamaño n, extraídas de una única población normal. A partir de ellas existen dos maneras independientes de estimar la varianza de la población (S2) 1) Una varianza dentro de los grupos (ya que sólo contribuye a ella la varianza dentro de las muestras), o varianza de error, o cuadrados medios del error, y habitualmente representada por SCError (Mean Square Error) que se calcula como la media de las k varianzas muestrales (cada varianza muestral es un estimador centrado de S2 y la media de k estimadores centrados es también un estimador centrado y más eficiente que todos ellos). SCError es un cociente: al numerador se le llama suma de cuadrados del error y se representa por SCE y al denominador grados de libertad por ser los términos independientes de la suma de cuadrados. 2) Otra llamada varianza entre grupos (sólo contribuye a ella la varianza entre las distintas muestras), o varianza de los tratamientos, o cuadrados medios de los tratamientos y representada por SCtrat o MSB (Mean Square Between). Se calcula a partir de la varianza de las medias muestrales y es también un cociente; al numerador se le llama suma de cuadrados de los tratamientos (se le representa por SCtrat) y al denominador (k-1) grados de libertad. SCtrat y SCError , estiman la varianza poblacional en la hipótesis de que las k muestras provengan de la misma población. La distribución muestral del cociente de dos estimaciones independientes de la varianza de una población normal es una razón con distribución F con los grados de libertad correspondientes al numerador y denominador respectivamente, por lo tanto se puede contrastar dicha hipótesis usando esa distribución. Variación total =Variación dentro de los tratamientos+ Variación entre los tratamientos Suma de cuadrados total = Suma de cuadrados dentro+Suma de cuadrados entre Diseño Experimental Cria43
49
Variación total =
ε
Variacióndentrodelos tratamientos= k
Estimacion de la var ianza dentro de tratam = ∑ k =1
nj
∑[ j =1
−
X IJ − X
]2
i
n−k
Ecuación 19 k
Estimacion de la var ianza entre tratam = ∑ n j [ k =1
−
X
i . IJ
−
−−
X General ]
2
Ecuación 20 −
X
= media de cada grupo
i . IJ
−−
X Genaral = Gran media A estas estimaciones se les conoce con el nombre de media de suma de cuadrados. Obtenidas las estimaciones se halla la razón entre ellas, la cual es una estimación F. F= Estimación entre los tratamientos / Estimación dentro de los tratamientos. Si en base a este contraste se rechaza la hipótesis de que SCtratamiento y SCME tenen la misma varianza, se puede rechazar la hipótesis de que las k medias provengan de una misma población. Aceptando que las muestras provengan de poblaciones con la misma varianza, este rechazo implica que las medias poblacionales son distintas, de modo que con un único contraste se contrasta la igualdad de k medias. Existe una tercera manera de estimar la varianza de la población, aunque no es independiente de las anteriores. Si se consideran las kn (N) observaciones como una única muestra, su varianza muestral también es un estimador centrado de S2. Se suele representar por CMT, se le denomina varianza total o cuadrados medios totales, es también un cociente y al numerador se le llama suma de cuadrados total y se representa por SCMT, y el denominador (kn -1) grados de libertad. Los resultados de un análisis de varianza (anova) se suelen representar en una tabla como la siguiente:
Diseño Experimental Cria43
50
k −1
Tabla 4. Ejemplo de un análisis de varianza SC
CM
F0
Fuente de variación
Grados de Libertad
Suma de cuadrados
Cuadrados medios
Razón
Entre Tratamientos
k-1
SCtratamient
SCtrat /(K-1)
SCtrat/ SCME
Dentro del Error
N-k
SCE
SCE /(N-K)
Total
N-1
SCT
SCTotal / (KN 1)
p-valor
F P (F>F0 )
K= Numero de tratamientos o niveles o grupos del factor de interés N= Numero total datos reportados n = Numero total de datos por grupo
CMtratam = SCtratam / (K-1) CME
Ecuación 21
= SCE /(N-k) Ecuación 22
Con F0 calculado como SCtrata / SCE
Ecuación 23
Y Con un α elegido ( generalmente 5%), con unos grados de libertad en el numerador (k-1), con unos grados de libertad en el denominador (N-k) se encuentra el valor critico superior de la distribución F, en una tabla de valores críticos como la del ejemplo del numeral 4.8, 4.9. El valor de F tabulada (Ft) se encuentra en las tablas con 4 grados de libertad en la horizontal o sea el numerador o tratamientos, y 15 grados de libertad en la vertical o sea el denominador o grados de libertad del error. Además, con el nivel de significancia ya sea de 5% o de 1%. Al comparar el valor de F calculado con el valor de F tabulada para 5 y 1% de significancia, se observa que Fc es mayor que Ft, lo cual indica que hay significancia. Por lo tanto, se rechaza Ho, esto quiere decir que hay uno varios tratamientos mejores que los demás. Si Fc es menor Ft los resultados no son significativos. Esto indica que se acepta la hipótesis nula de que no existen diferencias entre los tratamientos. El valor significativo de F implica que los tratamientos no pertenecen a poblaciones con μ común. Indica que los tratamientos difieren en forma significativa, pero no nos dice o señala cual de ellos es mejor. Una de las bases para estas pruebas son el error estándar de la media Sx y el error estándar para la diferencia entre medias de tratamientos Sd. En el ejemplo anterior estos valores serian: Sx = √ S2/r = √ 58.8/4 = √ 14.70 = 3.83 ; De donde S2 = cuadrado medio del error o varianza y, r = numero de repeticiones
Diseño Experimental Cria43
51
GRAFICO DE ANOVA Ejemplo de toma de decisión Distribución Fisher
Fexcelente Alfa
Zona de no rechazo de Ho O de no aceptar Ha
Zona de rechazo De Ho o aceptar Ha
Fc 2
Figura 4. ANOVA toma de decisión. 4.34. Diferencia mínima significativa Es la diferencia mínima que debe haber entre dos medias muéstrales para poder considerar que dos tratamientos son diferentes. Cuando para este diseño se rechaza la hipótesis de igualdad entre los tratamientos el investigador se pregunta cual(es) de ellos son diferentes entre si. Para averiguarlo se emplean los métodos de comparación de medias, uno de estos métodos(formulas) es el LSD diferencia minina significativa (Ecuacion 24) en donde se sustituye el numero de replicas por el numero de bloques, y también se deben cambiar los grados de libertad del error en el caso de bloques esta dado por (b-1)(tratam-1). Para Ktratamientos se tienen un total de k(k-1)/2 pares de medias. K=tratamientos b= bloques N = Total de experiencias observaciones para cada tratamiento.
n= numero de
El valor de tα / 2, N − K se toma de las tablas de la distribución T de Student con N-K grados de libertad del error.
LSD = tα / 2, N − K 2CME / n
Ecuación 24
4.35. Error experimental En todo proceso experimental se presentan dos clases de variaciones: la variación inherente al material experimental, al que se aplican los tratamientos y la que proviene de la falta de uniformidad en la realización física del Diseño Experimental Cria43
52
experimento o variaciones externas a la experimentación (como las ambientales, etc) que tienden a enmascarar el efecto de los tratamientos. Para expresar estas variaciones ajenas a los tratamientos los estadísticos aplican el término error experimental; término que no quiere decir equivocación, sino que incluye todo tipo de variación externa ajena al material experimental. Este error experimental es la medida de variación que existe entre las observaciones de unidades experimentales en el mismo tratamiento, es decir, la variación no proveniente de los tratamientos. Para los fines de cálculo en las ecuaciones se expresa con la letra
ε
4.36. Errores tipo I y tipo II. (8) Cuando se contrastan o se prueban las hipótesis se pueden cometer dos tipos de errores por los siguientes motivos:
•
La prueba de hipótesis comienza con una suposición, llamada hipótesis, que hacemos con respecto a un parámetro de población.
•
Después recolectamos y clasificamos los datos, aplicamos la estadística seleccionada a las muestras y usamos esta información para decidir qué tan probable es que sea correcto nuestro parámetro de población acerca del cual hicimos la hipótesis.
•
Debemos establecer el valor supuesto (hipotetizado) del parámetro de población antes de comenzar a tomar la muestra.
•
La suposición que deseamos probar se conoce como hipótesis nula, y se simboliza por H0.
•
Siempre que rechazamos la hipótesis, la conclusión que sí aceptamos se llama hipótesis alternativa y se simboliza por H1.
*** El rechazo de una hipótesis nula cuando es cierta se denomina error de tipo I, y su probabilidad (que es también el nivel de significancia) se simboliza como α . *** *** El hecho de aceptar una hipótesis nula cuando es falsa se denomina error de tipo II, y su probabilidad se simboliza como β . ***
•
La probabilidad de cometer un tipo de error puede reducirse sólo si deseamos incrementar la probabilidad de cometer el otro tipo de error.
Con el propósito de obtener una (probabilidad) β baja, tendremos que tolerar una probabilidad α alta; sin embargo el nivel de significancia adecuado se
Diseño Experimental Cria43
53
debe decidir acorde con los costos y desventajas vinculadas con ambos tipos de errores. 4.37. Las modalidades más recomendadas para disminuir el error son: En toda marcha experimental que se realice se debe a) Utilizar unidades experimentales muy uniformes, como materias primas homogéneas, procesos, densidad de muestras, etcétera. b) Tamaño adecuado de la unidad experimental. e) Eliminación de la competencia entre tratamientos. d) Distribución adecuada de los tratamientos mediante sorteos (azar). e) Usar el número adecuado de repeticiones para cada tratamiento. f) Poner todos los tratamientos en igualdad de condiciones, de manera que si alguno es superior a los demás, se pueda probar. 4.38. Modelo estadístico. (Varios autores) La finalidad de una serie de experimentos es determinar un modelo estadístico que refleje la creencia respecto a la relación entre los tratamientos y las observaciones. Cada resultado del experimento si este se repite n veces, esta determinado por
μ
la media general
y el efecto del tratamiento
τ.
La identificación de este fenómeno y la comprobación de las suposiciones se hacen en el momento de proponerlo basándose en el siguiente modelo matemático:
Yij = μ + τ i
Modelo matemático Ecuación 25
En donde i= 1,……., k j=1,…., r
numero de tratamientos numero de repeticiones
μ = promedio de todas las unidades experimentales del experimento = X Y
o
según el caso.
τ i = la diferencia entre el promedio ( μ ) y el resultado cuando se tiene la combinación de factores determinada por el tratamiento i. Como hay variaciones no controlables, la inexactitud de las mediciones, conforman un factor llamado error experimental ( ε ). El modelo finalmente se expresa como:
Yij = μ + τ i + ε ij
Modelo estadístico Ecuación 26
4.39. Análisis de Covarianza. Lo que se busca en cada, experimento es la veracidad de una hipótesis. Diseño Experimental Cria43
54
Cuando la hipótesis se refiere a los parámetros del fenómeno se convierte entonces en hipótesis estadística como la variabilidad del clima, de una temperatura en un proceso así se disponga de métodos de medida con bastante precisión y exactitud, sin olvidar que el resultado de todo experimento tiene un componente llamado error, generalmente debido al azar. Este efecto aleatorio obliga al investigador a recurrir a la estadística para minimizarlo y probar las hipótesis con un grado importante de certeza. El análisis de covarianza es un procedimiento muy importante en experimentación para la verificación de las hipótesis, pero lamentablemente no se usa con frecuencia. El análisis de covarianza permite realizar ajustes con las respuestas de las unidades experimentales en las que se varía un factor medible, con la respuesta que se hubiese obtenido, si todas las unidades experimentales hubiesen tenido, el valor promedio del factor variable, para eliminar así el efecto de ese factor. El análisis de covarianza entre muchas utilidades, se puede ,utilizar también para ajustar las respuestas de las unidades de experimentación de promedios de dos o mas factores variables denominadas covariables. Utiliza el análisis de varianza y el de regresión para eliminar la variabilidad que existe en la variable independiente X; también ajusta medias de tratamiento y así estima mucho mejor el efecto de la variable independiente X sobre la variable dependiente Y. La variable independiente X es una observación hecha en cada unidad experimental antes de aplicar los tratamientos, e indica hasta cierto grado la respuesta final Y de la unidad experimental. Por ejemplo en una granja asistida por la UNAD se realizo un experimento con el fin estudiar la conveniencia de raciones alimenticias en la ganancia de peso de los anteriores para lo cual se les determinaron los pesos iniciales X y el consumo de alimento Y; si los investigadores utilizan diferentes raciones las diferencias fisicas y efectos que presentan los semovientes pueden ser o no ser significativas, por la calidad de las raciones. Por lo tanto se deben preguntar si: ¿Al existir variación en los pesos iniciales de los semovientes, la diferencia que se presentan en los pesos finales es debido a las propiedades de alguna de las raciones? O que en un alto porcentaje se deban a las diferencias de los pesos iniciales? Por medio del análisis de covarianza, se puede calcular el efecto de la bondad de las raciones, eliminando la parte correspondiente a los pesos iniciales. 4.40. Recomendaciones • Al plantear un estudio estadístico, definir claramente la población objeto de análisis. Diseño Experimental Cria43
55
•
Si se trabaja con muestras, definir las condiciones que deben reunir antes de extraerlas.
•
Especificar qué se va a medir, las unidades a usar y la forma de registro.
4.41. Software estadísticos para la solución de problemas. De los programas adecuados para el manejo, el procesamiento y análisis de datos citamos los siguientes: Excell, minitab, statgraphics, SAS, curve expert; etc. sin embargo con la utilización de una calculadora también es posible la realización de la gran mayoría de las operaciones involucradas en el procesamiento de los datos.
Figura 5. Portada del programa Statgraphics.
Diseño Experimental Cria43
56
Figura 6. Hoja de cálculo de excell *. * Se le asigna el nombre de hoja de cálculo a un hoja que esta divida en renglones y columnas, al cruce de ellos se le denomina celdas sobre las cuales se almacena información (letras o números) que podemos usar para realizar operaciones, tales como sumas, restas, multiplicaciones, divisiones, cálculos financieros, estadísticos, de ingeniería, amortizaciones, etc.
4.42. Ejercicio desarrollado Ejercicio practico de estudio, reflexión y análisis. En un proyecto de investigación para la normalización de frutas se encontraron los siguientes datos de la producción de canastillas de 50 kilos de uchuva de un tamaño previamente seleccionado en 50 fincas del oriente de Cundinamarca: a) Con los datos anteriores y aplicando las formulas matemáticas suministradas compruebe que los datos obtenidos para este ejemplo de partida en el proyecto de normalización de frutas se pueden presentar como:
Tabla 5. Producción de canastillas de uchuva en seis veredas
Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5 49
61
44
39
31
30
60
38
36
66
50
41
43
47
49
40
38
30
51
69
53
47
45
44
45
33
32
51
64
44
40
52
43
39
58
60
59
42
39
31
48
43
47
48
35
36
56
60
40
36
Diseño Experimental Cria43
57
Grupo 1
Grupo 2, ,,…..
Variación interna 1
Variación interna 2,….
Grupo 5
Variación interna 5
Variación entre grupos
Figura 7.Varianza entre las diferentes fincas productoras de uchuvas.
Tabla 6. Resumen estadístico de los datos totales recolectados de la producción de uchuvas en cinco municipios de Cundinamarca. Características estadísticas encontradas para el proyecto de normalización Muestras totales(canastillas) Sumatoria total Promedio Varianza Desviación estándar Valor Mínimo de producción de uchuva Valor Máximo de producción de uchuva Sesgo Curtosis o apuntamiento
Enumere otras propiedades de interés para tener en cuenta en este ejercicio.
50 2282,0 45,64 99,2963 9,96475 30,0
69,0 1,33489 -0,66762
.
Diseño Experimental Cria43
58
Tabla 7. Resumen estadístico de los datos recolectados por mes de la producción de uchuvas en cinco municipios de Cundinamarca. M e S
Nº fincas
Promedio
Varianza
Desviación estándar
Skewness estándar
1
5
44,8
126,2
11,2339
0,402954
2
5
46,0
254,0
15,9374
0,482584
3
5
46,0
15,0
3,87298
0,392837
4
5
45,6
227,3
15,0765
0,950036
5
5
46,8
13,2
3,63318
1,62367
6
5
44,8
177,7
13,3304
0,574125
7 8
5 5
46,4 46,2
68,3 163,70 ,7283
8,26438 12,7945
0,693964 0,139123
9
5
44,2
30,7
5,54076
-1,4506
1 0
5
45,6
132,8
11,5239
0,538284
S u m
50
45,64
99,296 3
9,96475
1,33489
Kurtosis estándar 0,1668 01 1,1925 8 1,0041 6 0,3705 86 1,4570 1 0,3340 78 -86 1,1074 7 0,9761 77 1,3006
224,0
0,6676 2
2282,0
a- Revisa las graficas siguientes y sustenta si falta alguna de interés.?
PRODUCCION ANUAL DE UCHUVAS CAJAS DE 50 KILOS
70 60 50 40 30 1
2
3
4
5
6
7
8
9
10
MES
Figura 8. Grafico de la producción anual de uchuvas. Diseño Experimental Cria43
Sumatoria por grupo
59
230,0
230,0
228,0 234,0 224,0
232,0 231,0
221,0 228,0
MES
GRAFICO DE CAJAS Y BIGOTES 1 2 3 4 5 6 7 8 9 10 30
40
50
60
70
PRODUCCION DE UCHUVA
Figura 9. Grafico de cajas y bigotes de la producción mensual de uchuvas.
MEDIAS E INTERVALOS DEL 95% LSD 54 CJAS UCHUV
51 48 45 42 39 FINC 1
FINC 2
FINC 3
FINC 4
FINC 5
FINCAS
Figura 10. Grafico de medias e intervalos para la producción de uchuvas por finca. b- Además encuentre la mediana, la media, la frecuencia absoluta, el numero de muestras mínimas. c- Con los datos obtenidos elaboramos el cuadro de distribución de frecuencias. d- El tamaño de la muestra tomado es correcto? d-Que se podría concluir y decidir con los anteriores datos y que sugerencias se tendrían.? e- Complete el siguiente cuadro de análisis de mariaza para el ejercicio anterior con un nivel de confianza del 95,0%.
Tabla 8. Análisis de varianza (ANAVA) par el ejemplo de las fincas productoras de uchuva. Diseño Experimental Cria43
60
Grados de Libertad.
SC
CM
F0
Suma de cuadrados
Cuadrados medios
Razón
Entre grupos (fincas)
4
SCtratam
SCtratam /(k-1)
0,03
Dentro de los grupos = Error
45
SCE
SCE /(N-k)
Total
49
4865,52
SCMT / (kn -1)
Fuente de variación
p-valor
1
•
Y además responda si este valor de F-prueba es mayor, menor o iguala al p tomado como 0,05 (5%)?
•
Hay diferencia estadísticamente significativa en la producción de uchuva de un mes a otro?
4.43. Ejercicios y actividades 1 - Revise un artículo de una revista con temas pertinentes con la ingeniería de alimentos y o las ciencias agrarias,: a) Tome de él las variables que intervienen y clasifíquelas. b)Identifique el diseño experimental propuesto por los investigadores ejemplifique los conceptos de indicador y dimensión de una variable. c) ¿El criterio dado para decidir si el experimento fue exitoso considera que fue el apropiado.? 2- Un ingeniero conduce un experimento para comparar la absorción media de aceite esencial en un medio poroso. Para lo cual selecciona aleatoriamente una tira cinco posibles de un absorbente y lo divide en cinco pedazos uno de 3,5 centímetros, otro de cinco, ocho centímetros el siguiente, diez centímetros y trece centímetros el ultimo. Identifique la unidad experimental, los factores y los niveles de factor presentes en el experimento. Se podría anexar tomar otra división y dejarla al ambiente.? Como se le denominaría? Se podría plantear de otra forma? 3- En un supermercado operando bajo condiciones controladas, se evaluó, para 40 góndolas la temperatura alcanzada (20 con tubérculos y 20 con frutas) y se alcanzaron las siguientes temperaturas: Tubérculos Frutas
Diseño Experimental Cria43
8,5 8,4
8,7 8,2
8,8 8,7
8,9 8,6
8,7 8,3
8,3 8,5
8,7 8,3
8,4 8,5
8,2 8,4
61
a) ¿Identifica los tratamientos que se compararon en este estudio? b) ¿Las muestras de los vegetales son dependientes o independientes? Explique. e) ¿Podríamos decir que la temperatura promedio de los vegetales es igual para tubérculos y vegetales? 4- Los profesionales de una granja agropecuaria experimental están tratando de tomar una dedición para la compra de un complemento alimenticio para lo cual evalúan las ofertas de dos proveedores de raciones alimenticias mediante la verificación de ganancia en peso de dos lotes de semovientes y determinaron las siguientes ganancias en peso (Kgs). Proveedor 1 9 10 11 12 8 9
Proveedor 2 10 10 10 9 11 11
Calcular la media, la varianza, la desviación estándar. Plantear las hipótesis, y que concluiría de la ganancia en peso. Si consideramos un α = 0.05. B) Si la empresa decide probar con otro proveedor que criterio aplicarías?. Para este complemento se obtuvo la siguiente información:
Proveedor 3 8 8 6 12 12 13 Probar objetivamente si existe diferencia significativa entre los proveedores. ¡¡ Trabajo para desarrollar en casa y entregarlo al tutor.
Diseño Experimental Cria43
62
UNIDAD SEGUNDA: Los diseños experimentales en la ingeniería de alimentos Capitulo quinto: Clasificación de los diseños experimentales 5.1. Características de los diseños experimentales. (Varios autores) Los diseños experimentales deben tener entre otros las siguientes características: a. Simplicidad. La selección de los tratamientos y la disposición experimental deberá hacerse de la forma más simple posible. b. Grado de precisión. El experimento deberá tener la capacidad de medir diferencias entre tratamientos con los grados de precisión que desee el investigador. Para cumplir con este propósito se deberá partir de un diseño y un número de repeticiones adecuados. c. Ausencia de error sistemático. Se debe planear un experimento con el propósito de asegurar que las unidades experimentales que reciban un tratamiento no difieran sistemáticamente de aquellas que reciben otro tratamiento, procurando de esta manera obtener una estimación insesgada del efecto de tratamientos. d. Rango de validez de las conclusiones. Este deberá ser tan amplio como sea posible. Los experimentos que contribuyen a aumentar el rango de validez del experimento son los experimentos replicados y los experimentos con estructuras factoriales. e. Cálculo del grado de incertidumbre. En todo experimento existe algún grado de incertidumbre en cuanto a la validación de las conclusiones. El experimento deberá ser concebido de modo que sea posible calcular la probabilidad de obtener los resultados observados debido únicamente al azar. 5.2. Aaspectos influyentes en la selección de un diseño experimental. (Varios autores)
Se puede decir que el número de diseños experimentales es tan amplio como el numero de situaciones a estudiar y dar respuesta y a la gran diversidad de problemas o situaciones que ocurren en la práctica diaria de las profesiones. De allí que es importante saber cómo elegir el más adecuado para la situación o problema que se quiere resolver, por lo tanto la clasificación de los diseños de acuerdo a su objetivo y a su alcance dentro del objetivo en cuestión. Los cinco aspectos que más influyen en la selección de un diseño experimental son: a. El objetivo del experimento. b. El número de factores a controlar. c. El número de niveles que se prueban en cada factor. d. Los efectos que interesa investigar (relación factores-respuesta). e. El costo del experimento, tiempo y precisión deseada. 5.3. Clasificación de los diseños experimentales acorde con su utilización. (Varios autores)
Diseño Experimental Cria43
63
Para dar solución al gran número de situaciones y problemas teóricos prácticos que se presentan en la ingeniería y en otras actividades profesionales se han propuesto un buen numero de diseños experimentales cantidad que hacen necesario saber elegir el más adecuado para la situación que se quiere resolver, de allí que es conveniente conocer su clasificación de acuerdo a su alcance dentro del objetivo en propuesto. En este sentido, de acuerdo con su objetivo y sin pretender ser exhaustivo, los diseños se pueden clasificar como: 1. Diseños para comparar dos o más tratamientos. 2. Diseños para estudiar el efecto de varios factores sobre la(s) respuesta(s ). 3. Diseños para determinar el punto óptimo de operación de un proceso. 4. Diseños para la optimización de una mezcla. 5. Diseños para hacer el producto insensible a factores no controlables. Ejemplos de los anteriores son los que se van a tratar en este curso como los citados a continuación : Diseño Completo al Azar, Diseño de Bloques Completos al azar, diseño de Cuadro Latino, diseño de Cuadro Greco Latino, diseño factorial 2K, diseños factoriales 3K. 5.4. Experimentos de una variable Los experimentos de una variable se realizan para averiguar cómo una variable experimental afecta una o más variables de respuesta. En este tipo de experimentos, los tratamientos son simplemente niveles seleccionados de la variable experimental. Dependiendo de la variable experimental seleccionada, los tratamientos pueden diferir ya sea cualitativa o cuantitativamente. 5.5. Diseñó de experimentos sin bloquear. (Varios autores) A estos experimentos algunos autores los denominan diseño totalmente aleatorizado o completamente al azar, es el diseño más simple y se usa cuando las unidades experimentales son homogéneas, tienen las mismas posibilidades de recibir cualquier tratamiento y la variación entre ellas es muy pequeña. Como en los experimentos de laboratorio, de invernadero en experimentos en donde las condiciones ambientales son controladas, en algunos casos este diseño necesita solo una replica con un solo criterio de clasificación. Por lo tanto: 1. Es fácil de planear. 2. Es flexible en cuanto al número de tratamientos y repeticiones, el límite está dado por el número de unidades experimentales en general. 3. No es necesario que el número de tratamientos sea igual al número de repeticiones. 4. No se estiman unidades o muestras perdidas. Diseño Experimental Cria43
64
5. El número de grados de libertad para el error aumenta por no tener muchas restricciones. Las desventajas del diseño completamente al azar son: 1. No es eficiente con material experimental heterogéneo. 6. Puesto que no existen restricciones en cuanto a la aleatoriedad, el error experimental incluye la variación total entre unidades experimentales. El análisis de varianza para el diseño completamente al azar se muestra en las tablas 25 y 26. 5.6. Procedimiento estadístico para la comprobación de hipótesis en un diseño al azar. El procedimiento a seguir es común y debe ser acorde con lo planteado en la siguiente tabla. Tabla 9. Procedimiento estadístico para la comprobación de hipótesis
INFORMACION RECOPILADA SOBRE LA RESPUESTA A LOS TRATAMIENTOS
A
B
OBSERVACIONES
Total tratamiento
por
Media tratamiento
por
F1B1 F2B1
F1C1 F2C1
F3A1
F3B1
F3C1
Yi.1 N n
Yi.=∑ Yi j=1
Gran media
C
F1A1 F2A1
Numero de datos n por tratamiento
Yi. = Yi.
n
Y .. = Y ..
N
OPERACIONES ARITMETICAS A DESARROLLAR PARA EL CALCULO DEL ANAVA
n
1. = suma de cuadrados de todas las observaciones 2. Suma de los datos 3. Numero total de mediciones 4. Media de los datos 5. Efecto del método = Y observada - Y media
N = an
Suma de SCT cuadrados totales Suma de SCt cuadrados de los tratamientos Diseño Experimental Cria43
65
Y el ANAVA en la siguiente tabla Tabla 10. Análisis de varianza para los tratamientos con un solo factor, en un diseño totalmente aleatorizado o completamente al azar.
Fuente de variación
Grados de Libertad
SC
CM
F0
Suma de cuadrados
Cuadrados medios
Razón
SCtrat / CME
Tratamientos
k-1
SCtrat
SCtrat /(k-1)
Error
N-k
SCE
SCE /(N-k)
Total
N-1
SCT
p-valor
P (F>F0 )
SCMT / (kn -1)
k= Numero de tratamientos o niveles o grupos del factor de interés N= Numero total de datos reportados n = Numero total por grupo
El procedimiento consiste en calcular la suma del cuadrado de los tratamientos, la suma de los cuadrados totales y por diferencia la suma de cuadrados del error. Tabla 11. recopilación y presentación de los resultados de los tratamientos, en un diseño totalmente aleatorizado o completamente al azar.
NIVEL
1
2
3
∑X ∑X 1
A
F1A1
F2A1
F3A1
B
F1B1
F2B1
F3B1
C
F1C1
F2C1
F3C1
D
F1D1
F2D1
F3D1
E
F1A1
F2A1
FjeAJ
Yi.1
Y i..1
Yi.1
∑ CT
∑X
F1A1 hasta FJEAJ son los análisis o las muestras recolectadas o tomadas Yij
es
F 1 A1
cada
uno
hasta
Fje
Diseño Experimental Cria43
de
los
datos
representa
dos
como
66
n
Yi. = ∑ Yij
∑ X = Y .. = Gran media
Ecuación 27
Yi. = Yi.
n
j =1
Ecuación 28 a =1
Y .. = ∑∑ Yi j Ecuación 29
Y .. = Y ..
N
Ecuación 30
j =1
N = an
Ecuación 31
N = datos totales registrados a = número de niveles de = A + B + C + D + E n = número de repeticiones = 1 + 2 + 3 + etc − ⎛ ⎞ − Yij Y .. ⎟ ⎜ ∑ ⎠ j =1 ⎝
a
n
SCTotal = ∑ i =1
2
SCTotal = n ∑ i =1
a
i =1
Ecuación 32
a − ⎛− ⎞ ⎜ Y i. − Y .. ⎟ + ∑ ⎝ ⎠ i =1
a
SCTotal = ∑
2
n
∑ ( Yij ) − [ Y .. 2
2
− ⎛ ⎞ − Yij Yi .⎟ ⎜ ∑ ⎠ j =1 ⎝ n
N
]
2
Ecuación 33
Ecuación 34
j =1
n
SS tratamientos = ∑ Yij
n − [ Y ..2 / N
]
Ecuación 35
i =1
SSTotal = SStratam + SSerror
Ecuación 36
Cuadrado Medio de los trat = CMtratam = SCtratam /(k-1) Ecuación 37 Cuadrado Medio del error = CME= SCerror /(N-k) Ecuación 38 Con estos calcular el estadígrafo F0 como CMedio de tratT / CME 39
Ecuación
Y con un α elegido ( generalmente 5%), con unos grados de libertad en el numerador (k-1) de los tratamientos, con unos grados de libertad en el denominador (N-k) del error se encuentra el valor critico superior de la distribución F, en una tabla de valores críticos como la de los apéndices. Se realiza la comparación P (F>F0 ) para determinar las hipótesis propuestas. Este diseño sigue un modelo estadístico. (24) Diseño Experimental Cria43
67
5.7. Modelo estadístico para un diseño al azar. (Varios autores) Generalmente es representado por la ecuación siguiente:
Yij = μ + τi + εij
μ = mediaglobal τ i = tratamientos
Ecuación 40
εij = error 5.8. Ejemplo de un diseño de experimentos sin bloquear Se quiere mejorar las propiedades de transportabilidad, manejo y presentación de las rosquillas elaboradas por una panificadora, para tal efecto de determinara el efecto que sobre la dureza de estas tiene la incorporación de tres aditivos en la misma proporción; los aditivos se incorporaran individualmente en la masa elaborada (amasijo).
Diseño experimental totalmente aleatorizado Rosquilla
1
2
Ingrediente A
3
4
Ingrediente B
5
6
Ingrediente C
Figura 12. Diagrama de flujo para la producción de rosquillas a partir de una masa estandarizada. Para el estudio se empleara un diseño de experimentos sin bloquear.
•
Hipótesis de investigación: La hipótesis planteada es que al menos uno de los tres ingredientes mejorara la dureza final de las rosquillas.
Diseño Experimental Cria43
68
•
Diseño del experimento: una masa bien homogénea para la confección de las rosquillas se dividen en seis porciones iguales y a cada dos de ellas se les mezcla el ingrediente seleccionado.
La dureza se evalúa después de seis días de almacenamiento a 10*C. El primer paso es aleatorizar asignándole una secuencia de números aleatorios a las unidades experimentales, utilizando una de las tablas de permutación de donde se toma una permutación aleatoria por ejemplo: 318594267, asignar el primer tratamiento a las dos porciones del tratamiento A , los dos siguientes al tratamiento B y finalmente los otros dos restantes al tratamiento C En la tabla siguiente se resume la aleatorización hecha. Tabla 12. De aleatorización para el ejemplo de las rosquillas Porcion de masa Tratamiento o aditivo
3
1
7
5
4
8
2
6
9
A
A
A
B
B
B
C
C
C
Solucion: con los datos de la tabla desarrolle las operaciones indicadas n
Yi. = ∑ Yij = 7+9 +5+10+8+9+10+9+12 = 79
Yi. = 79 / 9 = 8.77
j =1
a
SCTotal = ∑ i =1
n
∑ ( Yij ) − [ Y .. 2
2
N
]
j =1
SCT = {(7)2+(9)2 + (5)2+(10)2 + (8)2+ (9)2+ (10)2+(9)2 + (12)2}- {(8.77)2/3x3 }= … SCtratamientos = [{(21)2+(27)2 + (31)2}]/3 -- {(8.77)2/3x3 }
SCT=SCE+SCt
Diseño Experimental Cria43
SCT – SCt = SCE
= ……..
SCE = …..
69
Tabla 13. Datos obtenidos en la determinación de la dureza para el ejemplo de las rosquillas. Tratamientos
Dureza o variable de respuesta Determinación Total Media (Und / cmt) 3
7
Aditivo A
7
Aditivo B
10
5 8
10
21
7
2
27
9
1
31
10.33
1.527
4
8 2
Aditivo C
1
9 5
Varianza
9 9
6
9
12
8.77
Gran media
Tabla 14. Análisis de varianza para evaluar el efecto de los aditivos en la elaboración de rosquillas. Grados de Libertad
SC
CM
F0
Suma de cuadrados
Cuadrados medios
Razon
Ecuac
Ecuac
Ecuac
Tratamientos
3-1=2
16,8889
8,44444
Error
6
14,6667
2,44444
Total
(9-1)=8
31,5556
Fuente de variación
p-valor
Ecuac 3,45
0,1004
SSTotales / (kn -1)
Si utilizamos además la prueba de rango múltiple para las rosquillas: 95% LSD Tabla 15. Análisis de homogeneidad y contraste de las rosquillas.
Tratamiento
Muestras
Media
A B C
3 3 3
7 9 10.33
Homogeneidad del grupo X XX X
Contraste (Diferencia) A-B B-C B-C
( -2) (-3.33)* (-1,33)
* Indica diferencia estadísticamente significativa
Diseño Experimental Cria43
70
Comprobando que el tratamiento seleccionado es el que presenta mejores condiciones para ser aplicado a la rosquilla.
Capitulo seis:
Diseño en bloques
6.1. Diseño de bloques completos al azar. (8) 6.1.1. Características. El objetivo del diseño de bloques completos al azar (DBCA) es reunir las unidades experimentales a las cuales se aplicaran los tratamientos, en bloques de cierto tamaño, de tal modo que los tratamientos se efectúen dentro de cada bloque, la variabilidad entre unidades experimentales de bloques diferentes será mayor que entre unidades del mismo bloque, como consecuencia, las diferencias encontradas entre unidades se deben principalmente a la discrepancia entre tratamientos. La disparidad que no se deba tratamiento, se elimina por el diseño y forma parte del error experimental. De acuerdo con esto, es fácil observar que la variabilidad entre bloques no afecta las diferencias entre medias de tratamientos, porque en cada bloque aparece una vez por tratamiento y así los bloques y tratamientos son ortogonales. En este diseño el material experimental es dividido en grupos de unidades experimentales (UE) lo más homogéneas posible. Cada uno de los grupos es una sola prueba o repetición. El objeto en todas las etapas del experimento es de mantener el error experimental dentro de cada grupo tan pequeño como sea posible en la práctica. Los conjuntos o grupos son llamados bloques. Dentro de cada bloque las (UE) son asignadas aleatoriamente, cada tratamiento ocurre exactamente una vez en un bloque. 6.1.2. Fuentes de variabilidad. En este diseño (DBCA) se consideran tres fuentes de variabilidad: el factor de tratamientos, el factor de bloques y el error aleatorio es decir, se tienen tres posibles responsables de la variabilidad que presenten los datos obtenidos. Se denominan completos porque en cada bloque se prueban todos los tratamientos, es decir, que los bloques están completos 6.1.3. Ventajas Las principales ventajas de bloques al azar son las siguientes: 1. Por medio de la agrupación comúnmente se obtienen resultados más exactos que cuando se usan diseños completamente al azar. Coch. 2. Puede incluirse cualquier numero de repeticiones. El análisis estadístico es el acostumbrado.
Diseño Experimental Cria43
71
3. Si la varianza del error experimental es mayor para algunos tratamientos que para otros aun puede obtenerse un error insesgado para probar cualquier combinación específica de las medias de los tratamientos. 4. Ningún otro diseño se usa tan frecuentemente como los bloques al azar.
6.1.4. Aleatorizacion. La aleatorización es realizada cuando las unidades se han agrupado y los tratamientos han sido asignados al azar a las unidades dentro de cada grupo. El nombre de bloques completos al azar es debido a que en cada bloque (por ejemplo un operador, un semoviente, una parcela) se prueban todos los tratamientos (completo) en orden aleatorio. 6.2. Procedimiento estadístico para la comprobación de hipótesis en un diseño de bloques completos al azar. El procedimiento a seguir es común y debe ser acorde con lo planteado en la siguiente tabla. Tabla 16. Recopilación y presentación de los resultados de los tratamientos, en un diseño de bloques completos al azar.
BLOQUES B1 Tratam XT1B1 r1
B2 XT1B2 XT2B2
B3 XT1B3
B4 XT1B4
r2
XT2B1
r3
XT3B1
XT3B2
XT3B3
XT3B4
r4
XT4B1
XT4B2
XT4B3
XT4B4
Y.j
Yi. B1
Yi. B2
XT2B3
XT2B4
Yi. B3
Yi. B4
∑X ∑X ∑X ∑X
∑X
Y i. R1 R2 R3 R4
Btotales
= ∑ Ttratotales..
∑ X = Y .. b
∑ X = Y .. = Gran media
Yi. = ∑ Yij Yi. = j =1
b
∑Yij j =1
Ecuación 41
a
Y .s = ∑Yij j =1
Yi. = Yi
b
Diseño Experimental Cria43
Ecuación 42
Ecuación 43
Y ij = Y . j
a
Ecuación 44
72
Y .. = Y ..
N
N = an
N = datos registrados totales a = número de niveles = A + B + C + D + E
Gran media
Ecuación 45
n = número de repeticiones = 1 + 2 + 3 + etc a
b
a
Y .. = ∑∑ Yi j = ∑Yi = ∑Y . j i =1 j =1
i =1
n
SCTotal = ∑ SS Bloques = [
∑ (Yij )
2
− (Y ..) 2
Ecuación 46
N
j =1
a
∑ (Y . j )
2
Ecuación 47
a ] − [(Y ..) 2
N
]
Ecuación 48
b ] − [(Y ..) 2
N
]
Ecuación 49
i =1
SS tratamientos = [
a
∑ (Y .i)
2
i =1
SSTotal = SSBloques + SSError
Ecuación 50
6.3. Arreglo de los datos en un diseño de DBCA. (Varios autores) Se acostumbra seguir el siguiente arreglo. Tabla 17. Arreglo de los datos en un diseño de bloques completos al azar.
BLOQUES
1 2 3 4
Y1f
TRATAMIENTOS 3 4 … Y31 Y41 … Y32 Y42 …. Y33 Y43 … Y34 Y44 .. …. … Y2f Y3f Y4f
Y.JB1
Y.JB2
1 Yll... Y12 Y13 Y14 …..
. f Y.JBJ
.....
2 Y22 Y21 Y23 Y24
Y.JB3
Y.JB4
Y.JB..
J Yj1 Yj2 Yj3 Yj4 … …
Yjf
YiB
Yi. B1 Yi. B2 Yi. B3 .. .
Yi. Bn.
Y.JBN
6.4. Modelo estadístico para un DBCA Cualquier observación en el DBCA, se puede representar por el modelo;
Yij = μ + τ i + γ j + ε ij Diseño Experimental Cria43
Ecuación 51
73
i= 1,……., k j=1,…., b
γ
numero de tratamientos
numero de bloques
j = efecto debido al bloque
6.5. Hipótesis a probar Las pruebas de hipótesis que se pueden efectuar dependen del tipo de modelo empleado.
• Estas conclusiones pueden estar sujetas a error: • Error de Tipo I: rechazar la igualdad de las medias de los tratamientos cuando éstas no difieren entre si.
• Error de Tipo II: no rechazar la igualdad de las medias de los tratamientos cuando éstas difieren entre si. H0 :
μ1 = μ 2 = μ3 = ...μ k = μ
Ha:
μ1# μ
Ecuación 52
j para algun i # j
6.6. ANOVA para un diseño en bloques completos al azar (DBCA) (Varios autores)
La metodología de análisis a emplear es el ANOVA a dos criterios de clasificación. En este caso, el análisis de varianza particiona la variabilidad total de la información en tres componentes: una primera debida al efecto de los tratamientos (Suma de Cuadrados Entre Tratamientos), la segunda a efecto de los bloques (Suma de Cuadrados de Bloques), y finalmente el Error Experimental (Suma de Cuadrados del Error). En la misma forma se particionan los grados de libertad. El rechazo o no de la hipótesis nula depende del valor del estadístico F: F = (S. C. de Tratamientos / t - 1) / (S. C. del Error / (t - 1) (r - 1)) Ecuación 53 Tabla 18. ANOVA para un diseño en bloques completos al azar
Suma de cuadrados Ecuac
Grados de libertad Ecuac
Cuadrados medios Ecuac
Tratamientos
SCtrat
k-1
SCtrat
Fo = SCtrat / CME
P(F > Fo)
Bloques
SCB
b-1
CMB
Fo = CMB /
P(F > Fo)
Diseño Experimental Cria43
Fo
p-value
Ecuac
74
CME Error
SCE
(k -l)(b -1)
Total
SCT
N-1
CME
6.7. Comparación de medias de tratamiento en el diseño de bloques completos al azar (BCA) Cuando para este diseño se rechaza la hipótesis de igualdad entre los tratamientos el investigador se pregunta cual(es) de ellos son diferentes entre si. Para averiguarlo se emplean los métodos de comparación de medias, uno de estos métodos(formulas) es el LSD diferencia mínima significativa (Ecuación ….) en donde se sustituye el numero de replicas por el numero de bloques, y también se deben cambiar los grados de libertad del error en el caso de bloques esta dado por (b-1)(tratam-1). Para K tratamientos se tienen un total de k(k-1)/2 pares de medias. K=tratamientos b= bloques N = Total de experiencias observaciones para cada tratamiento.
n= numero de
El valor de tα / 2, N − K se toma de las tablas de la distribución T de Student con N-K grados de libertad del error.
LSD = tα / 2, N − K 2CME / n
Ecuación 54
6.8. Ejemplo de bloques completos al azar (BCA) (Varios autores) Una empresa procesadora de jugos investiga el efecto de cuatro evaporadores en la velocidad de evaporación (concentración) de un jugo de tomate proveniente de cuatro localidades de la geografía nacional. Para lo cual se elabora un jugo con los tomates provenientes de una mima localidad y concentra cada uno de ellos en cuatro turnos en los cuatro evaporadores en orden completamente aleatorio. Como variable de respuesta se determina el tiempo de empleado para llegar a una concentración de 20 grados brix. El resultado de las 16 pruebas se presentan el la tabla 9. Por favor realizas las operaciones indiadas y discútelas con el tutor….. Tabla 19. Datos obtenidos en la determinación del contenido de sólidos para el ejemplo de concentración del jugo de tomate. Tratamientos = métodos de concentración
Diseño Experimental Cria43
75
BLOQUES =
1 2 3 4
Turnos
1
2
3
4
1.7 2.3 2 1.8
2.3 2.08 1.9 2
1.8 2.2 2.1 2.3
2.1 2.4 1.95 2
Para la realización de esta tabla se sigue el procedimiento que se ha venido siguiendo a través de los últimos cinco numerales. Tabla 20. Procesamiento de los datos obtenidos en la determinación del contenido de sólidos para el ejemplo de concentración del jugo de tomate. Métodos de concentración
Turnos
Totales por tratamiento Media por tratamiento
Totales por bloque
Medias
1
1 1.7
2 2.3
3 1.8
4 2.1
7,9
1,975
2
2.3
2.08
2.2
2.4
8,88
2,245
3
2
1.9
2.1
1.95
7,95
1,9875
4
1,8
2
2.3
2
8,1
2,025
7,8
8,28
8,4
8,44
1,95
2,07
2,1
2,11
33.83
n
Yi. = ∑ Yij = 1.7+2.3+1.8+2.1+2.3+2.08+2.2+2.4+2+1.9+2.1+1.95+….+2.3+2=……… j =1
Yi. = 79 / 9 = 8.77
… a
SCTotal = ∑ i =1
n
∑ ( Yij ) − [ Y .. 2
2
N
]
j =1
SCT = {(1.7)2+(2.32 + (1.8)2+(2.1)2 +….+ (2)2+ (2.3)2+(2)2 }- {(33.83)2/4x4 }= …
SCtratamientos = [{(7.8)2+(8.28)2 + (8.4)2+(8.44)}]/4 -- {(33.83)2/4x4 } SCBLOQUES = [{(7.9)2+(8.88)2 + (7.95)2+(8.1)}]/4 -- {(33.83)2/4x4 }
Diseño Experimental Cria43
= ……..
= …….. 76
SCT=SCE+SCt
SCT – SCt = SCE
SCE = ….
Y el ANAVA elaborado para este ejemplo es el siguiente:
Tabla 21. ANAVA para los datos obtenidos en la determinación del contenido de sólidos para el ejemplo de concentración del jugo de tomate. Suma de cuadrados Ecuac
Grados de libertad Ecuac
Cuadrados medios Ecuac
Fo
p-value
Ecuac
Tratamientos MET DE CONCENTRA
0,0661688
3
0,0220563
??
0,6662
Bloques B:OPERARIOS
0,191669
3
??
1,57
0,2641
Error
0,367006
9
0,0407785
Total
0,624844
15
?? debes completar los faltantes de la tabla 9 anterior. Ninguno de los factores tiene efecto significativo concentraciones el nivel de confidencia del 95%.
en el tiempo de
6.9. Ejercicio para realizar como actividad de grupo: Realizar un ensayo sobre la siguiente pregunta: ¿Cuando el numero de unidades experimentales no es igual que procedimiento se realiza? 6.10. Ejercicio propuesto Los profesionales de una empresa productora de quesos están realizando un estudio sobre la forma de presentar y transportar una variedad de queso (Q) que comercializan para lo cual han realizado una serie de mediciones sobre la
Diseño Experimental Cria43
77
dureza (de los mismos) en seis muestras provenientes de procesos diferentes utilizando para ello tres instrumentos de medida (P)... Obteniendo los siguientes resultados:
Q1 Q2 Q3 Q4 Q5 Q6
P1 9,5 10 11,4 11,2 9,8 9,4
P2 12,3 13 11,2 9,6 11 9,1
P3 12 10,8 10,6 10,2 10,2 10,3
-Probar si la diferencias entre la dureza de los quesos es significativa y si la diferencia entre los instrumentos de medida es significativa. Plantear las respectivas hipótesis, y que concluiría de la ganancia en peso. Si consideramos un α = 0.01.
Capitulo siete:
Diseño en cuadro latino
7.1. Diseño en cuadro latino El nombre de cuadrado Latino se debe a R.A. Fisher [The Arrangement of Field Experiments, J. Ministry Agric., 33: 503-513 (1926)]. Las primeras Aplicaciones fueron en el campo agronómico, especialmente en los casos de suelos con tendencias en fertilidad en dos direcciones. Diseño que contempla el control de dos factores de bloque, además del factor de tratamientos y los tres factores tienen la misma cantidad de niveles. Considerándose cuatro fuentes de variabilidad que vienen siendo los dos factores de bloque, el tratamiento y el error aleatorizado. El primer factor de bloqueo se representa en los renglones o filas, el segundo factor de bloqueo se representa en las columnas y los tratamientos se representan por letras latinas y se distribuyen en forma tal que cada tratamiento aparece sólo una vez en cada fila y una sola vez en cada columna (Latin square design). El interés se centra en un solo factor, los tratamientos, pero se imponen dos restricciones a la aleatorización en un cuadro como el ejemplo de la tabla del siguiente numeral. 7.2. Formación y tabulación de los datos experimentales en un cuadrado latino. Suponga 4 tratamientos A,B,C y D, con estos tratamientos se pueden formar 4 cuadros diferentes llamadas típicas o estandar (en la primera fila y en la primera columna se tiene la misma distribución).
Diseño Experimental Cria43
78
Tabla 22. Recopilación y presentación de los resultados de los tratamientos, en cuadro latino. A B C D
B A D C
C D B A
D C A B
A B C D
B C D A
C D A B
D A B C
A B C D
B D A C
C A D B
D C B A
A B C D
B A D C
C D A B
D C B A
De cada cuadro se obtienen 144 formas diferentes, en total se tienen 576 cuadros diferentes.
Un diseño de este tipo sólo es posible cuando el número de niveles de ambas restricciones sea igual al número de niveles del tratamiento. Por ejemplo, en una granja experimental si administramos tres medicamentos (tratamientos) a tres cabras con diferentes . El orden en el que los caprinos reciben los tratamientos puede ser completamente aleatorizado (diseño por bloques) o aleatorizado bajo la condición de “equilibrio” requerida para un cuadrado latino. Designemos los tratamientos por T1 ,T2 y T 3 . Una asignación equilibrada respecto al orden de administración puede ser 7.3. Arreglo de los datos en un diseño de Cuadro latino. Para facilitar el entendimiento de este diseño se debe seguir como ejemplo el recomendado por varios autores y presentado en la siguiente tabla: Tabla 23. Arreglo de los resultados de los tratamientos, en cuadro latino.
BLOQUES II 1
BLOQUES I
Yj..
1 2 3 4 . . f
2
A=Yl1l B=Y212 C=Y313 D=Y414
B=Y221 C=Y322 D=Y423 F =Y524
3
4
C=Y331 D=Y432 A =Y533 F=Y634
D=Y4411 E=Y442 B =Y443 A=Y544
….. .....
F=Yf1f
Y1..
A=Y12f
Y2..
B=Y23f
Yj..
… … …. … .. …. …
C=Y34f
Yj..
J
Yi..
F=YjJ1 A=Y1j2 B=Y2j3 C=Y3j4
Yi..1 Yi..2 Yi..3 Yi..4 Yi..,,
… …
J=YJjf
Ynj..
Yj..
Yi..f Y ... = ∑ Y ijk
La elección del cuadro latino se realiza antes de la obtención de los datos. 7.4. Procedimiento estadístico para la comprobación de hipótesis en un diseño de bloques en cuadro latino. El procedimiento a seguir es común y debe ser acorde con lo planteado en la siguiente tabla. Diseño Experimental Cria43
79
Y ... = la suma de todos los datos de la tabla de resultados Y ... = ∑ Y ijk
Ecuación 55
Yi.. = Yi..
bn
Yij. = Y ...
n
SCTotal = ∑
∑ ∑ ( Yijk ) − [ Y ...
i
Y j.. = Yj,\..
Ecuación 56
an Ecuación 57
Ecuación 58
2
j
2
]
N
Ecuación 59
k
t
SStratamie nto = ∑ [ Yijk2
a ] − Y ...
2
N
Ecuación 60
j =1
Nota : Los tratamientos se definen con las letras latinas b
[
SSrenglone s = ∑ Yijk2
b ] − Y ...
2
N
i =1
t
SScolumnas = ∑ [ Yijk2
c ] − Y ...
2
N
Ecuación 61
Ecuación 62
k =1
*Renglones primer factor de bloqueo **Columnas segundo factor de bloqueo A=b=c Los grados de libertad se cal SSTotales= SSrenglon+SScolumn+SStratamien+SSError Ecuación 63 7.5. Análisis del diseño de Cuadro latino (Varios autores) Cualquier observación en el DBCA, se puede representar por el modelo;
Yijl = μ + τ i + γ j + δ l + ε ijl i= 1,……., k j=1,…., b
Ecuación 64
numero de tratamientos numero de bloques
γ j = efecto debido al bloque δi = efecto debido al tratamiento
Diseño Experimental Cria43
80
1.19.2 Hipótesis a probar
H0 : μ1 = μ 2 = μ 3 = ...μ k = μ Ha:
μ1 # μ j para algun
i # j
7.6. ANAVA para el diseño de cuadro latino. El análisis de varianza se realiza siguiendo el método tradicional para comparar tres factores y en igual numero de factores, para el efecto se deben diligenciar las casillas contempladas en la tabla 36 y a manera de ejemplo practico en la tabla 23.
Tabla 24. ANOVA para el diseño de cuadro latino*
FUENTES DE VARIABILIDAD
SUMA DE CUADRADOS
GRADOS CUADRADOS DE MEDIOS LIBERTAD
Tratamientos
SCTRAT
k-1
Renglones
SCBl
Columnas
Fo
P-value
CMTRAT
F= CMTRAT/ CME
P (F > Fa)
k-1
CMBl
F = CMB l /CME
P(F > Fa)
SCB2
k-1
CMB2
F= CMB2/CME
P(F > Fa)
Error
SCE
(k - 2)(k -1)
CME
Total
SCT
k2 - 1
*Tomado de Gutierrez, H, et all. Analisis de experimentos. Capítulo Cuatro 132 SCT = SCtrat + SCBl + SCB2 + SCE
Ecuación 65
y los grados de libertad correspondientes son k2 -1 = (k -1) + (k -1) + (k -1) + (k - 2)(k -1) Ecuación 66
Diseño Experimental Cria43
81
7.7. Ejemplo para el diseño de cuadro latino. En una industria procesadora de alimentos se decide comprobar si es significativo la perdida en peso determinada en gramos de un producto almacenado en cuatro empaques diferentes A, B, C y D para lo cual se le solicita la comprobación del mismo a cuatro diferentes tecnólogos I, II, III y IV, utilizando para el efecto cuatro balanzas diferentes 1, 2, 3 y 4, las determinaciones son llevadas a cabo siguiendo el modelo de cuadro latino de la tabla siguiente: El resultado de las 16 pruebas se presentan el la tabla 25. Tabla 25. Datos recolectados por los tecnólogos Tecnólogo I
Métodos de pesado - Balanzas 1 2 3 4 A= 503 B= 507 C=510 D=512
II
B=514
A=493
D=495
C=496
III
C=507
D=509
A=509
B=505
IV
D=511
C=517
B=499
A=520
Procedimiento 1- Calcule la SCtratamientos (suma de cuadrados) acorde con la formula … y la tabla ……. 1.1. Para lo cual se debe calcular la sumatoria de todas los tratamientos A, los B, los C y los D como:
∑ A = 503 + 493 + 509 + 520 = 2025 ∑ D = 512 + 495 + 509 + 511 = 2027 Cada una de estas sumatorias se reemplaza en la ecuación de los tratamientos. 2- Calcule la SC renglones (suma de cuadrados) acorde con la formula dada. 3- Calcule la SCcolumnas (suma de cuadrados) acorde con la formula … 4- Calcule la SCTotales (suma de cuadrados) acorde con la formula Ec 10. 5- Determine el error por diferencia. SCE = SCT - SCtrat - SCBl - SCB2 6- Determine los grados de libertad correspondientes Ecuación …. 7- Calcule el ANAVA tabla ……. 8- Que se puede concluir
Diseño Experimental Cria43
82
El estudiante debe seleccionar la formula adecuada de las anteriormente propuestas.
Tabla 26. Calculo de los tratamientos (3eros o letras)
Letra latina
Total de tratamiento
A
A=
∑
∑ C= ∑
B
B=
C D
D=
∑
En este ejemplo A = 2025
Yl1l
B =2025
Y221
C =2030
Y331
D =2027
yi3
Tabla 27. ANOVA para el diseño de cuadro latino del ejemplo perdida de peso
FUENTES DE VARIABILIDAD
SUMA DE CUADRADOS Ecuac
GRADOS DE LIBERTAD Ecuac
CUADRADOS MEDIOS Ecuac
Fo Ecuac
P-value
Determinación peso- balanza
74,1875
3
24,7292
0,28
0,8355
Operario
??
3
106,229
1,22
??
Empaque
4,1875
3
??
0,02
0,9969
Error
522,375
6
87,0625
Total
919,438
15
?? Debes completar los faltantes de la tabla 27 anterior. No hay valores de P que sean menores de 0,05, y ningún factor presenta efecto significativo estadísticamente significativo en la perdida de peso en el nivel de 95% de confianza.
Diseño Experimental Cria43
83
Cual seria tu conclusión y que se podría recomendar para ejercicio? 7.8. Ejercicio propuestos 1) Con el fin de determinar si se presentan efectos en el peso, debido a la posición que pueden ocupar pollos de engorde, criados en jaula de 4 pisos (filas) y 4 casilleros (columnas). La variable analizada fue: Peso del pollo (kg.) a las 8 semanas de edad Casilleros Pisos 1 2 3 4
1 1.40(A) 1.35(B) 1.38(C) 1.39(D)
2 1.38(B) 1.28(A) 1.40(D) 1.39(C)
3 1.40(C) 1.45(D) 1.42(B) 1.40(A)
4 1.60(D) 1.62(C) 1.63(A) 1.60(B)
a) Formule y realice la Prueba de Hipótesis correspondiente. Use α=0.05 b) Realice la prueba de Tukey para comparar si existe diferencia entre el tratamiento A y B. Use α=0.05 c) Realice la prueba DLS para comparar si existe diferencia entre el tratamiento C y D. Use α=0.01 d) Utilice la prueba t para comparar si el peso promedio utilizando el tratamiento C es menor al peso promedio usando el tratamiento B. Use α=0.05
Capitulo ocho: Diseño en cuadro greco latino 8.1. Diseño en cuadro greco latino. Cuando se tiene un cuarto factor de bloque a controlar activamente en el diseño de cuadro latino como por ejemplo si en el ejercicio del numeral 1.19.5 se decide considerar el sitio de realización del experimento o la procedencia de un ingrediente para el producto considerado. Este diseño se denomina cuadro greco latino (DCGL), en el cual los niveles de el nuevo factor se denotan por las letras griegas α , β , δ , γ a; representándose los tratamiento con las letras latinas A, B, C y D. En el diseño en cuadrado greco-latino se superponen dos cuadrados latinos, resultando el siguiente modelo matemático:
Yijl = μ + τ i + γ j + δ l + β k + ε ijl i= 1,……., l j=1,…., b
Ecuación 67
numero de tratamientos numero de bloques
τ i = efecto debido al bloque 1 Diseño Experimental Cria43
84
γ j = efecto debido al bloque 2 δ l = efecto debido al tratamiento ηl =
cto debido al tratamient2
{ α l , β ,ϑ , ω }
El inconveniente de este modelo es que su utilización es muy restrictiva. Además pueden no existir cuadrados greco latinos de determinadas condiciones. 8.2. Formación y tabulación de los datos experimentales en un cuadrado greco latino. Tabla 28. Arreglo de los resultados de los tratamientos, en cuadro GrecoLatino.
1
2
α A=Y β B=Y ϑ C=Y ω D=Y
1 2 3 4 . . f
BLOQUES I Y i..
BLOQUES II Y ..k 3
β B=Y ϑ C=Y ϑ C=Y αω D=Y A =Y ω D=Y4 β B=Y α A=Y
l1l
331
22
432
212
322
533
313
2
414
23f
12f
4
Yi…
ω D=Y β B =Y α A=Y ϑ C=Y
F=YjJ1 A=Y1j2 B=Y2j3 C=Y3j4
4411 443
544
… …
34f
J=YJjf
Y…l
8.3. Procedimiento estadístico para la comprobación de hipótesis en un diseño de bloques en cuadro greco latino. El procedimiento a seguir es común y debe ser acorde con lo planteado en la siguiente tabla.
Y .... = la suma Y .... =
∑
de todos
los
datos
de la tabla
de resultados
Y ijkl
SCTotal = ∑ i
a
n
k
l1
∑ ∑ ∑ ( Yijkl ) − [ Y ... j
2
t
SStratamie nto letra latin = ∑ [ Y. 2j ..
2
N
p ] − Y ....
] Ecuación 68
2
N Ecuación 69
j =1
Nota : Los tratamientos se definen con las letras latinas
Diseño Experimental Cria43
85
p
[
p ] − Y ....
SSrenglone s = ∑ Yi...2
2
N
Ecuación 70
i =1
Pt
SScolumnas = ∑ [ Y....2 L
p ] − Y ....
2
N Ecuación 71
L =1
p
[
SStratamle trgriega = ∑ Y..2k .
p ] − Y ....
2
N
k =1
Ecuación 72
*Renglones primer factor de bloqueo **Columnas segundo factor de bloqueo Tratamiento representado por las letras griegas
α1 = β 2 = ω = ϑ Los grados de libertad se cal SSTotales= SSrenglon+SScolumn+SStratamienLatin+SStratamien;etrgriega+SSError Ecuación 73 8.4. Análisis del diseño de Cuadro greco latino (Varios autores) Cualquier observación en el DBCA, se puede representar por el modelo;
Yijl = μ + τ i + γ j + δ l + ε ijl i= 1,……., k j=1,…., b
Ecuación 74
numero de tratamientos numero de bloques
γ j = efecto debido al bloque
δi = efecto debido al tratamiento 8.5. Hipótesis a probar para el diseño greco latino
H0 :
μ1 = μ 2 = μ 3 = ...μ k = μ
Ha:
μ1 # μ j para algún
Diseño Experimental Cria43
i # j
86
8.6. ANAVA para el diseño grecolatino.
Tabla 29. ANOVA para el diseño de cuadro greco latino*
FUENTES DE VARIABILIDAD
SUMA DE CUADRADOS
GRADOS CUADRADOS DE MEDIOS LIBERTAD
Tratamientos Letra latin
SCtratlatin
k-1
Renglones
SCrenglo
Columnas
Fo
P-value
CMtratalatin
Ftralat = CMtratlatin/ CMEr
P (F > Fa)
k-1
CMrenglo
Fre = CMrenglol /CMEr
P(F > Fa)
SCcolumn
k-1
CMcolumn
Tratamientos Letra griega
SCtratgiega
k-1
CMtaratgriega
Error
SCE
(k - 2)(k -1)
Total
SCT
k2 - 1
F colmn= P(F > Fa) CMcolumn/CM Er
Ftratlgrieg=CM taratgriega
CMErr
*Tomado de Gutierrez, H, et all. Análisis de experimentos. Capítulo Cuatro 132 SCT = SCtrat + SCBl + SCB2 + SCE
Ecuación 75
y los grados de libertad correspondientes son k2 -1 = (k -1) + (k -1) + (k -1) + (k - 2)(k -1) Ecuación 76
8.7. Ejemplo para el diseño grecolatino. Ejemplo de un cuadrado greco-latino (Pena, 2002) Se compara el rendimiento de tres procesos de fabricación (A, B, C) en tres
condiciones experimentales (_ α , β , ϑ ) tres días distintos con tres procedimientos de medición. El diseñó y los resultados obtenidos se indican en el cuadro.
Diseño Experimental Cria43
87
P (F > Fa
Tabla 30. ANOVA para el ejemplo de diseño de cuadro greco latino* Dia 1
Aα
Metodo 1
10
Cϑ
Metodo 2
Dia2
Dia 3
Bβ
Cϑ
13
11
Aα
Yi… 34
Bβ
26
8
8
Metodo 3
Bβ
Cϑ
Aα 10
y…L
11 32
30
9 27
31
90
10
α ……………Y..1.=28 β …………….Y..2.=32 ϑ ……………..Y..3.=30 Tabla 30. ANOVA para el ejemplo de cuadro greco latino*
FUENTES DE VARIABILIDAD
SUMA DE CUADRADOS
GRADOS CUADRADOS DE MEDIOS LIBERTAD
Tratamientos Letra latin
SCtratlatin
k-1
Renglones
SCrenglo
Columnas
Fo
P-value
CMtratalatin
Ftralat = CMtratlatin/ CMEr
P (F > Fa)
k-1
CMrenglo
Fre = CMrenglol /CMEr
P(F > Fa)
SCcolumn
k-1
CMcolumn
Tratamientos Letra griega
SCtratgiega
k-1
CMtaratgriega
Error
SCE
(k - 2)(k -1)
Total
SCT
k2 - 1
F colmn= P(F > Fa) CMcolumn/CM Er
Diseño Experimental Cria43
Ftratlgrieg=CM taratgriega
CMErr
88
P (F > Fa
Capitulo nueve:
Diseños factoriales
9.1. Diseños factoriales En ingeniería muchos de los experimentos se llevan a cabo para estudiar los efectos producidos por dos o mas factores. El desplazamiento de estos dentro de un dominio experimental es costoso además las limitaciones de tiempo obligan al experimentador a ejecutar sólo los experimentos imprescindibles. En los métodos tradicionales solo se varia un factor cada vez esto no es lo mejor pues implica más experimentos de los necesarios y se obtiene información parcial pues no muestran la interacción entre los factores; las interacciones en un experimento son corrientes y son los efectos más importantes para comprender el comportamiento de muchos sistemas. Los diseños experimentales permiten variar simultáneamente varios factores pero evitándose que se vaya en la misma dirección. Y se complementan de tal modo que la información buscada se obtiene combinando las respuestas de todos ellos. 9.2. Ventajas de los Experimentos Factoriales Podemos resaltar entre varias las siguientes: 1. Economía en el material experimental pues se obtiene información sobre varios factores sin incrementar el tamaño del experimento. 2. Permiten el estudio de la interacción, o sea determinan el grado y la forma en la cual se modifica el efecto de un factor por los niveles de otro factor 9.3. Desventajas de los diseños factoriales Una desventaja de los experimentos factoriales es que requieren un gran número de tratamientos, especialmente cuando se tienen muchos factores o muchos niveles de un mismo factor. Este hecho tiene los siguientes efectos: 1. Si se desea usar bloques completos es difícil encontrar grupos de unidades experimentales homogéneas para aplicar todos los tratamientos. 2. Se aumenta el costo del experimento al tener muchas unidades experimentales; esto se minimiza usando factoriales fraccionados donde se prueba una sola parte de todo el conjunto de tratamientos. Los experimentos factoriales se pueden ejecutar bajo cualquier tipo de diseño de control de error o un sub muestreo o con covariables. En este modulo sólo se presentaran análisis de experimentos factoriales de dos factores bajo un DCA y o DBCA.
Diseño Experimental Cria43
89
9.4. Arreglo factorial El conjunto de experimentos individuales o tratamientos que se forman al considerar las posibilidades de combinación para el diseño factorial es el mostrado en la tabla siguiente;
FACTOR B
A1
FACTOR A
B1
Figura 11.Un experimento factorial
B1
FACTOR B B2
A1 FACTOR A A2
Figura 12.Un experimento factorial 9.5. Modelo estadístico para un diseño factorial Cualquier observación en el diseño factorial se puede representar por el modelo;
Yijl = μ + α i + β j + (αβ ) ij + ε ijk
Ecuación 77
i= 1,……., a numero de tratamientos j=1,…., b numero de bloques k= 1,2,..n μ = media general, también denominada β 0
α i = efecto debido al i-esimo nivel del factor A, también denominada β1 β = efecto debido al j-esimo nivel del factor B, también denominada β 2 . (αβ ) ij = representa al efecto de interacción en la combinación ij, también denominada β 1 β 2 .
(ε ) ijk =
es el error aleatorio que supone una distribución con media cero y
varianza constante Diseño Experimental Cria43
σ2 90
Estando el modelo de regresión descrito por :
Yijl = β o + β1 X 1 + β 2 X 2 + β1 β 2 X 1 X 2 + ε ijk
Ecuación 78
9.6. Hipótesis a probar H0 : Efecto A = 0 Ha: Efecto A # 0
H0 : Efecto B = 0 Ha: Efecto B # 0 H0 : Efecto AB = 0 Ha: Efecto AB # 0 Si efecto A=
α
Si efecto B=
β
Las hipótesis también se pueden plantear de la siguiente manera: H0 :
α 1 = α 2 = ...α a
HA :
α #0
=0
para algún i
HB :
β1 = β 2 = ...β b = 0 β j #0
H0 :
(αβ ) ij = 0
HAB:
(αβ ) ij #0
H0 :
para algún ij
Hipótesis que se prueban con la técnica de análisis de varianza (conocida). Calculo de la suma de cuadrados del error. SCE - SCT = SCA+ SCB + SCAB Ecuación 79 Calculo de la suma de cuadrados del error SCE= SCT-SCA-SCB-SCAB
Ecuación 80
9.7. ANOVA para el diseño factorial (a x b) o de dos factores El análisis de varianza se calcula de una manera similar a los primeros numerales del presente capitulo.
Diseño Experimental Cria43
91
9.8. Ejemplo de un diseño factorial Se corre un diseño factorial 3x2 con 2 replicas para investigar el encogimiento de un producto después del proceso de estandarizado. Tabla 31. ANOVA para el diseño factorial a
xb
Suma de cuadrados
Grados de libertad
Cuadrado s medios
Fo
p-value
EFECTOA
SCA
a-1
CMA
Fo = CMTRAT / CME
P(F > Fo)
EFECTOB
SCB
b-1
CMB
Fo = CMB / CME
P(F > Fo)
EFECTOAB
SCAB
(a -l)(b -1)
CMTRAT
Error
SCE
ab(n-1)
CME
Total
SCT
abn-1
CMTRAT
Los factores investigados son. A: Temperatura de la bodega de almacenamiento ( tres niveles, T1, T2 y T3) y contenido del preservante (material de curado) a dos niveles, B1 y B2. Los datos obtenidos se muestran en la tabla siguiente:
•
Hipótesis de investigación: la temperatura y los aditamentos influyen en el tamaño final del producto.
•
Diseño del experimento: una masa bien homogénea para la confección del producto se dividen en seis porciones iguales y a cada una de ellas se les mezcla el porcentaje del ingrediente seleccionado.
Tabla 32. Resultados del ensayo NOVA para el diseño factorial a Temperatura T2
T1 Empaque
B1 B2
3,9 3,5
4,2 3,8
xb
4,3 4,0
3.81 3.37
3.72 3.50
3.84 3,6
T3 4 3,9
3,8 4,1
** Elabore el ANAVA para este proceso y socialícelo con los compañeros en el grupo de curso. Diseño Experimental Cria43
92
3,4 4,3
Tabla 33. ANOVA para el ejemplo de diseño factorial a
Suma de cuadrados
Grados de libertad Ecuac
xb
Cuadrados medios Ecuac
Fo Ecuac
p-value
Ecuac
EFECTOA
EFECTOB EFECTOAB
Error
Total
* Que conclusiones sacarías? 9.9. Experimentos factoriales de dos vías En un experimento factorial de dos vías se eligen dos variables experimentales y se seleccionan dos o más niveles para cada una. Para cada combinación de niveles habrá un tratamiento. Aunque los experimentos factoriales comúnmente son más prolongados que los experimentos de una sola variable, por lo general producen mucho más información en el tiempo que toman. Cuando se analizan resultados como los de la tabla 9 se debe siempre preguntar si las diferencias que se observan obedecen a los tratamientos aplicados o a alguna otra variable, que posiblemente se desconoce. El propósito del diseño experimental es comprobar si hay interacción o no entre los factores. 9.10. Factor en el diseño de dos vías. Cuando se manejan en un solo experimento más de una variable experimental, éstas se conocen como factores experimentales. 9.11. Tratamiento en el diseño de dos vías. En un experimento factorial de dos vías un tratamiento es una combinación de niveles de los dos factores. Si hay 11, niveles del factor 1 y 2 niveles del factor 2 entonces habrá 11, por 11, tratamientos. Diseño Experimental Cria43
93
9.12. Interacción en el diseño de dos vías. Si el efecto de un factor en la variable de respuesta es diferente para distintos niveles del otro factor, se dice que los factores presentan una interacción. Las interacciones sólo se hacen visibles con experimentos factoriales, lo que da a éstos una ventaja importante sobre los experimentos de una variable. 9.13. Pasos para llegar al ANOVA en un diseño experimental. Para obtener el ANOVA por ejemplo en la tabla 42, 44 y otras para responder preguntas especificas sobre un experimento se debe: 1) Obtener los contrastes. O comparaciones entre las medias de los tratamientos. 2)Calcular los efectos. Ver ecuaciones 16,17 y 18. 3) Las sumas de cuadrados. Ver ecuaciones 19,20,21, 22, 23 y 24. 4) Realizar la prueba de significancia (FO). Ver tablas de ANOVA.
Capitulo diez:
Diseños factoriales 2k
10.1. Codificación de las variables La codificación consiste en asignar valores numéricos o alfanuméricos (códigos) a cada una de las variables con el fin de facilitar el tratamiento de los datos. Los niveles de los factores para el diseño factorial se pueden codificar con los símbolos +1 ( nivel superior) y -1 ( nivel inferior); para proporcionar un marco de trabajo uniforme y apropiado para investigar los efectos de los factores (variables) en cualquier región experimental en la que los valores reales de los factores dependen de los
X Codificada i = ( X i − X ) / Diferencia Diferencia = ½ (X M– Xn)
Ecuación 81
Ecuación 82
(X M– Xn) = diferencia entre los valores máximo y mínimo.
X i = es el valor de x
= el valor en el experimento
X = valor medio de los = el valor medio en el experimento k 10.2. El diseño factorial completo 2 Para la notación utilizada k = numero de factores. Y
2
(báse) es el número de niveles seleccionados.
En este diseño se consideran solo dos factores, A y B, cada uno con dos niveles.
Diseño Experimental Cria43
94
Se acostumbra denominar el nivel inferior de los factores como -1 o también A1 Y el nivel inferior por 1 o también A2.
Es la estrategia mas adecuada para conocer simultáneamente qué efecto tienen k factores sobre una respuesta y descubrir si interaccionan entre ellos. Las interacciones suelen ser muy corrientes y a veces son los efectos más importantes, por lo que conocerlas es imprescindible para comprender el comportamiento de muchos sistemas. Éste describe los experimentos más adecuados para conocer simultáneamente qué efecto tienen k factores sobre una respuesta y descubrir si interaccionan entre ellos. Al no haber factores correlacionados se evitan experimentos redundantes. Además, los experimentos se complementan de tal modo que la información buscada se obtiene combinando las respuestas de todos ellos. Tabla 34. Signos algebraicos para calcular los efectos en un diseño 22 Combinaci PRUEBA
A
B
AXB
ón de los tratamient os
REPETICIONES Y
Y 1
Y ..
Y n
PROMEDIO
2
Y 1 2 3 4
+ +
+ +
+ +
(1) a b ab
10.3. Efecto de un factor en un diseño 22 La influencia que tiene un factor sobre la variable de respuesta como el cambio en la respuesta cuando un factor cambia de su nivel inferior a su nivel superior, promediado sobre los demás factores. a) El efecto promedio de A es definido como: A = 1/2n{[ ab-b]+[a-(1)]} A = 1/2n[ ab+a – b -(1)]
Ecuación 83
b) El efecto promedio de B es definido como:
Diseño Experimental Cria43
95
B = 1/2n{[ ab-a]+[b-(1)]} B = 1/2n{[ ab + b – a - (1)]} Ecuación 84 c) El efecto de interacción de AB es definido como: AB = 1/2n{[ ab-b]-[a-(1)]} AB = 1/2n[ ab+(1)-a-b]
Ecuación 85
n = numero de repeticiones o replicas d) la suma de cuadrados de los efectos se calcula a partir de los contrastes y se definen como: SS= [Efecto]2[2k-2]n
Ecuación 86
También puede ser calculada d1) Para el factor A este se calcula con: SC A = {[ab + a − b − (1)]}2
n 2 2 Ecuación 87
d2. de B
SC B = {[ab − a + b − (1)]}2
n2 2 Ecuación 88
d3. de AB SC AB = {[ab + (1) − a − b]}2
n 2 2 Ecuación 89
d4. Calculo de la suma de cuadrados totales a
SS T = ∑ i =1
n
∑ ∑Y j =1
k =1
2 K =1
−Y 2
N
Ecuación 90
N = número de pruebas d5. Calculo de la suma de cuadrados del error SCE= SCT-SCA-SCB-SCAB
Ecuación 91
10.4. Análisis de residuos Es un procedimiento útil para la evaluación del ajuste de una ecuación de regresión. Los residuales se calculan cuando se encuentran diferencias entre el valor real y el valor de la variable dependiente y el valor predicho de la misma. En otras palabras un residual es la parte de Y que no est predicha por X..
Diseño Experimental Cria43
96
El valor medio de los residuales es cero y como la pendiente se resta en el proceso de calculo de los residuales, la relación entre estos y los valores de X también es cero.
Y = β 0 + β1 X 1 + β 2 X 2 + ε Ecuación 92 10.5. ANOVA para un diseño factorial 22 Con los productos de las ecuaciones del numeral anterior debemos construir la siguiente tabla. 10.6. Ejemplo de un diseño experimental factorial 22 Los pasos a seguir en la resolución de un ejercicio o situación de ingeniería en donde se aplique un diseño experimental son los siguientes: 1- Planteamiento del problema Se quiere comprobar el rendimiento de una reacción con un nuevo catalizador. Por tanto, se pretende determinar en qué grado la temperatura y el tiempo influyen en el rendimiento de reacción y cómo este se puede variar para mejorarlo. 10.7. Factores y dominio experimental Para lo cual acorde con la experiencia previa, la revisión bibliografía o las necesidades de la experimentación (criterios de rentabilidad, limitaciones experimentales), se debe escoger qué factores interesa estudiar y qué valores pueden tomar (el dominio experimental). Tabla 35. ANOVA para un diseño factorial 22 Suma de cuadrados
Grados de libertad
Cuadrados medios
Fo
p-value
SCA
1
CMA
P(F > Fo)
SCB
1
CMB
SCAB
1
CMAB
Fo = CMA / CME Fo = CMB / CME Fo = CMAB/ CME
Error
SCE
4(n-1)
CME
Total
SCT
n22-1
EFECTOA EFECTOB EFECTOAB
P(F > Fo) P(F > Fo)
La Tabla 35 muestra los dos factores escogidos. Como ambos factores son continuos, su dominio experimental se expresa con los valores máximo y mínimo que pueden tomar. Para lo cual se acordó que el tiempo de reacción no debería ser inferior a 8 horas para que el proceso fuera rentable, y superior a 6 horas para asegurar un Diseño Experimental Cria43
97
buen rendimiento; además el rango de temperatura de trabajo debe ser superior a los (40ºC) pero sin exceder los 80ºC. La Tabla 35 también muestra la notación codificada más habitual para factores continuos: se asigna el valor –1 al extremo inferior del dominio experimental y el valor +1 al extremo superior 2. Para simplificar a menudo sólo se indican – y +. Es necesario definir la correspondencia entre variables reales y codificadas porque el diseño de experimentos describe la experimentación óptima empleando variables codificadas (X1, X2,...) sin dimensión. De este modo las herramientas matemáticas y estadísticas son generales y se pueden aplicar a cada problema concreto. La experimentación más económica (mínimo número de experimentos) es aquella en la que cada factor toma sólo dos valores (niveles). Y la que proporcionará la información con menor incertidumbre es aquella en la que estos valores son los extremos del dominio experimental, –1 y +1. Esta misma tabla 35 muestra la matriz de experimentos que se obtiene combinando los dos niveles de los dos factores. Cada fila es un experimento y cada columna es un factor estudiado. Tabla 36. Respuestas para el ejemplo de diseño factorial 22 Matriz de experimentos
1 2 3 4
x1
x2
+ +
+ +
Plan de experimentación Tiempo (h) 6 8 6 8
Respuesta (% rendimiento)
Temperatura (ºC) 40 40 60 60
Corrida 1
Corrida 2
Corrida 2
49 54 70 78
48 58 72 55
49 55 73 56
Tabla 37. Matriz para el ejemplo de diseño factorial 22 Combinación PRUEBA
1 2 3 4
A
B
AXB
de los
x1
x2
x1 x2
tratamientos
+ +
+ +
+ +
(1) a b ab
Repeticiones
Y PROMEDIO
Y 1
Y 2
49 54 70 78
48 58 72 55
Y 3
49 55 73 56
48,66666667 55,66666667 71,66666667 63
Pasos a seguir a) El efecto promedio de A es definido como: A = 1/2n[ ab+a – b -(1)] Diseño Experimental Cria43
98
A = 1/2n[ ab+a – b -(1)] A= 7,666 b) El efecto promedio de B es definido como: B = 1/2n{[ ab + b – a - (1)]} B = 13 c) El efecto de interacción de AB es definido como: AB = 1/2n{[ ab-b]-[a-(1)]} AB = 1/2n[ ab+(1)-a-b] = AB = -9 n = numero de repeticiones o replicas Tabla 38. Análisis de varianza para el ejemplo de diseño factorial 22
Suma de cuadrados
Grados de libertad
Cuadrados medios
Fo
EFECTOA
176,3333333
1
176,3333333
0,032713984
EFECTOB
507
1
507
0,094060433
EFECTOAB
264,4533907
1
264,4533907
Error
43121,21328
8
5390,151659
Total
SCT
11
Capitulo once:
p-value
P(F > Fo)
P(F > Fo)
P(F > Fo)
0,049062328
Diseño factorial de tres factores
11.1. Diseño factorial de tres factores con dos niveles cada uno. Un diseño factorial de 23 involucra a tres factores A,B,C, todos con dos niveles sus combinaciones se muestran en la tabla siguiente.
Diseño Experimental Cria43
99
Tabla 38. Combinación de los tratamientos para un diseño 23 COMBINACIÓN CORRIDA
A
B
AXB
AXC
BXC
AXBXC
DE TRATAMIENTOS
C 1
-
-
-
+
+
+
-
(1)
2
+
-
-
-
-
+
+
a
3
-
+
-
-
+
-
+
b
4
+
+
+
+
-
-
-
ab
5
-
-
+
+
-
-
+
c
6
+
-
+
-
+
-
-
ac
7
-
+
+
-
-
+
-
bc
8
+
+
+
+
+
+
+
abc
11.2. Efecto de un factor en un diseño 23 Es la influencia que tiene un factor sobre la variable de respuesta (cambio en la respuesta) cuando un factor cambia de su nivel inferior a su nivel superior, promediado sobre los demás factores. Tabla 39. Signos algebraicos para calcular los efectos en un diseño 23
COMBINACIÓN DE LOS TRATAMIENTOS
EFECTO FACTORIAL I
A
B
AXB
AXC
BXC
XC
C (1)
+
-
-
-
+
+
+
-
a
+
+
-
-
-
-
+
+
b
+
-
+
-
-
+
-
+
ab
+
+
+
-
+
-
-
-
c
+
-
-
+
+
-
-
+
ac
+
+
-
+
-
+
-
-
bc
+
-
+
+
-
-
+
-
abc
+
+
+
+
+
+
+
+
a) El efecto promedio de A es definido como: a b ab c ac bc abc A = 1/2n{[-(1)+a -b+ab-c+ac-bc+abc]} Ecuación 93 Diseño Experimental Cria43
AXB
100
A = 1/2n[ a+ab+abc – b - bc -(1)] Ecuación 94 b) El efecto promedio de B es definido como: B = 1/2n{[-(1)-a+b+ab-c-ac+bc+abc]} B = 1/2n{[ ab + b+bc+abc – a-c-ac - (1)]} Ecuación 95 c) El efecto de interaccion de AB es definido como: AB = 1/2n{[(1)-a-b+ab+c-ac-bc+abc]} AB = 1/2n{[(1) +abc+ab+c -a-b-ac-bc]} Ecuación 95 n = numero de repeticiones o replicas d) El efecto de interaccion de AC es definido como: AC = 1/2n{[(1)-a+b-ab-c+ac-bc+abc]} AC = 1/2n{[(1) +b+ac+abc – a -ab-c-bc]} Ecuación 96 n = numero de repeticiones o replicas e) El efecto de interaccion de ABC es definido como: ABC = 1/2n{[(-1)+a+b-ab+c-ac-bc+abc]} ABC = 1/2n{[ a +b+c+abc – (1) -ab-ac-bc]} Ecuación 97 n = numero de repeticiones o replicas f) la suma de cuadrados es definida como: SS= [Efecto]2[2k-2]n Ecuación 98 También pueden ser calculados. Calculo de la suma de cuadrados totales a
SS T = ∑ i =1
n
∑ ∑Y j =1
k =1
2 K =1
−Y 2
N
Ecuación 98.1
g) Calculo de la suma de cuadrados del error. SSE= SST-SSA-SSB-SSAB Ecuación 99 h) Analisis de residuos
Y = β 0 + β1 X 1 + β 2 X 2 + ε
Diseño Experimental Cria43
Ecuación 100
101
11.3. Análisis de varianza para un diseño factorial 23 Tabla 40. Calculo del Análisis de varianza para un diseño factorial 23
Suma de cuadrados
Grados de libertad
Cuadrado s medios
Fo
p-value
EFECTOA
SCA
1
CMA
Fo = CMA / CME
P(F > Fo)
EFECTOB
SCB
1
CMB
Fo = CMB / CME
P(F > Fo)
EFECTOC
SCC
1
CMC
P(F > Fo)
EFECTOAB
SCAB
1
CMAB
Fo = CMC / CME Fo = CMAB/ CME
EFECTOAC
SCAC
1
CMAC
Fo = CMAC / CME
P(F > Fo)
EFECTOBC
SCBC
1
CMBC
Fo = CMBC / CME
P(F > Fo)
EFECTOABC
SCABC
1
CMABC
Fo = CMABC / CME
P(F > Fo)
Error
SCE
23(n-1)
CME
Total
SCT
n23-1
P(F > Fo)
11.4. Coeficientes de determinación Estos coeficientes miden la proporción o el coeficiente de variabilidad en los datos experimentales que es explicada por el modelo considerado.
R2 = {
[
SCTotal − SC Error / SCTotal ]100}
R 2 = [ SC Modelo / SCTotal ]100}
Ecuación 101 Ecuación 102
11.5. Ejemplo de un diseño factorial 23 En una empresa productora de bebidas achocolatadas ha tenido problemas con la viscosidad de cierta bebida de chocolate. Se cree que tres ingredientes Diseño Experimental Cria43
102
que se agregan en pequeñas cantidades son con los que se puede resolver este problema, por lo que es necesario explorar la situación; para ello se corre un experimento 23 con dos réplicas. Con los resultados obtenidos: Tabla 41. Datos de la viscosidad de la bebida desarrollada. INGREDIENTE A
INGREDIENTE B
INGREDIENTE C
-1 +1 -1 +1 -1 +1 -1 +1
-1 -1 +1 +1 -1 -1 +1 +1
-1 -1 -1 -1 +1 +1 +1 +1
VISCOSIDAD y2 Ym 13,4985184 13,7 14,5492268 14,4 14,5499141 14,5 14,1996479 14,1 17,0493402 17,2 15,4499191 15,4 17,0499267 17,1 18,949934 19,0
y1 13,3 14,7 14,6 14,3 16,9 15,5 17,0 18,9
Tabla 42. Promedio y factores calculados para el ejemplo de la viscosidad Promedio Factor A Factor B Factor C Factor AB Factor AC Factor BC
15,6621 0,250257 1,0506 2,92545 0,524613 -0,099964 0,699696
+/- 0,61255 +/- 1,2251 +/- 1,2251 +/- 1,2251 +/- 1,2251 +/- 1,2251 +/- 1,2251
Tabla 43. Análisis de la varianza para la viscosidad de bebida desarrollada.
Factor_A Factor_B Factor_C AB AC BC Total error Total (corr.)
Diseño Experimental Cria43
Suma de cuadrados 0,125257 2,20754 17,1166 0,550439 0,0199856 0,979149 3,00174 24,0007
Grados de libertad 1 1 1 1 1 1 1 1
Cuadrados medios 0,125257 2,20754 17,1166 0,550439 0,0199856 0,979149 3,00174
F
p
0,04 0,74 5,70 0,18 0,01 0,33
0,8717 0,5487 0,2525 0,7424 0,9482 0,6696
103
Figura 13. Pasos para calcular el ANOVA en un diseño 2k
Contrastes
Datos
Suma de cuadrados
Efectos
ANOVA
Para este caso hay cero efectos que sean de valor p menor que 0,05, lo cual nos indica que son significativamente diferentes de cero al nivel de confidencia del 95% Tabla 44. Coeficientes de regresión de la ecuación de los datos de viscosidad de la bebida desarrollada en el ejemplo anterior. Constante Factor_B AB BC
= 15,6621 = 0,525302 = 0,262307 = 0,349848
Factor_A Factor_C AC R2
= 0,125129 = 1,46273 = -0,049982 = 87,4931
La ecuación ajustada para el modelo es
Diseño Experimental Cria43
104
VISCOSIDAD = 15,6621 + 0,125129*Factor_A + 0,525302*Factor_B + 1,46273*Factor_C + 0,262307*Factor_A*Factor_B -
Estando los valores de las variables especificados en su forma original. 0,049982*Factor_A*Factor_C + 0,349848*Factor_B*Factor_C. Ecuación 37. R-cuadrado (ajustado para los grados de libertad) = 12,4516 porciento Error estandar = 1,73255 Media absoluta del error = 0,61255 Tabla 45. Valores para el r2 , el error estándar para el ejemplo de la viscosidad de la bebida desarrollada. El valor estadístico de R2indica que el modelo ajustado explica el 87,4931% de la variabilidad de la viscosidad, es mas apropiado para comparar modelos con diferente numero de variables independientes es de 12,455% El estimativo del error estándar muestra que la desviación estándar del error de los residuos es de 1,73255. La media absoluta de error (MAE) fue de 0,61255 el cual es el valor promedio de los residuos.
Tabla 46. Resultados estimados para los datos de viscosidad con la ecuación de regresión encontrada para el ejemplo anterior. Datos 1 2 3 4 5 6 7 8
Upper 95,0% CL
13,4985
14,1111
Lower 95,0% CL for Mean -6,48132
14,5492
13,9367
-6,65571
34,5291
14,5499
13,9374
-6,65502
34,5298
14,1996
14,8122
-5,78019
35,4046
17,0493
16,4368
-4,1556
37,0292
15,4499
16,0625
-4,52992
36,6549
17,0499
17,6625
18,9499
18,3374
Valor observado
Valor fijado
-2,92991 -2,255
34,7035
38,2549 38,9298
11.6. Presentación de resultados. La interpretación de los resultados sugerimos realizarlos en el siguiente orden y las siguientes recomendaciones: Diseño Experimental Cria43
105
1) Valor medio 2) Efectos principales 3) Efectos de interacción de dos factores 4) No olvidar que existe interacción cuando el efecto de un factor es diferente a distintos niveles de otro(s) factor(es). Esto se puede comprender fácilmente si evaluamos el efecto de cada factor por pares de experimentos. 5)Efecto de interacción de tres factores Por ejemplo para el ejercicio de la viscosidad se deberían presentar las siguientes graficas. EFECTOS MEDIOS PARA LA VISCOSIDAD
VISCOSIDAD
18 17 16 15 14 -1.0
Factor_A
1.0
-1.0
1.0
Factor_B
-1.0
Factor_C
1.0
Figura 16. Efectos medios para el ejemplo de la viscosidad.
INTERACCION PARA LA VISCOSIDAD +
VISCOSIDAD
18 +
+
17 + 16 15
+ -
-
14 -1.0
+
AB
1.0
-1.0
AC
1.0
-1.0
BC
1.0
Figura 17. Interacciones para el ejemplo de la viscosidad. 11.7. Metodología de la superficie de respuesta. Varios autores. Se conoce como superficie de respuesta a la estrategia experimental o al experimento planeado para modelar y determinar como responden los niveles de un factor cuando se comparan con los de otro. Para el ejemplo de el ejercicio de la viscosidad la superficie de respuesta obtenida es la siguiente
Diseño Experimental Cria43
106
GRAFICO DE SUPERFICIE DE RESPUESTA
VISCOSIDAD
Estimado para la viscosidad
17 16.5 16 15.5 15 14.5 14
-1
-0.6
-0.2
Factor_A
0.2
0.6
1
-0.2 -1 -0.6
0.2 0.6
1
Factor_B
Figura 18. Interacciones para el ejemplo de la viscosidad.
11.8. Región experimental Es el espacio delimitado por los rangos de experimentación utilizados con cada factor. 11.9. Región de operabilidad Conjunto de puntos donde el equipo o proceso puede ser operado. 11.10. Polinomio ortogonal. Son ecuaciones de regresión en las que cada una esta asociada con un exponente de la variable independiente, por ejemplo X, X1, X2 y todas son mutuamente independientes, es decir son ortogonales.
Capitulo doce: Análisis de regresión 12.1. Análisis de regresión. El análisis de regresión es útil para averiguar la forma probable de la relación entre las variables y cuando se utiliza éste método, el objetivo final generalmente consiste en predecir o estimar el valor de una variable que corresponde a un valor determinado de otra. Con base a los resultados obtenidos a partir de los análisis realizados a la muestra representativa, extraída de una población determinada, el investigador estará en capacidad de comprender y conocer minuciosamente la naturaleza y comportamiento de la población en la que se encuentra interesado. 12.2. Regresión lineal simple. (2, 3, 7 y varios autores) El análisis de regresión es útil para averiguar la forma probable de la relación entre las variables y cuando se utiliza éste método, el objetivo final generalmente consiste en predecir o estimar el valor de una variable que corresponde a un valor determinado de otra. Por otro lado, el análisis de correlación, se refiere a la medición de la intensidad existente entre las relaciones de las variables. Cuando se calculan los coeficientes de correlación de un conjunto de datos, el interés se centra en el grado de compatibilidad existente entre las variables que integran el problema.
Diseño Experimental Cria43
107
Tabla 48. Ecuaciones para el estimativo de una regresión lineal simple
Y = a + bX
Ecuación 11
b = {∑ XY −[∑ X ∑ Y
a = ∑ Y − b∑ X
n
r = {∑ XY −[∑ X ∑ Y
n]}
∑X
2
− [∑ X 2
n] Ecuación 12
Ecuación 13 n]}
[ )∑ X
− [∑ X 2
n
][∑ Y − ∑ Y 2
Ecuación 14 También es representada como
Y = β 0 + β1 X + ε Ecuación 15 En donde β 0 = a = int er sec cion β1 = b = pendiente
ε = cambio en el error. Variable aleatoria 12.3. Coeficientes de correlación. Una correlación es el grado de relación entre dos o más variables que busca determinar en que medida una línea u otra ecuación describe o explica dicha relación. Se encuentran dentro de un rango que va desde -1 hasta 1 rango que explica el alcance y la valoración de dicho coeficiente y la dirección de la correlación. Tabla 49. Tabla 49. Grado de asociación de los coeficientes de correlación para un conjunto de datos. (varios autores) COEFICIENTE DE CORRELACIÓN -1.00 - 0.95 - 0.50 - 0.10 0.0 + 0.10 + 0.50 + 0.95 + 1.00
Diseño Experimental Cria43
INTERPRETACIÓN Correlación negativa perfecta Correlación negativa fuerte Correlación negativa moderada Correlación negativa débil No existe ninguna correlación Correlación positiva débil Correlación positiva moderada Correlación positiva fuerte Correlación positiva perfecta
108
n
El grado de asociación, mientras más cerca este de la unidad, en una u otra dirección, mayor es la correlación. Generalmente en la mayoría de los trabajos de investigación se busca establecer una correlación lineal, ya sea positiva o negativa, no se puede considerar que todas las relaciones entre dos variables (X y Y) forman una línea recta. (ver capitulo siguiente). Existen muchas correlaciones de carácter curvilíneo que indican que una variable aumenta a medida que la otra se incrementa hasta que la relación misma se invierte, de tal manera que una variable decrece finalmente mientras que la otra sigue en aumento, es decir, que la relación entre X y Y que en un principio es positiva se convierte en negativa, o aquella que, en un comienzo es negativa se convierte en positiva; por ejemplo en una reacción química o en una reacción bioquímica. 12.4. Otros modelos de regresión lineal simple. (2, 3, 7 y varios autores) Tabla 50. Modelos de regresión lineal simple ECUACIÓN Y = e a +bX
Y =1
(a + bX )
Y = aX ) Y = a + b ln( X ) b
Y = a+b
(X )
MODELO
Exponencial
Ecuación 16
El reciproco Multiplicativo Logarítmico Reciproco
Ecuación 17 Ecuación 18 Ecuación 19 Ecuación 20
12.5. Regresión lineal múltiple. El análisis de regresión lineal múltiple consiste en generar modelos de regresión con más de una variable independiente (X1, X2, X3…..); el modelo de regresión lineal múltiple es representado por:
Y = β 0 + β1 X 1 + β 2 X 2 + ........ + β k X k + ε Ecuación 30 k = numero de variables (Xs)
12.6. Correlación múltiple. Si en la ecuación anterior es necesaria más de una variable independiente(X1, X2...) se aplica el término de "correlación múltiple". Los cálculos para este tipo de correlación son más dispendiosos y la interpretación de sus resultados más complejo. La inclusión de variables adicionales incrementa los datos necesarios y puede también adicionarse un considerable costo al estudio.
Diseño Experimental Cria43
109
Las razones principales para cambiar el análisis de una á dos o más variables independientes son: Existe una relación lógica, y una sola variable independiente no proporciona un coeficiente de correlación suficientemente satisfactorio. El coeficiente de correlación múltiple representa la proporción de variación en Y que explica el conjunto de variables explicativas seleccionadas. (3, 7, 8, 27 y varios autores)
12.7. Transformación de datos. (3, 7, 8, 27 y varios autores) En la práctica muchos de los procesos experimentales no siguen una distribución normal con varianza constante y aunque el procedimiento de anova es robusto y admite desviaciones moderadas el realizar un análisis estadístico con resultados que no cumplen con los supuestos acerca del modelo estadístico, se puede llegar a una conclusión y decisión errónea. Para lo cual mediante una transformación adecuada puede conseguirse que una variable que no se distribuye normalmente pase a tener una distribución casi normal; por ejemplo un cambio de escala puede variar la media y la varianza de la variable así como su relación con respecto a otras variables al igual que la forma de la distribución de una variable cambia con la escala. Las poblaciones con varianzas desiguales pueden convertirse en varianzas homogéneas mediante una transformación apropiada. Las transformaciones más usadas se presentan en la tabla siguiente: Tabla 51. Transformaciones usadas para datos Transformación apropiada Y ' = ln(Y )
O
Y ' = Y −1 / 2 Y ' = Y −1
Y ' = log10 (Y )
Tipo de transformación Transformación logarítmica Transformación de la raíz cuadrada Transformación del reciproco
12.8. Correlación múltiple. Si en la ecuación anterior es necesaria más de una variable independiente(X1, X2...) se aplica el término de "correlación múltiple". Los cálculos para este tipo de correlación son más dispendiosos y la interpretación de sus resultados más complejo. La inclusión de variables adicionales incrementa los datos necesarios y puede también adicionarse un considerable costo al estudio. Las razones principales para cambiar el análisis de una á dos o más variables independientes son:
Diseño Experimental Cria43
110
Existe una relación lógica, y una sola variable independiente no proporciona un coeficiente de correlación suficientemente satisfactorio. El coeficiente de correlación múltiple representa la proporción de variación en Y que explica el conjunto de variables explicativas seleccionadas. (3, 7, 8, 27 y varios autores)
12.9. Análisis de Covarianza. El análisis de covarianza es un procedimiento muy importante experimentación, pero lamentablemente no se usa con frecuencia.
en
Utiliza el análisis de varianza y el de regresión para eliminar la variabilidad que existe en la variable independiente X; también ajusta medias de tratamiento y así estima mucho mejor el efecto de la variable independiente X sobre la variable dependiente Y. La variable independiente X es una observación hecha en cada unidad experimental antes de aplicar los tratamientos, e indica hasta cierto grado la respuesta final y de la unidad experimental. 12.10. Los objetivos del análisis de covarianza son: a) Disminuir el error experimental con el respectivo aumento en precisión del experimento. b) Ajustar los promedios de los tratamientos. c) Interpretar mejor los resultados en el experimento, especialmente en lo relacionado con la naturaleza de los efectos de los tratamientos. d) Estimar el valor de las unidades perdidas en los experimentos. 12.11. Software estadístico para la solución de problemas. De los programas adecuados para el manejo, el procesamiento y análisis de datos citamos los siguientes: Excell, minitab, statgraphics, SAS, curve expert; etc. sin embargo con la utilización de una calculadora también es posible la realización de la gran mayoría de las operaciones involucradas en el procesamiento de los datos.
Capitulo trece: Diseños no experimentales 13.1. Diseños no experimentales. Varios autores Es un diseño que se apoya en la observación directa, la entrevista y la revisión de fuentes documentales; sin que se ejerza control, se manipule alguna sobre las variables bajo estudio, sino que se observa el desarrollo de las situaciones y acorde con un análisis cuidadoso se intenta extraer explicaciones de cierta validez y como no hay control de las variables, se pueden presentar muchas fuentes de error que hacen dudar de su validez. 13.2. Recomendaciones La observación científica debe seguir algunos principios básicos:
Diseño Experimental Cria43
111
1. 2. 3. 4. 5.
Debe tener un propósito específico. Debe ser planeada cuidadosa y sistemáticamente. Debe llevarse, por escrito, un control cuidadoso de la misma. Debe especificarse su duración y frecuencia. Debe seguir los principios básicos de validez y confiabilidad.
13.3. Ejercicios propuestos Resuelva los ejercicios siguientes y socialícelos con el tutor y compañeros en los momentos presénciales. Ejercicios para desarrollar Y socializar en los momentos presénciales acordados con el grupo. 1- Un ingeniero presenta el siguiente diseño factorial. Conteste los siguientes incisos sin utilizar un software computacional, es decir haga las operaciones que se le piden de manera manual. a) Que nombre recibe este diseño y por que.? b) cuales tratamientos tiene este diseño, cuantas replicas.? c) en total son doce las corridas experimentales las que se realizaron, señale en que orden debieron correrse y explique por que.? d) Señale los efectos que se pueden estudiar a través de este diseño.
A + +
B + +
i 66 61 71 75
REPLICA ii iii 67 74 79 76 83 70 80 67
Total (1) = ? (a) = ? (b) = ? (ab) = ?
e) Obtenga los contrastes para los efectos principales de A y B y para la interacción. f) Realice la grafica de la interacción entre los factores A y B e interprete con detalle. Verdaderamente el factor B tiene influencia sobre el factor A. 2- A un ingeniero de alimentos le solicitan analizar la resistencia a la ruptura (Y) de un empaque para alimentos, para lo cal utiliza una escala numérica. Examina tres factores, cada uno a dos niveles, X1 = material plástico, X2 = humedad , X3 = dirección del rasguño. Decide obtener tres observaciones o replicas en cada combinación, las mismas que se muestran en la siguiente tabla: a) Realice el ANAVA para estos datos. b) Interprete los datos significativos y que conclusión darías como ingeniero.?
Diseño Experimental Cria43
112
X1 + + + +
X2 + + + +
X3 + + + +
Resistencia a la ruptura 2,3 3 3,25 4,1 2,9 2,1 3,8 3,9 4,5 3,2 5,1 5,1 4,9 5,7 3,7 4,3 5,3 3,2 4 2,8 5 3,5 2,7 4,7
BIBLIOGRAFIA 1. Bavaresco, Aura (1979): Las técnicas de la investigación. Edit. Scott, Foresman & Co. 4ª edición. Gienview, Illinois, USA. (1ª edición: 1974). 2. Berenson , Mark; Levine, David; Krehbiel, Timothy. Estadistica para administración. Edit, pearson, 2a Edicion, mexico 2001, 734p 3. BickinG A. C. Some Uses of statistics en the Planning of Experiments. Industrial Quality Control, Vol. 10 No. 4, Enero 1954. 4. Bunge, Mario (1980): Ciencia y desarrollo. Edit. Siglo Veinte. Buenos Aires, Argentina. 5. Christensen, Howard. Estadística paso a paso. Edit Trillas. 5ª edic, 1990. México. 682 p. 6. Cochran, Willian; Cox, Gertrude. Diseños experimentales. Edit, Trillas, 5 reimpresion. Mexico 2001, 661p. 7. Costamagna, Alicia, M. Mapas conceptuales como expresión de procesos de interrelación para evaluar la evolución del conocimiento de alumnos universitarios. Enseñanza de la ciencia, 2001.19, (2), 309-318. 8. COX D. R. Planning of Experiments. John Wiley and Sons, Inc. New York, 1978. 700p. 9. Cortés, Manuel; Sánchez, William. Proyecto de investigación y desarrollo tecnologico. Universidad Nacional Abierta y a Distancia. Facultad de Ciencias Básicas e Ingeniería; Bogota; 2001; 313.Págs. 10. Dawson, Beth; Trapp, Robert. Bioestadistica médica. Edit, manual moderno. 3 Edicion. Mexico 2002, 435p. 11. FAOSTAT. 12. FSTA. Food science technology abstracts 13. Hernandez, Sampieri, Roberto. Metodologia de la investigación. Edit Mac Graw hill. Mexico, 2003, 692 p. 14. Hinkelmann, Klaus. Design and analysis of experiments. Vol I, edit. john wiley & sons, inc.1994. 495p. 15. Howard, B, Cristensen. Estadistica paso a paso. Edit, Trillas, 3 edicion. Mexico 2004, 682p. Diseño Experimental Cria43
113
16. INSTITUTO COLOMBIANO DE NORMAS TECNICAS Y CERTIFICACIÓN Compendio de Normas Técnicas Colombianas sobre Documentación, Tesis y otros trabajos de grado. Santafé de Bogotá: ICONTEC, 1996. 17. Kempthorne O. The Design and Analysis of Experiments. John Wiley and Sons. New York, 1952, p.10. 18. Kuehl, O, Robert. Diseño de experimentos. Thomson learning, .2da edición. México. 19. Mendez I. Lineamientos Generales para la planeación de Experimentos. Monografía No. 15, Vol. 15 IIMAS. 1980. 20. Montgomery, Douglas. Diseño y análisis de experimentos. Grupo editorial Iberoamérica.1991. 589p. 21. Novak, Joseph, D; Gowin, D, Bob. Aprendiendo a aprender. Edit. Martínez Roca, D.L. 1988. - 228 p. 22. Padrón, Corral, Emilio. Diseños experimentales con aplicación a la agricultura. Editorial trillas, 1996. 23. Pereira, Manrrique. Colección de lecturas teoría y praxis de la investigación. Tomo I y II. UNAD, 2001. 24. Ostle B. Estadística Aplicada. Limusa-Wiley, México, 1975, Cap. 10 25. Montgomery, Douglas. Diseño y analisis de exprimentos. Grupo Editorial ibero america, 1a Edicion, mexico 1991, 589p. 26. Sabino, Carlos A. El proceso de investigación. Ed. Lumen Humanitas. Argentina (1996). 27. Tamayo y Tamayo, Mario. El proceso de la investigación científica. 3ª ED.. ED. Limusa S.A. México (1998) 28. Valdés de León, Gustavo. Acerca experimentación en diseño. Mayo 2004.
de
la
posibilidad
de
Direcciones de las paginas Web. www.virtual.unal.edu.co/cursos/ciencias/2000352/ www.fao.org/docrep/T0848S/t0848s03.htm.pci204.cindoc.csic.es/tesauros/Tes_ Psic/HTML/PSI_D6.HTM http://www.sas.com/software/index.html www.educarchile.cl/eduteca/estadistica/esc_medic.htm es.wikipedia.org/wiki
Diseño Experimental Cria43
114
APENDICES
Tabla 1.
Tomado de Gutierrez.
Diseño Experimental Cria43
115
Tabla 2. Valores críticos de F
Diseño Experimental Cria43
116
Tabla 3. Valores críticos de
Diseño Experimental Cria43
λ1
2
117
Tabla 4. Prueba de Duncan 5%
Diseño Experimental Cria43
118
Tabla 5. Tabla de probabilidades P y Q para n= 5
Diseño Experimental Cria43
119
Tabla 6. Tabla de probabilidades P y Q para n= 15
Diseño Experimental Cria43
120
Tabla 7. Valores t de Student
Diseño Experimental Cria43
121