INSTITUTO TECNOLÓGICO DE CAMPECHE INGENIERÍA EN GESTIÓN EMPRESARIAL
NÚMERO Y NOMBRE DEL TRABAJO: 1.- TEMAS DE INVESTIGACIÓN CONCEPTUAL NOMBRE Y NÚMERO DE LA UNIDAD: UNIDAD 1 .- REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
NOMBRE DEL ALUMNO: UC CHAN RAFAEL NOMBRE DEL PROFESOR: RAMÓN AGUSTÍN BOCOS PATRÓN ESTADÍSTICA INFERENCIAL II GRUPO: MG5
SAN FCO. DE CAMPECHE CAMP. A 6 DE SEPTIEMBRE DEL 2017.
ÍNDICE Competencia específica a desarrollar ………………………………………….………………..………….. 3 Introducción…………………………………………………………………………………… ..…………………… La regresión lineal simple………………………………………………………………… ..………..……………. 4 Una definición formal de la R. L. S. …………………………………………………………………… .…..... 5 El diagrama de dispersión …………………………………………………………………… ..…………..………6 Tipos de modelos de regresión……………………………………………………………………………….. Determinación de la ecuación de R. L. S. …………………………………………………………………… 8 Interpretación de la pendiente del modelo ……………………………………………………………… Suposiciones en la R. L. S …………………………………………………………………………………………… 9 Inf erencias en la R. L. S ………………………………………………………………………… .………………….10 Evaluación de la adecuación del modelo de regresión …………………………………………….. 11-12 El coeficiente de determinación……………………………………………………………………………….. 13 El análisis de correlación…………………………………………………………………………………………… 15 Bibliografía………………………………………………………………………………………………………………… 16
2
COMPETENCIA A DESARROLLAR Es objetivo de esta unidad es analizar los conceptos fundamentales de regresión simple y correlación tanto en el desarrollo y aplicación del ámbito empresarial.
INTRODUCCIÓN A continuación se buscara un análisis de la estadística inferencial con el número de unidad del uso de la regresión lineal simple es muy utilizado para observar el tipo relación que existe entre dos variables y poder a llevar a cabo la toma de decisiones correspondiente dependiendo de la relación entre dichas variables así por la relación entre las variables involucradas y en consecuencia la decisión podría ser buscar cual es la variable dependiente que influya sobre la independientes y realizar un estudio en buscar de un resultado obtenido
3
CONTENIDO
La regresión lineal simple
-Antecedentes La palabra “regresión” se usó por primera vez en contexto por Francis Galton (1822-1911) en sus estudios biológicos sobre herencia, de manera básica, la regresión tiene dos significados: uno surge de la distribución conjunta de probabilidad de dos variables aleatoria; el otro es empírico y nace de la necesidad de ajustar algún función a un conjunto de datos. El análisis de regresión es la parte de la estadística que se ocupa de investigar la relación entre dos o más variables relacionadas en una forma no determinística. La regresión lineal simple examina la relación lineal entre dos variables continuas: una respuesta (Y) y un predictor (X). Cuando las dos variables están relacionadas, es posible predecir un valor de respuesta a partir de un valor predictor con una exactitud mayor que la asociada únicamente a las probabilidades
Mediciones invariables, bivariables y multivariables en estadística En la estadística está basado en las matemáticas y en este caso es de variables ya sea por mediciones para establecer cómo se van a medir, ejemplo: -Factores económicos y culturales relacionados con el rendimiento académico de los estudiantes -Las variables deben ser claramente definidas para entender claramente el objetivo de la variable. -Otro técnico serio análisis de datos ya sea por cuantitativa y cualitativa. Ejemplo de una medición (univariable, bivariable y multivariable.
4
Definición
Un modelo de regresión es un modelo que permite describir cómo influye una variable X sobre otra variable Y.
Tiene como propósito de predicción que permite desarrollar un modelo estadístico que se pueda usar para predecir los valores de una variable dependiente o de respuestas basados en los valores de al menos una variable independiente o explicita. Si > 0 hay relación lineal positiva. Si < 0 hay relación lineal negativa
Relación positiva
Relación negativa
Diagrama de dispersión
Es una gráfica en la que cada punto trazado representa un par de valores observados por las variables independiente y dependiente. El valor la variable independiente X, se traza en relación con el eje horizontal y el valor de la variable dependiente Y, en relación con el eje vertical.
5
Los métodos de regresión se utilizan con fre cuencia para analizar datos de experimentos no planeados, también son muy útiles en experimentos diseñados cuando algo salió mal.
Tipos de modelos de Regresión
En primer lugar, en función del número de variables independientes:
Regresión simple: Cuando la variable Y depende únicamente de una única variable X .
Regresión múltiple : Cuando la variable Y depende de varias variables ( X 1, X 2, ..., X r )
En segundo lugar, en función del tipo de función f ( X ):
Regresión lineal : Cuando f ( X ) es una función lineal.
Regresión no lineal : Cuando f ( X ) no es una función lineal.
En tercer lugar, en función de la naturaleza de la relación que exista entre las dos variables:
La variable X puede ser la causa del valor de la variable Y
Determinación de la ecuación de R. L. S.
Método de mínimos cuadrados Un procedimiento para ajustar la mejor recta Y para estimar es mediante el método de mínimos cuadrados, lo cual consiste Ejemplo:
De esta forma, se quieren encontrar los valores de que minimizan la suma de los errores cuadrados. Es decir, se busca ajustar la recta de manera que la suma de las distancias en forma vertical de los puntos a la recta se minimice.
6
El procedimiento matemático para minimizar los errores de la ecuación y así encontrar los estimadores de mínimos cuadrados de , consiste en derivar a S con respecto a ,
y derivar también a S con respecto a ,
, se obtiene:
Al igualar a cero las dos ecuaciones y resolverlas en forma simultánea con respecto a las dos incógnitas ( ), se obtiene la solución única:
Donde;
x, y son las medias muéstrales de las dos variables, es decir,
Determinación de los coeficientes - Es el punto en el cual la línea recta intercepta o cruza el eje Y. – Es la pendiente de la línea, es decir, la cantidad en que se incrementa o disminuye la variable Y por cada unidad que se incrementa X.
7
Ajuste e interpretación de la recta Un aspecto importante del análisis de regresión es, simplemente, estimar los parámetros α y β (es decir, estimar los llamados coeficientes de regresión). En la sección siguiente se estudiará el método para estimarlos. Suponga que los estimados de α y β se denotan con a y b, respectivamente. Entonces, la recta de regresión ajustada, o estimada, está dada por yˆ = a + bX, donde yˆ es el valor pronosticado o ajustado Se refiere a encontrar la línea recta que mejor se a juste a os datos que se puede definirse de varias maneras. Quizás la más sencilla sea encontrar la línea recta para la cual las diferencias entre los valores reales y los valores pronosticados a partir de la regla ajustada de regresión sea tan pequeñas como sea posible.
Ejemplo de una interpretación de una recta
Interpretación de la pendiente del modelo
Ejemplo Suponga que el gerente de una cadena de servicios de entrega de paquetería desea desarrollar un modelo para predecir las ventas semanales (en miles de dólares) para las tiendas individuales basado en el número de clientes que realizan compras. Se seleccionó una muestra aleatoria entre todas las tiendas de la cadena con los siguientes resultados.
8
(a) Grafique el diagrama de dispersión. (b) Suponga una relación lineal y utilice el método de mínimos cuadrados para encontrar los coeficientes de regresión y (c) Interprete el significado de la pendiente. (d) Pronostique las ventas semanales (en miles de dólares) para las tiendas que tienen 600 clientes. (e) ¿Qué otros factores además del número de clientes pueden afectar las ventas?
Solución a)
b) Los coeficientes son = 2,3086 y = 0,0088 c) Por cada cliente más, se espera un incremento en las ventas de 0,0088612 de miles de dólares en promedio. d) = 2,3086 + 0,0088612(600) = 7,6252 e) Factores tan variados como, atención al cliente, lejanía, falta de estacionamiento etc., etc.
9
Suposiciones en la R. L. S.
Las suposiciones para la regresión lineal son: -
Los valores de la variable independiente son fijos, a se le llama variable no aleatoria.
-
Para cada valor de hay una subpovblacion de valores de y cada subpoblación de valores de y cada subpoblación de valores de debe estar normalmente distribuida.
-
La varianzas de las subpoblaciones de deben ser iguales.
-
Las medias de las subpoblaciones de todas están sobre una recta. (suposición de linealidad).
-
Los valores de son estadísticamente independientes; es decir, los valores de correspondientes a un valor de no dependen de los valores de para otro valor de .
Inferencias en la R. L. S.
Error estándar de la estimación Una medición sobre la calidad del ajuste de un modelo lo da el error estándar de estimación, que es una estimación de la desviación estándar del error . En el caso de la regresión lineal simple, está dado por:
10
-
I. de C. para ( pendiente y ordenada del modelo)
La pendiente de la línea de regresión de la población es el cambio promedio verdadero en la variable dependiente y asociada con un incremento de una unidad en la variable independiente x. La pendiente de la línea de regresión de la población es el cambio promedio verdadero en la variable dependiente y asociada con un incremento de una unidad en la variable independiente x . La pendiente de la línea de mínimos cuadrados , da una estimación puntual de Del mismo modo que un intervalo de confianza para _ y los procedimientos para probar hipótesis con respecto a _ se basaron en propiedades de la distribución de muestreo X las inferencias adicionales sobre están basadas en considerar a como un estadístico e investigar su distribución de muestreo. Se supone que los valores de las xi se eligen antes de realizar el experimento, así que sólo las Yi son aleatorias. Los estimadores (estadísticos, y por lo tanto variables aleatorias) de se eligen antes de realizar el experimento, así que sólo las Yi son aleatorias. Los estimadores (estadísticos, y por lo tanto variables aleatorias) de se obtienen reemplazando yi por Yi en se obtienen reemplazando yi por Yi en:
11
-
I. de C. para la media ,
12
-
I. de C. de predicción de Y
-
Análisis residual
El coeficiente de determinación
Está dado por
Se interpreta como la proporción de variación y observada que puede ser explicada por el modelo de regresión lineal simple entre y y x.
13
El análisis de correlación
14
-
Prueba de Hipótesis
15
BIBLIOGRAFÍA -
Estadística Inferencial II – Instituto Tecnológico de Ensenada,- Raul Jimenez González. Diseño y análisis de experimentos –Douglas C. Montgomry segunda edición – Universidad Estatal de Arizona. Probabilidad y Estadística (Aplicaciones y métodos) -. George C. Canavos Probabilidad y Estadística (Para Ciencias Química- Biológicas) Maria Jose Marques de Cantú
16