Regresión Logarítmica: Es un modelo de regresión que se utiliza cuando el modelo lineal no logra un coeficiente de determinación apropiado, o cuando el fenómeno en estudio tiene un comportamiento considerado potencial o logarítmico.
Ecuación característica La función que define el modelo es la siguiente:
Donde: Yi :
Variable dependiente, iésima observación
A, B: Parámetros de la ecuación, que generalmente generalmente son desconocidos E: Xi :
Error asociado al modelo Valor de la í-esima observación de la variable independiente
Al sustituir los parámetros por estimadores, el modelo adopta la siguiente forma:
Aplicando logaritmos de ambos lados, con lo cual se convierte a una forma lineal:
Tabla de datos Para el ajuste de un conjunto de datos al modelo geométrico de regresión, se construye la siguiente tabla de datos: X ..
Y ..
2
Ln x
Ln y ..
(ln x) ..
Σln x
Σln y
Σ(ln x)
(ln y) ..
2
Σ(lny)
Ln X*ln y .. ΣLnx*lny
Debido a las propiedades de los logaritmos, ningún valor de x ni de y puede ser negativo. negativo. Se puede trabajar con logaritmos naturales o logaritmos base 10. Estimadores del modelo
Será necesario utilizar antilogaritmos para obtener el valor final de a Análisis de varianza para la regresión Con el objeto de determinar si el modelo explica o no el fenómeno en estudio, se realiza el análisis de varianza, que se calcula de la siguiente manera
Fuente de Variación Regresión Error Total
Grados de libertad 1 n-2 n-1
Suma de cuadrados
Cuadrado medio
b* (ΣLnxlny-Σ(Lnx)*Σ(lny)/n) S.C. Reg/1 S.C. Total- S.C. Regresión S.C. Error/(n-2) 2 2 Σ(lny) -(Σlny) /n n-1
F calculada
F tabulada
C.M.Reg/C.M.Error
Ho: El modelo no explica el fenómeno en estudio Ha: El modelo sí explica el fenómeno en estudio Grado de ajuste del modelo Para determinar el grado de ajuste del modelo, se calcula el coeficiente de determinación, de la siguiente manera
2
El valor de r tiene un rango entre 0 y 1. No puede obtenerse valores negativos Pruebas de Hipótesis para el modelo Para el coeficiente b Para probar la hipótesis de que el coeficiente b es igual a un valor b´, ser igual a cero, se procede de la siguiente manera: 1.
Se plantea la hipótesis Ho:b=b´ y la alternativa Ha: b≠ b´
2.
Se calcula el estadístico :
S b es conocido como el error standard de b y se calcula de la siguiente manera:
El cuadrado medio del error se obtiene del anàlisis de varianza. 3.
Se busca en la tabla de t de student el valor tabulado para los siguientes datos: n-2 grados de libertad y un nivel α/2
4.
Si el valor de t calculado es mayor que el tabulado, se rechaza el Ho, en caso contrario, se acepta.
Para el coeficiente a Se puede probar la hipótesis de que el coeficiente a es igual a un valor a´, para lo cual se sigue el siguiente procedimiento: 1.
Se define la hipótesis: Ho: a=a´ y la alternativa Ha: a≠a´
2.
Se calcula el error standard para a con la siguiente fórmula:
3.
Se calcula el estadístico de prueba:
4.
Se obtiene en la tabla de t de student el estadístico comparador, con los siguientes datos: n-2 grados de libertad y nivel α/2
5.
Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso contrario, la hipótesis se acepta
Intervalos de confianza Para el coeficiente b El intervalo de confianza para el coeficiente b se calcula así:
El cuadrado medio del error se obtiene del análisis de varianza El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2 Para el coeficiente a El intervalo de confianza para el coeficiente a se calcula así:
El cuadrado medio del error se obtiene del análisis de varianza El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2
Para la media de y Un intervalo de confianza para la respuesta media de y, dado x 0 sería:
El cuadrado medio del error se obtiene del análisis de varianza El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2 El valor de xm que aparece en la fórmula es el promedio de valores de los logaritmos de x Para la estimación de y El intervalo de confianza para la estimación de y, dado un valor de x 0 se obtiene de la siguiente manera:
El cuadrado medio del error se obtiene del análisis de varianza El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2 El valor de xm que aparece en la fórmula es el promedio de valores de x Ejemplo: Se realizó un estudio comparativo del nivel de ruido (en decibeles) producido por discotecas rodantes, se procedió a evaluar diferentes niveles de potencia (en vatios). Los datos finales fueron: POTENCIA 100 500 1000 5000 10000
DECIBELES 60 80 90 99 120
En base a los datos anteriores: a)
Construya un diagrama de dispersión
b)
Efectúe la estimación del modelo logarítmico
c)
Determine el grado de ajuste e interprételo
d)
Elabore el análisis de varianza y discútalo
e)
Qué lectura se obtendría con una potencia de 3000 vatios?
f)
Pruebe la hipótesis que b=1 con un 99% de confianza
g)
Calcule intervalo de confianza al 95% para a y b
a)
Diagrama de Dispersión
b) Estimadores del modelo Tabla de Datos: x 100
y 60
Ln x 4.6052
Ln y 4.0943
(ln x)2 21.2076
(ln y)2 16.7637
Lnx*Lny 18.8552
500
80
6.2146
4.3820
38.6214
19.2022
27.2326
1000
90
6.9078
4.4998
47.7171
20.2483
31.0836
5000
99
8.5172
4.5951
72.5426
21.1151
39.1375
10000
120
9.2103
4.7875
84.8304
22.9201
44.0944
SUMAS:
35.4551
22.3588
264.9190
100.2493
160.4033
Estimadores del modelo
c)
Grado de ajuste del modelo
Se puede concluir que el grado de ajuste del modelo es alto, por lo que el modelo es confiable para hacer predicciones. d)
Análisis de varianza del modelo
iii)
Suma de cuadrados del error : 0.2661-0.255= 0.0111
iv)
Grados de libertad de regresión=1
v)
Grados de libertad totales= 5-1=4
vi)
Grados de libertad del error=5-2=3
vii)
Cuadrado medio de regresión= 0.255/1=0.255
viii)
Cuadrado medio del error= 0.0111/3=0.0037
ix)
F Calculada=0.255/0.0037=68.91
x)
F Tabulada (1,3,0.01)= 34.12
xi)
Tabla de Andeva:
Fuente de Variaci ón
Grad os de libert ad
Suma de cuadra dos
Cuadra do medio
F calcula da
F tabula da
Regresi ón Error
1
0.2550
0.255
68.91
34.1 2*
4
0.0111
0.003 7
Total
5
0.2661
Debido a que F calculada es mayor que F tabulada, se rechaza l a Ho y se acepta la Ha, con lo cual se concluye que el modelo sí explica el fenómeno en estudio y que los resultados obtenidos no se deben a la casualidad. e) Qué lectura en decibeles se obtiene al aplicar una potencia de 3,000 vatios? Para esto, simplemente se utiliza la ecuación anteriormente encontrada por estimación, sustituyendo el valor de x por 3,000
Pruebe la hipótesis de que b=1 con un 99% de confianza Inicialmente se plantea Ho: b=1 y su alterna Ha: b≠1
El valor de t de student de calcula de la siguiente manera: (el logaritmo de 1 es cero)
El valor de t se obtiene en la tabla de t de student, con 5-2=3 grados de libertad y (1- .99)/2=0.005 de α, siendo el valor igual a 5.841 Finalmente, dado que t calculada es mayor que la tabulada, se concluye al 99% que el coeficiente b no es igual a 1. Calcule intervalos de confianza al 95% para a y b El valor de t de student al 95% con 3 grados de libertad es= 3.182 Intervalo de confianza para b:
El intervalo final será entonces el siguiente: -0.3892< B< 0.664 Intervalo de confianza para a:
El intervalo final para el logaritmo de a sería: 3.1137< Ln A <3.8803
Análisis de varianza Suma de cuadrados de regresión
Suma de cuadrados total
4.09430 4.3820 (4.0943 4.382 4.4998 4.5595 4.7875) 4.4998
4.5595 4.7875 Suma de cuadrados del error =: 0.2661-0.255=0.0111 Grados de libertad de regresión=1 Grados de libertad totales= 5-1=4
2
-5(4.47176) = 0.2661
Grados de libertad del error=5-2=3 Cuadrado medio de regresión= 0.255/1=0.255 Cuadrado medio del error= 0.0111/3=0.0037 F Calculada=0.255/0.0037=68.91 F Tabulada (1,3,0.01)= 34.12
Bibliografía:
Martínez, M. (2007). Estadística y Probabilidad. Valencia: Universidad de Valencia.