DD118 – ESTADÍSTICA BÁSICA
CASO PRÁCTICO En 2012, Angeliki Xifara del Architectural Science group, Welsh School of Architecture, Cardiff University, UK y Athanasios Tsanas del Oxford Centre for Industrial and Applied Mathematics (OCIAM), Mathematical Institute, University of Oxford, Oxford, UK presentaron un estudio sobre el efecto de la estimación de la eficiencia energética en edificios sobre la base de análisis estadístico y herramientas de aprendizaje máquina (Tsanas & Xifara, 2012). Se analizaron 12 tipologías diferentes de edificios, las cuales diferían en relación al área acristalada, la distribución del área acristalada y la orientación entre otros parámetros. En total se analizaron 768 muestras, de las cuales se evaluaron 8 variables (X1, X2, X3, X4, X5, X6, X7, X8) con el objetivo de predecir las cargas térmicas necesarias para calentar y enfriar el recinto (Y1, Y2). Ver archivo ENB2012_data.xlsx Referencia bibliográfica: [1]
Tsanas, A., & Xifara, A. (2012). Accurate quantitative estimation of energy performance of residential buildings using statistical machine learning tools. Energy and Buildings, 49, 560-567. Obtenido de de http://people.maths.ox.ac.uk/tsanas/Preprints/ENB2012.pdf
1
CASO PRÁCTICO
Instrucciones para el desarrollo de la actividad Realice un análisis estadístico descriptivo completo de las variables independientes. ó
Media
0.76
671.71
318.5
176.6
5.25
3.5
0.23
2.81
Mediana
0.75
673.75
318.5
183.75
5.25
3.5
0.25
3
Moda
0.98
514.5
294
220.5
7
2
0.1
1
Varianza
0.011174
7,749,061
1,900,792
2,037,307
30,625
1.25
0.017725
2,402,344
Desviación estándar
0.105777
8,808,612
4,362,648
4,516,595
175,114
1,118,763
0.133221
155,096
Coeficiente de variación
14%
13
14
26
33
32
57
55
Máximo
0.98
808.5
416.5
220.5
7
5
0.4
5
Mìnimo Amplitud
0.62
514.5
245
110.25
3.5
2
0
0
0.36
294
171.5
110.25
3.5
3
0.4
5
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Matriz de Covarianza X1
X2
X3
X4
X5
X6
X7
X8
X1
0.0112
-9.23
-0 -0.9392
-4 -4.1454
0.1531
0
0
0
X2
- 9.23
7749.0608
7749.0908
3499.3741
- 132.1979
0
0
0
X3
- 0.9392
75 7 50.3125
1900.7917
- 575.2396
21.4375
0
0
0
X4
- 4.1454
3499.3741
-575.2396
2037.3069
-76.8177
0
0
0
X5
0.1531
- 132.1979
21.4375
-7 -76.8177
-3.0625
0
0
0
X6
0
0
0
0
0
1.25
0
0
X7
0
0
0
0
0
0
0.0177
0.04439
X8
0
0
0
0
0
0
0.0439
2.4023
Matriz de Correlaciones X1
X2
X3
X4
X6
X5
X8
X7
X1
1
-0 -0.9919
-0 -0.2038
-0 -0.8688
0.8277
0
0
0
X2
-0.9919
1
0.1955
0.8581
-0.8581
0
0
0
X3
-0.2038
0.1955
1
- 0.2923
0.281
0
0
0
X4
-0.8688
0.8807
- 0.2923
1
-0.9725
0
0
0
X5
0.8277
- 0.8581
0.281
- 76.8177
1
0
0
0
X6
0
0
0
0
0
1
0
0
X7
0
0
0
0
0
0
1
0.213
X8
0
0
0
0
0
0
0.213
1
Desarrolle un modelo de Regresión Lineal Simple que permita predecir la carga térmica de calentamiento (Y1) en función del análisis individual de cada una de las 8 variables analizadas. ¿Cuál variable describe mejor la carga térmica de calentamiento? ¿Qué porcentaje de la variabilidad es capaz de explicar el modelo? Regresión Lineal Y1 = a + bxi D e s cripción
Media Mediana Moda varianza Desv Desviiaci ación está están ndar Coefi Coe ficient cientee de de variación Máximo mínimo Amplitud
X1
X2
0.7641667 671.70833 0.75 673.75 0.98 514.5 0.1117431 431 774 7749.0607 0.1057 0.1057748 748 88.08 88.08611 6116 6 0.1384 0.138422 22 0.1311 0.1311345 345 0.98 0.62 0.36
808.5 51 514.5 294
X3
X4
X5
X6
318.5 176.60417 5.25 318.5 183.75 5.25 294 220.5 7 1900.791667 2037. 37.3069 3.0 3.0625 436264 436264814 8144 4 45.165 45.16595 95 1.751 1.751140 1404 4
X7
X8
Y1
3.5 0.234375 2.8125 22.31 3.5 0.25 3 18.95 2 0.1 1 15.16 1.25 0.0177225 2.4023438 101.67965 1.1187 1.118762 62 0.133 0.133220 2206 6 1.5509 1.5509597 597 10.0 10.0836 83633 33
0.1369 0.1369748 74824 24 0.2557 0.2557468 468 0.3335506 0.3335506 0.3196465 0.3196465 0.5684077 0.5684077 0.5514523 0.5514523 416.5 245 171.5
220.5 110.25 110.25
7 3.5 3.5
5 2 3
0.4 0 0.4
5 0 5
Y2
24.59 22.08 21.33 90.38514 9.5071 9.50711 1
0.4520 0.452035 35 0.3866 0.3866603 603 43.1 6.01 37.09
48.03 10 10.13 37.13
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Ecuaciones de la regresión lineal de Y1 con variables independientes Y1=a+bX1
Y1+a+bX2
a) b)
-2305 -230530 3014 1406 06
72.9 72.945 4539 3947 474 4
59.35 59.3590 90526 5261 1
-0.0753 -0.0753871 87184 84
a+bXi
Y1=-23.05+59.36X1
Y1=72.94-0.075X2
Coeficiente de determinación
0.3408
R²
0.5838-
Y1=a+bX3 Y1=a+bX4
Y1=a+bX5
-11.2 -11.259 5968 6813 133 3 56.3 56.309 0965 657 7 0.1053 0.105390 90508 508
Y1=a+bX6 Y1=a+bX7
-4.59 -4.5988 8875 75
-0.1925 -0.192535 35
22.3 22.388 8885 8510 104 4 17.5 17.517 1710 1046 46
5.1249 5.1249657 65774 74
Y1=- Y1=56.31-
Y1=a+bX8 20.7 20.708 0850 5012 12
-0.0233 -0.0233302 30208 08 20.437 20.437968 9683 3 0.5684 0.568400 00068 068
Y1=-
Y1=22.39-
Y1=17.51+ Y1=20.71+0.
11.26+0.1X3
0.19X4
4.6+5.12X5
0.02X6
20.43X7
57X8
0
0
0
0
0
0.0404
0
0.007
0.001
0.0019
0.0504
0.0002
0.201
0.0056
Desarrolle un modelo de Regresión Lineal que permita predecir la carga térmica de enfriamiento (Y2) en función del análisis individual de cada una de las 8 variables analizadas. ¿Cuál variable describe mejor la carga térmica de enfriamiento? ¿Qué porcentaje de la variabilidad es capaz de explicar el modelo? Regresión Lineal Y2 = a + bxi De s cripción Media Mediana Moda varianza Desv Desviiación ó n están estándar dar
Coef Coeficiente e nte de vari ariaci ación
X1
X2 671.7083333 673.75 514.5 7,749.06 88.086 88.086116 11606 06
0.76416667 0 .7 5 0.98 0.011174306 0.1057 0.1057774 77476 76 0.13 0.1384 8421 2199 9977
Máximo mínimo Amplitud
0.98 0 .6 2 0 .3 6
X3
318.5 318.5 294 1,900.79 43.6264 43.6264814 81444
X4 X5 176.6041667 5 .2 5 183.75 5 .2 5 220.5 7 2,037,306,858 2, 3.0625 45.165 45.165950 95022 22 1.7511 1.7511404 40437 37
0.13 0.1369 6974 7482 8244
0.25 0.2557 5746 4679 7988 0.33 0.3335 3550 5055 5599
808.5 514.5 294
416.5 245 171.5
220.5 110.25 110.25
X6
3.5 3 .5 2 1 .2 5 1.1187 1.1187625 62587 87
X7 X8 X8 Y1 Y1 Y2 0.234375 28 2 2 .3 1 2 4 .9 5 0.25 0. 3 18.95 2 2 .0 8 0. 1 1 15.16 2 1 .0 8 0.01772461 2.40234375 101.67965 90.38514 0.1332 0.1332205 20566 1.5509 1.5509596 59664 64 10.083 10.083633 633 9.507 9.50711 11
0.319 0.31964 6464 6453 53 0.56 0.5684 8407 0774 74 0.55 0.5514 1452 5232 3255
7 3.5 3.5
5 2 3
0. 4 0 0. 4
0.45 0.4520 2035 35 0.38 0.3866 6660 6033
5 0 5
43.1 6.01 37.09
4 8 .0 3 10.9 3 7 .1 3
Matrices de las Covarianzas Covarianzas X1 Y1 Y2
0.663296191 0.637500087
Y1=a+Bx1
a) b) a+bXi Coeficiente Coeficiente de determinación R
X2 - 5.841798662 - 5. 5.632321376
Y1+a+bX2
Y1 Y1=a+bX3
- 19.00835515
73.41015734
57.05053291
- 0.072683923
Y2=-19,00+57,05X1
X3 200.3253984 177.0364258
Y1=a+bX4
5.07677495
56.6728909
0.093138259
- 0.181678219
Y2=-
Y2=73,41-0,07X2
X4 X5 - 392.2526323 15.69520768 - 37 370.1342817 14.90357422
Y2=56,67-0,18X4
5,08+0,09X3
X6 X7 X8 - 0.02916276 0.362255 1.36549235 0.151888021 0.26264274 0.744514974
Y1=a+ Y1=a+bX bX66
Y1=a+bX5 - 0.9612239
Y1=a Y1=a+bX +bX88
24.16247396 21.1147985 23.71613313
4.8664732 Y2=-
Y1=a+bX Y1=a+bX77
0.121510417
14.81797 0.309911924
Y2=24,16+0,12X Y2=21,11+ Y2=168,63+6
0,96+4,87X5 6
0.3984
0
0
0
0.0029
0 63119372
0 000804158
0 00103046
0 002010045
0 53841519
14,82X7 0
0.0269
8,7X8 0
0 001344363 0 16394255 0 003428793
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Investigue la posibilidad de desarrollar un modelo de regresión lineal múltiple (teniendo en cuenta el efecto de más de una variable independiente a la vez) para la predicción de las cargas térmicas de calentamiento y enfriamiento. Estadística de Regresión
R Múltiple R-Cuadrado R-Cuadrado ajustado
0.992861609 0.985774174 0.980083843 1.700097719
Error estándar Observaciones
8
ANOVA GL Regresión residuo total
7
Coeficientes Intersección Y1 Y2
Error e stándar
SQ 21,001.42 514.4516611 51 1015.875
Stat t
MQ 500.71167 2.89023355
Valor-P
95% POR DEBAJO
F F Significado 173.23672 0
95% POR ARRIBA
Menores a mayor mayores es a 95% 95%
-3.5 -3.531 3177 7795 9544
1.80 1.8069 6991 9124 2466
-1.9 -1.954 5450 5083 8388
0.10 0.1080 8044 4473 73 -8.1 -8.176 7679 7984 8421 21
1.11 1.1132 3239 3932 3266 -8.1 -8.176 7679 7984 84 1.11 1.1132 3239 3932 3266
0.57 0.5794 9434 3491 9111
0.15 0.1539 3953 5329 2988
3.76 3.7637 3705 0575 75
0.01 0.0131 3107 0745 4588 0.18 0.1836 3685 8536 3611
0.97 0.9751 5184 8446 4611 0.18 0.1836 3685 8536 36 0.97 0.9751 5184 8446 4611
0.44 0.4478 7859 5925 2555
0.16 0.1627 2757 5762 6222
2.751 2.75169 6945 4513 13
0.04 0.0402 0229 2922 0.02 0.0294 9477 7746 4699
0.86 0.8662 6241 4104 0411 0.02 0.0294 9477 7747 47 0.86 0.8662 6241 4104 0411
Calcule los intervalos de confianza al 95% para la media de la carga térmica de calentamiento y la carga térmica de enfriamiento. El Intervalo de confianza de la carga térmica de calentamiento es [21,63; 22.98] Intervalo de Confianza n_X média_y1 DP_Y1 Error_Y1 Limi Limite te inferi inferior_Y1 or_Y1 Limi Limite te superior_Y2
768 22.3072 9.50711 0.6722382 21.63481 21.6 3481 22.97958 22.9 7958
Z0,975
El Intervalo de confianza de la carga térmica de enfriamiento es (23,87; 25,3).
N_Y
768
1.96
0.343058
0.672394
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Determine, para un nivel de significación del 5%, si existen diferencias entre la carga térmica de calentamiento (Y1) y la carga térmica de enfriamiento (Y2). Diferencia entre Y1 y Y2
n_X média_X1 DP_X1 N_Y Média_y1 DP-Y1 Z0,975 Diferencia media Error común
768 22.3072 9.50711 768 24.58776 10.08363 1.96 - 2.28057 1.731387
Inferior
-0.54918
IC diferencia Superior Superior
-4.01195 -4 .01195
El Intervalo de confianza de la diferencia entre la carga térmica de calefacción y la carga térmica de enfriamiento sería (-0,55; -4,01). Ese intervalo no contiene el valor 0, existe una diferencia entre las dos variables.