Clase 03 Rendimiento de Com!"t#do$ ING. JOSE R. SANDOVAL SANDOVAL JIMENEZ EPIS-FICSA-2016-0
Rendimiento A%i&n
C#!#'id #d !#(#)e$o (
A"tono m*# +,m
Veo'id# d '$"'e$o +,m/
P$od"'ti%id# d +!#(#)e$o(, m/
oein 333
435
350
780
463500
oein 33
30
6635
780
60600
Con'o$de
142
645
2135
283100
DC-8
16
1040
835
123350
Rendimiento de "n (i(tem# Sistema – Traba Trabajo jo en un determinado determinado tiempo •
Rendimiento de una computadora ejecuta instrucciones Tiempo Tiempo que tarda tarda en ejecutar los programas
P#$9met$o( de $endimiento de !$o'e(#do$ 1 ! 3 # &
•
Frecuencia de la CPU
•
Periodo de la CPU
•
Ciclos por instrucci"n
•
$% de instrucciones del programa
•
'ultitarea
E $endimiento de "n !$o'e(#do$
(prog)
E)e$'i'io •
*ada las caracter+sticas de un programa, Calcular el tiempo que demora en ejecutar el programa su rendimiento, .a cpu trabaja a 1/, 2l programa se compone de 1 instrucciones de 3 tipos 45 6 - C - cada tipo de instrucciones tiene un n% de microinstrucciones di7erentes, :i!o de in(t$"''
In(t$"''P$o
CPIi
4
&
!
6
8
3
C
9
1
E)e$'i'io •
Se dispone de un computador basado en un P:; a ! /<, Se ejecuta un programa de 1000 instrucciones, Seg=n la tabla5 calcular el rendimiento :i!o de in(t$"''
In(t$"''P$o
CPIi
."gico>aritm?tica
!0@
#
Salto indondicional
10@
3
Salto condicional
10@A10@
BA&
Carga Reg>'D
30@
3
4lmacenamiento '>RD
!0@
#
Com!#$#'i&n de Rendimiento 2l rendimiento 'edida cuantitatiEa
-
-
1. ACELERACION DEL RENDIMIEN:O
4()
!, ACELERACION DEL :IEMPO
4 T)
E)e$'i'io •
Tenemos un P:; de !/< - ejecuta un programa de 1000 instrucciones seg=n la siguiente tabla calcular el rendimiento, Para aumentar el rendimiento se aHade posteriormente una cac? que aorra 1 ciclo en accesos si el dato est en la cac? - si no est dura lo mismo, 2l porcentaje de aciertos es del 0@, Calcular el rendimiento - la aceleraci"n del rendimiento con respecto del anterior sin cac?,
:i!o de in(t$"''i&n
In(t$"''P$o
CPIi
."gica>aritm?tica
300
&
.lamada a subrutina
100
Salto incondicional
100
8
Salto condicional
&0A&0
A3
Carga R>'D
100
!
4lmacenamiento '>RD
100
#
'oE R>RD
!00
!
;NIDADES DE MEDIDA DE RENDIMIEN:O GLOAL ':PS 'illones de :nstruccione s por segundo •
':PS ;4I
Se escoge una mquina representatiEa ;4I 11AB90 equiEalente 90!98D
MEGAFLOPS NA:IVOS < RELA:IVOS
'F.GPS$4T:;GS
'F.GPSR2.4T:; GS
In(t$"''ione(
Pe(o
1 operaci"n Jotante
de
punto
de
punto
*:;5SKRT
# operaci"n Jotante
de
punto
2IP5S:$
9 operaci"n Jotante
4**5SU65'U.
E)e$'i'io •
4**
!0
1
SU6
10
1
'U.
10
1
*:;
1!
#
2IP
!
9
S:$
9
SKRT
1
#
en'/m#$= •
•
1, 6encmar Sint?tico
• •
• • •
• •
!, 6encmar Reducido o de
• • • • • •
Simular el comportamiento de aplicaciones del mundo real Rutinas repetitiEas de los programas ms usados D>RMAR, +MIPS 'iden eLciencia del procesador - compilador en un entorno de desarrollo .4$ *r-stone ':PS ?>ES:ONE ENC>MAR, 2jecuci"n de programas cient+Lcos - de ingenier+a FGRTR4$ – enteros - punto Jotante MN:PS 'iles de instrucciones Nestone O segD 10 - 100 l+neas de c"digo ToQers Perm Criba de 2ratostenes Pule Kuicsort
3, Mernel 6encmar
•
• •
•
•
#,Program as Reales
• • •
PequeHas pieas claEes de programas reales $o eEal=an prestaciones grLcas @Li%e$mo$e Loo!( – !1 7ragmentos de bucles pequeHos @Lin!#'= – subrutinas de lgebra lineal
Programas ecos con partes de programas reales procesadores de teto5 compiladores5 C4*5 etc Complejos de usar S,G incompatibles $o son estndar ni de libre distribuci"n
iCOMP •
•
•
iCG'P es un bencmar desarrollado por :ntel para poder medir el rendimiento de sus procesadores5 cuando cambios arquitect"nicos imped+an una comparaci"n =nicamente por la 7recuencia de reloj, iCG'P es un acr"nimo de Inte COm!#$#ti%e Mi'$o!$o'e((o$ Pe$Bo$m#n'e , Sin embargo5 este bencmar no a tenido la repercusi"n que :ntel esperaba, 2l tipo de computadoras que intenta medir son las 'om!"t#do$#( !e$(on#e( (e$%ido$e( de $ed basados en microprocesadores :ntel,
–
–
–
.a Eersi"n 1,0 indicaba el rendimiento con respecto al #98SI !& .a Eersi"n !,0 indicaba el rendimiento con respecto al Pentium 1!05 .a Eersi"n 3,0 indicaba el rendimiento con respecto al Pentium :: 3&0',
Re("t#do( •
•
•
Su resultado epresa el rendimiento relatiEo de los procesadores :ntel respecto a alg=n procesador :ntel que se considera base, Para esto '#'"# # medi# eomt$i'# !onde$#d# de los distintos bencmars que lo componen, 2n la %e$(i&n 1.0 e !$o'e(#do$ Inte 86S 25M> ten*# e !"nt#)e de 100 5 los bencmas que lo componen son –
–
–
–
•
2n la %e$(i&n 2.0 e !$o'e(#do$ de $eBe$en'i# !#(& # (e$ e Penti"m de 120 M>5 - los bencmars que lo componen estn preparados para medir la per7ormance de procesadores de 3! bits, 2stos son –
–
–
–
•
•
•
*i>*aEisD 6enc > 89@ 18>bit Netstone > !@ SP2Cint! > !&@ SP2C7p! > &@
CPUmar3! $orton Utilities S:3! C:$T& - CFP& de SP2C :ntel 'edia 6encmar,
2stas medidas 7ueron escogidas entre una serie de bencmars p=blicamente disponibles, 2ntre las raones esgrimidas para su elecci"n tenemos que cada uno mide una caracter+stica especial de la arquitectura :ntel adems utilian una mecla de aplicaciones que se encuentran o- en d+a en la ma-or+a de los sistemas, 4l otorgarle distintos pesos a cada uno :ntel tambi?n establece cules son de esas caracter+sticas las ms importantes para las aplicaciones del momento, Posteriormente sali" al p=blico # %e$(i&n 4.0 H"e tom& 'omo #(e # Penti"m II de 450 M> - nueEamente cambi" la mecla que con7orma el bencmar general, GbEiamente5 al ser un bencmar deLnido por el mismo :ntel responde a sus propios
SPEC •
St#nd#$d Pe$Bo$m#n'e E%#"#tion Co$!o$#tion +SPEC 5 es un consorcio sin Lnes de lucro que inclu-e a –
–
–
–
•
Eendedores de computadoras, integradores de sistemas UniEersidades grupos de inEestigaci"n5 consultores de todo el mundo,
publicadores
-
Tiene dos objetiEos –
–
crear un en'/m#$= e(t9nd#$ para medir el rendimiento de computadoras controlar - publicar los resultados de estos tests,
•
•
O!en S(tem( G$o"! +OSG D5 grupo de sistemas abiertos realian bencmars de niEel de componentes - sistemas en ambientes UniA$TA;'S, 4dems del conocido –
–
–
–
–
•
SP2C CPU!000 suite5 el grupo a desarrollado en'/m#$=( !#$# J#%# SPEC)A!!Se$%e$2002 >en el cual eperimentan con una nueEa m?trica de costoArendimiento>5 SP2Cj4ppSerEer!0015 SP2C V66!000 - SP2C V;'9D5 de (e$%ido$e( e SP2CQebWSS.5 SP2CQeb - SP2CQeb8D5 un en'/m#$= !#$# (e$%ido$ de 'o$$eo( el SP2C '4:.!001D uno de (i(tem#( de $ed el SP2C SFSBWR1D, Por otra parte5 tiene una serie de bencmars ms actualmente en desarrollo entre ellos podemos contar "n n"e%o en'/m#$= de (e$%ido$ de 'o$$eo( que inclu-e el protocolo i'4P,
>i/ Pe$Bo$m#n'e G$o"!+>PG D5 grupo de alto rendimiento bencmaring en un ambiente de computaci"n num?rico5 con ?n7asis en computaci"n num?rica de alto rendimiento, 2l nico que intenta cubrir este bencmar inclu-e sistemas con multiprocesadores sim?tricos5 clusters de estaciones de trabajo5 sistemas paralelos con memoria distribuida - las tradicionales supercomputadoras Eectoriales - Eectoriales paralelas,
SPEC CP; 2000 •
•
•
SP2C CPU!000 es un 6encmar producido por la SP2C, Fue creado con el Ln de proEeer una medida de rendimiento que pueda ser usado para comparar cargas de trabajo intensiEas en c"mputo en distintos sistemas de computadora, Contiene dos bencmar suites –
–
•
C:$T!000 para medir - comparar el rendimiento computaci"n intensiEa de enteros5 CFP!000 para medir - compara el rendimiento computaci"n intensiEa en Jotantes,
de de
2l C:$T!000 - el CFP!000 no 7ueran la entradaAsalida unidades de discoD5 trabajo en red o grLcos,
•
C:$T!000 contiene 11 aplicaciones escritas en C - una en CXX !&!,eonD que son usadas como bencmars, Nom$e $e%e de('$i!'i&n 18#,gip Utilidad de compresi"n de datos, 1B&,Epr *ireccionamiento - ubicaci"n de circuitos FP/4, 1B8,gcc Compilador C, 191,mc7 Resolutor de costo m+nimo de Jujo de red, 198,cra7t- Programa de ajedre, 1B,parser Procesamiento de lenguaje natural, !&!,eon 27ectos producidos por distintas 7uentes de lu, !&3,perl bm Perl, !,gap Teor+a de grupo computational, !&&,Eorte 6ase de datos orientada a objetos, !&8,bip! Utilidad de compresi"n de datos, 300,tQol7 Simulador de ubicaci"n - ruteo,
•
•
CFP!000 contiene 1# aplicaciones seis en FortranBB5 cuatro en FGRTR4$0 - cuatro en CD que son usadas como bencmars Nom$e $e%e De('$i!'i&n 189,QupQise Cromodinmica de cuantos, 1B1,sQim 'odelado de aguas poco pro7undas, 1B!,mgrid Resolutor de multi>grilla en campos potenciales 3*, 1B3,applu 2cuaciones di7erenciales parciales parab"licasAel+pticas, 1BB,mesa 6iblioteca de grLcos 3*, 1B9,galgel *inmica de Juidos anlisis de inestabilidad oscilatoria, 1B,art Simulaci"n de red neuronal teor+a de la resonancia adaptatiEa, 193,equae Simulaci"n de elementos Lnitos modelado de terremotos, 19B,7acerec Reconocimientos de imgenes reconocimiento de rostros, 199,ammp Ku+mica computacional, 19,lucas Teor+a de los n=meros prueba de primalidad, 11,7ma3d Simulaci"n de elementos Lnitos en coque, !00,sitrac 'odelo de acelerador de part+culas, 301,apsi Resolutor de problemas de temperatura5 Eiento distribuci"n de contaminantes,
LEL •
•
2Eal=an las modiLcaciones en el rendimiento de un computador cuando se introducen mejoras o ms recursos, 2l '$ite$io – lo que a- que mejorar o modiLcar siempre es lo que ms se usa 7recuentemente,
P$ime$# Le de Amd#/ •
2l aumento del rendimiento debido a la inclusi"n de una mejora con un nueEo recurso en el sistema est limitado por el tiempo que se utilia dica mejora en la ejecuci"n de la tarea,
Se"nd# Le de Amd#/ •
Cuando se introduce una mejora a un computador preEiamente mejorado5 el incremento del rendimiento es menor que si se introduce la mejora sobre el sistema sin mejorar,
2jercicios resueltos •
Se cambia la 4.U de un procesador dedicado a una tarea la cual el &0@ del tiempo lo ace la 4.U, .a nueEa 4.U es dos Eeces ms rpido que la anterior, Calcular el tiempo de mejora,
•
Sustituimos la 4.U por una nueEa un 30@ ma-or, Si inicialmente una computador tardaba !seg, 2n acer un programa Ycunto tarda aora sabiendo que la 4.U para este programa est 7uncionando el &0@ del tiempoZ
•
2Ealuar la aceleraci"n del rendimiento del sistema computador cuando se cambio la 4.U del procesador por otro 10 Eeces ms rpida5 sabiendo que la 4.U participa durante el #0@ del tiempo que dura la tarea,
•
Un programa se ejecuta en 10seg trabajando la cpu a #00 '<, Se desea diseHar una implementaci"n para que dico c"digo se ejecute en 8seg, Se sabe que un aumento de la 7recuencia del reloj aumenta el CP: en 15! Eeces el que ten+a Ycul debe ser la nueEa 7recuencia de 7uncionamientoZ