Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia
Tractament i publicació d’imatge i vídeo Jaume Reig Carrascosa Primera Prova d’Avaluació Continuada (PAC 1)
UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia Tractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa
1. Heu estudiat i treballat els diferents tipus de transformades: puntuals, lineals, no lineals , i espacials. Explica la diferència principal de treball sobre la imatge de cadascuna d’elles i indica que tipus de transformació s’utilitza en els següents: a. Al realitzar un clipping en la imatge. b. Eliminar soroll uniforme gaussià. c. Realitzar un zoom de la imatge. d. Acolorir una imatge en nivell de grisos. e. Enfocar una la imatge. f. Realçar els detalls d’una imatge. g. Eliminar objectes foscs de grandària petita no desitjats de la imatge.
a. Al realitzar un clipping en la imatge. Transformació puntual. És la reducció de la imatge a unes poques tonalitats o normalment a 2 (blanc i negre). En el cas de la reducció a 2 tonalitats (blanc i negre) és la binarització (en Photoshop Umbral). En el cas de més colors (Posterizar en photoshop)
b. Eliminar soroll uniforme gaussià. S’utilitza una transformació espacial lineal. Amb una màscara laplaciana de suavització (filtre de mitjana). Aquestes màscares es dissenyen amb la condició que la suma dels seus coeficients sigui 1. Aquesta màscara el que fa és mitjanar els píxels de la finestra de treball amb els seus veïns, fent que els píxels extrems es tornin més grisos i per tan estem difuminant els contorns i també difuminant el soroll de fons uniforme. c. Realitzar un zoom de la imatge. És una transformació espacial geomètrica (una interpolació). El que estem fer és separar els píxels de tal forma que enmig d’aquesta separació que hem creat afegim nous píxels d’informació de color. Aquests píxels que afegim poden ser calculats de diverses maneres entre les quals: interpolació lineal, interpolació bilineal i interpolació bicúbica.
2
UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia Tractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa
d. Acolorir una imatge en nivell de grisos. És una transformació puntual. Es tracta d’associar cada nivell de gris a un color mitjançant una paleta de color d’on agafarà el color. (l’operació resultant s’anomena pseudocolor). Pot ser considerat també com una variant del color indexat, ja que agafa cada nivell de gris i el substitueix per un de la paleta de color i per tant la imatge resultant acolorida pesa el mateix que la imatge en escala de grisos.
e. Enfocar una la imatge. És una transformació espacial lineal. Hem d’utilitzar màscares de realçament de contorns o de detecció de contorns (laplacianes) per tractar de definir els contorns dels objectes que estan difuminats. La utilització d’una o l’altre serà depenent de com desenfocada estigui la imatge.
f. Realçar els detalls d’una imatge. És una transformació espacial lineal. Hem d’utilitzar màscares de realçament de contorns (laplacianes).
g. Eliminar objectes foscs de grandària petita no desitjats de la imatge. És una transformació espacial no lineal. Hem d’utilitzar una erosió o també un tancament, encara que millor la darrera el tancament.
3
UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia Tractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa
2. Com puc saber si una imatge que he pres amb una càmera digital està correctament exposada, amb la il·luminació correcta, i a quins són els millors ajustaments que es poden aplicar sobre la imatge? Una imatge ben exposada en general observant en l’histograma hauria de tindre una distribució uniforme i el més extensa possible per tots els nivells (això és cert per la majoria d’imatges, però es poden donar casos especials com per exemple el cas d’una fotografia amb paisatge totalment nevat, on lògicament els nivells blancs seran els predominants en la imatge i els foscos inexistents). Un bon ajustament per il·luminació d’una imatge és per exemple llegir els valors màxims i mínims de nivells en l’histograma i aplicar a partir d’aquests punts una corba de transformació lineal per parts.
3. Raona a través del següent histograma si pertany a una imatge contrastada o no:
La imatge no està ben contrastada. Aquesta imatge té molts nivells foscos i els nivells més clars son pràcticament inexistents. Perquè estigués ben contrastada la imatge hauria de tindre una presència de nivells clars equiparables als foscos i els tons mitjos més baixos que els foscos i els clars. En l’histograma es pot preveure que la imatge en general és molt fosca.
4
UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia Tractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa
4. Explica que signifiquen els paràmetres que apareixen sota histograma anterior. Quina probabilitat hi ha de trobar un píxel del mateix nivell de gris al seleccionat?
Promedio: El valor mitjà en nivells del 0 al 256 entre tots els píxels de la imatge. Desv. est (Desviació estàndard o típica): És la mitja aritmètica de les diferencies de la mitjana de tots els píxels. És un indicatiu si la imatge està poc o molt contrastada. Normalment està entre 40 i 90 en imatges normals. Mediana: Mostra el valor mitjà en el rang de nivells de la imatge. Pixeles: El nombre total de píxels de la imatge Nivel: El nivell sobre el qual està situat el punter. Cantidad: Mostra el nombre total de píxels corresponents al nivell on tenim situat el punter. Percentil: El percentatge de píxels que hi ha del total del nivell d’intensitat on està situat el cursor. Nivel de caché: El nivell de caché utilitzat per a crear l’histograma. La probabilitat hi ha de trobar un píxel del mateix nivell de gris al seleccionat és el Percentil. O sigui el nivell 52 apareix 543 vegades d’un total de 65536: 543*100/65536= 0,83%
5
UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia Tractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa
5. Quina diferència hi ha entre una transformació de contrast i l’ecualització de la imatge? La diferència és que en una corba de contrast descomprimim tota la gama tonal de tal forma que distribuïm els tons clars, foscos i mitjos expandint tota la gama tonal. En l’equalització agafem el valor més clar i més fosc com a referència i distribuïm uniformement els tons mitjos. 6. En què consisteix la indexació del color? Indica tipus, les seves característiques de funcionament i per a què es pot usar (posa 3 exemples concrets).
Usualment les imatges en color estan quantificades a 8 bits per canal de color. En el cas d’imatges RGB serien 24 bits per píxel (16,7 milions de colors). El color indexat funciona diferent ja que aquest no emmagatzema directament cada píxel d’informació de color, sinó que els agafa d’una paleta de colors que està limitada a 256 colors, pel que cada píxel de color es pot guardar en tan sols 8 bits. Quan convertim una imatge de color a color indexat reduïm la informació de color de cada píxel i hem de triar la paleta de colors que farem servir i el mètode d’assignació de colors. Per assignar colors poden fer servir el mètode uniforme, que tria el valor mitjà en un espai dividit en fraccions iguals o el adaptatiu que tria el valor més freqüent també entre un espai dividit en fraccions iguals. En els dos casos la paleta de colors que fem servir és depenent de la imatge original. També hi ha la possibilitat de treballar amb paletes fixes de colors no depennets de la imatge original. Utilitats • La primera utilitat concreta per transformar una imatge de color a indexat és per la reducció de pes de la imatge resultant al reduir la informació de color de cada píxel. • Una altra utilitat per exemple és utilitzar el format GIF (que és color indexat), ja que aquest accepta transparències alfa cosa que és molt útil per la web on podem integrar imatges amb el fons de color html. • La tercera utilitat pot ser per a destacar zones determinades d’una imatge, com podria ser el cas d’imatges mèdiques canviant-ne el color original de la imatge original.
6
UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia Tractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa
7. Què és una màscara de suavitzat? Què és el paràmetre d’escala que es necessita per a determinar una màscara o filtre d’aquest tipus en el Photoshop? La màscara de suavitzat és una transformació espacial lineal. Aquestes màscares suavitzen i difuminen les zones on hi ha contrastos forts (zones on els píxels propers entre si tenen valors molt diferents, fent aquesta màscara que s’igualin aquests píxels). Per fer-ho amb una màscara de suavització, hem de pensar com si la màscara fos una quadrícula que agafa els valors de cada porció d’aquesta quadrícula i en fa la mitjana substituïnt el valor central d’aquesta quadrícula per la mitjana calculada. Les màscares de suavització es dissenyen tenint en compte que la suma dels seus coeficients sigui igual a 1. En Photoshop el valor “escala” són els denominadors o total de fraccions en què s’ha fraccionat el numerador. 8. Indica que variacions s’estan produint a l’aplicar sobre una imatge les diferents transformades lineals, raonar la diferència entre elles:
En la primera corba estem enfosquin la imatge en general. Estem expandint els tons mitjos de la imatge fent que passin a ser més foscos. En la segona imatge estem contrastant aquesta retallant els nivells d’entrada. O sigui, si per exemple establim un punt d’entrada per les llums a 9 i de sortida a 0, vol dir que tots els píxels per sota de 9 passen a ser 0. I per les ombres el mateix procediment. Aquest tipus de corba “recta” té l’inconvenient que provoca o pot provocar àreas molt saturades les quals podem visualitzar el l’histograma on s’agrupen els píxels en els extrems. En la tercera imatge també és una corba de contrast però en aquest cas l’efecte és més suavitzat. A diferència de l’anterior es podem evitar més fàcilment les zones saturades i “cremades”.
7
UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia Tractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa
9. Fer una taula resum sobre el funcionament, usos aconsellats i desaconsellats, avantatges i desavantatges dels sistemes de: dilatació, erosió, obertura, tancament. Dilatació Funcionament
Erosió
Obertura
Tancament
És una operació mor- És una operació morfo- És una erosió seguida És una dilatació seguida fològica que retorna el lògica que retorna el va- d’una dilatació.
d’una erosió.
valor màxim de nivell lor mínim de nivell de de gris de la finestra de gris de la finestra de tretreball (element estruc- ball (element estructuturant), de tal manera rant), de tal manera que que si hi ha un píxel amb si hi ha un píxel amb ninivell 255 retorna 255 vell 0 retorna 0 fent que fent que es redueixin es redueixin les zones les zones negres. Amb negres. Amb photoshop photoshop és: filtro -> és: filtro -> mínimo máximo Usos aconsellats
- Unir objectes propers
- Separar objectes pro- - Aillar objectes en imat- - Aillar objectes en imat-
- Fer contorns més grui- pers. xuts d’objectes tancats.
ges sobre fons negre o ges sobre fons blanc o
- Fer contorns més fosc.
clar.
- Destacar o fer més prims dels objectes tan- - Èmfasi general de con- - Èmfasi general de congrans objectes petits cats.
torns.
torns.
aillats (per imatges bina- Eliminar o reduir ob- - Eliminar soroll de fons - Eliminar soroll de fons ries)
jectes petits aillats. (per impulsional (blanc).
impulsional (negre).
imatges binaries) Usos desaconsellats
Per imatges acolorides Per imatges acolorides Eliminar soroll de fons Eliminar soroll de fons i imatges monocromà- i imatges monocromà- gaussià. tiques.
Avantatges
gaussià.
tiques.
Amb un sol pas podem Amb un sol pas podem Elimina o minimitza els Elimina o minimitza els aplicar la transformació aplicar la transformació efectes indesitjats de efectes indesitjats de la i veure els resultats.
Inconvenients
i veure els resultats.
l’erosió.
dilatació.
Poden sortir efectes in- Poden sortir efectes in- Hem de fer 2 passos per Hem de fer 2 passos per desitjats en les imatges desitjats en les imatges aplicar la transforma- aplicar la transformatals com: aclariment ge- tals com: enfosquiment ció. neral, aprimament d’ob- general, engruiximent jectes i desaparició.
d’objectes i unió.
8
ció.
UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia Tractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa
10. Explica que procés s’ha realitzat per a obtenir la imatge A i B, si la següent imatge és l’original, de partida:
Per la figura A fem servir una obertura. O sigui una erosió (Photoshop: Filtro -> Otro -> Mínimo) seguida d’una dilatació (Photoshop: Filtro -> Otro -> Máximo) Per la figura B fem servir un tancament. O sigui una dilatació seguida d’una erosió.
9
UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia Tractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa
11. Explica les diferents formes d’obtenció de contorns estudiades. Punts forts i febles de cada sistema. Es pot fer de 3 maneres: màscares laplacianes, màscares de gradient i operacions morfológiques (per erosió o dilatació restant les imatges originals per la erosionada o dilatada) Màscares laplacianes (detectores de contorns): La màscra es dissenya de tal manera que la suma dels seus coheficients valgui 0, per tant quan en la finestra de treball troba valors en nivells similars pràcticament no canvia res en la sortida i només canvia substancialment quan detecta nivells diferents (contorns). Màscares de gradient: Aquest és un altre tipus de màscares detectores de contorns. Funcionen amb la mateixa lógica que les anteriors de que la suma de coheficients valgui 0, però aquestes són detectores de contorns selectius, o sigui de detecten contorns horitzontals, verticals i diagonals per separat. Operacions morfológiques (erosió, dilatació): Aquestes també son detectores de contorns. La lógica de funcionament per les imatges erosionades és: la erosió redueix les parts blanques d’una imatge, per tant si restem la imatge original per l’erosionada n’obtenim els contorns. El mateix passa per la dilatació però amb les parts negres.
Avantatges inconvenients de cadascuna
Màscares laplacianes Avantatges: serveix per tot tipus d’imatges. Monocromàtiques, color, binaries. Desavantatges: Produeix soroll de fons Màscares de gradient Avantatges: Pot detectar contorns selectivament en horitzontal, vertical i diagonal. Produeix poc soroll de fons. Desavantatges: És poc efectiu en la detecció de contorns globals i la detecció no és tan fina com en les màscares laplacianes. Operacions morfològiques Avantatges: En imatges monocromàtiques i binaries la detecció de contorns és més fina que en les laplacianes i les de gradient. No produeix soroll de fons. Desavantatges: Produeix un enfosquiment o aclariment general de la imatge. El fons ens queda de color negre.
10
UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia Tractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa
12. Com eliminaries el soroll de tipus salt&pepper d’una imatge? Raona la resposta.
Per reduir el soroll de tipus salt&pepper (soroll impusional), la millor manera és utilitzar el filtre de mediana. La mediana és l’ordenació d’una mostra de nombres enters, llavors el nombre que queda el mig és la mediana. Per tant en una imatge els nivells extrems (que són els que provoquen el soroll impusional de valors extrems distribuïts de forma no homogènia), sempre estaran al principi o al final de la seqüència ordenada, fent que aquestos desapareixin i produint poc canvis en els valors mitjos. Amb photoshop per aplicar el filtre de mediana: Filtro -> Ruido ->Mediana
11
UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia Tractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa
13. Què és la resolució de la imatge i com és el seu sistema de mesura ? Si la resolució d’una imatge escanejada en una A3 és de 500ppp, quin és la grandària de la imatge en píxels?
Bàsicament és una mesura per saber quan definida està una imatge. Com més alt sigui el nombre més definició tindrà la imatge. Si per exemple tenim una imatge a 72 ppp, vol dir que cada polzada té 72 píxels. La formula de càlcul de la mida física d’una imatge és: mida (polzades)
= mida (píxels)/ resolució (píxels/polzada)
Per tant per calcular la resolució serà: resolució (píxels/polzada)
= mida (píxels) * mida (polzada)
mida (píxels) -> mida per pantalla mida (polzades) -> mida física Càlcul imatge A3 de 500ppp
Un A3 es: 297 x 420 mm i en polzades - > 11,69 x 16,53 polzades Per tant: mida (píxels)
= resolució * mida (polzades)
mida amplada = 11,69 * 500 = 5845 píxels mida llargada = 16,53 * 500 = 8265 píxels
12
UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia Tractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa
14. Dels tipus d’interpolació estudiats indica que tipus s’ha usat per a cadascuna de les següents imatges si hem quatriplicat la seva grandària, raona la resposta:
Costa bastant d’identificar ja que els canvis són mínims però la imatge primera està lleugerament més enfocada en els contorns que la segona. Per tant jo diria que la primera ha estat interpolada amb interpolació bicúbica i la segona interpolació bilineal. En tot cas cap de les dues per interpolació per veí més proper ja que no hi ha efecte “píxelat”. Nota: per veure les diferències he creat un nou document de photoshop amb les dues imatges una a cada capa i amagant i mostrant capa per veure les diferències.
13
UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia Tractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa
Bibliografia extra utilitzada Paulo Porta. Destripando el histograma [en línia]. [data de consulta: 12 de novembre del 2011]. Disponible en . Paulo Porta. Técnicas de filtrado [en línia]. [data de consulta: 12 de novembre del 2011]. Disponible en . Adobe Photoshop. Acerca de los histogramas [en línia]. [data de consulta: 12 de novembre del 2011]. Disponible en . Colaboradores de Wikipedia. Ruido en la fotografía digital [en línea]. Wikipedia, La enciclopedia libre, 2011 [fecha de consulta: 14 de noviembre del 2011]. Disponible en .
Jaume Reig Carrascosa Novembre de 2011
14