F. W. Lancaster
Indexação e resumos Teoria e prática
Segunda edição revista e atualizada
Lancaster, F. W. 1933Indexação e resumos teoria e !r"tica # F. W. Lancaster $ tradução de %ntonio %genor &ri'uet de Lemos. ( ) ed. *er. atual. ( &ras+lia, F &ri'uet &ri 'uet de Lemos # Livros, ). /+tulo original Indexing and adstracting in theory and practice. &i0liograa IS&2 4-4536-)-) 1. Indexação. ). 7esumos ( 7edação. I. /+tulo.
esde sua !rimeira edição em 1991, este livro encontrou excelente acol8ida entre os !rossi !rossionais onais da inormaçã inormação. o. Sua tradução tradução 0rasileira 0rasileira inaugurou inaugurou as atividade atividadess editoriais editoriais de &ri'uet de Lemos # Livros, em 1993. :sta terceira edição, cu;o original oi !u0licado nos :<% em )3, oi inteiramente revista e atualizada, tendo sido inclu+dos dois novos ca!+tulos so0re 0ases de dados de imagens e sons, e indexação na internet. /rata-se /rata-se de texto 'ue alcançou a categoria de cl"ssico na mat=ria e 'ue = recomendado !raticamente em todos os cursos de 0i0lioteconomia e ci>ncia da inormação. %l=m disso, sua utilida utilidade de = incont incontest est"ve "vell !ara !ara !ros !rossio sionai naiss 'ue, 'ue, entre entre outras outras ativid atividade ades, s, tra0al tra0al8em 8em na !rodução e manutenção de 0ases de dados, construção de !ortais na internet, intranets e em !rogr !rograma amass de gestão gestão do con8ec con8ecime imento nto.. % !arte !arte so0re so0re resum resumos os reves revestete-se se de !artic !articula ularr interesse não a!enas !ara !rodutores de 0ases de dados, mas tam0=m !ara editores de !eri?dicos cient+cos. F. W. Lancas Lancaster ter = !roe !roess ssor or em=rit em=rito o da @radua @raduate te Sc8ool Sc8ool o Li0rar Li0rarA A and Inor Inormat mation ion Science da
ncia da inormação, teve a !rimeira edição desta o0ra !remiadas, em 199), !ela %merican SocietA or Inormation Science, como o mel8or livro de ci>ncia da inormação. Dremiação 'ue voltou a ser concedida a tr>s outros t+tulos de sua autoria.
Eomo reerenciar os ca!+tulos do livro L%2E%S/:7, F. W. /+tulo do ca!+tulo. In GGGGGGGG. Indexação e resumos: teoria e !r"tica. &ras+lia, F &ri'uet de Lemos#Livros, ). Ea!. 2Hmero do ca!+tulo, !. D"gina inicial-D"gina nal. OBS.: preencha todos os campos (basta dar um clique em cima de cada um) com os dados necessários e copie depois todo o modelo de referncia acima e cole no local dese!ado. texto
Páginas inicial e fnal de cada capítulo no livro original impresso de onde se extraiu o
"i#is$e s
Darte 1 /eoria, /eoria, !rinc+!io se a!licaç es
Darte ) Dr"tica %!>ndic es
)
%ap&tulo
'&tulo
áina Inicial
áina *inal
1
Introdução
1
4
)
Drinc+!ios da indexação
5
)3
3
% !r"tica da indexação
)
9
Jndices !r=-coordenados
4
56
4
Eoer>ncia da indexação
5
)
5
Kualidade da indexação
3
99
6
7esumos ti!os e unçes
1
11)
% redação do resumo
113
13
9
%s!ectos da avaliação
134
146
1
=todos adotados em serviços im!ressos de indexação e resumos
14
14
11
Eomo mel8orar a indexação
15
19
1)
a indexação e redação de resumos de o0ras de cção
199
)13
13
&ases de dados de imagens e sons
)1
)
1
&uscas em textos
)9
)3
14
Indexação autom"tica, redação autom"tica de resumos e !rocessos ans
)
33
15
% indexação e a internet
339
346
16
M uturo da indexação e redação de resumos
34
35
1
:xerc+cios de indexação
359
3)
19
:xerc+cios de redação de resumos
33
391
1
S+ntese de !rinc+!ios de redação de resumos
39)
393
)
%n"lise de conteHdo modular
39
395
Sumário
Dre"cio.......................................... Dre"cio.............................................................................. ...................................................................... ..................................5 5 %gradecimentos..................................................................................................6
:xtensão do registro...........................................................................................................16 :ta!as da indexação de assuntos.......................................................................................1 %tin>ncia.............................................................................................................................)1 /radução......................................... /radução......................................... ................................. .................................. .................. ) *oca0ul"rios controlados.....................................................................................................)4 Indexação como classicação.............................................................................................)4 :s!ecicidade do voca0ul"rio.............................................................................................)5
Ea!+tulo 3 ( % !r"tica da indexação..................................................... indexação................................................................) ...........)
:xaustividade da indexação................................................................................................3 Drinc+!io da es!ecicidade..................................................................................................3 Mutras diretrizes..................................................................................................................34 Jndices !?s-coordenados.....................................................................................................35 Instrumentos auxiliares da indexação.................................................................................36
Ea!+tulo ( Jndices !r=-coordenados.............................................................5
Elassicação em +ndices de assuntos..................................................................................4) 2+vel de coordenação..........................................................................................................45 Jndices de nal de livro.......................................................................................................46 Jndices !r=-coordenados versus +ndices !?s-coordenados..................................................46
Ea!+tulo 4 ( Eoer>ncia da indexação..............................................................4
Fatores 'ue inNuem na coer>ncia........................................................................................49 Eoer>ncia na an"lise conceitual versus coer>ncia na tradução...........................................53
Ea!+tulo 5 ( Kualidade da indexação..............................................................56 indexação..............................................................56
Eomo recon8ecer umaO 0oaO indexação..............................................................................59 Fatores 'ue inNuem na 'ualidade da indexação..................................................................6 % 'ualidade est" relacionada P coer>ncia..........................................................................6) % utilidade dos estudos de coer>ncia..................................................................................63 % 'ualidade medida com o em!rego de um !adrão............................................................6
Ea!+tulo 6 ( 7esumos 7esumos ti!os e unçes............................................................6 unçes............................................................6
Finalidade dos resumos....................................................................................................... 7esumos modulares............................................................................................................) inirresumos.......................................................................................................................4 7esumos telegr"cos..........................................................................................................4
Ea!+tulo ( % redação do resumo..................................................................5
EonteHdo e ormato............................................................................................................6 7esumidores........................................................................................................................91 Kualidade e coer>ncia na redação de resumos...................................................................9) Kuestes de com!ati0ilidade..............................................................................................94 M 0oletim interno................................................................................................................95 Inclinação !ara um assunto.................................................................................................99
Ea!+tulo 9 ( %s!ectos da avaliação...............................................................1 avaliação...............................................................1
Eo0ertura..........................................................................................................................1 7ecu!era0ilidade...............................................................................................................15 3
Drevisi0ilidade...................................................................................................................19 %tualidade.........................................................................................................................111 2ormas..............................................................................................................................11) Mutros as!ectos concernentes P avaliação.......................................................................11)
Ea!+t Ea!+tul ulo o 1 ( =to =todo doss adot adotad ados os em servi serviço çoss im!r im!ress essos os de inde indexa xaçã ção o e resumos........................................................................................................11
Jndices ala0=tico-es!ec+cos............................................................................................11 Jndices classicados..........................................................................................................11 Mutros +ndices...................................................................................................................1) Jndices de citaçes............................................................................................................131 Eonclusão..........................................................................................................................13
Ea!+tulo 11 ( Eomo mel8orar a indexação...................................................136
Indexação !onderada........................................................................................................136 :los entre termos..............................................................................................................13 Indicadores de unção.......................................................................................................139 Su0ca0eçal8os..................................................................................................................13 is!ositivos da linguagem de indexação...........................................................................1
Ea!+tulo 1) ( a indexação e redação de resumos de o0ras de cção........15
% cção em !articular.......................................................................................................1 7edação de resumos.........................................................................................................14)
Ea!+tulo 13 ( &ases de dados de imagens e sons........................................145
Indexação de imagens......................................................................................................145 %0ordagens 0aseadas no conteHdo...................................................................................149 Imagens na 7ede undial.................................................................................................15 7esumos de imagens........................................................................................................154 %tri0utos da imagem.........................................................................................................155 Eom 0ase em conceitos ou em conteHdo........................................................................15 etadados e voca0ul"rios de indexação...........................................................................16 &ases de dados de sons....................................................................................................16 7ecu!eração de mHsica....................................................................................................163 Sistemas multim+dias........................................................................................................16 Eoncluses........................................................................................................................165
Ea!+tulo 1 ( &uscas em textos....................................................................16
Ea!+t Ea!+tul ulo o 14 ( Inde Indexa xaçã ção o auto autom" m"ti tica ca,, reda redaçã ção o auto autom" m"ti tica ca de resu resumo moss e !rocessos ans.............................................................................................199
Indexação !or extração autom"tica..................................................................................) Indexação !or atri0uição autom"tica................................................................................)) :studos anteriores so0re indexação..................................................................................)) Mutras ormas de classicação..........................................................................................) 7edação autom"tica de resumos......................................................................................) M!eraçes Rautom"ticasO de recu!eração.........................................................................)1) %0ordagens atuais.............................................................................................................)1 Eoncluses........................................................................................................................))6
Ea!+tulo 15 ( % indexação e a internet.........................................................)3)
Serviços de 0usca na 7ede................................................................................................)3)
7ecursos de recu!eração..................................................................................................)33 etadados.........................................................................................................................)35 7esumos na 7ede..............................................................................................................)3 Spamming de +ndice e outras tra!aças.............................................................................)39 *inculação de 8i!ertexto#8i!erm+dia.................................................................................) Elassicação na internet...................................................................................................)1 Dortais...............................................................................................................................))
Ea!+tulo 16 ( M uturo da indexação e redação de resumos.........................)
%0ordagens !rossionais...................................................................................................)5 %0ordagens alternativas....................................................................................................)6 %0ordagens autom"ticas...................................................................................................) Eonclusão..........................................................................................................................)
Darte ) ( Dr"tica..................................................... Dr"tica.......................................................................................... ..........................................)4 .....)4 Ea!+tulo 1 ( :xerc+cios de indexação..........................................................)4
Itens a serem indexados...................................................................................................)4 Indexação e ex!licaçes do autor.....................................................................................)43
Ea!+tulo 19 ( :xerc+cios de redação de resumos..........................................)49
D%7/: 1.............................................................................................................................)49 7esumos deste autor.........................................................................................................)49 D%7/: ).............................................................................................................................)51 7esumos............................................................................................................................)51 Eoment"rios deste autor...................................................................................................)53
%!>ndice 1 ( S+ntese de !rinc+!ios de redação de resumos.........................)54
Drinc+!ios gerais................................................................................................................)54 Drinc+!ios relativos ao conteHdo........................................................................................)54
%!>ndice ) ( %n"lise de conteHdo modular com m?dulos tem"ticos...........)56
:ntradas de +ndice.............................................................................................................)5
4
refácio % !rimeira edição desta o0ra, 'ue rece0eu o !r>mio de mel8or livro do ano so0re ci>ncia da inormação, outorgado !ela %merican SocietA or Inormation Science, oi !u0licada em 1991$ a segunda oi lançada em 199. %m0as oram 0em-rece0idas !elos cr+ticos, e o livro tem sido am!lamente utilizado como texto did"tico na %m=rica do 2orte, no 7eino -lo. :m0ora a indexação e redação de resumos ossem antigamente tidas como !rocessos 'ue somente interessavam a 0i0liotecas e a algumas editoras, sua relevncia e utilidade são recon8ecidas 8o;e em dia de modo muito mais am!lo, !ois, o0viamente, encontram a!licação em todos os ti!os de recursos de inormação em ormato digital. %ssim, esta edição, em0ora continue sendo destinada undamentalmente ao uso como texto did"tico em escolas de 0i0lioteconomia e ci>ncia da inormação Be !rogramas ansC, ainda se reveste de interesse !ara um !H0lico muito maior !rodutores de 0ases de dados de todos os ti!os, 0em como a'uelas !essoas interessadas em outras "reas, como o !ro;eto de intranets, desenvolvimento de !ortais, sistemas de gerenciamento da inormação, e gestão do con8ecimento em geral. %c8o 'ue devo dizer algo acerca das ontes citadas. M autor de uma recensão da !rimeira edição criticou-me !or continuar citando ontes RantigasO. %!esar de ter eito um esorço !ara atualizar !or com!leto as ontes citadas Bat= o começo de )3C, não ten8o !or 'ue me descul!ar !or continuar citando material antigo e at= muito antigo. Dara mim = inconce0+vel 'ue um livro so0re este assunto deixe de citar B!or exem!loC Eutter B165C e 7anganat8an Bd=cada de 193C. %demais, muitas !essoas 'ue 8o;e escrevem so0re esses temas !arecem não ter interesse nem con8ecer as !rimeiras contri0uiçes eitas a este cam!o. %credito 'ue se;a im!ortante, !rinci!almente !ara os estudantes, com!reender como este cam!o se desenvolveu e recon8ecer 'ue muitas das id=ias atualmente a!resentadas como novas !odem ser encontradas, de ato, na literatura de trinta ou mais anos !assados, em orma um tanto similar. o mesmo 'ue nas ediçes anteriores, esta não !rocura lidar com os +ndices de livros isolados, 'ue a!arecem no nal dos livros im!ressos. /rata-se de assunto 0em estudado em outras o0ras escritas !or !essoas com muito mais ex!eri>ncia do 'ue eu nessa "rea es!ec+ca. :sta edição deve ainda ser vista como um texto de natureza introdut?ria. :m0ora creia 'ue os ca!+tulos 1-1) se;am 0astante a0rangentes, ;" so0re os temas ocalizados nos ca!+tulos 13-14 oram escritos livros com!letos, de modo 'ue esses ca!+tulos, em !articular, devem ser lidos como introduçes a esses temas. F.W. L%2E%S/:7
5
+radecimentos :ncontra-se consignada nas legendas das guras a !ermissão !ara utilização de v"rias guras de dierentes ontes. %l=m disso, 'uero agradecer a :lsevier Science !ela !ermissão !ara citar alguns trec8os extensos de textos !u0licados em Inormation Processing and Management $ MELE Inc. !ela !ermissão !ara re!roduzir longas !assagens de um artigo de MO2eill et al. B)1C$ To8n WileA and Sons !ela !ermissão !ara citar v"rios trec8os extensos de material !u0licado no Journal o the American Society or Inormation Science and echnology Be seus antecessoresC$ Inormation /odaA Inc. BUVVV.inotodaA.com !ela !ermissão !ara re!roduzir extensas citaçes de 7ocX B)1C, de !"ontent e de #nline$ I& !ela !ermissão !ara re!roduzir uma longa citação do I$M Systems Journal $ /8omas Eraven !ela !ermissão !ara re!roduzir citaçes de v"rios de seus artigos$ @ettA 7esearc8 Institute !or extensas citaçes de LaAne B))C$ IMS Dress !ela !ermissão de re!roduzir urna extensa citação de 2ielsen B1996C$ e %E Du0lications !ela !ermissão de azer citação de Wactlar et al. B))C. Ms termos e deniçes extra+dos da iso 4953194 são re!roduzidos com a !ermissão da International Mrganization or Standardization BISMC. :sta norma !ode ser o0tida ;unto a 'ual'uer mem0ro da 14 e no s+tio na 7ede da secretaria central da ISM no seguinte endereço UVVV.iso.org. M detentor do direito autoral = a ISM. Dor m, 'uero agradecer a v"rias !essoas !or sua a;uda nesta edição &ella Wein0erg !or ter me c8amado a atenção !ara algumas ontes 'ue, de outra orma, me teriam !assado des!erce0idas$ &rAan Yeidorn !or ter lido um !rimeiro rascun8o do ca!+tulo 13$ Susanne Yum!8reA e Lou Znec8t !or atualizarem as inormaçes de 'ue dis!un8a acerca da 2ational Li0rarA o edicine$ Tune Silvester, do Eenter or %ero S!ace Inormation$ E8andra Dra08a !elas inormaçes do MELE$ o !essoal da Li0rarA and Inormation Science Li0rarA da
6
,ma nota sobre terminoloia (e a redescoberta da roda) /en8o tra0al8ado em 0i0liotecas ou em torno delas 8" muitos anos. urante grande !arte desse tem!o estive envolvido, de uma ou outra orma, com a an"lise de assuntos. :m 1946, comecei a tra0al8ar redigindo resumos, 'ue a0rangiam uma am!la gama de material cient+co e tecnol?gico, !ara um 0oletim de resumos !ara a indHstria, tarea 'ue exigia tam0=m um n+vel minucioso de indexação tem"tica dos itens resumidos. :m 194, assumi o tra0al8o de editor desse 0oletim. %nteriormente tivera ex!eri>ncia com a classicação de livros numa 0i0lioteca !H0lica, al=m de redigir anotaçes, so0re caracter+sticas locais, a serern inclu+das nas c8as catalogr"cas Bna d=cada de 194 a catalogação coo!erativa ou centralizada ainda não era a normaC. Dor volta de 1951 estava envolvido no cam!o da Rrecu!eração da inormaçãoO, e !u0li'uei meu !rimeiro artigo em 1953 e o !rimeiro livro em 195. :m outras !alavras, tem sido muito longa min8a !artici!ação nas "reas de an"lise tem"tica#recu!eração da inormação, !resenciei inHmeras mudanças e con8eci muitos dos !rinci!ais atores deste !alco em !articular. %t= o nal da d=cada de 19 e começo da d=cada de 194, o cam!o 'ue 8o;e lem0ramos como Rrecu!eração da inormaçãoO era dom+nio 'uase exclusivo da !rossão de 0i0liotec"rio. % realização de duas im!ortantes coner>ncias internacionais, al=m do recon8ecimento de 'ue os com!utadores !oderiam a!ortar uma contri0uição im!ortante ao !ro0lema da recu!eração da inormação, tornaram o cam!o mais atraente e !ara ele acorreram !es'uisadores de muitas outras "reas. %o longo de um !er+odo de mais de 4 anos, as contri0uiçes P 0i0liograa so0re recu!eração da inormação tiveram origem em !raticamente todos os cam!os acad>micos, inclusive matem"tica, ci>ncia da com!utação, !sicologia, estat+stica, direito e medicina Binorm"tica m=dicaC. :m0ora rostos novos e novos eno'ues se;am sem!re 0em-vindos, = lament"vel 'ue muitos dos 'ue 8o;e tra0al8am neste cam!o não ten8am nen8uma ormação !r=via e, !or isso, nen8um alicerce s?lido so0re o 'ual construir. M maior !ro0lema = causado !elo ato de 'ue muitos dos 'ue atualmente tra0al8am com recu!eração da inormação !arecem com!letamente ignorantes do ato de 'ue outros !rocessos dierentes dos totalmente autom"ticos oram a!licados, com algum sucesso, P recu!eração da inormação durante mais de 1 anos, e 'ue de ato existe uma 0i0liograa so0re recu!eração da inormação al=m da'uela da comunidade de inorm"tica. :xem!lo gritante encontra-se em %gosti et al. B1994C, 'ue denem as Reta!as da indexaçãoO como [extração de termos \term extractionl, remoção de termos !roi0idos- \sto!-terni remova], usão \conNation] e !onderação \Veig8ting]^. uitas id=ias surgidas 8o;e !ossuem claros antecedentes na literatura de 3 ou anos atr"s, mas esses tra0al8os !ioneiros são com!letamente descon8ecidos !ara os !es'uisadores atuais. ncia eita !or @eorge SantaAana !ara 'uem a'ueles 'ue não !odem recordar o !assado estão condenados a re!eti-lo. Yolmes, !artindo disso, acrescenta
\...] o 'ue !ensamos 'ue se;am inovaçes muitas vezes são meras re!etiçes \...] nossa !rossão !ode desenvolver-se de modo mais r"!ido e mel8or !or meio de inovaçes cumulativas, construindo so0re os alicerces de seu !assado ao inv=s de ignor"-lo B!. 1C.
:le arma 'ue, em !articular, as o0ras de *annevar &us8 e Yans Deter Lu8n, 'ue datam de ou 5 anos, cont>m id=ias 'ue desde então são reinventadas. in8a !ior ex!eri>ncia com esse !ro0lema es!ec+co ocorreu 8" v"rios anos, 'uando de!arei com um artigo escrito !or um cientista euro!eu, essencialmente um matem"tico, acerca de assunto so0re o 'ual eu !u0licara anteriormente. Kuando escrevi !ara mostrar 'ue ele deixara de citar meu tra0al8o anterior, e diversos outros de autoria de outros !es'uisadores, ele contestou, olgadamente, !ara dizer 'ue nunca !es'uisava na literatura, a não ser 'ue estivesse escrevendo um artigo de revisão` Kue es!=cie de não-ci>ncia ego+sta = essa Mutro resultado da multi!licidade de !rosses 'ue agora contri0uem !ara a literatura de an"lise tem"tica#recu!eração da inormação est" na su0stituição, sem necessidade, da terminologia, a!ro!riada e recon8ecida, da !rossão 0i0liotec"ria. :xem!lo ?0vio = RmetadadosO. M Mxord :nglis8 ictionarA Bem lin8aC registra 195 como o ano do a!arecimento dessa !alavra. 2a =!oca oi usada !ara designar dados 'ue descreviam con;untos de dados Bnum=ricos ou estat+sticosC. esde então tornou-se !raticamente um su0stituto !ara Rdescrição 0i0liogr"caO, denominação esta !ereitamente razo"vel, com a 'ual conviv+amos 8" muitos e muitos anos e 'ue = aceita em normas internacionais. %lgu=m, = claro, !oderia argumentar 'ue R0i0liogr"coO a!lica-se a!enas a livros. Sua extensão, !or=m, a outras ormas document"rias Bcomo em R0ase de dados 0i0liogr"cosO e Rreer>ncia 0i0liogr"caOC convive conosco 8" muito tem!o. %lguns autores, com certeza, c8amaram atenção !ara o mesmo !ro0lema. ilstead e Feldman B1999C, !or exem!lo, argumentam convincentemente Kuer o c8amemos de catalogação. indexação ou metadados. o conceito = amiliar aos !rossionais da inormação. %gora, o mundo eletrQnico !or m o desco0riu. Faz alguns anos, somente uns !oucos l?soos 8aviam ouvido alarem RmetadadosO. Yo;e em dia, = di+cil encontrar uma !u0licação so0re recursos eletrQnicos 'ue ignore essa !alavra. \...] Eomo o !ersonagem 'ue !assou toda a vida escrevendo !rosa sem sa0er 'ue o azia, 1 os 0i0liotec"rios e indexadores v>m 8" s=culos !roduzindo e normalizando metadados. Ignorando este legado, uma imensa variedade de outros atores ingressaram recentemente nesse cam!o, e muitos deles não t>m 'ual'uer id=ia de 'ue algu=m mais antes deles ;" ten8a Restado ali, eito a'uiloO. Sistemas dierentes estão sendo desenvolvidos !ara ti!os dierentes e Ps vezes os mesmos de inormação, disso resultando uma atmosera ca?tica de normas conNitantes B!. )4C.
2ão o0stante, !arecem dis!ostas a aceitar a nova terminologia. Dessoas de nosso !r?!rio cam!o, 'ue certamente deveriam sa0er mais Be ser mais res!ons"veisC, cola0oram com essa situação. Dor exem!lo, @reen0erg B)3C nos diz 'ue a geração de metadados !or seres 8umanos ocorre 'uando uma !essoa, como um criador !rossional de metadados ou um ornecedor de conteHdo, !roduz metadados. Dara ela Rcriador !rossional de metadadosO = o RcatalogadorO ou RindexadorO, conorme admite de!ois em seu artigo Bem0ora ela tam0=m inclua RVe0 inasterO nesta categoriaC. Fi'uei !roundamente c8ocado Be de modo algum satiseitoC ao sa0er 'ue gastei v"rios anos de min8a vida como criador !rossional de metadados, se 0em 'ue inocente disso. uitos 'ue escrevem so0re recu!eração de imagens usam o termo RanotaçãoO !ara designar a atri0uição de r?tulos de texto, como !alavras-c8ave, 'ue identicam o 'ue a imagem re!resenta, o 'ue, evidentemente, eOO indexaçãoO. Isso = duas vezes lament"vel !or'ue RanotaçãoO \annotation], 8" muitos anos, = em!regada !ara designar o 'ue =, undamentalmente, um resumo muito sucinto B'ue a!arecia antigamente em c8as de cat"logosC. Liu e Li B))C mencionam termos de indexação atri0u+dos a videocli!es como Reti'uetas de anotaçãoO \atinotation tags]. Darece 'ue elas constituem uma Rdescrição semnticaO \semantic descri!tion] e são o0tidas !or meio de Rextração semnticaO \semantic extraction] 'ue, !rovavelmente, signica identicação do assunto tratado. Darte dessa conusão terminol?gica se deve a desleixo no tra0al8o editorial. Faz !ouco de!arei com um artigo em 'ue a !alavra RindexationO, 'ue estava at= no t+tulo, era usada como sinQnimo de RindexingO. M voc"0ulo RindexationO realmente existe na l+ngua inglesa, mas em!regado a!enas em contexto econQmico B!or exem!lo, em relação a certas vari"veis, como aumento ou redução de sal"rios e ;uros Ps mesmas taxas do +ndic= de custo de vidaC$ 'uase com certeza não = sinQnimo de RindexingO. Ms autores, neste caso, t>m uma descul!a !or'ue 1
onsieur Tourdan, !ersonagem de Le 0ourgeois gentil8omme, de oli>re. B2./.C
9
são ranceses BRindexationO = o e'uivalente ranc>s de RindexingOC, mas não 8" descul!a !ara os editores de um !eri?dico em l+ngua inglesa se !ermitirem tal incorreção. %guardo agora 'ue a !alavra RindexationO ven8a a su0stituir RindexingO na literatura de ci>ncia da com!utação. Santini B))C, outro cientista da com!utação, conclamou seus colegas de !rossão a ser mais res!ons"veis no uso da linguagem. : adverte 'ue M irrere"vel uso incorreto da linguagem em inorm"tica ameaça levar nossa !rossão a se isolar da sociedade e tornar incom!reens+veis nossas realizaçes B!. 1)C.
Santini concorda com o !onto 'ue ven8o tentando ex!or Mutras !alavras azem mais sentido, mas estão sendo inex!licavelmente a0andonadas em avor de voc"0ulos menos a!ro!riados B!. 1)5C.
entre os termos 'ue ele destaca !ara serem des!rezados estão Rdata Vare8ouseO \armaz=m de dados] e Rdata inartO \mercado de dados] em vez de Rdata- 0aseO \0ase de dados]. s vezes```C Rtaxonoinized set o termsO \con;unto taxonomizado de termos]. % maneira como estes termos são denidos em artigos recentes mostra claramente 'ue são em!regados como sinQnimos de Rclassication sc8emeO \es'uema de classicação]. Earacter+stico disso = um artigo de YovA B)3C 'ue dene \...] uma ontologia sim!lesmente como um con;unto taxonomizado de termos, 'ue variam desde termos muito gerais na !arte su!erior \...] at= termos muito es!ecializados na !arte inerior B!. C.
% RontologiaO de YovA toma-se uma RcoiVe!t 8ierarc8AO \8ierar'uia de conceitos] em eng et al. B))C, 'ue a denem como [um grande nHmero de conceitos organizados em mHlti!los n+veis, de modo 'ue os conceitos em n+veis su!eriores !ossuem signicados mais am!los do 'ue os de n+veis ineriores^. Kuando z o curso de 0i0lioteconomia, zil8es de anos atr"s, essas deniçes teriam sido deniçes exatas, em0ora muito sim!listas, de classicação 8ier"r'uica. Soergel B1999C tam0=m execrou a su0stituição de RclassicaçãoO !or RontologiaO e o ez com muita !ro!riedade ncia da inormação, so0re a estrutura das classicaçes e as maneiras de re!resent"-las, 0em como o imenso ca!ital intelectual consu0stanciado em muitos es'uemas de classicação e tesauros. Sistemas grandes e Hteis v>m sendo constru+dos com mais esorço do 'ue seria necess"rio. :xem!los são o cAc ontologA BUVVV.cAc.com#cAc)- l#intro-!u0lic.8tmlC, cu;a a!resentação !oderia ser 0astante mel8orada, ou Vord2ct BUcogsci.!rinceton.edu#bVn ou UVVV.notredame.ac.;!lcgi-0in#Vn.cgiC, uni sistema maravil8oso cu;a construção teria lucrado com a a!licação da ex!eri>ncia com a construção de tesauros e cu;a 8ierar'uia Bde conceitosC sAnset deveria ser tornada mais acilmente acess+vel com o em!rego de m=todos cl"ssicos de re!resentação de classicação. Mutro exem!lo = o %2SI %d Yoc @rou! on MntologA SLandards BUVVVXsl.stanord.cdu#ontoGstd#index,8tmlC, 'ue !arece não contar entre seus mem0ros com nen8um cientista da inormação interessado em classicação B!. 11)C.
% RclassicaçãoO como atividade tam0=m est" sendo su0stituida na literatura de ci>ncia da inormação !ela RcategorizaçãoO Bcomo em Rcategorização de textosOC, mas isso, a!esar de a0orrecer, não !arece ser tão escandaloso. 1
%lguns termos da nova terminologia são su!ercialmente atraentes. Fui razoavelmente rece!tivo ao voc"0ulo RsummarizationO \sumarização] B!or'ue !oderia ser usado !ara a0arcar Ra0stractingO \redação de resumos], RextractingO \extratação] e at= mesmo RannotationO \anotação]C at= 'ue desco0ri 'ue um livro im!ortante so0re o assunto B:ndres-2iggemeAer, 199C inclui a indexação tem"tica como uma orma de sumarização. :m0ora um con;unto de termos de indexação !ossa, de ato, uncionar como uma es!=cie de resumo do conteHdo, a sumarização não =, com certeza, o !rinci!al o0;etivo da indexação. 2este livro, sem!re 'ue !oss+vel, ative-me P terminologia antiga. Dor razes de clareza, usei alguns !oucos termos novos, como metadados, mas o z com relutncia.
11
-ista de uras Figura 1 ( % unção da ela0oração de +ndices e resumos no 'uadro mais am!lo da recu!eração da inormação...........................................................................................................................14 Figura ) ( M !ro0lema da recu!eração de itens !ertinentes de uma 0ase de dados........ .........14 Figura 3 ( :eito da extensão do registro so0re a recu!era0ilidade...........................................1 Figura ( :xem!lo de um documento indexado segundo dierentes !ontos de vista...............19 Figura 4 ( %n"lise conceitual traduzida em tr>s voca0ul"rios controlados.................................)6 Figura 5 ( %s duas dimenses da indexação de um documento................................................31 Figura 6 ( 7endimentos decrescentes na indexação.................................................... ..............33 Figura ( Sistema de recu!eração da inormação re!resentado como uma matriz..................3 Figura 9 ( Formul"rio de indexação utilizado antigamente !ela 2ational Li0rarA o edicine. . .39 Figura 1 ( Formul"rio caracter+stico da indexação de ooers.................................................. Figura 11 ( Darte de voca0ul"rio es!ecializado so0re com!utadores digitais utilizado !elo <. S. Datent and /rademarX Mce.....................................................................................................1 Figura 1) ( Seção do microtesauro do %ir Dollution /ec8nical Inormation Eenter.................. ....) Figura 13 ( /ela de eti'uetas no ES......................................................................................3 Figura 1 ( 7egistro de indexação !ronto no ES................................................................... Figura 14 ( :xem!lo de entradas de Medical su%&ect headings ' annoted alpha%etic list ()**+, .................................................................................................................................................. Figura 15 ( :xem!lo de entradas de umor -ey , um voca0ul"rio de entradas es!ecializado antigamente utilizado !ela 2ational Li0rarA o edicine...........................................................4 Figura 16 ( :ntradas de um +ndice SLIE.....................................................................................6 Figura 1 ( :ntradas de +ndice 0aseado na alternação sistem"tica Bmodelo da !xcerpta MedicaC .................................................................................................................................................. Figura 19 ( :xem!lo de entradas de um +ndice ZWIE................................................................9 Figura ) ( %mostra das entradas de um +ndice ZWME.............................................................4 Figura )1 ( Formato alternativo de um +ndice ZWME usado no ia0etes-7elated Literature Index, su!lemento de ia0etes, volume 1), 195.....................................................................41 Figura )) ( :xem!lo de entradas do &ritis8 /ec8nologA lndex................................. ..................44 Figura )3 ( Sistema de relaçes de Farradane...........................................................................45 Figura ) ( /ermos B - TC atri0u+dos ao mesmo documento !or cinco indexadores dierentes Ba - eC.............................................................................................................................................4 Figura )4 ( Doss+veis atores 'ue inNuem na coer>ncia da indexação.......................................49 Figura )5 ( 7elação entre coer>ncia e 'uantidade de termos atri0u+dos........................ ...........5 Figura )6 ( :eito da 'uantidade de termos atri0u+dos so0re a coer>ncia do indexador Bdois indexadoresC..............................................................................................................................51 Figura ) ( ois eno'ues dierentes na indexação de um artigo intitulado............... ...............5 Figura )9 ( ois eno'ues dierentes na indexação de um artigo intitulado............... ...............5 Figura 3 ( ois eno'ues dierentes na indexação de um artigo intitulado............... ...............54 Figura 31 ( ois eno'ues dierentes na indexação de um artigo intitulado............... ...............54 Figura 3) ( ierenças na an"lise conceitual de um artigo intitulado........................................55 Figura 33 ( Fatores 'ue inNuem nos resultados de uma 0usca numa 0ase de dados................5 Figura 3 ( :xem!lo da !erda de um item im!ortante !or causa de mera omissão do indexador .................................................................................................................................................. 59 Figura 34 ( Fatores 'ue !odem aetar a 'ualidade da indexação..............................................6 Figura 35 ( Eoer>ncia do indexador relacionada aos interesses dos usu"rios...........................6) Figura 36 ( RDadrãoO de indexação !ara um artigo m=dico, mostrando escores relativos P atri0uição de v"rios ti!os de termos..........................................................................................64 Figura 3 ( :scores de dois indexadores em com!aração com o !adrão da gura 36...............64 Figura 39 ( 7esumo indicativo...................................................................................................6 Figura ( 7esumo inormativo................................................................................................69 Figura 1 ( :xem!lo de um resumo cr+tico................................................................................ Figura ) ( @a0arito !ara um resumo estruturado....................................................................1 Figura 3 ( 7esumo em Rdiagrama de 0locoO de um artigo 8i!ot=tico ;unto com um resumo RconvencionalO !ara com!aração...............................................................................................) Figura ( 7esumos modulares................................................................................................3 Figura 4 ( :ntradas de +ndices modulares................................................................................3 Figura 5, Darte 1 ( Eom!aração de minirresumo, resumo de autor e resumos !u0licados em E8emical %0stracts e &iological %0stracts Bver a !arte ) da guraC.......................................... Figura 5, Darte )...................................................................................................................... Figura 6 ( Drinc+!ios !ara redação de resumos, do eense ocumentation Eenter B195C.. ..6 1)
Figura ( :xem!lo de resumo altamente ormatado...............................................................9 Figura 9 ( Inormaçes essenciais de 'ue necessitam os cl+nicos !ara avaliar a relevncia e a 'ualidade de artigos e, !ortanto, !ara sua inclusão em resumos estruturados.........................9 Figura 4 ( Fundamentos da redação de resumos.....................................................................91 Figura 41 ( 7esultados 8i!ot=ticos de um teste de !revisi0ilidade de relevncia......................9) Figura 4) ( 7egras, destinadas a resumidores, concernentes Ps caracter+sticas de recu!era0ilidade dos resumos...................................................................................................9 Figura 43 ( Erescimento da literatura cient+ca so0re %IS, 19)-196 BFonte :LI2:C.. .. .13 Figura 4 ( Literatura so0re %IS co0ertura !or idioma, 19)-196 BFonte :LI2:C..........13 Figura 44 ( Literatura so0re %IS co0ertura !or !a+s, 19)-196 BFonte :LI2:C..............13 Figura 45 ( 2Hmero de !eri?dicos 'ue !u0licam artigos so0re %IS, 19)-196 BFonte :LI2:C.................................................................................................................................13 Figura 46 ( is!ersão da literatura de !eri?dicos so0re %IS em 196 BFonte :LI2:C.......1 Figura 4 ( @r"co da dis!ersão da literatura so0re %IS.......................................................14 Figura 49 ( Deri?dicos cient+cos 'ue !u0licaram a maioria dos artigos so0re %IMS, 19)-196 BFonte :LI2:C.....................................................................................................................14 Figura 5 ( :xem!lo 8i!ot=tico da distri0uição de itens so0re Rsu!ercondutoresO so0 termos num +ndice im!resso...............................................................................................................16 Figura 51 ( istri0uição de itens so0re imunologia celular no !orco so0 termos no Index edicus...................................................................................................................................1 Figura 5) ( is!ersão de itens so0 termos de indexação........................................................1 Figura 53 ( :xem!lo de entradas do "umulated Index Medicus B1995C...................................114 Figura 5 ( :xem!lo de entradas do Medical su%&ect headings B1995C....................................115 Figura 54 ( :xem!lo de entradas da estrutura 8ier"r'uica B ree structuresC do Medical su%&ect headings B1995C......................................................................................................................116 Figura 55 ( :xem!lo de entradas do +ndice de autores do "umulated Index Medicus .............116 Figura 56 ( :xem!lo de entradas do Applied Science and echnology Index , 195.................11 Figura 5 ( :xem!lo de entradas do volume anual do !ngineering Index B1993C....................119 Figura 59 ( :xem!lo de entradas do +ndice de assuntos do !ngineering Index B1993C............1) Figura 6 ( :xem!lo de entradas do i%rary and Inormation Science A%stracts Bantes de 1993C ................................................................................................................................................ 1)1 Figura 61 ( :xem!los de entradas do +ndice de assuntos do i%rary and Inormation Science A%stracts Bantes de 1993C.......................................................................................................1)) Figura 6) ( Eategorias de assuntos usadas !elo i%rary and Inormation Science A%stracts B1996C......................................................................................................................................1)3 Figura 63 ( :xem!lo de entradas do i%rary and Inormation Science A%stracts .....................1) Figura 6 ( :xem!lo de entradas do +ndice de assuntos do i%rary and Inormation Science A%stracts.................................................................................................................................1)4 Figura 64 ( :xem!lo de entradas do +ndice de assuntos do "hemical A%stracts......................1)5 Figura 65 ( :xem!lo de entradas do +ndice de !alavras-c8ave do "hemical A%stracts............1)6 Figura 66 ( :xem!lo de entradas do +ndice de ?rmulas do E8emical %0stracts......................1) Figura 6 ( :xem!lo de resumos de Sociology o !ducation A%stracts ....................................1)9 Figura 69 ( :xem!lo de entradas de +ndice do Sociology o !ducation A%stracts ....................1)9 Figura ( :xem!lo de entradas do +ndice de assuntos do !pilepsy A%stracts.......................13 Figura 1 ( ierenças na a!resentação de reer>ncias entre o $ritish echnology Index B$ IC e o "urrent echnology Index B"IC de um item so0re cadin8os \ladles] !ara ornos a arco el=trico \arc urnaces] na !rodução de aço \ steel]...............................................................................13 Figura ) ( :xem!lo de entradas D7:EIS do $ritish !ducation lndex .......................................131 Figura 3 ( :xem!lo de entradas do Social Sciences "itation lndex ........................................13) Figura ( :xem!lo de entrada do +ndice de ontes do Social Sciences "itation Index ...........13) Figura 4 ( :xem!lo de entrada do +ndice de assuntos Permuterm do Social Sciences "itation Index .......................................................................................................................................133 Figura 5 ( :xem!lo de !"gina do "urrent "ontents...............................................................13 Figura 6 ( :xem!lo de entradas do +ndice de !alavras-c8ave do "urrent "ontents...............134 Figura ( M sistema de indicadores de unção do :TE...........................................................1 Figura 9 ( Inxos semnticos do sistema da Western 7eserve
Figura 9 ( :xem!lo de um romance indexado com o em!rego do m=todo de De;tersen........14 Figura 94 ( uas sino!ses !oss+veis de %s aventuras de Pedro/ o "oelho, de &eatrix Dotter...143 Figura 95 ( :xem!lo de uma entrada de Masterplots II B195C................................................14 Figura 96 ( :struturas ling+sticas !ara orientar a anotação e indexação indexação de cção...... ........ .... ......144 ..144 Figura 9 ( Drinci!ais n+veis de a0stração na 0ase de dados de um museu de arte...... .......... ...... ....146 146 Figura 99 ( :xem!lo do registro catalogr"co de uma !intura................................................14 Figura 1 ( Eonsulta ormulada a uma 0ase de dados meteorol?gicos. % consulta !ede um com!lexo sistema de 0aixa !ressão so0re a 2ova _elndia com sistemas de alta !ressão a leste e oeste............................................................................................................................151 Figura 11 ( ois ma!as meteorol?gicos recu!erados em res!osta P consulta da gura 1.15) Figura 1) ( Eonsulta incremental incremental numa 0ase de dados de imagens................ ......................153 ..................... .153 Figura 13 ( Eom!aração entre resumo e indexação com voca0ul"rio controlado............. .....13 Figura 1 ( Ms !r?s e contras do texto livre versus voca0ul"rio controlado.................... controlado.......................... .......1 .1 Figura 14 ( :xem!lo de entrada da 0ase de dados /:7......................................................193 Figura 15 ( Ms !ro0lemas undamentais undamentais da recu!eração da inormação................. inormação........................ ............. .......) .) Figura 16 ( :xem!lo de entradas de tesauro tesauro extra+das !or m=todos autom"ticos.... autom"ticos........ ........ ........ ....)6 )6 Figura 1 ( Ligaçes de citaçes#reer>ncias.........................................................................) Figura 19 ( :xem!lo de um auto-resumo auto-resumo de Lu8n BLu8n 194C.............................. ............. ....... ........)1 ..)1 Figura 11 ( :xem!lo de extrato !roduzido !elo sistema %% de redação autom"tica de resumos...................................................................................................................................)11 Figura 111 ( a!a de relaçes textuais 0aseado em Salton et al. B1996C...............................)13 Figura 11) ( &usca inicial numa 0ase de dados de um serviço de atendimento a clientes..... .))5 Figura 113 ( Des'uisa !or mais inormação em 0ase de dados de serviço de atendimento a clientes....................................................................................................................................))6 Figura 11 ( Easos com ordenação mais alta selecionados com 0ase em consulta cr+tica e res!ostas dos clientes Ps !erguntas........................................................................................)) Figura 114 ( 7esumo de caso com a ação recomendada ao cliente........................................))
1
arte / 0 'eoria1 princ&pios e aplicaç$es %ap&tulo / 2 Introdução M !ro!?sito !rinci!al da ela0oração de +ndices e resumos = construir re!resentaçes de documentos !u0licados numa orma 'ue se !reste a sua inclusão em algum ti!o de 0ase de dados. dados. :ssa 0ase de dados dados de re!resent re!resentaçe açess !ode ser im!ressa im!ressa Bcomo numa !u0licaçã !u0licação o de indexação#resumos$ !or exem!lo, o E8emical %0stracts ou o :ngineering lndexC, em ormato eletrQnico B'uando a 0ase de dados muitas vezes ser" o e'uivalente a!roximado de um serviço im!ressoC, ou em c8as Bcomo num cat"logo convencional de 0i0liotecaC. % unç unção ão das das o!er o!eraç açe ess de inde indexa xarr # resu resumi mir, r, no m0i m0ito to maio maiorr das das ativ ativid idad ades es de recu!eração da inormação, ac8a-se es'uematizada na gura 1. :m !rimeiro lugar, o !rodutor da 0ase 0ase de dados dados selec selecion iona a da !o!ula !o!ulaçã ção o de docume documento ntoss rec=m rec=m-!u -!u0li 0licad cados os a'uele a'ueless 'ue atendam a certos crit=rios !ara sua inclusão na 0ase de dados. M mais ?0vio desses crit=rios = o assunto de 'ue trata o documento. Mutros crit=rios, no entanto, como o ti!o de documento, a l+ngua em 'ue se ac8a escrito, ou sua origem, tam0=m são im!ortantes. 2o caso das 0ases de dados 'ue lidam !rinci!almente com artigos de !eri?dicos, os crit=rios de seleção comumente estarão centrados no !eri?dico e não no artigo$ ou se;a, alguns !eri?dicos serão inclu+dos e outros não Bem0ora alguns !eri?dicos se;am indexados em sua inteireza e outros o se;am de orma seletivaC. % co0ertura !ro!orcionada !or muitas 0ases de dados =, em grande medida, determinada !or razes de custo-ec"cia. Darticularmente no caso de 0ases de dados 'ue a0ran;am um cam!o altamente es!ecializado, elas somente incluirão a'ueles !eri?dicos 'ue !u0licam !rioritariamente artigos so0re os assuntos de interesse. Ms itens selecionados !ara inclusão na 0ase de dados serão RdescritosO de v"rias ormas. Ms !rocessos de catalogação descritiva B'ue não a!arecem na gura 1C identicam autores, t+tulos, ontes, e outros elementos 0i0liogr"cos$ os !rocessos de indexação identicam o assunto de 'ue trata o documento$ e o resumo serve !ara sintetizar$ o conteHdo do item. Ms termos utilizados na indexação serão com re'>ncia extra+dos de algum ti!o de voca0ul"rio controlado, como um tesauro Bo Rvoca0ul"rio do sistemaO da gura 1C, mas, em vez disso, !odem ser termos RlivresO B!or exem!lo, exem!lo, extra+dos do !r?!rio documentoC.1 :stas atividades de descrição criam re!resentaçes dos documentos numa orma 'ue se !rest !resta a !ara !ara sua inclus inclusão ão na 0ase 0ase de dados. dados. Ms !r?!r !r?!rios ios docume documento ntoss normal normalmen mente te serão serão destinados a um ti!o dierente de 0ase de dados Bo acervo de documentosC como = o caso das estantes de uma 0i0lioteca. Ms mem0ros da comunidade a ser atendida utiliz lizarão rão a 0ase de dados, undamentalmente, !ara satisazer a dierentes necessidades de inormação. Dara lograr isso, devem converter uma necessidade de inormação em algum ti!o de Restrat=gia de 0uscaO, a 'ual !ode ser tão sim!les 'uanto a escol8a de um Hnico termo !ara consultar um +ndice im!resso ou um cat"logo em c8as, ou exigir a com0inação de muitos termos numa estrat=gia mais mais ela0 ela0or orad ada a e com! com!le lexa xa,, em!r em!reg egad ada a !ara !ara cons consul ulta tarr uma uma 0ase 0ase de dado dadoss mant mantid ida a localmente ou conectada em lin8a a alguma rede de com!utadores. com!utadores. M 'ue se alme;a, evidentemente, ao azer uma 0usca numa 0ase de dados, = encontrar documentos 'ue se;am Hteis !ara satisazer a uma necessidade de inormação, e evitar a recu recu!e !era raçã ção o de iten itenss inHt inHteis eis.. R7el R7elev evan ante teOO e R!er R!erti tine nent nteO eO são são term termos os re' re'e ent ntem emen ente te em!regados !ara se reerir a itens RHteisO, e oram denidos de dierentes ormas. Y" muito desacordo so0re o 'ue realmente signicam RrelevnciaO e R!ertin>nciaO BLancaster e Warner, 1993C. 2este livro considerarei como sinQnimas as ex!resses RHtilO, R!ertinenteO e Rrelevante !ara uma necessidade de inormaçãoO. Mu se;a, um documento !ertinente BHtilC = a'uele 'ue contri0ui !ara satisazer a uma necessidade de inormação. M !ro0lema da recu!eração da inormação est" re!resentado gracamente na gura ). M retngulo inteiro re!resenta uma 0ase de dados e os itens 'ue cont=m. Ms itens com sinal de adição BC são a'ueles 'ue um consulente 8i!ot=tico consideraria Hteis !ara atender a uma necessidade de inormação atual, e os itens com sinal de su0tração B-C são a'ueles 'ue não consideraria Hteis. Dara 'ual'uer necessidade es!ec+ca de inormação 8aver" muito mais itens - do 'ue itens . 2a realidade, se se desen8asse o diagrama Rem escalaO, seria 'uase certo 'ue os onze itens Hteis estariam acom!an8ados de toda uma mural8a de itens inHteis. M 1
Ms termos utilizados !odem, genericamente, ser designados como Rtermos de indexaçãoO, em0ora, muitas vezes, se;a tam0=m em!regada a !alavra RdescritoresO, em !articular 'uando n?s estamos reerindo a termos de um tesauro. 2este livro, am0as as ex!resses são usadas de modo llBuivaXnlc.
14
!ro0lema est" em recu!erar tantos itens Hteis 'uantos or !oss+vel, e o menor nHmero !oss+vel de itens inHteis.
Figura Figura 1 ( % unção da ela0oração de +ndices e resumos no 'uadro mais am!lo da recu!eração da inormação
Figura Figura ) ( M !ro0lema da recu!eração de itens !ertinentes de uma 0ase de dados
M menor dos dois retngulos internos da gura ) re!resenta os resultados de uma 0usca realizada na 0ase de dados, 'ue recu!erou 46 itens, seis dos 'uais oram Hteis e 41 inHteis. % relação entre itens Hteis e o total de itens recu!erados B5#46 ou cerca de 1f neste casoC = comume comumente nte denomi denominad nada a coefciente de precis0o. M +ndice em!regado 8a0itualmente !ara ex!r ex!res essa sarr a exte extens nsão ão com com 'ue 'ue todo todoss os iten itenss Htei Hteiss são são enco encont ntra rado doss = o coefcien coefciente te de revoca10o. 2o !resente exem!lo, o coeciente de revocação = de 5#11 ou cerca de 4f. 2essa 2essa situação, situação, !rovavel !rovavelmente mente seria !reciso, !reciso, !ara mel8orar mel8orar a revocaç revocação, ão, azer azer uma 0usca mais gen=rica. :ssa 0usca = re!resentada !elo maior dos dois retngulos internos. %o azer a 0usca de modo mais gen=rico, aumentou-se a revocação !ara #11 B63fC, mas a !recisão caiu ainda mais !ara #11), ou cerca de 6f.
P recu!eração da inormação, = 'ue uma mel8oria da revocação em geral im!lica !erda de !recisão e vice-versa. % gura ) sugere outro enQmeno. /alvez /alvez osse !oss+vel azer uma 0usca sucientemente gen=rica !ara localizar todos os itens Hteis Bisto =, alcançar 1f de revocaçãoC$ entretanto a !recisão seria !rovavelmente inaceit"vel. %demais, 'uanto maior or a 0ase de dados, menos aceit"vel ser" uma 0aixa !recisão. :m0ora o usu"rio este;a dis!osto a examinar, !or 8i!?tese, 46 itens, a m de encontrar seis 'ue l8e se;am Hteis, talvez se sinta muito menos inclinado a examinar 46 resumos !ara encontrar 5 'ue se;am Hteis. :m 0ases de dados muito grandes torna-se, !ortanto, !rogressivamente !rogressivamente mais di+cil alcançar um n+vel de revocação aceit"vel com um n+vel de !recisão satisat?rio, uma situação 'ue c8egou a um !onto cr+tico 'uando se !rocura inormação na internet. 2este livro em!rego o termo revoca10o \ recall] !ara designar a ca!acidade de recu!erar docu docume ment ntos os Htei Hteis, s, e precis0o !ara !ara design designar ar a ca!ac ca!acida idade de de evitar evitar docume documento ntoss inHtei inHteis. s. :xistem outras medidas do desem!en8o !ara 0uscas realizadas em 0ases de dados Bver, !or exem!lo, 7o0ertson, 1959C, algumas das 'uais são matematicamente mais exatas, !or=m a revoca10o e a precis0o com!em o 'uadro geral e ainda !arecem ser as medidas ?0vias a serem utilizadas !ara ex!ressar os resultados de 'ual'uer 0usca 'ue sim!lesmente divida uma 0ase de dados em duas !artes Brecu!erados e não recu!eradosC.1 % gura 1 deixa evidente 'ue são muitos os atores 'ue determinam se uma 0usca numa 0ase de dados = ou não 0em sucedi sucedida. da. :ntre :ntre tais tais ator atores es encont encontrara-se se a co0ert co0ertura ura da 0ase 0ase de dados dados,, sua !ol+ti !ol+tica ca de indexação, sua !r"tica de indexação, sua !ol+tica e !r"tica de redação de resumos, a 'ualidade do voca0ul"rio em!regado na indexação, a 'ualidade das estrat=gias de 0usca, e assim !or diante. :ste livro não enceta 'ual'uer esorço no sentido de tratar de todos esses atores Bainda 'ue todos este;am inter-relacionadosC, mas se concentra nas atividades im!ortantes de descri descrição ção do docume documento nto ou, !elo !elo menos, menos, a'uela a'uelass 'ue dizem dizem res!e res!eito ito ao conteH conteHdo do dos documentos. :m !rinc+!io, a 0ase de dados re!resentada na gura 1 !oderia ser a totalidade do conteHdo da 7ede undial BWorld Wide We0C Bdoravante denominada sim!lesmente a 7edeC. 2o entanto, o diagrama não re!resenta a situação da 7ede tão 0em 'uanto re!resenta 0ases de dados, como o cat"logo de uma 0i0lioteca universit"ria ou uma 0ase de dados de registros 0i0liogr"cos de a11igos de !eri?dicos, como a 0ase de dados :LI2: da 2ational Li0rarA o edicine.
1
16
%ap&tulo 3 0 rinc&pios da indexação :m0ora o t+tulo deste livro se rera P RindexaçãoO, seu alcance limita-se, de ato, P indexação de assuntos e redação de resumos. % indexação de assuntos e a redação de resumos são atividades intimamente relacionadas, !ois am0as im!licam a !re!aração de uma re!resent re!resentação ação do conteHdo conteHdo tem"tico tem"tico dos documento documentos. s. M resumido resumidorr redige redige uma descrição descrição narrativa ou s+ntese do documento, e o indexador descreve seu conteHdo ao em!regar um ou v"ri v"rios os term termos os de inde indexa xaçã ção, o, comu comume ment nte e sele seleci cion onad ados os de algu algum m ti!o ti!o de voca voca0u 0ul" l"ri rio o controlado. M !rinci!al o0;etivo do resumo = indicar de 'ue trata o documento ou sintetizar seu conteHdo.
:m certo sentido, essa lista de termos !ode ser vista como uma es!=cie de minirresumo. Serviria a tal !ro!?sito se todos os termos ossem reunidos num +ndice !u0licado, co!iados !ela im!ressora ou mostrados na tela !ara re!resentar um item recu!erado numa 0ase de dados, como resultado de uma 0usca em lin8a. e modo mais evidente, os termos atri0u+dos !elo indexador servem como !ontos de acesso mediante os 'uais um item = localizado e recu!erado, durante uma 0usca !or assunto num +ndice !u0licado ou numa 0ase de dados eletrQnica.1 %ssim, num +ndice im!resso, conv=m 'ue se !ossa encontrar o item 8i!ot=tico mencionado anteriormente so0 'ual'uer um dos seis termos. 2um sistema de recu!eração inormatizado, evidentemente, seria natural encontr"-lo so0 'ual'uer um desses termos ou, de ato, so0 'ual'uer com0inação deles. % dierença entre indexação e redação de resumos est" se tornando cada vez mais diusa. Dor um lado, uma lista de termos de indexação !ode ser co!iada !ela im!ressora ou mostrada na tela de modo a constituir um minirresumo. Dor outro lado, o texto de resumos !ode ser armazenado num sistema inormatizado de modo a !ermitir a realização de 0uscas !or meio da com0inação de !alavras 'ue ocorram nos textos. :sses resumos !odem ser utilizados no lugar de termos de indexação, !ermitindo o acesso aos itens, ou com!lementar os !ontos de acesso !ro!orcionados !elos termos de indexação. :m certa medida isso modica a unção do resumidor, 'ue deve agora !reocu!ar-se não s? em redigir uma descrição clara e de 0oa 'ualidade do conteHdo do documento, mas tam0=m em criar um registro 'ue se;a uma re!resentação re!resentação ecaz !ara ns de recu!eração. recu!eração. Se a inde indexa xaçã ção o e a reda redaçã ção o de resu resumo moss oss ossem em cons consid ider erad adas as como como ativ ativid idad ades es inteiramente com!lementares, a natureza da atividade de indexação soreria algum ti!o de muda mudanç nça. a. Dor exem!l em!lo, o, o inde indexa xado dorr se conc concen entr trar aria ia na atri atri0u 0uiç ição ão de term termos os 'ue 'ue com!lementassem os !ontos de acesso existentes no resumo. /al com!lementaridade, !or=m, deve deve ser inteir inteirame amente nte recon recon8ec 8ecida ida e com!re com!reend endida ida !elo !elo usu"ri usu"rio o da 0ase 0ase de dados dados.. o cont contr" r"ri rio, o, um con; con;un unto to de term termos os de inde indexa xaçã ção o isol isolad ados os dari daria a uma uma imag imagem em 0ast 0astan ante te e'uivocada do conteHdo de um item. 4xtensão do reistro
os termos termos como Rindic Rindicado adore resO sO de conteH conteHdo$ do$ index indexação ação como como [o !roces !rocesso so de indic indicar ar o conteH conteHdo do e caract caracter+ er+sti sticas cas ans ans de um documento^. MOEonnor B1995C !reere o termo Ra!ontamentoO \ pointing] os termos de indexação são a!ontadores$ indexação = a tarea de atri0uir a!ontadores Hteis a ontes de inormação. 1
1
M t+tulo cont=m uma indicação geral so0re a'uilo de 'ue trata o artigo. M resumo 0reve oerece mais detal8es, indicando 'ue o artigo a!resenta resultados da !es'uisa e identicando as !rinci!ais 'uestes analisadas. M resumo am!liado vai mais al=m, identicando todas as 'uestes ocalizadas na !es'uisa e inormando so0re o taman8o da amostra utilizada no estudo. Kuanto mais inormaçes são a!resentadas, mais claramente a re!resentação revela o alcance do artigo, tornando-se mais !rov"vel 'ue ven8a a indicar !ara o leitor se esse artigo satisaz ou não a uma necessidade de inormação. Dor exem!lo, algu=m talvez este;a P !rocura de artigos 'ue mencionem as atitudes norte-americanas em relação a v"rios l+deres "ra0es. M t+tulo não traz indicação alguma de 'ue esse t?!ico es!ec+co se;a analisado, e o resumo 0reve, ao ocalizar outros t?!icos, sugere 'ue talvez isso não aconteça. somente o resumo am!liado 'ue mostra 'ue o artigo inclui inormaçes so0re esse assunto. /am0=m, 'uanto maior a re!resentação, mais !ontos de acesso ela !ro!orciona. Se as !alavras do t+tulo ossem os Hnicos !ontos de acesso, esse item !rovavelmente não seria localizado em muitas 0uscas !ara as 'uais !oderia ser considerado uma res!osta v"lida. h medida 'ue se aumenta a extensão da re!resentação tam0=m se aumenta a recu!era0ilidade do item. !rov"vel 'ue somente com o resumo am!liado osse !oss+vel recu!erar esse item durante uma 0usca de inormaçes so0re as atitudes norte-americanas em ace dos l+deres "ra0es. '&tulo Des'uisa nacional de o!inião !H0lica so0re as atitudes norte-americanas a res!eito do Mriente =dio
Indexação BseletivaC MDI2IM Dj&LIE% D:SK
5esumo B0reveC ncia de !az$ e se um :stado !alestino inde!endente = um !r=-re'uisito !ara a !az.
Indexação BexaustivaC MDI2IM Dj&LIE% D:SK
5esumo Bam!liadoC :m 194 oram eitas entrevistas !or teleone com uma amostra !ro0a0il+stica de 544 norte-americanos. M0tiveram-se res!ostas Ps seguintes 'uestes o esta0elecimento de um :stado !alestino = essencial !ara a !az$ deve ser reduzida a a;uda norte-americana a Israel e ao :gito$ os :<% devem !artici!ar de uma coner>ncia de !az 'ue inclua a MLD$ os :<% não devem avorecer nem Israel nem as naçes "ra0es, mas, sim, manter relaçes amistosas com eles /am0=m se ex!ressaram o!inies so0re os !rinci!ais l+deres do Mriente =dio BYussein, %raat, Deres, u0araX, Fa8d, %ssadC, es!ecialmente seus esorços !ela !az, e se os entrevistados ac8avam 'ue !ossu+am ou não inormaçes sucientes so0re os diversos gru!os nacionais da região. Figura 3 ( :eito da extensão do registro so0re a recu!era0ilidade
% mesma situação a!lica-se P indexação. % indexação seletiva, 'ue inclua a!enas cinco termos, a!resenta uma indicação muito geral da'uilo de 'ue trata o artigo Ba!roximadamente e'uivalente, neste caso, ao t+tuloC e um n+vel de acesso muito limitado. % indexação mais 19
exaustiva !ro!orciona uma indicação muito mel8or do assunto es!ec+co de 'ue trata o artigo, 0em como !ossi0ilita muito mais !ontos de acesso. 4tapas da indexação de assuntos
% indexação de assuntos envolve duas eta!as !rinci!ais 1. %n"lise conceitual, e ). /radução. Intelectualmente são eta!as totalmente distintas, em0ora nem sem!re se;am dierençadas com clareza e !ossam, de ato, ocorrer de modo simultneo. % an"lise conceitual, em !rimeiro lugar, im!lica decidir do 'ue trata um documento - isto =, 'ual o seu assunto. Ms termos 'ue a!arecem na lista P direita, na gura 3, re!resentam a an"lise conceitual de um artigo eita !or este autor a'uilo 'ue, segundo sua o!inião, constitu+a o assunto do artigo. :sta armativa so0re an"lise conceitual est" 0astante sim!licada. % indexação de assuntos = normalmente eita visando a atender Ps necessidades de determinada clientela - os usu"rios de um centro de inormação ou de uma !u0licação es!ec+ca.
a0neA B195aC admitiu isso ao azer uma distinção entre indexação orientada !ara o documento e indexação orientada !ara a consulta. %c8a-se tam0=m im!l+cito no m=todo c8amadoOgedan-enO !ro!osto !or Eoo!er BI96C. 1
)
Figura ( :xem!lo de um documento indexado segundo dierentes !ontos de vista
Y;orland B)1C concorda 'ue a indexação deve ser moldada !ara se a;ustar Ps necessidades de determinada clientela
:ste as!ecto oi tam0=m examinado !or &ates B199C \...] o desao !ara o indexador = tentar anteci!ar 'uais os termos 'ue as !essoas 'ue !ossuem lacunas de inormação de v"rios ti!os !rocurariam nos casos em 'ue o registro de 'ue dis!em, de ato, ca a meio camin8o de satisazer a necessidade de inormação do usu"rio. Kuando se !ensa em tal desao, = !oss+vel !erce0er 'ue se trata de algo muito !eculiar. Kuais os ti!os de necessidades de inormação 'ue as !essoas teriam e as levariam a 'uerer inormaçes 'ue o registro, de ato, cont=m B!. 116C.
ai B)1C, 'ue se vale da semi?tica na an"lise do !rocesso de indexação tem"tica, az uma descrição lHcida das diculdades 'ue caracterizam o esorço de recon8ecer !or 'ue determinado documento viria a ter interesse !ara uturos usu"rios Seria 'uase im!oss+vel, naturalmente, !ara 'ual'uer !essoa ou, neste caso, 'ual'uer indexador, !recisar todas as id=ias e signicados 'ue estivessem associados a 'ual'uer documento, !osto 'ue sem!re 8aver" id=ias e signicados !otenciais 'ue dierentes !essoas em dierentes momentos e lugares !oderão desco0rir nesse documento. %l=m do 'ue, seria 'uase im!oss+vel !rever com exatidão 'uais das inHmeras id=ias e signicados 'ue estivessem associados ao documento seriam es!ecicamente jteis !ara os usu"rios ou dariam ao documento alguma utilidade duradoura. da m"xima im!ortncia recon8ecer e aceitar essa indenição undamental. M indexador deve com!reender, desde o in+cio, 'ue ;amais desco0rir" todas as id=ias e signicados 'ue estariam associados ao documento e 'ue, !ortanto, não = !oss+vel descrever todas essas id=ias e signicados B!. 55C.
LaAne B))C, reerindo-se es!ecicamente P indexação de imagens no cam!o da alie, tam0=m admite a necessidade de indexação dierente, com terminologia dierente, !ara !H0licos dierentes M segundo as!ecto da escol8a do voca0ul"rio !ara imagens art+sticas est" em 'ue uma imagem !ode interessar a v"rias disci!linas com dierentes voca0ul"rios. Dor exem!lo, M nascimento de :saH e Tac? teria interesse !ara 8istoriadores da medicina 'ue dese;assem usar o voca0ul"rio m=dico, ao inv=s de um voca0ul"rio mais comum, na 0usca de imagens. :videntemente, não = !r"tico em!regar todos os voca0ul"rios !oss+veis 'uando da criação de acessos tem"ticos !ara imagens art+sticas. as, se se sou0er ou 8ouver a intenção de 'ue determinado acervo de imagens art+sticas ser" usado !or determinada disci!lina, talvez val8a a !ena !onderar 'uanto ao uso de um voca0ul"rio es!ecializado al=m do voca0ul"rio geral. Dor exem!lo, uma imagem de tuli!as seria indexada como Rtuli!asO ou mesmo RNoresO !ara usu"rios comuns, e os nomes cient+cos das es!=cies, como /uli!a turXestanica, seriam em!regados como termos de indexação, caso 8ouvesse 0otnicos entre os usu"rios !retendidos B!. 14C.
)1
Dara certos ti!os de materiais, a indexação orientada !ara o usu"rio !ode at= ser mais im!ortante do 'ue o = no caso de artigos de !eri?dicos, livros ou relat?rios t=cnicos. Dor exem!lo, certos autores, como S8atord B195C e :nser B1994C, salientam 'ue dierentes gru!os de usu"rios !odem ver os acervos de imagens de modo 0astante dierente. M 'ue levou &roVn et al. B1995C a sugerirem a necessidade de um tratamento Rdemocr"ticoO da indexação, em 'ue os usu"rios acrescentariam aos registros termos de sua !r?!ria escol8a, 'uando isso osse necess"rio e a!ro!riado. YidderleAe 7apertA B1996C a!resentam um m=todo de tratamento democr"tico da indexação. ncia, onde !artici!am de 0uscas nos registros 'ue criaram. Dode-se avançar ainda mais com o !rinc+!io da indexação orientada !ara o usu"rio ao sustentar 'ue, em relação a determinado acervo de documentos e determinado gru!o de usu"rios, 'ual'uer con;unto ideal de termos de indexação ser" ideal somente em determinado ponto no tempo. Dassados alguns anos, o mesmo gru!o de usu"rios !oder" !recisar de acesso ao mesmo acervo Bou outro 0astante semel8anteC a !artir de !ers!ectivas dierentes. ncias. 2aturalmente, o custo da reindexação e reorganização em geral torna essa !ro!osta economicamente !ouco atraente. Wein0erg B199)C salientou a im!erman>ncia do acesso tem"tico e o ato de ser RrelativoO. 2o entanto, ela 0aseia essa armação no ato de 'ue os voca0ul"rios B!or exem!lo, ca0eçal8os de assuntos, classicaçesC mudam e não no ato de 'ue as necessidades e interesses dos usu"rios mudam. ai B)C tam0=m adverte 'ue a indexação orientada !ara o usu"rio somente !ode estar voltada !ara determinado con;unto de usu"rios em determinado !onto no tem!o Se se ocalizar exclusivamente o as!ecto da re!resentação, ignorando os usu"rios uturos, corre-se o risco de re!resentar os documentos de uma orma 'ue não ter" 'ual'uer serventia !ara os usu"rios. muita atenção aos usu"rios !oder" o!tar !or re!resentar assuntos de documentos 'ue não ten8am interesse !ara eles, ou usar um voca0ul"rio dierente do voca0ul"rio deles, ou re!resentar o assunto em n+vel 'ue se;a muito gen=rico ou muito es!ec+co !ara eles. 2o entanto, se o indexador der excessiva atenção aos usu"rios do sistema, !oder" re!resentar os documentos numa orma tal 'ue a re!resentação tem"tica dos documentos somente atenda aos usu"rios atuais e Ps necessidades de inormação atuais B!. )9C.
))
+tinncia
2as consideraçes anteriores não se ez 'ual'uer tentativa !ara denir a ex!ressão Rde 'ue trata um documentoO a ex!ressão Rde 'ue trataO era sim!lesmente um sinQnimo !ara Rtem !or assuntoO. Mu se;a, usou-se Rde 'ue trata um documentoO !ara designar o mesmo 'ue Ros assuntos de um documentoO. :stas ex!resses talvez não se;am muito !recisas e não = "cil denir Rtrata deO e Rtem !or assuntoO. %!esar disso, são ex!resses 'ue soam aceit"veis !ara a maioria das !essoas, sendo !or elas com!reendidas. 2ão !retendo !artir !ara uma discussão los?ca so0re o signicado de Rtrata deO ou Ratin>nciaO. 1 *"rios autores ;" o zeram. : nem assim conseguiram esclarecer a situação, !elo menos no 'ue tange P atividade da indexação de assuntos. &eg8tol B195C e Yutc8ins B196C recorrem am0os P ling+stica do texto ao examinar esta 'uestão$ aron B1966C adota um eno'ue !ro0a0il+stico, e SVit et al. B196C são cautelosos ao salientar 'ue a atin>ncia na indexação talvez não coincida com a atin>ncia 'ue as !essoas 'ue estão em 0usca de inormaçes t>m em mente. Wilson B195C c8ega ao !onto de sugerir 'ue a indexação de assuntos se deronta com !ro0lemas Rintrat"veisO, visto ser tão di+cil decidir do 'ue trata um documento. oens et al. B1999C armam 'ue um texto não !ossui uma Ratin>nciaO intr+nseca, mas 'ue tam0=m !ossui dierentes RsignicadosO de acordo com [o uso !articular 'ue uma !essoa !ode azer da atin>ncia em dado momento^. LaAne B))C az distinção entre Rde->nciaO \R o2nessO] e atin>ncia \R a%outness O] no caso de imagens art+sticas enos ?0vio do 'ue a de23ncia \o2ness] de uma o0ra de arte, mas muitas vezes mais instigante, = a'uilo de 4ue trata a o0ra de arte o \...] hs vezes, a atin>ncia \ a%out2ness] de uma o0ra de arte = relativamente ?0via, como na Alegoria da &usti1a, de @eorg Denczo \...] :ssa = a imagem de \ o ] uma mul8er des!ida 'ue segura uma es!ada e uma 0alança, mas o t+tulo nos diz 'ue a imagem = uma gura aleg?rica 'ue re!resenta a ;ustiça ou, em outras !alavras, 'ue a imagem trata do \is a%out ] conceito a0strato de R;ustiçaO. 2o desen8o de @oAa 5espreciar los insultos \...] a atin3ncia = um !ouco menos ?0via, mas = claro 'ue essa o0ra !ossui algum signicado al=m sim!lesmente do 'ue mostra de. e ato, uma descrição do 'ue cont=m - um 8omem, talvez o !r?!rio @oAa, gesticulando !ara dois anes uniormizados - não 0asta realmente !ara dar sentido P imagem$ ela sim0oliza algo mais, trata de algo mais a relação entre :s!an8a e França no in+cio do s=culo I ou, mais es!ecicamente, a atitude !essoal de @oAa em relação P ocu!ação da :s!an8a !ela França B!. C.
:la acredita 'ue essa distinção = v"lida e 'ue, na recu!eração, deveria ser !oss+vel se!arar uma da outra \...] !ossi0ilita recu!erar, !or exem!lo, exatamente a'uelas imagens 'ue se;am da RmorteO e excluir as 'ue tratam da RmorteO. /am0=m !ermite a su0divisão de grandes con;untos de imagens recu!eradas com 0ase nessas distinçes. Dor exem!lo, uma !es'uisa so0re RmorteO como assunto recu!eraria imagens su0divididas em gru!os 0aseados em se a imagem re!resenta ex!licitamente a RmorteO ou se trata do tema da RmorteO B!. 13C.
&ruza et al. B)C ocalizam a atin>ncia de uma !ers!ectiva l?gica. /entam [ormalizar a relevncia l?gica mediante a ormalização de !ro!riedades do senso comum 'ue descrevem a relação de atin>ncia^ o /am0=m tra0al8am com a Rnão-atin>nciaO e a interação entre atin>ncia e não-atin>ncia. 2o contexto da recu!eração da inormação, a não-atin>ncia constitui realmente uma situação mais sim!les !or'ue a grande maioria dos itens em 'ual'uer 0ase de dados evidentemente não guarda 'ual'uer relação !oss+vel com 'ual'uer consulta ou necessidade de inormação Bisto =, são naturalmente itens Rnão-atinentesOC. M tema da atin>ncia est" relacionado muito de !erto com o da relevncia isto =, a relação entre um documento e uma necessidade de inormação ou entre um documento e um enunciado de necessidade de inormação Buma consultaC. M tema da relevncia#!ertin>ncia !roduziu um grande volume de de0ates e !u0licaçes. :ncontra-se em izzaro B199C um a!an8ado muito com!leto. Y;1^land B)C salienta 'ue a relevncia = de!endente dos !ressu!ostos te?ricos 'ue orientam o com!ortamento da !essoa 'ue 0usca inormação. Eonorme Yarter B199)C ressaltou, no entanto, um documento !ode ser relevante !ara uma necessidade de inormação sem RtratarO dessa necessidade de inormação. Dor exem!lo, se escrevo so0re o tema das 0arreiras P comunicação, uma 8ist?ria do latim talvez ten8a alguma relevncia, !rinci!almente se lidar com a utilização atual do latim !ela Igre;a Eat?lica e 1
M autor em!rega os termos ingleses a%out e a%outness o !rimeiro traduzimos !or Rtrata deO e o segundo !or Ratin>nciaO o Mutros traduzem a%outness !or RtematicidadeO, Rtem"ticaO, Racerca-deO, Rser acerca-deO, Rser so0re algoO, etc. B2./.C
)3
comas instituiçes 'ue 8o;e em dia se esorçam !ara !romover seu uso mais am!lo. 2ão o0stante, ainda 'ue !ossa ins!irar-me nessa onte ao escrever meu artigo, !oucas !essoas alegariam 'ue ele RtrataO da comunicação internacional, sendo im!rov"vel 'ue ven8a a ser indexado desta orma, a menos 'ue o autor aça menção ex!licitamente ao as!ecto da comunicação internacional. Wong et al. B)1C tratam Ratin>nciaO como sendo mais ou menos sinQnimo de RrelevnciaO \...] se um dado documento. M trata do !edido K, então existe uma alta !ro0a0ilidade de 'ue ser" relevante em relação P necessidade de inormação associada. %ssim, o !ro0lema da recu!eração da inormação se reduz P decisão acerca da relação de atin>ncia entre documentos e !edidos B!. 33C.
:les relacionam a atin>ncia diretamente Ps medidas de revocação e !recisão. Eontinuam a a!arecer na literatura artigos so0re atin>ncia. Y;rland B)1C e &ruza et al. B)C são exem!los. :m0ora !ossam a!resentar algum interesse acad>mico BY;rland d"-se ao tra0al8o de tentar dierençar termos como RassuntoO, Rt?!icoO, RtemaO, Rdom+nioO, Rcam!oO e RconteHdoOC, não t>m 'ual'uer im!ortncia !r"tica !ara o indexador, 'ue ar" 0em se ignorar essas dierenças semnticas e sim!lesmente atri0uir ao item os r?tulos 'ue o tornarão utilmente recu!er"vel !elos mem0ros de uma comunidade-alvo. :m outras !alavras, ser" 'ue !recisamos realmente com!reender o 'ue = Ratin>nciaO a m de indexar de maneira eciente 2ão 0astar" 'ue se;amos ca!azes de recon8ecer 'ue um documento tem interesse !ara determinada comunidade !elo ato de contri0uir !ara nossa com!reensão dos t?!icos x, qe z M recon8ecimento de 'ue realmente contri0ui !ara isso exem!lica o !rocesso 'ue c8amamos Ran"lise conceitualO, en'uanto o !rocesso de RtraduçãoO envolve uma decisão so0re 'uais dos r?tulos dis!on+veis mel8or re!resentam x, qe _. REonceitoO = outra !alavra so0re a 'ual alguns autores gostam de losoar Bver, !or exem!lo, a8l0erg \1969]C. 2este livro em!rego-a !ara reerir-me a um assunto estudado !or um autor ou re!resentado de alguma outra orma B!or exem!lo, numa otograa ou outra imagemC. R%n"lise conceitualO, !ortanto, signica nada mais do 'ue a identicação dos assuntos estudados ou re!resentados num documento. Dresc8el B196)C adota uma a0ordagem muito !r"tica. Dara ela, RconceitoO signica Rmat=ria index"velO, e Ran"lise conceitualO = a R!erce!ção !elo indexador de mat=ria index"velO. /inXer tam0=m adota uma !osição !r"tica B1955C %o atri0uir um descritor \isto =, um termo de indexação] a um documento, o indexador declara 'ue tal descritor !ossui alto grau de relevncia !ara o conteHdo do documento$ 'uer dizer, ele declara 'ue o signicado do descritor est" ortemente associado a um conceito incor!orado ao documento, e 'ue = ade'uado P "rea tem"tica do documento B!. 96C.
Wooster B195C = ainda mais !ragm"tico, ao se reerir P indexação como a atri0uição de termos [!rovavelmente relacionados de alguma orma com o conteHdo intelectual do documento original, !ara a;udar voc> a encontr"-lo 'uando !recisar^. 2ão ve;o nada de errado nessas deniçes ou descriçes !ragm"ticas da indexação tem"tica. Ms !uristas sem dHvida tergiversarão so0re elas argumentando 'ue ex!resses como Rmat=ria index"velO, RrelevnciaO, RsignicadoO, Rassociado aO, RconceitoO, Rade'uado aO, Rrelacionado comO e RconteHdo intelectualO não se ac8am denidas !recisamente de modo a satisazer a todos. 2o entanto, se tivermos de c8egar a um acordo 'uanto P denição exata dos termos antes de encetar 'ual'uer tarea, = im!rov"vel 'ue c8eguemos muito longe, se;a na indexação se;a em 'ual'uer outra atividade. Wein0erg B19C levanta a 8i!?tese de 'ue a indexação rustra o !es'uisador !or'ue ela lida a!enas de orma gen=rica com a'uilo de 'ue RtrataO um documento e não ocaliza a'uilo 'ue ele !ro!orciona de RnovidadeO a res!eito do t?!ico. :la arma 'ue esta distinção se reNete na dierença entre Ratin>nciaO e Ras!ectoO, entre Rt?!icoO e Rcoment"rioO ou entre RtemaO e RremaO. :la não consegue convencer 'ue essas distinçes se;am realmente Hteis no contexto da indexação ou 'ue se;a !oss+vel !ara os indexadores sustentar essas distinçes. SVit et al. B196C examinam as limitaçes de um eno'ue 0aseado na atin>ncia na indexação em ci>ncias sociais, e recomendam 'ue os documentos se;am indexados de acordo com os R!ro0lemasO com os 'uais !areçam estar relacionados. di+cil !erce0er como a distinção 'ue azem diere da distinção, eita anteriormente neste ca!+tulo, entre do 'ue trata um documento e !or 'ue um determinado usu"rio ou gru!o de usu"rios teria interesse nele. EroVe B195C arma 'ue o indexador deve remeter ao R!onto de vista su0;etivoO do autor.
8a0itual da indexação, como, !or exem!lo, o em!rego de su0ca0eçal8os !ela 2ational Li0rarA o edicine. &reton B191C alega 'ue os engen8eiros R!ouco recorrem Ps 0ases de dados !or'ue os indexadores rotulam os documentos com os nomes de materiais ou dis!ositivos, en'uanto = mais !rov"vel 'ue os engen8eiros !recisem azer as 0uscas a !artir dos atri%utos ou das un16es desem!en8adas !or esses materiais ou dis!ositivos. :m outras !alavras, eles gostariam de localizar um material ou dis!ositivo 'ue satiszesse a algum re'uisito atual B'uanto P resist>ncia, condutividade, resist>ncia P corrosão, ou coisa 'ue o val8aC sem terem de nome"-lo. Isso não constitui uma condenação da indexação de assuntos de !er si, mas das !ol+ticas de indexação adotadas !ela maioria dos !rodutores de 0ases de dados. Se se diz 'ue um novo material ou uma liga descrita num relat?rio !ossui certa resist>ncia P tração, esta !ro!riedade !ode ser indexada B!or exem!lo, atri0uindo o termo 7:SIS/2EI% h /7%kMC, !or=m o valor es!ec+co dessa !ro!riedade Bisto =, a resist>ncia alcanç"velC não seria indexado !ela maioria dos !rodutores de 0ases de dados, em0ora se !ossa mencion"-lo no resumo. 2aturalmente, não 8" razão !ara 'ue os valores não se;am indexados B!or exem!lo, o termo 7:SIS/2EI% h /7%kM !oderia ser su0dividido em vinte termos mais es!ec+cos, cada um re!resentando uma ordem de valores de resist>ncia P traçãoC e eles estariam em algumas 0ases de dados, assim como os +ndices de uma em!resa !ara seus !r?!rios ar'uivos de contratos, +ndices de com!ilaçes de dados, ou certas 0ases de dados de !atentes. %lgumas das o0;eçes de &reton, então, seriam contestadas mediante a indexação em n+vel muito mais alto de es!ecicidade. /am0=m = !oss+vel indexar as unçes, desde 'ue as 'ue !ossivelmente se a!li'uem a um dis!ositivo se;am identicadas !elo autor e 8a;a termos a!ro!riados no voca0ul"rio da 0ase de dados. Dor=m, = totalmente irracional alimentar a ex!ectativa de 'ue o indexador se;a ca!az de recon8ecer a!licaçes 'ue não oram es!ecicamente armadas !elo autor. Dosteriormente, &reton B1991C relatou !es'uisas so0re um sistema de indexação 'ue concretizava suas id=ias e !retendia a;udar no !rocesso de RinvençãoO. M sistema ex!erimental resultou da indexação de mil8ares de !rodutos industriais segundo as unçes 'ue desem!en8am e seus Ratri0utos distintivosO. Ms atri0utos inclu+am coisas como Rmais leveO, Rmais 0aratoO, Rmais seguroO e Rmais orteO. %lguns autores sugerem 'ue = !oss+vel mel8orar a recu!eração em certos contextos !or meio da indexação somente de determinadas caracter+sticas de um texto. Dor exem!lo, M8 B199C sugere 'ue, em !sicologia, a indexação a!enas de Ratos em!+ricosO Bnomes de vari"veis, valores de correlação e inormação so0re o n+vel de signicnciaC mel8oraria as condiçes de recu!eração. :m0ora uma indexação altamente es!ecializada como essa se;a ;ustic"vel em raras situaçes, = im!rov"vel 'ue se;a uma exig>ncia da maioria e !rovavelmente ser" muito mais dis!endiosa do 'ue uma a0ordagem mais convencional. *irou moda nos Hltimos anos considerar o !ro0lema da recu!eração da inormação como sendo undamentalmente uma 'uestão de com!arar o Restado anQmalo de con8ecimentoO de um consulente com o estado de con8ecimento mais RcoerenteO dos autores Bver, !or exem!lo, &elXin et al., 19)C, im!licando isso 'ue os !ro0lemas residem mais na sa+da do sistema B0uscaC do 'ue na entrada. Y" um certo e'u+voco nisso. Se aceitamos 'ue a indexação = mais eciente 'uando se orienta !ara as necessidades de determinado gru!o de usu"rios, a unção do indexador ser" !rever os ti!os de !edidos !ara os 'uais determinado documento ser" !rovavelmente uma res!osta Htil. /alvez isso ainda se;a mais di+cil do 'ue !rever 'uais os ti!os de documentos 'ue t>m !ro0a0ilidade de corres!onder de modo Htil a determinado !edido, o 'ue constitui, em certo sentido, a unção de 'uem az a 0usca. Doder-se-ia argir, então, 'ue o estado RanQmaloO de con8ecimento a!lica-se mais ao lado de entrada do sistema de recu!eração do 'ue P sua sa+da. Mlasen e *oXac B193C v>em essa !articularidade com clareza M indexador tem de azer con;eturas so0re 'uais consultas serão ormuladas !elo uturo usu"rio do sistema. Inde!endentemente do grau de 8a0ilidade a!licada a esse exerc+cio de adivin8ação, ainda assim serão con;eturas, e o usu"rio recorre ao sistema levando sua !r?!ria 'uestão concreta, e as associaçes 'ue az !odem ser dierentes das do indexador B!. )9C.
:stes autores tam0=m cometem um exagero de sim!licação ao se reerirem Ps 'uestes trazidas !elo usu"rio como RconcretasO, 'uando, de ato, muitas delas estarão longe disso. %!esar de tudo, talvez este;am certos ao sugerirem 'ue os !ro0lemas de uma eciente entrada de dados num sistema de recu!eração su!eram os !ro0lemas concernentes P sa+da. Eonorme Fairt8orne B194C salientou, 8" muitos anos [% indexação = o !ro0lema undamental 0em como o o0st"culo mais dis!endioso da recu!eração da inormação^. )4
:m algumas a!licaçes da indexação talvez se;a !oss+vel ser 0astante mais !reciso no 'ue se reere ao 'ue deva ser consideradoOindex"velO. %o tratar da indexação de uma enciclo!=dia$ Dresc8el B191C oerece as seguintes diretrizes /oda inormação textual de natureza su0stantiva deve ser indexada. ene-se como Rsu0stantivaO a inormação 'ue a0ran;a de a 1 lin8as de texto ou 'ue se;a singular ou notável e 'ue 'uase com certeza não ocorra em outro lugar da enciclo!=dia B!. )C. 1
:m outras situaçes nem sem!re = !oss+vel tanta !recisão. Eom eeito, a 'uestão so0re de 'ue. trata um item torna-se muito mais di+cil 'uando se examina a indexação de o0ras de criação, como textos de cção ou lmes de longa-metragem, ou imagens em geral. 2esses contextos, a atin>ncia ser" vista em !r?ximos ca!+tulos. 2aturalmente, toda a 'uestão da Ratin>nciaO tornou-se muito mais com!lexa no atual am0iente de 8i!ertexto#8i!erm+dia. Kuando um item !ode ser vinculado \linXed] a muitos outros, ;" não existe mais clareza so0re onde um começa e o outro aca0a.
/radução, a segunda eta!a da indexação de assuntos, envolve a conversão da an"lise conceitual de um documento num determinado con;unto de termos de indexação. % esse res!eito, az-se uma distinção entre indexação !or extração Bindexação derivadaC e indexação !or atri0uição. 2a indexação !or extração, !alavras ou ex!resses 'ue realmente ocorrem no documento são selecionadas !ara re!resentar seu conteHdo tem"tico. Dor exem!lo, o item da gura 3 !oderia ser indexado com os seguintes termos MDI2IM Dj&LIE% D:SK
IS7%:L :@I/M %T<% D%_
/odos os 'uais a!arecem no t+tulo ou no resumo.
:sta citação de um texto in=dito = re!roduzida com autorização de FunX Wagnalls.
)5
3. 7eunir ou ligar termos cu;os signicados a!resentem uma relação mais estreita entre si. ois ti!os de relaçes são identicados ex!licitamente as 8ier"r'uicas e as não-8ier"r'uicas Bou associativasC. Dor exem!lo, o termo s os ti!os !rinci!ais de voca0ul"rios controlados es'uemas de classicação 0i0liogr"ca Bcomo a "lassifca10o 5ecimal de 5e8ey C, listas de ca0eçal8os de assuntos e tesauros. /odos !rocuram a!resentar os termos tanto ala0=tica 'uanto RsistematicamenteO. 2as classicaçes, o arran;o ala0=tico = secund"rio, na orma de um +ndice 'ue remete !ara o arran;o !rinci!al, 'ue = 8ier"r'uico. 2o tesauro, o arran;o ex!l+cito dos termos = ala0=tico, mas existe uma estrutura 8ier"r'uica im!l+cita, incor!orada P lista ala0=tica !or meio de remissivas. % tradicional lista de ca0eçal8os de assuntos = similar ao tesauro !or ser de 0ase ala0=tica, mas diere dele !or'ue incor!ora uma estrutura 8ier"r'uica im!ereita e !or não distinguir claramente as relaçes 8ier"r'uicas das associativas. Ms tr>s ti!os de voca0ul"rio controlam sinQnimos, distinguem 8om?graos e agru!am termos ans, mas em!regam m=todos um tanto dierentes !ara alcançar estes o0;etivos.
2a 0i0liograa de 0i0lioteconomia e ci>ncia da inormação, az-se, Ps vezes, uma distinção entre as tr>s ex!resses indexa10o de assuntos/ cataloga10o de assuntos e classifca10o. "ataloga10o de assuntos reere-se comumente P atri0uição de ca0eçal8os de assuntos !ara re!resentar o conteHdo total de itens 0i0liogr"cos inteiros Blivros, relat?rios, !eri?dicos, etc.C no cat"logo das 0i0liotecas. Indexa10o de assuntos = ex!ressão usada de modo mais im!reciso$ reere-se P re!resentação do conteHdo tem"tico de partes de itens 0i0liogr"cos inteiros, como = o caso do +ndice de nal de livro. %ssim, uma 0i0lioteca !ode RcatalogarO um livro so0 o ca0eçal8o de assunto E:S, !ara indicar seu conteHdo tem"tico glo0al$ o conteHdo !ormenorizado somente = revelado !elo índice de assuntos no nal do livro. % distinção entre as ex!resses cataloga10o de assuntos e indexa10o de assuntos , uma delas reerindo-se a itens 0i0liogr"cos inteiros e a outra a !artes de itens, = articial, enganosa e incongruente. M !rocesso !elo 'ual o conteHdo tem"tico de itens 0i0liogr"cos = re!resentado em 0ases de dados !u0licadas - em ormato im!resso ou eletrQnico - = 'uase invariavelmente c8amado de indexação de assuntos, 'uer se este;am examinando itens total ou !arcialmente. %ssim, o índice de assuntos , !or exem!lo, do "hemical A%stracts remete a livros ou relat?rios t=cnicos inteiros, 0em como a !artes de itens 0i0liogr"cos Bca!+tulos de livros, tra0al8os !u0licados em anais de eventos, artigos de !eri?dicosC. Dor outro lado, as 0i0liotecas !odem o!tar !or re!resentar em seus cat"logos !artes de livros B!or exem!lo, ca!+tulos ou artigosC$ a isto se denomina comumente cataloga10o analítica. Kuando a!licada ao conteHdo tem"tico, esta atividade seria a catalogação anal+tica de assuntos. % situação ca ainda mais conusa ao se examinar o termo classifca10o. Ms 0i0liotec"rios costumam em!regar esta !alavra !ara designar a atri0uição de nHmeros de classicação Bextra+dos de um es'uema de classicação - !or exem!lo, o ecimal de eVeA BEC, o ecimal ncia de um es'uema de classicação B catálogo sistemáticoC. Su!on8amos 'ue o 0i0liotec"rio tome um livro e decida 'ue trata de RavesO. :le l8e atri0ui o ca0eçal8o de assunto %*:S. %lternativamente, !ode atri0uir o nHmero de classicação 49. uitos se reeririam P !rimeira o!eração como catalogação de assuntos e P segunda como classifca10o, uma distinção totalmente a0surda. % conusão = ainda maior 'uando se !erce0e 'ue indexa10o de assuntos !ode envolver o em!rego de um es'uema de classicação ou 'ue um +ndice im!resso de assuntos !ode a.dotar a se'>ncia de um es'uema de classicação. :stas dierenças termino l?gicas são muito inex!ressivas e s? servem !ara conundir Bver %cton, 195, !ara um exem!lo t+!icoC. M ato = 'ue a classifca10o, em sentido mais am!lo, !ermeia todas as atividades !ertinentes ao armazenamento e recu!eração da inormação. Darte dessa conusão terminol?gica se deve P inca!acidade de distinguir entre as eta!as de análise conceitual e de tradu10o na indexação. )6
Su!on8amos 'ue um es!ecialista em inormação ten8a em mão um item 0i0liogr"co e decida 'ue ele trata do assunto Rro0QsO. % atividade intelectual 'ue tal decisão im!lica = a mesma, 'ual'uer 'ue se;a o ti!o de documento 'ue ten8a em mão - livro, !arte de livro, !eri?dico, artigo de !eri?dico, anais de evento, tra0al8o a!resentado em evento, se;a o 'ue or. M es!ecialista classicou o item, isto =, colocou-o na classe conceitual de Rdocumentos 'ue tratam de ro0QsO. Eomo vimos antes, o !rocesso de tradução envolve a re!resentação da an"lise conceitual mediante um termo ou termos extra+dos de um voca0ul"rio. ncia Bou, com eeito, não ar'uivado de modo algumC, 'uer o o0;eto do exerc+cio se;a organizar documentos em estantes ou registros em cat"logos, +ndices im!ressos ou 0ases de dados eletrQnicas. 2o cam!o do armazenamento e recu!eração da inormação, a classicação de documentos reere-se P ormação de classes de itens com 0ase no conteHdo tem"tico. /esauros, ca0eçal8os de assuntos e es'uemas de classicação 0i0liogr"ca são essencialmente listas dos r?tulos com os 'uais se identicam e, !orventura, se organizam essas classes. M !rocesso da 0usca.de inormação im!lica decidir 'uais classes consultar num +ndice im!resso, cat"logo em c8as ou 0ase de dados eletrQnica. % 0usca !ode com!reender o exame de uma Hnica classe B!or exem!lo, tudo 'ue a!areça so0 o ca0eçal8o 7M&SC ou a0ranger com0inaçes de v"rias classes B!or exem!lo, itens 'ue a!areçam so0 7M&S e tam0=m so0 I2/:LI@2EI% %7/IFIEI%LC. Kuantas com0inaçes são !oss+veis ou com 'ual acilidade v"rias classes !odem ser com0inadas = algo 'ue de!ende muito do ormato da erramenta 'ue estiver sendo utilizada na 0usca, !rinci!almente se or im!ressa ou em ormato eletrQnico. :m suma, a indexação de assuntos = conceitualmente id>ntica P catalogação de assuntos. % atividade 'ue isso com!reende = a classicação de assuntos, ou se;a, ormar classes de o0;etos com 0ase em seu conteHdo tem"tico. 2este texto, em!rega-se indexação de assuntos ou mesmo indexação, !or razes de comodidade, !ara designar todas as atividades de classicação de assuntos. 4specicidade do #ocabulário
% gura 4 mostra uma an"lise conceitual eita !ara um artigo de !eri?dico, 0em como a tradução desta an"lise conceitual em tr>s ti!os dierentes de voca0ul"rio. M artigo trata da utilização de ro0Qs na indHstria, es!ecicamente, suas a!licaçes na a0ricação e manuseio de materiais. /am0=m examina o em!rego de t=cnicas de intelig>ncia articial no !ro;eto e o!eração de ro0Qs, 0em como os !ro0lemas es!ec+cos inerentes a azer com 'ue os ro0Qs se movimentem ade'uadamente Bisto =, !ro0lemas de locomoçãoC. Eom relação a todos esses as!ectos, a an"lise conceitual !ode ser traduzida eetivamente !ara 'ual'uer um dos voca0ul"rios. M0serve-se 'ue as id=ias transmitidas !ela an"lise conceitual da gura 4 são a0rangi das coletivamente !elos gru!os de termos listados nos tr>s voca0ul"rios. Dor exem!lo, os tr>s nHmeros de classicação da E, tomados em con;unto, a0rangem o conteHdo tem"tico desse artigo, de modo claro e com!leto, em0ora não 8a;a uma relação un+voca entre os elementos individuais da an"lise conceitual e os termos da E. :m0ora ediçes anteriores da E não !ermitissem muita s+ntese das notaçes Bisto =, a construção de nHmerosC, ediçes !osteriores !ermitem isso cada vez mais. %ssim, 56.)6) Bro0Qs em o!eraçes de a0ricaçãoC !ode ser su0dividido !or -5. ncia articial, os nHmeros !odem ser com0inados !ara ormar o nHmero altamente es!ec+co 56.)6)53. % an"lise conceitual da gura 4 = a0rangida de modo igual, com!leta e es!ecicamente, em cada voca0ul"rio, 'uando se consideram gru!os inteiros de termos. 2o n+vel de um Hnico termo, = claro, existem de ato dierenças. Se a!enas um termo !udesse ser atri0u+do a esse artigo, a E seria mel8or do 'ue os outros voca0ul"rios, !ois = !oss+vel construir um Hnico nHmero de classicação 'ue ex!resse o t?!ico !rinci!al desse artigo. )
:ste exem!lo ilustra dois as!ectos im!ortantes. Drimeiro, o ti!o de voca0ul"rio controlado Bes'uema de classicação, ca0eçal8os de assuntos, tesauroC não = o ator mais im!ortante a inNuir na eta!a de tradução da indexação. uito mais im!ortantes são o alcance Ba0rang>nciaC e a es!ecicidade do voca0ul"rio. 2este exerc+cio de indexação, os tr>s voca0ul"rios !odem a0ranger o assunto muito 0em, em0ora de modo um tanto dierente. M segundo as!ecto 'ue o exem!lo ilustra = 'ue, em0ora a es!ecicidade se;a uma !ro!riedade muito im!ortante de um voca0ul"rio controlado, !ode ser o0tida de dierentes ormas em dierentes voca0ul"rios. im!ortante considerar, em es!ecial, as !ro!riedades de com0inaçes de termos de indexação mais do 'ue as !ro!riedades de termos isolados. %n"lise conceitual
Elassicação ecimal de eVeA
7o0Qs industriais Intelig>ncia articial
56.)6)53 Intelig>ncia articial a!licada a ro0Qs em o!eraçes de a0ricação
M!eraçes de a0ricação
Li0rarA o Eongress Su0;ect Yeadings
I2SD:E /8esaurus
7M&M/S, I2
I2
%7/IFIEI%L I2/:LLI@:2E:
%7/IFIEI%L I2/:LLI@:2E:
%2
%2
anuseio de materiais
5)1.5 :'ui!amento de manuseio de materiais
%/:7I%LS Y%2LI2@
%/:7I%LS Y%2LI2@
Locomoção
431.11) Einem"tica
7M&M/S - M/IM2
ZI2:%/IES
Figura 4 ( %n"lise conceitual traduzida em tr>s voca0ul"rios controlados
*e;amos, !or exem!lo, um artigo so0re os serviços de saHde mental. M *oca0ul"rio % cont=m o descritor es!ec+co S:7*IkMS : S%j: :2/%L, en'uanto o *oca0ul"rio & !ossui o termo S:7*IkMS : S%j:, mas não o termo mais es!ec+co. Dor=m, & tam0=m inclui o termo S%j: :2/%L, de modo 'ue a id=ia de Rserviços de saHde mentalO = a0rangida es!ecicamente !ela indexação so0 S:7*IkMS : S%j: e S%j: :2/%L. So0re este t?!ico, !ortanto, o *oca0ul"rio & = tão es!ec+co 'uanto %. MS voca0ul"rios E e são menos es!ec+cos E cont=m o termo S%j: :2/%L, mas não !ossui termo algum !ara serviços de saHde, en'uanto traz S:7*IkMS : S%j:, mas carece de um termo !ara saHde mental, de modo 'ue nen8um dos dois a!resenta a !ossi0ilidade de ex!ressar es!ecicamente a id=ia de Rserviços de saHde mentalO. 2o momento de realizar uma 0usca nos sistemas re!resentados !elos dierentes voca0ul"rios, seria !oss+vel o0ter resultados eetivos em % e &, mas seria im!oss+vel limitar a 0usca em E e - ou seria recu!erado tudo so0re saHde mental, ou tudo so0re serviços de saHde. :ste ca!+tulo tratou dos !rinc+!ios da indexação a!enas teoricamente, !ois não usou como modelo nen8um serviço de inormação. !rov"vel 'ue grandes serviços de inormação !roduzam suas !r?!rias diretrizes de indexação, 'ue merecem ser examinadas !ara se ver como as regras são a!licadas em determinado contexto.
)9
%ap&tulo 7 0 + prática da indexação % o indexador raramente = dado o luxo de !oder ler um documento atentamente do começo ao m. % exig>ncia de indexar determinada 'uantidade de itens !or dia 8aver" de l8e im!or 'ue se satisaça comumente com uma leitura 'ue estar" longe de ser com!leta. m uma imagem exata do 'ue trata o documento. 2o entanto, o indexador deve, 8a0itualmente, levar em conta o documento inteiro B!artes lidas, !artes 'ue oram vistas de relanceC, e os termos atri0u+dos !recisam reNetir o todo. % exceção seria 'uando somente !arte do documento B!or exem!lo, um documento longo com mHlti!los assuntosC interessasse ao gru!o de usu"rios a ser atendido. Tones B1965C, citando %nderson B1961C, salienta 'ue certas !artes de um documento são !articularmente graticantes !ara o indexador [Dar"graos de a0ertura Bde ca!+tulos ou seçesC e rases de a0ertura e encerramento de !ar"graos !arecem ser es!ecialmente ricos em !alavras index"veis.^ Isso conrma as concluses de &axendale B194C em seu tra0al8o so0re o desenvolvimento de !rocessos de indexação autom"tica de documentos.
Dalavras ou gru!os de !alavras 'ue a!areçam su0lin8ados ou graados com ti!os dierentes.
/odos esses elementos devem ser examinados e avaliados !elo indexador durante a an"lise 'ue az do documento. 2ão = recomend"vel azer a indexação a !artir exclusivamente do t+tulo, e, se 8ouver um resumo, não deve ser visto como um su0stituto satisat?rio do exame do texto. Ms t+tulos !odem ser enganosos$ tanto os t+tulos 'uanto os resumos !odem ser inade'uados$ em muitos casos nen8um dos dois = uma onte con"vel do ti!o de inormação 'ue o indexador re'uer B!. )C.
:m seu a0rangente estudo so0re como os indexadores realmente executam suas atividades, Mliver et al. B1955C desco0riram 'ue a maioria adota, eetivamente, um m=todo de ler#!assar os ol8os M maior gru!o de indexadores Bcerca de 4f do totalC armou 'ue examinam rotineiramente o documento inteiro. :sses indexadores, !or=m, salientaram 'ue certas !artes do documento eram examinadas mais atentamente do 'ue outras. :ssas !artes inclu+am resumo, introdução, sino!se, concluses, metodologia, resultados e ta0elas e gr"cos. Se uma ou mais de uma dessas seçes RcondensadasO osse considerada ade'uada !elo indexador, ele !oderia examinar de relance ou sim!lesmente Rol8earO outras !artes do documento. Ms !rinci!ais motivos !ara examinar o cor!o do documento oram !ara constatar se alguma coisa !assara des!erce0ida, oerecer maior !roundidade da indexação, e dirimir 'uais'uer dHvidas ou 'uestes B!. -1C.
Dosteriormente, E8u e MO&rien B1993C o0servaram 'ue indexadores novatos utilizavam 0astante os resumos, 'uando existiam, !ara determinar o assunto dos artigos. :m0ora 8a;am o0servado mais de cem indexadores, o estudo a0rangeu a!enas tr>s artigos. /udo isso se a!?ia no !ressu!osto de 'ue = !oss+vel ler o documento a ser indexado. Eonorme ressalta a ISM 4953 B Methods or examining documents, 194C, !rocedimentos dierentes se a!licarão a outros ti!os de itens 3
ocumentos não-im!ressos, como os meios audiovisuais, visuais e sonoros, inclusive o0;etos tridimensionais, exigem !rocedimentos dierentes. 2em sem!re = !oss+vel, na !r"tica, examinar um registro em sua inteireza B!or exem!lo, !ro;etando um lmeC. % indexação, então, = comumente eita a !artir de um t+tulo e#ou de uma sino!se, em0ora ao indexador deva ser dada a o!ortunidade de assistir ou ouvir o 'ue se ac8a gravado, caso a descrição escrita se;a inade'uada ou !areça inexata B!. )C.
M motivo !ara se examinar o documento =, naturalmente, a decisão so0re o 'ue incluir na indexação Bnas !alavras de Dresc8el B196)C, isso constitui a identicação da Rmat=ria index"velOC.1 Eonorme sugerido no ca!+tulo ), o indexador, !ara azer isso com eci>ncia, !recisa con8ecer muito 0em os interesses da comunidade servida !elo +ndice. 2uma instituição es!ec+ca, os indexadores !odem ser orientados no sentido de !rocurar nos documentos certos elementos !redenidos$ caso ocorram, deverão ser inclu+dos na indexação. Eonorme o ti!o de instituição, esses elementos im!ortantes incluem materiais de a0ricação, tem!eraturas envolvidas, gru!o et"rio envolvido, n+vel de escolaridade, etc. :m certos casos, os elementos mais im!ortantes são !r=-im!ressos no ormul"rio de indexação, lem0rando ao indexador 'ue os termos a!ro!riados devem ser usados, se se a!licarem a determinado documento. Dor exem!lo, a 2ational Li0rarA o edicine em!rega Reti'uetasO \chec-tags ] desse ti!o !ara indicar gru!os et"rios, g>nero, ti!os de animais utilizados em ex!eri>ncias, etc. :ssa eta!a de Ran"lise conceitualO da indexação não deve ser inNuenciada !elas caracter+sticas do voca0ul"rio a ser usado na eta!a de tradução. Isto =, o indexador decide, !rimeiramente, 'uais os assuntos 'ue !recisam ser re!resentados$ s? de!ois Ba todo momento talvezC = 'ue vericar" se o voca0ul"rio !ermite ou não re!resent"-los ade'uadamente. :m outras !alavras, o indexador não deve ignorar um assunto !or'ue sa0e ou descona 'ue não !ode ser ex!resso ade'uadamente. !oss+vel 'ue um exame mais meticuloso do voca0ul"rio mostre 'ue estava e'uivocado. %demais, uma unção im!ortante do indexador = contri0uir !ara o a!ereiçoamento do voca0ul"rio controlado, comunicando suas deci>ncias aos res!ons"veis !or sua manutenção. im!rov"vel 'ue isso ocorra se o indexador or estimulado a R!ensarO com os termos controlados. % !ro!?sito, discordo totalmente da ISM 4953, 'ue arma 'ue [tanto a an"lise 'uanto a transcrição devem ser realizadas com o aux+lio de instrumentos de indexação, como tesauros e es'uemas de classicação^. % transcrição, = claro, não se realiza sem essas erramentas, mas a an"lise inde!ende totalmente delas.
31
:m0ora concorde inteiramente com 'ue a indexação este;a relacionada Ps necessidades de determinado gru!o de usu"rios, ac8o 'ue Y;orland !ode estar conundindo as eta!as de an"lise conceitual e tradução. durante a !rimeira 'ue se identicam as necessidades dos usu"rios. Isto >, o indexador decide 'uais as!ectos do documento !rovavelmente interessarão aos usu"rios. :m seguida, o indexador seleciona os termos controlados 'ue mel8or re!resentam esses as!ectos. 4xausti#idade da indexação
Ms atores 'ue inNuem no desem!en8o de um sistema de recu!eração da inormação e 'ue são diretamente atri0u+veis P indexação !odem ser assim categorizados 1. Dol+tica de indexação ). :xatidão da indexação %n"lise conceitual /radução %s decises 'uanto P !ol+tica são tomadas !elos gestores do serviço de inormação, estando, !ortanto, ora do controle do indexador individual$ os atores relativos P exatidão se estão so0 o controle do indexador individual. % !rinci!al decisão !ol+tica diz res!eito P exaustividade da indexação, a 'ual corres!onde, grosso modo, ao nHmero de termos atri0u+dos em m=dia. M eeito da exaustividade oi anteriormente exem!licado na gura 3. % indexação exaustiva im!lica o em!rego de termos em nHmero suciente !ara a0ranger o conteHdo tem"tico do documento de modo 0astante com!leto. % indexação seletiva, !or outro lado, im!lica o em!rego de uma 'uantidade muito menor de termos, a m de a0ranger somente o conteHdo tem"tico !rinci!al do documento. Kuanto mais termos orem utilizados !ara indexar um documento mais acess+vel ele se tornar" e, !rovavelmente, mais vezes ser" recu!erado. ncia a realização de 0uscas com!letas.
Isso oi demonstrado em numerosas ocasies$ !or exem!lo, !or &oAce e cLain B199C.
3)
% id=ia de RexaustividadeO tam0=m se a!lica a um sistema de recu!eração 'ue uncione com 0ase em 0uscas eitas em textos Bver ca!+tulo 13C. M t+tulo do documento da gura 3 não constitui uma re!resentação muito exaustiva de seu conteHdo tem"tico. % exaustividade cresce P medida 'ue aumenta o nHmero de !alavras !resentes na re!resentação. M termo R!roundidadeO = re'entemente em!regado !ara designar a 'uantidade de termos atri0u+dos a um documento. Kuer dizer, em!rega-se R!roundidadeO em lugar de RexaustividadeO. %m0os os termos são im!recisos e !odem ser enganosos. Dara com!reender mel8or o eeito do aumento do nHmero de termos usados na indexação de um documento, imaginemo-lo como se !ossu+sse duas dimenses, como mostra a gura 5. igamos 'ue o indexador consiga identicar dez assuntos ans 'ue são estudados no documento. Eonsiderase isso como sendo o m0ito de a0rang>ncia do documento. Se o indexador tentar incluir todos esses assuntos, a indexação ser" tida como exaustiva Bisto =, ela = uma re!resentação exaustiva do conteHdo tem"ticoC. Kuanto mais assuntos orem inclu+dos mais exaustiva ser" a indexação. Dor outro lado, 'uanto menos assuntos orem inclu+dos mais seletiva ser" a indexação. :videntemente, a indexação exaustiva exigir" o em!rego de maior nHmero de termos. % segunda dimensão do documento, do !onto de vista da indexação, = denominada especifcidade na gura 5. Isto =, alguns assuntos identicados seriam indexados em mais de um n+vel de es!ecicidade. Su!on8amos 'ue o !rimeiro assunto se;aO ar'uitetura de catedraisO, 'ue seria indexado so0 o termo %7Kncia da indexação exem!licado na gura 5. RDroundidadeO = um termo menos satisat?rio !or'ue denota o o!osto de a0rang>ncia e se a!lica de modo mais a!ro!riado P dimensão da es!ecicidade mostrada na gura 5. % 'uantidade de termos atri0u+dos ao documento constitui realmente uma 'uestão de custo-ec"cia. :m geral, 'uanto mais exaustiva or a indexação maior ser" o custo, 1 e não =.muito razo"vel indexar num n+vel de maior exaustividade 'ue as necessidades dos usu"rios do serviço não ;usti'ue. Ser" !reciso um n+vel mais alto de exaustividade se orem ormulados muitos !edidos de 0uscas realmente exaustivas. 2o caso de serem eitos muitos !edidos de 0uscas 'ue realmente cu0ram o assunto de modo com!leto, ser" necess"rio um alto n+vel de exaustividade. Se essas 0uscas 'ue !rocuram exaurir o assunto orem a exceção e não a regra, 0astar" um n+vel muito mais 0aixo de exaustividade. claro 'ue 'uanto mais termos orem em!regados !or documento Bisto =, maior or a exaustividadeC, maior ser" a !ro0a0ilidade de ele ser recu!erado e maior ser" o nHmero de caracter+sticas 'ue o distingam de outros documentos. as a distri0uição de itens entre os termos tam0=m aetar" a discriminação termos 'ue se a!licam a muitos documentos não oerecerão muita discriminação$ os 'ue se a!licarem a !oucos documentos serão 0ons discriminadores.
2a realidade, naturalmente, isso = um exagero de sim!licação. Kuando tem em mãos um documento !rolixo, o indexador talvez !recise de mais tem!o !ara incluir de modo exaustivo seu conteHdo. :m outros casos, talvez se;a mais r"!ido usar muitos termos ao inv=s de tentar selecionar alguns !oucos de um gru!o em 'ue eles !odem estar estreitamente relacionados ou serem coincidentes. :m geral, no entanto, 'uanto mais termos orem usados, mais dis!endioso ser" dar-l8es entrada na 0ase de dados e !rocess"-las su0se'entemente. %l=m disso, aumentar a 'uantidade de termos aumentar" su0stancialmente os custos dos +ndices em ormato de c8as ou im!ressos. 1
33
Figura 5 ( %s duas dimenses da indexação de um documento
Wolram e _8ang B))C em!regaram simulação em com!utador !ara estudar os eeitos da variação tanto dos n+veis de exaustividade 'uanto das distri0uiçes dos termos Bo nHmero m=dio de itens aos 'uais um termo se a!licaC. Sua conclusão oi 'ue &aixa exaustividade e distri0uiçes de termos !ouco !roundas !roduzem menos dierenciação entre documentos, !ois menos termos são atri0u+dos !or documento e mais termos comuns são com!artil8ados entre documentos, disso resultando maior nHmero de termos de 0aixo valor re!resentativo. :xaustividade mais alta oerece maiores o!ortunidades !ara o acr=scimo ao documento de termos adicionais mais distintivos. Igualmente, uma distri0uição de termos mais !rounda, 'uando se encontra um +ndice m=dio menor de atri0uição de termos es!ec+cos ao item, acentua a distingui0ilidade do documento. Kuando se t>m alta exaustividade !ara descrever de modo mais com!leto o documento e distri0uiçes de termos mais !roundas, denindo con;untos de termos mais exclusivos, encontram-se as menores densidades de documentos, o 'ue acilita distinguir os documentos entre si. Ms resultados de cada modelo demonstram ser !oss+vel o0ter densidades es!aciais similares de documentos com dierentes com0inaçes de exaustividade de indexação e distri0uiçes de termos. Dor exem!lo, a com0inação de alta exaustividade#distri0uição de termos !ouco !rounda e 0aixa exaustividade#distri0uição de termos !rounda resultou em n+veis similares de densidade es!acial de documentos B!. 94-941C.
Ms m=todos de indexação e redação autom"ticas de resumos Bver ca!+tulo 14C 0aseiamse grandemente em crit=rios estat+sticos Ba contagem de ocorr>ncias de !alavras no textoC, de modo 'ue = !oss+vel a!licar medidas de RdensidadeO Bisto =, o nHmero de termos de indexação ou a extensão do resumo em relação P extensão do textoC. EonnollA e Landeen B)1C !ro!em e a!licam medida similar BnHmero de entradas do +ndice em relação ao nHmero total de lin8as de textoC aos +ndices do nal de livros. ?0vio 'ue, P medida 'ue as 0ases de dados crescem de taman8o, a 'uantidade de itens 'ue a!arecem so0 'ual'uer termo tam0=m tende a crescer. /orna-se necess"rio, !ortanto, indexar com o em!rego de mais termos Be tam0=m torn"-los cada vez mais es!ec+cosC de modo 'ue a indexação se;a mais discriminativa !ara !ossi0ilitar !es'uisas em 'ue se alcance um n+vel ade'uado de revocação com n+vel toler"vel de !recisão. Lamentavelmente, isso não tem sido levado em conta na !r"tica da catalogação de assuntos entre a comunidade 0i0liotec"ria dos :<%. M conteHdo tem"tico dos livros = re!resentado em n+vel muito gen=rico e su!ercial Bem m=dia, menos de duas com0inaçes de ca0eçal8o de assunto# su0ca0eçal8o !or item, conorme MO2eill e %luri, 191C. esmo 'ue isso osse aceit"vel 8" 4 anos, 'uando os acervos eram 0em menores, e ainda o se;a no caso de acervos muito !e'uenos, = 8o;e !raticamente inHtil em cat"logos 'ue a0ran;am v"rios mil8es de itens. % conversão de cat"logos em c8as !ara cat"logos em lin8a !ro!orcionou aos usu"rios uma grande vantagem !otencial - a !ossi0ilidade de azer 0uscas com termos em com0inaçes l?gicas. M valor !otencial disso, !or=m, reduz-se grandemente devido ao 0aixo n+vel de exaustividade das re!resentaçes constantes do cat"logo. Dor conseguinte, as !es'uisas em lin8a nos cat"logos de grandes 0i0liotecas universit"rias re'entemente resultam na recu!eração de centenas de itens, a maioria dos 'uais talvez se;a totalmente im!rest"vel !ara o consulente BLancaster et al., 1991C. :sse RenQmeno da recu!eração volumosaO estimulou a realização de muitas ex!eri>ncias so0re como azer 0uscas em grandes cat"logos de orma mais discriminativa Bver, !or exem!lo, Dra08a, 1991C, tais como a delimitação !or data, l+ngua e outros crit=rios. M ato de a maioria dos cat"logos !ermitir 0uscas nas !alavras dos t+tulos Be Ps vezes nos nHmeros de classicaçãoC, 0em como nos ca0eçal8os de assuntos, !arece ter tido, sur!reendentemente, reduzido eeito na exaustividade da re!resentação, uma vez 'ue as !alavras dos t+tulo, os ca0eçal8os de assuntos e os nHmeros de classicação em geral se re!etem Bu e Lancaster, 199C. 3
*"rios estudos examinaram a extensão com 'ue os ca0eçal8os de assuntos nos cat"logos em lin8a de acesso !H0lico \MD%ES] re!etem as !alavras-c8ave dos t+tulos dos livros. *oor0i; B199C, !or exem!lo, analisou essa 'uestão num contexto 8oland>s. e ato, ele !rocurava com!rovação de 'ue a atri0uição de descritores aos livros, um !rocesso dis!endioso, valia a !ena. Mu se;a, em 'ue eles contri0uem 'ue as !alavras-c8ave do t+tulo não o açam Ms descritores de assuntos conseguiram recu!erar 'uase duas vezes mais itens relevantes do 'ue as !alavras-c8ave. 2ão s? muitos t+tulos são indicadores inade'uados da'uilo de 'ue trata um livro, mas, salienta *oor0i;, o mesmo assunto !ode a!arecer nos t+tulos re!resentado de muitas maneiras dierentes. M controle de voca0ul"rio im!osto !elos ca0eçal8os de assuntos = im!ortante. :sse estudo oi realizado nas 8umanidades e ci>ncias sociais, 'ue !odem, em m=dia, a!resentar t+tulos menos descritivos ou com!letos do 'ue acontece nas ci>ncias r+gidas. % gura 6 mostra a lei dos rendimentos decrescentes a!licada P indexação. 2o exem!lo 8i!ot=tico desse serviço de inormação, a atri0uição em m=dia de termos satisar" a cerca de f das necessidades dos usu"rios. % m de elevar esse !ercentual !ara 9-94f seria !reciso uma exaustividade muito maior na indexação. % !osição do !onto nessa curva e o 'ue re!resenta em nHmero de termos de!enderão muit+ssimo de 'uestes es!ec+cas do sistema. Ms gestores do serviço de inormação ela0oram diretrizes so0re exaustividade da indexação 'ue resultam do seu con8ecimento das necessidades dos usu"rios. :ssas diretrizes costumam 0asear-se na intuição, em0ora se;a !oss+vel realizar ex!erimentos controlados em 'ue se com!arem amostras de necessidades de inormação com uma coleção de documentos indexados com 'uantidades variadas de termos.
Figura 6 ( 7endimentos decrescentes na indexação
:videntemente, a id=ia de um n+vel ideal de exaustividade a!lic"vel a todos os itens de uma 0ase de dados = um tanto enganosa, uma vez 'ue se a!licariam valores ideais extremamente dierentes a dierentes documentos, de!endendo dos !edidos eetivamente ormulados !elos usu"rios do sistema Baron, 1969C. % exaustividade ideal = inteiramente de!endente dos !edidos. Dara alguns ti!os de itens index"veis, ser" exce!cionalmente di+cil c8egar a um acordo so0re Rde 'ue eles tratamO. :m relação a eles, não ser" "cil alcançar consenso e coer>ncia na indexação, e, !or isso, talvez !recisem ser indexados em n+vel exaustivo 'ue atenda a dierentes !ontos de vista. Isso acontece, !or exem!lo, na indexação de imagens, 'ue !odem ser vistas !elos indexadores em n+veis dierentes, desde o altamente concreto at= o altamente a0strato B:nser, 1994C. Intner B19C mostrou 'ue, ao decidir so0re o 'ue incluir e 'uantos termos usar, o indexador !oderia realmente exercer uma orma de censura, talvez deixando de co0rir algum as!ecto do tra0al8o 'ue ele desa!rova. % situação inversa, naturalmente, consiste em usar uma 'uantidade in;ustic"vel de termos !ara azer com 'ue um item se;a recu!erado o maior nHmero !oss+vel de vezes, tentação ca!az de ocorrer se estiver associado P sua recu!eração algum gan8o nanceiro ou de outro ti!o. /al enQmeno tem sido o0servado no am0iente da internet Bver ca!+tulo 15C, onde = denominado Rspoofng O ou Rspamming O. Drice B193C talvez ten8a sido o !rimeiro a recon8ecer isso como um !ro0lema em !otencial. &ell B1991 aC estuda uma situação semel8ante em relação aos +ndices do nal de livros os indexadores, ou !ossivelmente os editores, !odem revelar um vi=s ao omitir certos t?!icos do +ndice, ao reorçar as id=ias do autor Bou o contr"rioC, ou ao introduzir as !r?!rias atitudes do indexador. %!resenta v"rios exem!los. % 'uantidade de termos atri0u+dos a um documento = um ator cr+tico !ara denir se determinado item ser" ou não recu!erado. Mutros atores ans, !or=m, tam0=m !artici!am 34
disso. M0viamente, = 'uase certo 'ue a 'uantidade de itens recu!erados ven8a a declinar P medida 'ue mais termos orem com0inados numa relação do ti!o e, numa estrat=gia de 0usca. claro 'ue a extensão com 'ue os termos !odem ser com0inados com >xito numa 0usca de!ende grandemente da 'uantidade de termos usados na indexação. /omando-se um exem!lo trivial, a com0inação de tr>s termos B%. &. EC !ode recu!erar um grande nHmero de itens 'uando se em!rega na indexação uma m=dia de ) termos !or item, mas = im!rov"vel 'ue recu!ere muitos deles numa 0ase de dados em 'ue somente tr>s termos se;am atri0u+dos em m=dia a cada item. Bevido a razes antes mencionadas, não recu!eraria muitos, se = 'ue recu!eraria algum, numa 0usca eita num cat"logo de 0i0lioteca em lin8a.C Kuanto mais seletiva or a indexação mais necessidade 8aver" de com0inar termos numa relação do ti!o ou, a m de mel8orar a revocação. %s interaçes entre exaustividade de indexação e as caracter+sticas das estrat=gias de 0usca oram estudadas !or S!arcX Tones B1963C. :studos so0re o eeito da exaustividade em m=todos mais autom"ticos de recu!eração Bver ca!+tulo 14C encontram-se em S8aV B195, 1999a,0C e &urgin B1991,1994C. :m muitos serviços de inormação a indexação visa a duas nalidades um tanto dierentes aC !ermitir 'ue se ten8a acesso a um item num +ndice im!resso, e 0C !ermitir 'ue se ten8a acesso a esse mesmo item numa 0ase de dados eletrQnica. 2essas circunstncias, exige-se do indexador 'ue indexe de acordo com certo n+vel de exaustividade !reesta0elecido !ara a segunda das nalidades acima, e 'ue selecione um su0con;unto dos termos de indexação Btalvez entre dois e 'uatroC assim atri0u+dos, os 'uais servirão de !ontos de acesso no +ndice im!resso. Ms termos desse su0con;unto serão a'ueles 'ue o indexador considerar como os 'ue mel8or re!resentam os as!ectos mais im!ortantes do documento. Isto !ode ser visto como uma orma tosca de indexação R!onderadaO um termo rece0e um de dois !esos R!rinci!alO BconteHdo tem"tico undamental, !ara o +ndice im!ressoC ou Rsecund"rioO Btodos os outros termosC. 2o ca!+tulo 11 examina-se mais detidamente a indexação !onderada. rinc&pio da especicidade
M !rinc+!io 'ue, isoladamente, = o mais im!ortante da indexação de assuntos, e 'ue remonta a Eutter B165C, = a'uele segundo o 'ual um t?!ico deve ser indexado so0 o termo mais es!ec+co 'ue o a0ran;a com!letamente. %ssim, um artigo 'ue trate do cultivo de laran;as ser" indexado so0 L%7%2T%S e não so0 F7%S EJ/7IE%S ou F7%S. 2ormalmente, seria mel8or utilizar v"rios termos es!ec+cos, ao inv=s de um termo 'ue se;a mais gen=rico. Se um artigo descreve o cultivo de limes, limas e tangerinas ser" mais 0em indexado so0 os tr>s termos es!ec+cos do 'ue so0 o termo mais gen=rico F7%S EJ/7IE%S. M termo F7%S EJ/7IE%S ser" usado a!enas !ara artigos 'ue tratem das rutas c+tricas em geral, e !ara a'ueles 'ue tratem !raticamente de todas as rutas c+tricas. :sta diretriz !ode ser estendida P situação na 'ual se trata de v"rias rutas c+tricas, mas não com muitos detal8es Ba ;u+zo do indexadorC 'ue ;usti'uem o em!rego dos termos es!ec+cos. :m alguns casos, tam0=m, a clientela atendida !elo indexador !ode estar interessada a!enas em determinadas rutas. 2esta situação seria v"lido indexar a!enas estas e não incluir termos corres!ondentes Ps outras rutas. %lguns estudantes de indexação cometem o e'u+voco de indexar de modo redundante. /endo indexado um artigo so0re laran;as so0 o termo L%7%2T%S, sentem necessidade de tam0=m atri0uir-l8e o termo F7%S EJ/7IE%S e at= mesmo F7%S. 2ão 8" necessidade disso. 2a verdade, trata-se de uma !r"tica de indexação med+ocre. Se os termos gen=ricos orem atri0u+dos toda vez 'ue or utilizado um termo es!ec+co, car" di+cil dierençar artigos gen=ricos de artigos es!ec+cos. Dor exem!lo, o usu"rio 'ue consulta um +ndice so0 o termo F7%S es!era encontrar itens so0re rutas em geral, e não so0re rutas es!ec+cas. 2os sistemas manuais de recu!eração 'ue antecederam os sistemas inormatizados, de ato era !reciso desdo0rar as entradas dos termos es!ec+cos !ara os gen=ricos res!ectivos$ !or exem!lo, o em!rego do termo L%7%2T%S ao se indexar um item im!licava 'ue tam0=m l8e seriam atri0u+dos os termos F7%S EJ/7IE%S, F7%S e talvez at= mesmo D7M
onde 8ouvesse um artigo 'ue tratasse de trutas c+tricas em geral, mas 'ue inclu+sse extensas consideraçes so0re laran;as, ou outro 'ue tratasse de rutas c+tricas e em 'ue as laran;as ossem o exem!lo B!or exem!lo, a irrigação de rutas c+tricas com exem!los tomados da irrigação de laran;aisC. M indexador deve ter em mente 'ue = !oss+vel conseguir es!ecicidade mediante com0inaçes de termos. Se não 8ouver nen8um termo 'ue sozin8o !ossa re!resentar o t?!ico, 0usca-se uma com0inação a!ro!riada de termos no voca0ul"rio controlado. :is alguns exem!los 8i!ot=ticos Literatura Francesa edieval indexado so0 LI/:7%/<7% :I:*%L e LI/:7%/<7% F7%2E:S% &i0liotecas =dicas indexado so0 &I&LIM/:E%S :SD:EI%LI_%%S e EI2EI%S IE%S Literatura Eanadense indexado so0 LI/:7%/<7% e E%2% leo de %mendoim . indexado so0 L:MS *:@:/%IS e %:2MI M0serve-se 'ue o indexador deve !rocurar a com0inação mais a!ro!riada !ara cada caso. /eoricamente, Literatura edieval Francesa seria ex!resso !or meio de LI/:7%/<7% :I:*%L e F7%2k%, mas a com0inação de LI/:7%/<7% :I:*%L e LI/:7%/<7% F7%2E:S% ex!rime a id=ia de modo mais exato. a mesma orma, com0inou-se EI2EI%S IE%S com &I&LIM/:E%S :SD:EI%LI_%%S e não com &I&LIM/:E%S, !ara ex!ressar a id=ia de 0i0liotecas m=dicas, !ois estas são evidentemente es!ecializadas, e com0inou-se %:2MI com L:MS *:@:/%IS e não com L:MS, uma vez 'ue o ?leo de amendoim = um ?leo vegetal. hs vezes, o voca0ul"rio controlado não inclui um termo no n+vel de es!ecicidade exigido !or determinado documento. 2esse caso o indexador adotar" o termo mais es!ec+co existente B!or exem!lo, F7%S EJ/7IE%S, ao inv=s de F7%S, !ara um artigo so0re laran;asC. :le !ode tam0=m sugerir P e'ui!e res!ons"vel !ela manutenção do tesauro 'ue existe a necessidade de termos mais es!ec+cos nessa categoria. Outras diretri8es
M !rocesso da indexação de assuntos !arece ser rerat"rio a regras rigorosas. %l=m do !rinc+!io da es!ecicidade, não oram desenvolvidas regras verdadeiras so0re a atri0uição de termos, a!esar de 8aver muitas acerca do 'ue azer com os termos de indexação de!ois de atri0u+dos B!or exem!lo, como esta0elecer a se'>ncia em 'ue são listados, a m de ormar ca0eçal8os num +ndice im!ressoC. uitas RteoriasO so0re indexação oram ormuladas, algumas das 'uais !assadas em revista !or &orXo B1966C, !or=m, costumam não ser teorias de verdade, e oerecem !ouca a;uda !r"tica !ara o indexador. Fugmann B1969, 194C a!resentou v"rios axiomas so0reO indexação e !rovisão de inormaçãoO, mas nem todos t>m relação direta com a indexação como tal. M Hnico !rinc+!io de indexação verdadeiro at= agora ormulado, denominado Rindexação com!uls?riaO, arma 'ue o indexador deve utilizar os termos mais a!ro!riados de 'ue dis!on8a !ara descrever o conteHdo tem"tico de um documento. Eomo isso signica, normalmente, os termos mais es!ec+cos, trata-se essencialmente de uma reiteração do !rinc+!io da es!ecicidade. % maior !arte dos axiomas de Fugmann corres!onde realmente a atores 'ue inNuem no desem!en8o de sistemas de recu!eração da inormação e não a elementos de uma teoria da indexação, em0ora v"rios deles ten8am im!licaçes !ara a indexação. Dor exem!lo, o axioma da deni0ilidade tem relação com a ca!acidade de denir clara e ine'uivocamente uma necessidade de inormação. Isso !ode, evidentemente, ser estendido P ca!acidade de denir o conteHdo tem"tico de documentos de modo claro. e ine'u+voco. M axioma da !revisi0ilidade diz 'ue o >xito de uma 0usca num sistema de recu!eração de!ende grandemente da !revisi0ilidade com 'ue = descrito o conteHdo tem"tico, o 'ue a!onta !ara a im!ortncia da coer>ncia na indexação. M axioma da delidade diz 'ue outro ator 'ue inNui no desem!en8o = a ca!acidade de denir com rigor e exatidão o conteHdo tem"tico Bdas necessidades de inormação e, !or extensão, dos documentosC, 'ue tem a ver mais com o voca0ul"rio usado !ara indexar do 'ue com a !r?!ria indexação. 2ão consegui, de ato, encontrar uma teoria verdadeira, 'ual'uer 'ue osse, a!lic"vel ao !rocesso de indexação, em0ora 8a;a algumas Bver, !or exem!lo, TonXer B195CC relativas Ps caracter+sticas dos termos de indexação. %demais, creio ser !oss+vel identicar a!enas duas 36
regras 0"sicas da indexação uma, 'ue se reere P eta!a de an"lise conceitual, e a outra, P eta!a de tradução, a sa0er 1. Inclua todos os t?!icos recon8ecidamente de interesse !ara os usu"rios do serviço de inormação, 'ue se;am tratados su0stantivamente no documento. ). Indexe cada um desses t?!icos tão es!ecicamente 'uanto o !ermita o voca0ul"rio do sistema e o ;usti'uem as necessidades ou interesses dos usu"rios. :stas regras estão, naturalmente, su;eitas a inter!retação. Dor exem!lo, o 'ue Rsu0stantivamenteO de ato signica s atores aC a 'uantidade de inormaçes a!resentadas so0re o assunto, 0C o grau de interesse no assunto, e cC a 'uantidade de inormaçes ; " existentes so0re o assunto uma menção 0reve e isolada de um com!osto merece ser indexada se sa0e 'ue esse com!osto = 0astante recente$ anos de!ois seria necess"rio um volume muito maior de inormaçes !ara ;usticar sua inclusão. % ex!ressão Rnecessidades ou interesses dos usu"riosO, na segunda regra, im!lica 'ue o !rinc+!io da es!ecicidade !ode e deve ser modicado 'uando se sa0e 'ue os usu"rios de um sistema ou erramenta de inormação, em certas circunstncias, seriam mais 0em servidos !or meio da indexação de determinado t?!ico em n+vel mais gen=rico. Dor exem!lo, numa 0ase de dados de medicina os artigos de veterin"ria a!licada a cães seriam indexados so0 os nomes das res!ectivas raças caninas. Dor outro lado, artigos so0re o uso de cães em ex!eri>ncias de la0orat?rio seriam sim!lesmente indexados so0 E:S, mesmo 'uando a raça es!ec+ca osse mencionada.
R7esultados não alegados !elo autorO não devem, = claro, ser conundidos com resultados negativos, !ois estes comumente merecem ser indexados. Dor exem!lo, se um estudo mostra 'ue certo material não se !resta !ara ser utilizado em determinada a!licação, a a!licação mencionada deve ser denitivamente inclu+da na indexação, caso se;am contem!lados outros crit=rios B!or exem!lo, o volume de inormaçes ornecidasC. :m a!licaçes mais es!ecializadas, os indexadores !odem ser estimulados a 0uscar iner>ncias. Dor exem!lo, Sc8roeder B199C, re!ortando-se a ex!eri>ncia no @eneral otors edia %rc8ives, ressalta a im!ortncia de uma Rcamada de iner>nciaO na indexação de imagens. Dor exem!lo, uma otograa de determinado ve+culo !ode mostr"-lo atravessando um terreno acidentado, sendo então necess"rio identicar não somente o ve+culo mas tam0=m em!regar termos 'ue indi'uem sua ca!acidade de desem!en8o em locais !edregosos. Zlement B))C az uma distinção entre indexação de Rsistema a0ertoO e indexação de Rsistema ec8adoO. % Hltima Bcu;o exem!lo mais evidente são os +ndices de nal de livroC reerese a +ndices de um Hnico item$ esses +ndices são não-cont+nuos. % indexação de sistema a0erto, ao contr"rio, a!lica-se a inHmeros itens e = cont+nua, como = o caso da indexação de artigos de !eri?dicos em 0ases de dados como, !or exem!lo, o :LI2:. Kuando a indexação se a!lica a muitos itens, e = cont+nua, os termos adotados nas entradas do +ndice devem ser !adronizados. % !adronização não constitui de ato um !ro0lema na indexação de sistema ec8ado, em0ora se;a o0viamente necess"rio utilizar uma terminologia uniorme, coerente, em toda a extensão do +ndice. % indexação de sistema ec8ado !ode usar termos 'ue são nãocont+nuos RLeonardo da *inci, morreO !ode ser !ereitamente a!ro!riado nesse ti!o de +ndice, 3
sendo im!rov"vel 'ue a!areça num +ndice de sistema a0erto Bem0ora RLeonardo da *inciO a!areçaC. 9ndices ps2coordenados
M conteHdo tem"tico o0;eto de um documento e re!resentado !elos termos de indexação 'ue l8e são atri0u+dos !ossui car"ter multidimensional. *e;amos, !or exem!lo, um artigo 'ue trate da migração de mão-de-o0ra de oçam0i'ue !ara as minas da rica do Sul e 'ue = indexado so0 os seguintes termos Mk%&IK<: F7IE% M S
:m0ora os termos se;am a'ui a!resentados em orma de lista, re!resentam, na realidade, uma rede de relaçes
Eonv=m recu!erar esse documento durante uma 0usca 'ue envolva 'ual'uer um dos termos tomados isoladamente ou 'ual'uer com0inação entre eles 'uais'uer dois termos, 'uais'uer tr>s, 'uais'uer 'uatro, ou todos os cinco m sido !?s-com0inação ou mani!ulat?rioC. Ms sistemas !?s-coordenados surgiram na d=cada de 19, 'uando oram im!lantados com a utilização de v"rios ti!os de c8as. ncia 0i0liogr"ca acom!an8ada normalmente de termos de indexação ou um resumo, ou am0os. ). s itens satisazem a esse re'uisito. %tendendo P solicitação do interessado, o com!utador localiza esses registros !elos seus nHmeros de identicação B, , 1C e os mostra na tela do monitor ou os im!rime. :sse !rocesso !ermanece o mesmo inde!endentemente de 'uantos termos se ac8em envolvidos e 'uais se;am as relaçes l?gicas es!ecicadas !or 'uem az a 0usca. Se or !edido F ou @, o sistema indicar" 'ue cinco itens satisazem P condição. Kuem az a 0usca solicita então 'ue esta lista de cinco itens se;a com0inada com a lista so0 2 - isto =, BF ou @C e 2 - do 39
'ue resulta a recu!eração de tr>s itens. % res!eito dos sistemas !?s-coordenados = !oss+vel armar 'ue 1. Ms termos !odem ser com0inados entre si de 'ual'uer orma no momento em 'ue se az a 0usca. ). Dreserva-se a multidimensionalidade das relaçes entre os termos. 3. /odo termo atri0u+do a um documento tem !eso igual nen8um = mais im!ortante do 'ue outro Bem0ora a indexação !onderada, estudada em ca!+tulo !osterior, !ossa ser utilizadaC. :stas caracter+sticas não se a!licam a +ndices !r=-coordenados, 'ue serão o0;eto do !r?ximo ca!+tulo. Instrumentos auxiliares da indexação
M indexador !recisa contar com alguma orma de anotação dos resultados da o!eração de indexação. São 'uatro as !ossi0ilidades 1. %notação no !r?!rio documento ). Dreenc8imento de algum ti!o de ormul"rio im!resso em !a!el 3. @ravação numa ta de "udio . Dreenc8imento de um ormul"rio mostrado na tela de um monitor em lin8a
Figura ( Sistema de recu!eração da inormação re!resentado como uma matriz
:m0ora 8o;e em dia a norma se;a indexar diretamente em lin8a, com o em!rego de algum ti!o de tela estruturada, antigamente eram comuns outras !ossi0ilidades 'ue ainda são adotadas em certos lugares. :m certas instituiçes o indexador sim!lesmente marca o documento 'ue tem em mãos, e um datil?grao transcreve o 'ue ele marcou. :sta orma de tra0al8o s? conv=m, normalmente, se adota um m=todo de indexação relativamente sim!les, como, !or exem!lo, enri'uecimento de t+tulos associado P inclusão de uma 'uantidade relativamente !e'uena de termos ou c?digos de indexação. %t= 'ue os sistemas em lin8a se tornassem comuns, era corri'ueiro o indexador dar entrada aos termos num ormul"rio im!resso. % gura 9, !or exem!lo, mostra uma versão do ormul"rio 'ue era adotado !ela 2ational Li0rarA o edicine. M0serve-se o em!rego de Reti'uetasO \c8ecXtags], 'ue são termos !otencialmente a!lic"veis a inHmeros documentos da 0ase de dados.
Figura 9 ( Formul"rio de indexação utilizado antigamente !ela 2ational Li0rarA o edicine
Sua !r=-im!ressão no ormul"rio = eciente e econQmica, !ois o indexador s? !recisa ticar os 'ue se a!licarem a cada caso. Isto não s? !ou!a tem!o ao indexador, mas tam0=m az com 'ue se lem0re de 'ue esses termos devem ser atri0u+dos sem!re 'ue se a!licarem a determinado documento. evido a essa orma de advert>ncia, as eti'uetas são atri0u+das de modo mais coerente do 'ue outros termos BLancaster, 195a$ FunX et al., 193C.
1
Figura 1 ( Formul"rio caracter+stico da indexação de ooers
7e!roduzido de &renner ooers B194C com !ermissão de *an 2ostrand 7ein8old
:m am0ientes onde se !ratica uma indexação altamente es!ecializada, talvez se;a !oss+vel !r=-im!rimir o.voca0ul"rio controlado com!leto no ormul"rio de indexação, !ermitindo assim 'ue todos os termos se tornem 0asicamente eti'uetas. M !ioneiro desse m=todo oi !rovavelmente ooers. % gura 1 Bconorme &renner e ooers, 194C mostra um ormul"rio caracter+stico da indexação de ooers. M0serve-se como os descritores são agru!ados sistematicamente. %o analisar o documento, o indexador considera 0asicamente cada descritor da ta0ela como !otencialmente a!lic"vel. Eom eeito, o indexador ormula a si mesmo as !erguntas !ro!ostas !elo !r?!rio ormul"rio de indexação. Se, !or exem!lo, a res!osta P !ergunta Rexistem cargas aerodinmicasO or RsimO Bisto =, o documento em exame trata de cargas es!ec+casC, o indexador levar" isso em consideração atri0uindo o descritor, ou descritores, mais a!ro!riado !ara carga aerodinmica. % lista de descritores, a!resentada dessa orma, sim!lica o !rocesso de indexação !or'ue !ou!a ao indexador uma !arte de seu esorço intelectual. %s utilizaçes !otenciais 'ue um documento de interesse !ode ter !ara a instituição são re!resentadas !ela lista de !erguntasO orientadorasO 'ue oi criteriosamente com!ilada !or !essoal cient+co graduado. M indexador sim!lesmente segue as RdicasO dadas nessa lista. %ntigamente, o <. S. Datent and /rademarX Mce desenvolveu !e'uenos sistemas de recu!eração limitados a uma Hnica classe ou a um nHmero restrito de classes na "rea de !atentes Foram criados voca0ul"rios es!ecializados !ara essas classes, sucientemente sucintos !ara 'ue ossem im!ressos em !oucas ol8as. % gura 11 mostra !arte de um desses voca0ul"rios, destinado P su0classe de !atentes 'ue tratam de com!utadores digitais de uso geral. Igual Ps ta0elas de descritores de ooers, todo o voca0ul"rio !ode ser acilmente examinado, evitando 'ue o indexador deixe !assar des!erce0ido um termo im!ortante, e eliminando a necessidade de dar entrada aos termos num ormul"rio de indexação. 2este caso, encontram-se dis!on+veis mHlti!los exem!lares da lista de termos, e uma !atente = indexada sim!lesmente traçando-se um c+rculo em volta dos termos a!ro!riados ou seus c?digos num exem!lar da lista. /odo o !rocessamento !osterior re'uer a!enas tra0al8o de rotina. M RmicrotesauroO do %ir Dollution /ec8nical Inormation Eenter, descrito !or /ancredi e 2ic8ols B195C, oi tam0=m criado !ara ser utilizado traçando-se um c+rculo em volta dos termos. xito em algumas instituiçes onde o indexador !assou a ditar os termos num gravador de ta !ara serem !osteriormente transcritos !or datil?graos. :ste m=todo de ato a!resenta alguns !ro0lemas. Dodem ocorrer muitos erros de datilograa 'uando se em!rega um extenso voca0ul"rio t=cnico, estran8o ao datil?grao, o 'ue exige um )
tra0al8o de revisão muito cuidadoso. %lguns indexadores não conseguem tra0al8ar 0em dessa maneira !or'ue t>m diculdades em se lem0rar 'uais oram os termos 'ue ;" atri0u+ram a um item. Yo;e em dia, !or=m, a maioria dos !rodutores de 0ases de dados adota !rocessos de indexação em lin8a. %ssim, a!arecem no monitor v"rias telas ormatadas e o indexador vai inserindo os dados nos cam!os a!resentados. :ssa modalidade de o!eração oerece grandes vantagens em relação Ps suas !redecessoras o indexador !ode rece0er v"rios ti!os de mensagens, alguns de seus e'u+vocos !odem ser recon8ecidos !or !rogramas de detecção de erros 'ue o advertem imediatamente, al=m de dis!ensar a eta!a rotineira intermedi"ria, 'uando se converte o tra0al8o do indexador !ara ormato eletrQnico. %demais, existe a !ossi0ilidade de o indexador !assar do modo de entrada de dados !ara o de recu!eração, e assim valer-se de casos !recedentes !ara se orientar 'uanto a certas decises concernentes P indexação. Kuer dizer, o indexador acessa a 0ase de dados, !ara vericar como um termo oi usado antes ou como um documento mais antigo, am a outro 'ue est" sendo examinado, oi indexado.
Figura 11 ( Darte de voca0ul"rio es!ecializado so0re com!utadores digitais utilizado !elo <. S. Datent and /rademarX Mce 7e!roduzida com !ermissão do <. S. Datent and /rademarX Mce
3
Figura 1) ( Seção do microtesauro do %ir Dollution /ec8nical Inormation Eenter %!ud American 5ocumentation B/ancredi 2ic8ols \195]C Eo!Arig8t 195 To8n WileA Sons, Inc. 7e!roduzida com !ermissão de To8n WileA Sons, Inc.
oerece a !ossi0ilidade de enviar mensagens ao indexador. Dor exem!lo, se or usada a eti'ueta !regnaneA, o ES inormar" auto-maticamente ao indexador !araO acrescentar emale e o advertir" !ara usar animal ou human. M ES tam0=m advertir" !ara o em!rego de certas eti'uetas, com 0ase num nHmero limitado de !alavras 'ue ocorrem nos t+tulos ou resumos. Dor exem!lo, se a !alavra R eline a!arecer no texto, o indexador ser" advertido !ara examinar a !ossi0ilidade de usar a eti'ueta cats.
Figura 13 ( /ela de eti'uetas no ES
M ES tem outras caracter+sticas 'ue acilitam o !rocesso de indexação. M voca0ul"rio BMedical Su%&ect ;eadings C !ode ser visualizado na tela e o indexador !ode selecionar termos sem ter 'ue redigit"-los. Dara 'ual'uer um dos termos 'ue or selecionado o sistema !ode ser solicitado a mostrar na tela do monitor uma anotação ex!licativa ou, alternativamente, uma lista dos su0ca0eçal8os 'ue !odem ser usados com esse termo. M sistema tam0=m levar" BRma!ear"OC de um termo não-a!rovado !ara um a!rovado !or meio das remissivas inclu+das no Medical Su%&ect ;eadings . M0viamente, o voca0ul"rio controlado usado !or um serviço de inormação ser" erramenta de im!ortncia crucial !ara o indexador. ever" ser organizado e a!resentado de orma a oerecer ao indexador um aux+lio !ositivo na seleção dos termos mais a!ro!riados !ara determinada situação. :m0ora ten8a estreita relação com o tema da indexação, a construção e as !ro!riedades dos voca0ul"rios controlados são 'uestes 'ue estão ora do m0ito deste livro. Foram tratadas com detal8es em outras !u0licaçes BLancaster, 195$ Soergel, 196C.
4
Figura 1 ( 7egistro de indexação !ronto no ES
Dor exem!lo, a 2ational Li0rarA o edicine B2LC lança mão de v"rias erramentas, ricas em com!onentes de voca0ul"rio de entradas e diretrizes !ara indexação. % mais ?0via = o navegador eletrQnico eSY &roVser. :sta erramenta, eita !ara a 7ede, destina-se a ser usada !or indexadores, catalogadores de assuntos e es!ecialistas em 0uscas e = muito mais ela0orada do 'ue os Medical Su%&ect ;eadings , 'ue tem !or nalidade servir de guia no uso do Index edicus im!resso. Mutra erramenta, em ormato im!resso, = Medical Su%&ect ;eadings 2 Annotated Alpha%etic ist . % gura 14 mostra algumas entradas desta versão anotada. :ssa erramenta 0astante com!lexa !ossui com!onentes de voca0ul"rio de entradas B!or exem!lo, de!t8 intoxication \intoxicação !rounda] remete !ara inert gas narcosis \narcose !or g"s inerte] 0em como outras diretrizes ou instruçes !ara indexação termos relacionados Bver, !or exem!lo, o ato de 'ue depressive disorder \transtorno de!ressivo] deve ser dierençado de depression \de!ressão], termos 'ue eram usados antigamente B!or exem!lo, no !er+odo de 1963-199 o termo dermacentor somente existia !ara 0uscas em lin8a$ !ara im!ressão no Index Medicus esse organismo devia ser indexado tam0=m so0 o ca0eçal8o mais gen=rico tic-s \carra!atos]C mesmo algumas deniçes Bver, !or exem!lo, derma%rasion \derma0rasão]C.
5
Figura 14 ( :xem!lo de entradas de Medical su%&ect headings ' annoted alpha%etic list ()**+,
:ntre os voca0ul"rios de entradas mais es!ec+cos desenvolvidos !ela 2L est" o /umor XeA \E8ave de tumores], 'ue orientava so0re indexação de doenças neo!l"sicas. % gura 15 mostra entradas desse voca0ul"rio. M0serve-se como !ode ser considerado um verdadeiro voca0ul"rio de entradas 'ue inclui tanto remissivas unidirecionais 'uanto multidirecionais. Dor exem!lo, cisto terat?ide \teratoid cyst ] deve ser indexado so0 teratoma, !or=m cistoadenocarcinoma do ducto 0iliar \%ie duct cystadenocarcinoma ] ser" indexado so0 cAstadenocarcinoma \cistoadenocarcinom a] e tam0=m so0 c8olangiocarcinoma \colangiocarcinoma ]. :sses voca0ul"rios es!ecializados não são mais mantidos !ela 2L.
6
Figura 15 ( :xem!lo de entradas de umor -ey , um voca0ul"rio de entradas es!ecializado antigamente utilizado !ela 2ational Li0rarA o edicine
% maioria dos tesamos !u0licados inclui com!onentes de voca0ul"rios de entradas, mas = im!rov"vel 'ue !ossuam a ri'ueza Bou com!lexidadeC do exem!lo da gura 14. %s o0ras de reer>ncia !u0licadas são muito Hteis !ara o indexador, !rinci!almente na denição do signicado de termos !ouco comuns. Darticularmente im!ortantes são os dicion"rios e enciclo!=dias es!ecializados e gerais, 0em como os gloss"rios de todos os ti!os. &aXeVell B196C ela0orou uma lista de o0ras de reer>ncia de interesse !otencial !ara o indexador, !or=m 8o;e ela se a!resenta muito desatualizada. :m algumas instituiçes o tra0al8o do indexador conta com o aux+lio do acesso em lin8a a 0ancos de dados terminol?gicos.
%ap&tulo ; 0 9ndices pr<2coordenados % Nexi0ilidade inerente aos sistemas !?s-coordenados deixa de existir 'uando os termos de indexação são im!ressos em !a!el ou c8as catalogr"cas convencionais. Ms +ndices im!ressos e os cat"logos em c8as são !r=-coordenados$ suas caracter+sticas são as seguintes 1. di+cil re!resentar a multidimensionalidade das relaçes entre os termos. ). Ms termos somente !odem ser listados numa determinada se'>ncia B%, &, E, , :C, o 'ue im!lica 'ue o !rimeiro termo = mais im!ortante do 'ue os outros. 3. 2ão = "cil Bsenão com!letamente im!oss+velC com0inar termos no momento em 'ue se az uma 0usca. % orma mais rudimentar de um sistema de recu!eração da inormação talvez se;a o tradicional cat"logo em c8as utilizado 8" s=culos nas 0i0liotecas. *e;amos o item mencionado anteriormente um livro so0re migração de mão-de-o0ra de oçam0i'ue !ara as minas da rica do Sul. Su!on8amos 'ue l8e ten8am sido atri0u+dos tr>s ca0eçal8os de assuntos Mk%&IK<:, F7IE% M Ss ca0eçal8os num cat"logo ala0=tico de assuntos em ormato de c8as. Isso az com 'ue se ten8a acesso ao livro so0 'ual'uer um desses ca0eçal8os. Ser", entretanto, extremamente di+cil realizar uma 0usca a res!eito de 'ual'uer com0inação desses termos. Dor exem!lo, um usu"rio 'ue este;a !rocurando livros so0re as relaçes !ol+ticas ou econQmicas entre oçam0i'ue e rica do Sul !recisaria examinar todas as entradas so0 o ca0eçal8o Mk%&IK<: ou so0 o ca0eçal8o F7IE% M S
ou mesmo oçam0i'ue - 7elaçes :conQmicas - rica do Sul
Ms su0ca0eçal8os, no entanto, costumam ser adotados de maneira relativamente !arcimoniosa nos cat"logos de 0i0liotecas, e seria raro o cat"logo 'ue reunisse toda uma se'>ncia1 de termos como na seguinte entrada !r=-coordenada oçam0i'ue, 7elaçes :conQmicas, rica do Sul, /ra0al8adores igrantes, ineiros.
mais !rov"vel 'ue entradas detal8adas como essa a!areçam em +ndices im!ressos do 'ue em cat"logos em c8as. % este res!eito, os +ndices im!ressos são considerados erramentas de recu!eração mais ecientes do 'ue os cat"logos convencionais de 0i0liotecas. :m certos +ndices im!ressos, o usu"rio !ercorreria as entradas so0 oçam0i'ue !ara vericar se alguma delas tam0=m menciona a rica do Sul. :xem!los de v"rias ormas de +ndices im!ressos encontram-se no ca!+tulo 1. as uma entrada como essa do exem!lo a!resenta um !ro0lema ?0vio ela !ro!orciona acesso ao documento somente !ara 'uem estiver !rocurando so0 o termo Mk%&IK<:, sem dar acesso numa 0usca relativa P rica do Sul, mineiros ou tra0al8adores migrantes. Dara 'ue se;am oerecidos !ontos de acesso adicionais = !reciso criar mais entradas no +ndice. 2ão existe maneira alguma !ela 'ual um +ndice im!resso !ossa !ro!orcionar, de orma econQmica, o mesmo n+vel de acesso ao documento 'ue = !ro!orcionado !or um sistema de recu!eração !?s-coordenado. Eonorme mostramos anteriormente, um sistema !?scoordenado !ermite o acesso !or meio de 'ual'uer com0inação de termos atri0u+dos ao documento. M nHmero de com0inaçes = )n-1, onde n re!resenta o nHmero de termos. %ssim, !ara um item indexado so0 cinco termos, 8aver" )4-1 com0inaçes, ou se;a, um total de 31. 1
Dor isso, esse ti!o de indexação = Ps vezes c8amado indexa10o em se4=3ncia \string indexing] BEraven, 195C.
9
/eoricamente, então, um +ndice im!resso !ro!orcionaria todas as com0inaçes de cinco termos, se im!rimisse 31 entradas. Seria economicamente invi"vel criar um +ndice im!resso 'ue contivesse tantas entradas !ara cada item, e a 'uantidade de entradas aumentaria dramaticamente P medida 'ue aumentasse o nHmero de termos - existem )44 com0inaçes de oito termos` %l=m do mais, como os termos devem ser im!ressos um em seguida ao outro numa entrada Bisto =, numa se'>ncia linearC, aos +ndices im!ressos !reside a permuta10o e não a com%ina10o . Dor exem!lo, a se'>ncia Mk%&IK<:, F7IE% M Sncia de termos. ncia de termos em ordem ala0=tica. :sta se'>ncia Bver gura 16C torna-se a !rimeira entrada do +ndice. M !rograma gera, então, todas as demais entradas ;ulgadas necess"rias, o0edecendo a duas regras sim!les 1. Ms termos são sem!re listados em ordem ala0=tica. ). %s se'>ncias redundantes são eliminadas B!or exem!lo, a entrada /ra0al8adores igrantes, ineiros não ser" necess"ria se ;" 8ouver /ra0al8adores igrantes, ineiros, rica do SulC. Kuando esta regra = o0edecida, a 'uantidade de entradas cai de )1L 1 !ara )n-1 . rica do Sul ineiros, rica do Sul ineiros, rica do Sul, oçam0i'ue 7elaçes :conQmicas, rica do Sul 7elaçes :conQmicas, rica do Sul, ineiros 7elaçes :conQmicas, rica do Sul, ineiros, oçam0i'ue 7elaçes :conQmicas, rica do Sul, ineiros, oçam0i'ue, /ra0al8adores igrantes 7elaçes :conQmicas, rica do Sul, ineiros, /ra0al8adores igrantes 7elaçes :conQmicas, rica do Sul, oçam0i'ue 7elaçes :conQmicas, rica do Sul, /ra0al8adores igrantes 7elaçes :conQmicas, /ra0al8adores igrantes, oçam0i'ue, rica do Sul, /ra0al8adores igrantes, rica do Sul, /ra0al8adores igrantes, rica do Sul, ineiros /ra0al8adores igrantes, rica do Sul, ineiros, oçam0i'ue /ra0al8adores igrantes, rica do Sul, oçam0i'ue Figura 16 ( :ntradas de um +ndice SLIE
M m=todo SLIE = engen8oso, !ois !ermite todas as ;usta!osiçes Hteis de termos, !elo menos en'uanto estes orem mantidos em ordem ala0=tica. as tam0=m tem suas desvantagens ainda gera um nHmero 0astante grande de entradas$ o consulente, !ara usar o +ndice com eci>ncia, deve reorganizar mentalmente os termos de 0usca em ordem ala0=tica B!or exem!lo, encontrar" /ra0al8adores igrantes, oçam0i'ue, mas não oçam0i'ue, /ra0al8adores igrantesC$ !erde o contexto !ara os termos situados !erto do in+cio da ordem ala0=tica B!or exem!lo, 'uem !rocurasse todas as entradas so0 rica do Sul não teria id=ia alguma so0re o assunto deste itemC. Mutros +ndices 0aseiam-se num con;unto de entradas 'ue se o0t>m sistematicamente mediante alternação \cycling], rotação ou deslocamento \ shunting ]. 2a alterna10o, cada termo numa se'>ncia = movido !ara a !osição mais P es'uerda, a m de se tornar um !onto de entrada, sendo os demais termos listados de!ois dele %&EM: &EM:% EM:%& M:%&E :%&EM
2ote-se 'ue, a!?s o termo de entrada, v>m !rimeiro os termos 'ue o seguiam na se'>ncia original e, de!ois, os 'ue originalmente o !recediam. 2o +ndice alternado, a 4
sucessão de termos numa se'>ncia não !recisa dis!or-se segundo uma ordem evidente, em0ora este;am re'entemente ordenados ala0eticamente e !ossam ser ordenados RsistematicamenteO Bcomo se ver" adianteC. % rotação = essencialmente o mesmo 'ue a alternação, exceto 'ue o termo de entrada = ressaltado de alguma orma B!or exem!lo, griado ou su0lin8adoC, em vez de ser deslocado !ara a !osição mais P es'uerda %&EM: %&EM: %&E: %&E: %&EM: /anto a alternação 'uanto a rotação !ro!orcionam um certo RcontextoO !ara um termo, mas as relaçes entre alguns dos termos ainda !ermanecem o0scuras ou am0+guas.
&.% &.E. E.
M !rinci!al exem!lo disso, 'ue = o D7:EIS, ser" examinado mais adiante.1 ncia de modicadores. %inda 'ue isso não ense;e todas as ;usta!osiçes !oss+veis de termos, na realidade oerece algumas vantagens evidentes em com!aração com o SLIE = mais econQmico Bnão 8" mais entradas do 'ue a 'uantidade de termos atri0u+dosC e cada entrada conta com seu RcontextoO com!leto. 2esse ti!o de +ndice im!resso = !oss+vel recon8ecer dois ti!os de termos os 'ue geram entradas de +ndice e os 'ue não as geram. Ms termos 'ue não irão gerar entradas são marcados de alguma orma !elo indexador Bou são recon8ecidos automaticamenteC. /ais termos serão utilizados a!enas como modicadores. %!arecem no nal da se'>ncia de termos e são recon8ecidos !or estarem ora da ordem ala0=tica e talvez im!ressos com dierente estilo de letra Bver o exem!lo R0i0liograaO na gura 1C. rica do Sul, ineiros, oçam0i'ue, 7elaçes :conQmicas, /ra0al8adores igrantes, &i0liograa ineiros, rica do Sul, oçam0i'ue, 7elaçes :conQmicas, /ra0al8adores igrantes, &i0liograa oçam0i'ue, rica do Sul, ineiros, 7elaçes :conQmicas, /ra0al8adores igrantes, &i0liograa 7elaçes :conQmicas, rica do Sul, ineiros, oçam0i'ue, /ra0al8adores igrantes, &i0liograa /ra0al8adores igrantes, rica do Sul, ineiros, oçam0i'ue, 7elaçes :conQmicas, &i0liograa Figura 1 ( :ntradas de +ndice 0aseado na alternação sistem"tica Bmodelo da !xcerpta MedicaC
Ms +ndices exem!licados nas guras 16 e 1 !ressu!em o em!rego de termos de indexação e não de texto livre, em0ora, em !rinc+!io, !ossam ser !roduzidos !or com!utador de!ois 'ue, mediante !rogramas, ten8am sido extra+das do texto narrativo rases RsignicativasO. %lguns m=todos ainda mais sim!les de !rodução de +ndices im!ressos oram criados !ara tra0al8ar com textos e, es!ecialmente, !alavras 'ue ocorrem nos t+tulos dos documentos. Ms m=todos mais adotados são o ZWIE B -ey8ord in context C \!alavra-c8ave no contexto], ZWME BXeAVord out o contextC \!alavra-c8ave ora do contexto] e suas variantes. M +ndice ZWIE BLu8n, 1949C = um +ndice rotado, derivado, em sua orma mais comum, dos t+tulos de !u0licaçes. Eada palavra2chave 'ue a!arece num t+tulo torna-se !onto de entrada, % terminologia relativa a +ndices !r=-coordenados não se ac8a realmente !adronizada. Dor exem!lo, Eraven B195C !arece 'ue não az distinção entre alternação e rotação. 1
41
destacada de alguma orma, a!arecendo, normalmente, realçada no centro da !"gina como no exem!lo da gura 19. %s !alavras restantes do t+tulo a!arecem RenvolvendoO a !alavra-c8ave. M +ndice ZWIE constitui o m=todo mais sim!les de !rodução de +ndices im!ressos !or com!utador, no entanto, tem alguma eci>ncia, !ois cada !alavra-c8ave = vista em seu RcontextoO. Dor exem!lo Bgura 19C$ = !oss+vel !ercorrer as entradas !ara RcrystalsO \cristais] em 0usca das 'ue !areçam tratar das !ro!riedades el"sticas ou !l"sticas dos cristais. Ms +ndices ZWIE normalmente remetem a!enas !ara alguma orma de nHmero de documento, sendo !reciso re!ortar-se a esse nHmero a m de o0ter inormaçes 0i0liogr"cas com!letas so0re o item re!resentado. 2ote-se 'ue o !rograma de com!utador 'ue gera o +ndice identica as !alavras-c8ave mediante um !rocesso RreversoO recon8ece as 'ue não são !alavras-c8ave Bconstantes de uma lista de !alavras !roi0idasC e im!ede 'ue se;am adotadas como !ontos de entrada. Ms voc"0ulos dessa lista de !alavras !roi0idas t>m unção sint"tica Bartigos, !re!osiçes, con;unçes, etc.C, mas, em si mesmos, não !ossuem conteHdo tem"tico. M +ndice ZWIE = um m=todo 0arato de o0ter certo n+vel de acesso tem"tico ao conteHdo de uma coleção. Htil na medida em 'ue os t+tulos se;am 0ons indicadores de conteHdo B!or isso, = !rov"vel 'ue uncione mel8or com certos assuntos ou ti!os de materiais do 'ue com outrosC, em0ora, em !rinc+!io, não 8a;a motivo !ara 'ue os +ndices ZWIE não derivem de outro texto, como, !or exem!lo, rases de resumos ou at= se'>ncias de ca0eçal8os de assuntos. uitos estudos oram eitos so0re a utilidade dos t+tulos na recu!eração Bver Yodges, 193, e Y;orland e 2ielsen, )1C. Ms t+tulos !odem tam0=m car mais inormativos com o acr=scimo ou enri'uecimento. Isto =, outras !alavras são acrescentadas ao t+tulo, normalmente entre !ar>nteses, !ara ex!lic"-lo ou torn"-lo uma descrição mais com!leta do conteHdo do item.
Figura 19 ( :xem!lo de entradas de um +ndice ZWIE
7e!roduzido de ZWIE Index o 7ocX ec8anies Literature, com !ermissão do %merican Institute o ining, etallurgical and Detroleum :ngineers, Inc.
M +ndice ZWME = similar ao ZWIE, exceto 'ue as !alavras-c8ave 'ue se tornam !ontos de acesso são re!etidas ora do contexto, comumente destacadas na margem es'uerda da !"gina Bgura )C ou usadas como se ossem ca0eçal8os de assuntos Bgura )1C. Faz-se Ps vezes uma dierença entre +ndices ZWME e +ndices ZW%E B-ey8ord and context \!alavra-c8ave e contexto]C. Kuem adota essa distinção c8ama de +ndices ZW %E os +ndices mostrados nas guras ) e )1.
cada !alavra-c8ave do t+tulo = ligada, uma !or vez, com outra !alavrac8ave nesse t+tulo, !or exem!lo E7IS/%IS %L<J2IM )61 %2LIS: 1) EM&%L/M 9 E7:SEI:2/M )61 :SLME%k:S 66 :K
Ms seguintes exem!los, extra+dos de %rmstrong e Zeen, demonstram o !rinc+!io Indexação de Deri?dicos de Ku+mica !or Des'uisadores Deri?dicos de Ku+mica, Indexação de, !or !es'uisadores Ku+mica, Deri?dicos de, Indexação de, !or !es'uisadores
43
Figura ) ( %mostra das entradas de um +ndice ZWME
7e!roduzida de <.S @overnment /8ec8nical 7e!orts *olume I, 1953, com !ermissão do 2ational /ec8nical Inormation Service
2ote-se 'ue = mantida a sintaxe do texto original de modo 'ue o signicado do enunciado original não ca o0scuro. :sses enunciados de indexação !odem ser !re!arados !elo indexador, o0edecendo a um con;unto !rescrito de regras, ou !odem ser desenvolvidos !rogramas de com!utador 'ue geram essas entradas B%rmitage LAnc8, 195$ LAnc8 Detrie, 1963C.
4
Figura )1 ( Formato alternativo de um +ndice ZWME usado no ia0etes-7elated Literature Index, su!lemento de ia0etes, volume 1), 195. Eo!Arig8t 195 0A t8e %merican ia0etes %ssociation. 7e!roduzido com !ermissão
gerar" as duas entradas seguintes Drodutividade das Des'uisas de :s!ecialistas do Sono :s!ecialistas do Sono, Drodutividade das Des'uisas de
Eraven ela0ora este !rinc+!io sim!les com o acr=scimo de outros s+m0olos e convençes a serem utilizados !elo indexador !ara criar entradas de +ndice 'ue se;am coerentes e ine'u+vocas, al=m de Hteis. M tra0al8o de %rmstrong e Zeen B19)C nos d" uma id=ia das !ossi0ilidades deste m=todo de indexação relativamente sim!les. &astante semel8ante ao 2:DYIS = o sistema D%SI BDragmatic %!!roac8 to Su0;ect Indexing \=todo Dragm"tico de Indexação de %ssuntos]C descrito !or utta e Sin8a B19C. 44
*ale a !ena citar 0revemente outro sistema de indexação. M SDI2: BSelective Dermutation Index \Jndice de Dermutação Seletiva]C, criado !ara a indexação de undos ar'uiv+sticos, originalmente não !assava de um +ndice ZW %E ou ZWME B&urXe, 1956C. :m verses !osteriores, soreu alteraçes !ara !roduzir entradas de +ndice de dois n+veis, 'ue consistiam em !alavras-c8ave !rinci!ais e 'ualicadoras, como nos exem!los %7I_M2%, Kuestes ind+genas, e K<:S/:S I2J@:2%S, %rizona BEooX, 19C. Lamentavelmente, a sigla SDI2:, com o signicado de Su0;ect Drole lndex \Jndice de Derl de %ssuntos], oi tam0=m usada !ara um ormato dierente !or !arte de !rodutores de v"rios +ndices im!ressos, inclusive o %merican &i0liogra!8ical Eenter B'ue edita ;istorical A%stracts e Americal ;istory and ieC. :ste m=todo, de!ois denominado %&ESDI2: B%merican &i0liogra!8ical EenterOs Su0;ect Drole IndexC !ara dierenç"-lo do SDI2:, com o 'ual não tem relação, !arece ser !raticamente id>ntico aos +ndices alternados utilizados !ela !xcerpta Medica BFalX &aser, 19C. %lassicação em &ndices de assuntos
/odos os +ndices at= a'ui examinados adotam m=todos 'ue são Rala0=ticosO, mas não Rsistem"ticosO. Mutros ti!os de +ndices exigem 'ue as entradas se;am constru+das segundo !rinc+!ios Rl?gicosO. :sses m=todos remontam a Eutter B165C, 'ue esta0eleceu regras !ara 'uestes como entrada direta versus entrada invertida BYist?ria da %ntiguidade ou %ntiguidade, Yist?riaC. Zaiser B1911C introduziu um eno'ue mais ela0orado, 'ue recon8ecia tr>s categorias de termos concretos, !rocessos e termos de localidade. REoncretosO são termos relativos a RcoisasO, reais ou imagin"rias, e R!rocessosO a0rangem atividades. Zaiser determinava 'ue os RenunciadosO de indexação a!resentassem os termos em se'>ncia sistem"tica e não em ordem ala0=tica. S? eram !ermitidas tr>s se'>ncias 1. Eoncreto-Drocesso Bcomo em /u0os-Soldagem ou /u0os de %ço-SoldagemC ). Localidade-Drocesso Bcomo em %rgentina - Eom=rcioC 3. Eoncreto ( Localidade - Drocesso Bcomo em Ea= - &rasil - :x!ortaçãoC % m de o0edecer Ps regras de Zaiser, o indexador deveria evidenciar um termo concreto 'ue se ac8asse im!l+cito. Dor exem!lo, o termo dessalinização tornar-se- ia gua essalinização. %tri0ui-se a 7anganat8an o mais im!ortante desenvolvimento 'ue teve lugar de!ois disso. :m0ora seu nome este;a undamentalmente ligado Ps teorias da classicação e a seu !r?!rio es'uema de classicação 0i0liogr"ca, a "olon "lassifcation \Elassicação dos ois Dontos], 7anganat8an tam0=m !restou im!ortante contri0uição P !r"tica moderna da indexação ala0=tica de assuntos. Sua indexa10o em cadeia constitui uma tentativa de o0ter um !rocesso de desenvolvimento coerente do +ndice ala0=tico de assuntos do cat"logo sistem"tico Bem orma de c8as ou de livroC. Ms !rinc+!ios de seu es'uema de classicação, 0em como suas teorias da classicação, ogem ao esco!o deste livro. &astaria dizer 'ue uma das !rinci!ais caracter+sticas dos es'uemas de classicação ela0orados de conormidade com os !rinc+!ios de 7anganat8an = a Rs+nteseO ou Rconstrução de nHmerosO. Kuer dizer, o nHmero de classicação 'ue re!resenta um assunto com!lexo = o0tido !ela reunião dos elementos notacionais 'ue re!resentam assuntos mais sim!les. Dor exem!lo, o t?!ico Rconecção de rou!as de lã na %leman8a no s=culo IO = re!resentado !ela notação A%";>4?h, na 'ual A% re!resenta Rrou!asO, "@l0@ , ; RconecçãoO , >4 R%leman8aO, e ?h Rs=culo IO, sendo todos estes elementos notacionais retirados de dierentes !artes do es'uema de classicação e com0inados numa se'>ncia BRordem !reeridaO ou Rordem de citaçãoOC es!ecicada !elo com!ilador do es'uema. ?0vio 'ue o +ndice ala0=tico de um cat"logo sistem"tico ela0orado segundo esses !rinc+!ios deve ser desenvolvido de orma coerente, senão resultar" em algo ca?tico e im!oss+vel de usar. % solução dada !or 7anganat8an a este !ro0lema - a indexação em cadeia - im!lica 'ue se indexe cada degrau da cadeia 8ier"r'uica, do mais es!ec+co at= o mais gen=rico. %ssim, um item re!resentado !ela classicação A%";>4?h geraria as seguintes entradas no +ndice S=culo I, %leman8a, Eonecção, %rtigos de Lã, 7ou!as A%";>4?% %leman8a, Eonecção, %rtigos de Lã, 7ou!as A%";>4 Eonecção, %rtigos de Lã, 7ou!as A%"; %rtigos de Lã, 7ou!as A%" 7ou!as A%
45
:videntemente, o usu"rio desse ti!o de +ndice deve azer a 0usca o0edecendo tam0=m a uma se'>ncia !redenida de termos. Dor exem!lo, se estivesse !rocurando inormaçes so0re rou!as na %leman8a no s=culo I, de !ouca valia l8e seria esse +ndice ao consultar o termo rou!as. %o determinar a se'>ncia em 'ue os nHmeros de classicação são com0inados num es'uema de classicação Ranal+tico-sint=ticoO Bre'entemente denominado, um tanto e'uivocadamente, RacetadoOC, 7anganat8an c8egou a cinco Rcategorias undamentaisO e a uma ?rmula de reuni-las. %s categorias, Dersonalidade, at=ria, :nergia, :s!aço e /em!o, são com0inadas nesta se'>ncia e a ormula = Ps vezes denominada sim!lesmente RD:S/O \onde o S corres!onde P letra inicial de Rs!aceO, es!aço em ingl>s]. M modo mais "cil de descrever a Dersonalidade = como Ra coisa em siO. at=ria = o material de 'ue a coisa = com!osta. :nergia = a ação realizada na ou !ela coisa. :s!aço = onde a ação se verica, e /em!o = 'uando ela ocorre. % se'>ncia A%";>4?h o0edece P ordem D:S/. Dor conseguinte, a entrada num +ndice em cadeia de um item categorizado dessa orma ser" o inverso dessa ordem. % se'>ncia Rl?gicaO das acetas esta0elecida !or 7anganat8an !ara a construção de nHmeros !ode ser tam0=m adotada em cat"logos e +ndices ala0=ticos de assuntos. Doder-sela, assim, ela0orar uma entrada de +ndice l?gica, de acordo com a ?rmula D:S/, da seguinte orma 7ou!as %rtigos de Lã Eonecção %leman8a S=culo I
Inelizmente, a ?rmula D:S/ = um !ouco sim!lista. %o indexar assuntos altamente com!lexos, = !oss+vel 'ue uma categoria ocorra mais de uma vez B!or exem!lo, a tensão exercida so0re uma estrutura !ode levar ao rac8amento dessa estrutura, o 'ue im!lica duas ocorr>ncias dierentes da categoria RenergiaOC$ algumas das categorias !recisam ser su0divididas mais ainda B!or exem!lo, !ara indicar dierentes ti!os de atividadesC$ ademais, a ?rmula D:S/ não trata claramente de certos atri0utos 'ue são im!ortantes na indexação, tais como as !ro!riedades dos materiais. %s teorias de 7anganat8an, no entanto, tiveram !roundo eeito nas !r"ticas modernas da indexação de assuntos. Isso se verica de modo !atente, na o0ra de Eoates B195C, 'ue !ostula um cat"logo ou +ndice des!ido da rigidez dos ca0eçal8os de assuntos !reesta0elecidos.
Eoates utiliza uma R?rmula de im!ortnciaO !ara esta0elecer a se'>ncia em 'ue os termos com!onentes .serão reunidos. % se'>ncia 0"sica 'ue adota = Eoisa, Darte, aterial, %ção, Dro!riedade, a 'ual, !or=m, !ode ser modicada em determinadas circunstncias. M ca0eçal8o utilizado acima, !or exem!lo, adota a se'>ncia Eoisa, :s!=cie, Darte, %ção, %gente. Ms !rocessos desenvolvidos !or Eoates oram adotados !elo $ritish echnology Index B!osteriormente denominado "urrent echnology Index C, do 'ual ele oi o !rimeiro editor. % gura )) mostra exem!los de entradas desse +ndice. M0serve-se 'ue um item a!arece uma Hnica vez no +ndice. Dro!orcionam-se acessos adicionais !or meio de remissivas. Dode-se tam0=m !onderar 'ue as teorias de 7anganat8an exerceram inNu>ncia so0re o D7:EIS BDreserved Eontext Index SAstem \Sistema de Indexação de Eontexto Dreservado]C, desenvolvido !or %ustin B%ustin, 19C. 2o D7:EIS, !rogramas de com!utador geram um con;unto com!leto de entradas de +ndice e remissivas a !artir de uma se'>ncia de termos e c?digos de instrução ornecidos !elo indexador !ara cada item. M conteHdo tem"tico de um documento = descrito !or meio de uma s=rie de termos colocados numa se'>ncia Rde!endente do contextoO. %ustin e igger B1966C utilizam o seguinte exem!lo Jndia, IndHstria algodoeira, Dessoal, /reinamento
%lega-se 'ue a l?gica disso est" em 'ue cada termo = essencialmente de!endente do termo 'ue o antecede imediatamente. %ssim, RtreinamentoO a!lica-se somente ao contexto de R!essoalO, R!essoalO a!lica-se somente ao contexto da RindHstria algodoeiraO, e esta se a!lica somente ao contexto da Jndia. 46
2o D7:EIS, as relaçes entre os termos com!onentes de uma entrada do +ndice são evidenciadas numa dis!osição em duas lin8as Dessoal. IndHstria algodoeira. Jndia /reinamento
Isso = ;usticado com o argumento de 'ue !ro!orciona uma orma !r"tica de mostrar, simultaneamente, a relação entre o termo em!regado como !onto de entrada no +ndice e os termos 'ue são aC de contexto mais am!lo, e 0C de contexto mais restrito. 2o exem!lo acima, RDessoalO = modicado !or RIndHstria algodoeiraO e RJndiaO a m de mostrar o contexto mais am!lo, en'uanto R/reinamentoO = a!resentado como um de!endente de RDessoalO. Eomo se v> neste exem!lo, uma entrada D7:EIS cont=m tr>s com!onentes
M termo RguiaO = o !onto de entrada no +ndice, sendo im!resso em negrito, o R'ualicadorO a!resenta o contexto mais am!lo, e a Rex!osiçãoO mostra os termos de contexto mais restrito. :m0ora a !osição de guia este;a evidentemente sem!re ocu!ada, as outras !osiçes nem sem!re !recisam estar ocu!adas. :ntradas do ti!o geral acima exem!licado !odem ser geradas !or com!utador a !artir de uma s=rie de termos a!resentados numa se'>ncia de!endente de contexto. %ssim, a se'>ncia Jndia, IndHstria algodoeira, Dessoal, /reinamento geraria as seguintes entradas Jndia IndHstria algodoeira. Dessoal. /reinamento IndHstria algodoeira. Jndia Dessoal. /reinamento
Inelizmente o !rocesso não = tão sim!les 'uanto o 'ue sugere este Hnico exem!lo. Y" muitos casos em 'ue a se'>ncia numa s=rie de termos não revela, !or si mesma e de modo ine'u+voco, as de!end>ncias. 2a realidade, um indexador 'ue utilize o D7:EIS dever" em!regar Ro!eradoresO Bc?digos axados aos termos com!onentesC, a m de re!resentar sem am0igidade as relaçes entre os termos. Dara o exem!lo mostrado antes a se'>ncia de entrada seria BC Jndia B1C indHstria algodoeira B!C !essoal B)C treinamento Mnde B)C re!resenta Ração de transiçãoO, BDC Ro0;eto de ação, !arte do sistema - c8aveO, BoC RlocalizaçãoO, e B1C Rsistema-c8aveO Bo0;eto da ação transitivaC. :stes o!eradores mostram a RunçãoO 'ue um termo desem!en8a em relação a outros termos B!ro!orcionando uma es!=cie de sintaxeC e assim !odem ser considerados comoO indicadores de unçãoO ou Ro!eradores de unçãoO. %ustin e igger a!resentam uma lista de )5 o!eradores desse ti!o. claro 'ue a utilização desse es'uema torna 0astante com!licada a o!eração de indexação e eleva seu custo, al=m de exigir, !ara im!lant"-lo, um extenso manual de instruçes !ara a indexação. e algum modo relacionado com o D7:EIS 8" o sistema DMDSI BDostulate0ased Dermuted Su0;ect Indexing \Indexação Dermutada de %ssunto com &ase em Dostulados]C B&8attac8arAAa, 191C, ins!irado nas teorias de 7anganat8an so0re classicação. M es'uema de indexação de Farradane B1956, 19C, anterior ao D7:EIS, guarda semel8ança com este !or tam0=m utilizar um es'uema de indicadores de unção. :n'uanto o D7:EIS em!rega suas unçes exclusivamente como meio de gerar !or com!utador enunciados de indexação coerentes, as unçes são reservadas no sistema de Farradane !ara indicar relaçes !recisas entre os termos. :stas relaçes se 0aseiam nos tra0al8os de !sicologia ex!erimental do racioc+nio, de Diaget, *inacXe, Isaacs e outros autores, e corro0oradas !elo tra0al8o de @uilord so0re a Restrutura do intelectoO. 2o es'uema de Farradane 8" nove relaçes ex!l+citas, cada uma re!resentada !or um Ro!eradorO. M con;unto com!leto dos o!eradores encontra-se na gura )3. M es'uema 4
re!resenta est"dios de desenvolvimento do racioc+nio extra+dos da !sicologia inantil, isto =, os est"dios !elos 'uais a criança se desenvolve ao associar e dierençar o0;etos. Y" dois con;untos de gradação em mecanismos associativos e em mecanismos discriminativos. M !rimeiro est"dio associativo = a !erce!ção sim!les sem reer>ncia ao tem!o$ o segundo = a associação tem!or"ria entre id=ias$ e o terceiro = a associação xa B!ermanenteC de id=ias. Ms est"dios de discriminação são coincid>ncia sim!les Bconceitos di+ceis de discriminarC, nãodistinto Bconceitos 'ue t>m muito em comumC e conceituação distinta Bconceitos 'ue !odem ser com!letamente discriminadosC.
Figura )) ( :xem!lo de entradas do &ritis8 /ec8nologA lndex 7e!roduzido com gentil !ermissão de ES%
Eonstr?em-se os enunciados de indexação mediante a reunião de termos BRisoladosOC, usando esses o!eradores.
e outro mais com!lexo *idro # BMxig>nio#C FlHor # - Su0stituição
'ue re!resenta a su0stituição do oxig>nio !elo NHor no vidro.
M armazenamento de 0eterra0as lavadas
Lavagem
49
7ato #
wSucrose
7atos alimentados com
wleo de coco #-%limentação
sucrose com ?leo de coco
Farradane B1966C com!arou seu sistema de indexação relacional com o D7:EIS, o 2:DYIS e o DMDSI, aos 'uais se reere de modo im!reciso como ca!azes de !roduzir +ndices R!ermutadosO. %lega ser !oss+vel converter !or com!utador seus diagramas 0idimensionais em entradas de +ndices ala0=ticos !ermutados.
Figura )3 ( Sistema de relaçes de Farradane
7e!roduzido de Farradane B19C com gentil !ermissão de ES%
@ardiner et al. B1994C recon8ecem a inNu>ncia de Farradane em sua a0ordagem das 0uscas em 0ases de dados de textos. Isto =, seus !rocedimentos de 0usca !rocuram textos em 'ue os termos dese;ados !arecem relacionar-se entre si na orma exata exigida !elo enunciado de 0usca. M SAm0olic S8ort8and SAstem \Sistema /a'uigr"co Sim0?lico] BSelAe, 1955$ SelAe e :m0er, 195C = outro sistema de indexação 'ue ex!ressa relaçes entre termos mediante indicadores de unção. M indexador extrai os termos de um es'uema de classicação, 'ue com!reende ) classes !rinci!ais, organizado !redominantemente com 0ase no sistema do cor!o 8umano. :m todo o es'uema são em!regados s+m0olos mnemQnicos \v"lidos !ara a l+ngua inglesa, 2./.] !ara re!resentar os assuntos. Dor exem!lo, %dr re!resenta a glndula adrenal, YA!t 8i!ot"lamo, &7 a taxa de meta0olismo 0asal, e assim !or diante. M !rinci!al indicador de unção de SelAe = uma Nec8a B C 'ue mostra a direção da ação, como em
Eer
%E/Y
:eito do 8ormQnio adrenocorticotr?co so0re o c=re0ro
ou no exem!lo mais com!lexo %dr
YA!
%E/Y /
:eito so0re a ad-renal da 8i!osectomia em associação com o 8ormQnio adrenocorticotr?co e a tiroxina
Mutros indicadores de unção mostram outras relaçes. Dor exem!lo, o s+m0olo U = usado !ara indicar conteHdo ou com!onente B@lu U & re!resenta açHcar no sangueC e os dois !ontos BC !ara a unção de com!aração. EonteHdos tem"ticos 0astante com!lexos !odem ser re!resentados de modo conciso e ine'u+voco neste sistema, conorme mostram os seguintes exem!los 7
BRF
7#
BIn;eção de su0stncia renal do !ato no sangue de coel8o e in;eção do soro assim o0tido em ratos, !roduzindo alteraçes renaisC @lu U & B
EM2
B:eito da cortisona so0re o conteHdo de açHcar no sangue com!arado como conteHdo de açHcar na urinaC =el de coordenação
:sta0eleceu-se uma distinção entre sistemas !r=-coordenados e !?s-coordenados. 2a realidade, !or=m, = !rov"vel 'ue um sistema de recu!eração da inormação moderno incor!ore caracter+sticas de !r=-coordenação, 0em como recursos de !?s-coordenação. Dossivelmente 8aver" certa !r=-coordenação no voca0ul"rio utilizado na indexação. Dor 5
exem!lo, o descritor E7:SEI:2/M DMD
Finalmente, a !essoa 'ue az a 0usca !ode com0inar termos livremente em relaçes l?gicas, como, !or exem!lo, Rrecu!erar itens indexados so0 E7:SEI:2/M DMD
%inda 'ue muitos dos !rinc+!ios examinados neste livro se;am v"lidos !ara +ndices de todos os ti!os, sua atenção se concentra !rinci!almente na indexação destinada a 0ases de dados de itens 0i0liogr"cos - indexação !?s-coordenada !ara 0ases de dados em ormato eletrQnico, e indexação !r=-coordenada !ara a'uelas em orma im!ressa. 2ão se tentou a!resentar instruçes minuciosas so0re a indexação de livros como !eças isoladas. :ste t?!ico encontra-se 0em estudado em outras !u0licaçes B!or exem!lo, ulvanA, 199$ @uidelines or indexes, 1996C. iodato B199C a!resenta resultados de estudo so0re !reer>ncias dos usu"rios em mat=ria de +ndices de livros$ são com!aradas as o!inies de 0i0liotec"rios e !essoal docente. Ms estudos mais com!letos so0re +ndices de livros !arecem ser os relatados !or &is8o! et al. B1991C e LiddA et al. B1991C. 2esse !ar de estudos ans, o !rimeiro analisa as caracter+sticas de uma amostra de +ndices Bormato, arran;o e 'uestes similaresC, en'uanto o segundo examina as !ol+ticas das editoras B!or exem!lo, 'uem ela0ora o +ndice, exig>ncias ormaisC$ este artigo tam0=m inclui algumas inormaçes so0re caracter+sticas dos +ndices e concluses relativas ao !ro;eto como um todo. LiddA e Tyrgensen B1993aC usaram estudantes como volunt"rios, a m de vericar como realmente utilizavam o +ndice de um livro. 9ndices pr<2coordenados #ersus &ndices ps2coordenados
Ms +ndices im!ressos do ti!o 'ue oi examinado neste ca!+tulo !odem ser muito ecazes na localização de um ou RalgunsO itens so0re um assunto de modo 0em r"!ido. %lguns autores, !or=m, !arecem exagerar ao louvar as virtudes dos +ndices !r=-coordenados. Eriticam a recu!eração !?s-coordenada com o argumento de 'ue seus resultados são med+ocres Bver Wein0erg, 1994, !or exem!loC, como, !or exem!lo, excessiva irrelevncia, em0ora isso !ossa ocorrer com todos os m=todos, e 'ue muitos usu"rios t>m diculdade !ara com!reender a l?gica das 0uscas. :ssa Hltima alegação = certamente verdadeira, mas tam0=m = verdade 'ue muitas !essoas enrentam enorme diculdade !ara entender e usar o mais sim!les dos +ndices im!ressos Bver, !or exem!lo, LiddA e Tyrgensen, 1993a,0C. iante da o!ção, os usu"rios das 0i0liotecas !arecem !reerir, de modo esmagador, as 0uscas !?s-coordenadas em 0ases de dados eletrQnicas em com!aração com o uso dos +ndices im!ressos Bver, !or exem!lo, asseA - &urzio, 199C, em0ora, de ato, !ossam o0ter resultados muito ineriores em suas 0uscas Bver !. 1)1-1)6 de Lancaster e Sandore, 1996C.
51
%ap&tulo > 0 %oerncia da indexação : mais do 'ue evidente 'ue a indexação = um !rocesso su0;etivo e não o0;etivo. uas Bou maisC !essoas !ossivelmente divergirão a res!eito do 'ue trata uma !u0licação, 'uais as!ectos merecem ser indexados, ou 'uais os termos 'ue mel8or descrevem os temas selecionados. %demais, uma mesma !essoa decidir" de modo dierente 'uanto P indexação em momentos dierentes. % coer>ncia na indexação reere-se P extensão com 'ue 8" concordncia 'uanto aos termos a serem usados !ara indexar o documento. % coer>ncia interindexadores reere-se P concordncia entre indexadores, en'uanto a coer>ncia intra-indexador reere-se P extensão com 'ue um indexador = coerente consigo mesmo. T" oram adotadas ou !ro!ostas v"rias medidas dierentes !ara a coer>ncia, e so0re as 'uais existe uma 0oa revisão 0i0liogr"ca eita !or Leonard B1964C. /alvez a medida mais comum se;a a sim!les relação % B% &C, onde % re!resenta os termos atri0u+dos !elo indexador a, & re!resenta os termos atri0u+dos !elo indexador 0, e %& re!resenta os termos com os 'uais a e 0 concordam. *e;amos a situação retratada na gura ). Einco !essoas indexaram o mesmo item, com o nHmero de termos atri0u+dos variando de 'uatro Bindexador 0C a oito Bindexador eC. Dodem-se com!arar os termos atri0u+dos !or 'ual'uer !ar de indexadores. Yoo!er B1954C reere-se aos valores da coer>ncia de !ares como !ares de coer>ncia B!csC. Dara os indexadores a e 0, o DE = 3#5 ou ,4 Bexistem seis termos exclusivos atri0u+dos e tr>s deles oram atri0u+dos !or am0osC. Eada !ar do gru!o = tratado da mesma ormaC a. % !artir dos dados a!resentados são derivados os seguintes DEs a0, B,4C$ ac, #6 B,46C$ ad, #5 B,64C$ ae, #9 B,C$ 0c, 3#6 B,3C$ 0d, )#6 B,)9C$ 0e, # B,4C$ cd, 3# B,36C$ ce, 4#9 B,45C$ de, 3#1 B,3C. M0t=m-se uma medida da coer>ncia intergru!al !or meio da determinação da m=dia dos resultados !ara cada !ar de indexadores. Dara o gru!o a-e a coer>ncia glo0al = de a!roximadamente ,6. Se a se'>ncia de termos na gura ) reNete !rioridade na atri0uição de termos, verica-se 'ue existe concordncia razo"vel 'uanto aos termos mais im!ortantes. /odos os cinco indexadores atri0uem o termo %, e 'uatro deles atri0uem tanto % 'uanto &. *erica-se muito menos concordncia 'uanto aos as!ectos secund"rios do documento ou 'uais os termos a serem atri0u+dos a esses as!ectos. M0serve-se tam0=m como a 'uantidade de termos atri0u+dos inNui no escore da coer>ncia 'uanto mais termos atri0u+dos B!elo menos at= certo !ontoC, menor tender" a ser a coer>ncia. _unde e exter B1959 0C e 7olling B191C sugerem 'ue as medidas de coer>ncia deveriam levar em conta a im!ortncia de diversos termos !ara o conteHdo tem"tico do documento. % incoer>ncia na atri0uição de termos de menor im!ortncia ser" muito menos signicativa do 'ue a incoer>ncia na atri0uição de termos de maior im!ortncia, e isso se reNetiria em 'ual'uer m=todo de !ontuação. a % & E C :
0 % & : F
c % E C : F @
d % & E C Y
e % & C : F @ I T
Figura ) ( /ermos B - TC atri0u+dos ao mesmo documento !or cinco indexadores dierentes Ba - eC
Ms dados da gura ) !oderiam tam0=m re!resentar a coer>ncia intraindexador a situação em 'ue uma !essoa indexa o mesmo documento em cinco ocasies dierentes. Eoo!er B1959C considera a coer>ncia interindexadores de modo dierente no n+vel do termo. Kuer dizer, ele mede o grau com 'ue um gru!o de indexadores concorda com a atri0uição de determinado termo a um documento. Eom relação a esse termo, a coer>ncia interindexadores = denida como a !ro!orção de indexadores 'ue atri0uem o termo menos a !ro!orção da'ueles 'ue não o atri0uem do exem!lo da gura ) 8" 1f de concordncia 'uanto ao termo %, en'uanto a concordncia 'uanto a & tem um valor de 5f Bf-)fC, a concordncia 'uanto a E tem um valor de ) B5f-fC, e assim !or diante. T" oram realizados muitos estudos so0re coer>ncia interindexadores, em0ora 8o;e não se;am tão comuns 'uanto no !assado$ eles costumam mostrar 'ue = muito di+cil alcançar alto n+vel de coer>ncia. Yoo!er B1954C ez um resumo de 1 estudos dierentes e encontrou valores 5)
'ue variavam de 1f a f. Dara os seis estudos em 'ue !Qde recalcular os valores a !artir dos dados ornecidos B!ara ter certeza de 'ue a coer>ncia seria calculada da mesma orma !ara cada umC, os resultados variaram de )f a f. Draticamente todos os estudos so0re coer>ncia interindexadores at= 8o;e realizados tratam cada termo como igual, em0ora, conorme sugerido antes, osse mais sensato atri0uir um R!esoO maior P coer>ncia na atri0uição dos termos mais im!ortantes. Mutra com!licação est" no ato de 'ue, com certos ti!os de voca0ul"rios controlados e !rocedimentos de indexação, seria !oss+vel a ocorr>ncia de uma coincid>ncia !arcial. Dor exem!lo, dois indexadores concordariam com o mesmo ca0eçal8o !rinci!al, mas não com o su0ca0eçal8o. *e;amos o exem!lo a seguir em 'ue as letras maiHsculas re!resentam ca0eçal8os e o asterisco marca os ca0eçal8os 'ue o indexador considera mais im!ortantes Indexador / %#0 #c c# # :
Indexador 3 %#E E c# #r F @
Indexador 7 %#0 E # F Y#' I
/rata-se de uma situação realista. Dor exem!lo, ela se assemel8a de !erto P !r"tica de indexação da 2ational Li0rarA o edicine onde mais de um su0ca0eçal8o !ode ser atri0u+do a um termo e os descritores !rinci!ais são dierençados dos menos im!ortantes. claro 'ue esse ti!o de indexação a!resenta !ro0lemas im!ortantes na realização de estudos de coer>ncia. %'ui deixa de ter signicado o m=todo sim!les do !ar de coer>ncia. 2a indexação desse ti!o, dever-se-ia dar mais Rcr=ditoO a uma !ereita concordncia entre dois indexadores. Dor exem!lo, os indexadores 1 e 3 mereceriam grande cr=dito !elo ato de am0os concordarem com a com0inação %#0 de ca0eçal8o !rinci!al#su0ca0eçal8o e de 'ue este seria um descritor !rinci!al. :m0ora se;a !oss+vel desenvolver um m=todo de !ontuação num=rica !ara ex!ressar a coer>ncia B4 !ontos !ara uma !ereita concordncia ca0eçal8o !rinci!al#su0ca0eçal8o, 1 !ontos !ara uma concordncia de ca0eçal8o !rinci!al#su0ca0eçal8o se am0os os indexadores o utilizarem como descrito r mais im!ortante, e assim !or dianteC$ = di+cil c8egar a um acordo so0re 'ual seria o escore, e mais di+cil ainda inter!retar o 'ue o escore realmente signica. mais !rov"vel 'ue esse ti!o de !ontuação se;a a!lic"vel a estudos de 'ualidade de indexação, 'ue = o0;eto do !r?ximo ca!+tulo. *atores que in?uem na coerncia
:ssa varia0ilidade nos escores da coer>ncia leva a se indagar R'uais são os atores 'ue t>m maior eeito na determinação da coer>ncia na indexaçãoO 2a gura )4 !rocuram-se identicar !oss+veis atores. T" se mencionou a 'uantidade de termos atri0u+dos. Se se !edisse aos indexadores 'ue atri0u+ssem termos, em ordem de Rim!ortnciaO !erce0ida, ao conteHdo tem"tico do documento, !rovavelmente o0ter-se-ia razo"vel grau de concordncia no 'ue concerne aos termos do alto da lista. 2a medida em 'ue se descer nessa lista, essa concordncia certamente diminuir". :m outras !alavras, = certo 'ue 8aver" mais concordncia 'uanto aos t?!icos do documento considerados !rinci!ais do 'ue 'uanto aos t?!icos considerados de menor im!ortncia 'ue mereçam ser inclu+dos. Isso, !or=m, talvez se;a um !ouco sim!lista. % gura )5 sugere uma relação !oss+vel entre coer>ncia e 'uantidade de termos atri0u+dos. Su!ondo 'ue os termos se;am atri0u+dos em ordem de !rioridade, levanta-se a 8i!?tese de 'ue a concordncia atingir" o !onto mais alto no n+vel de dois termos e em seguida começar" a cair gradualmente at= o !onto onde ten8am sido atri0u+dos tantos termos 'ue a concordncia voltar" a aumentar. Isto = exem!licado na gura )6. 1. Kuantidade de termos atri0u+dos. ). *oca0ul"rio controlado versus indexação com termos livres 3. /aman8o e es!ecicidade do voca0ul"rio. . Earacter+sticas do conteHdo tem"tico e sua terminologia 4. Fatores de!endentes do indexador
53
5. Instrumentos de aux+lio com 'ue conta o indexador 6. :xtensão do item a ser indexado
Figura )4 ( Doss+veis atores 'ue inNuem na coer>ncia da indexação
:ssa gura a!resenta listas ordenadas segundo a im!ortncia dos termos atri0u+dos !elos indexadores a e 0. Isto =, a ac8a 'ue % = o termo mais im!ortante, & = o 'ue se segue em ordem de im!ortncia, e assim !or diante. Mutra orma de examinar isso = dizer 'ue, se o indexador a !udesse atri0uir somente um termo ao documento, esse termo seria %. Eada indexador nalmente atri0ui 15 termos. M0serve-se 'ue, em0ora os indexadores concordem com os dois termos do alto da lista, eles não concordam com o !rimeiro desses termos. Isso não constitui sur!resa. uitos documentos envolvem uma relação entre dois conceitos !rinci!ais. /alvez se;a !oss+vel estar de acordo so0re 'uais são esses conceitos, mas não concordar com 'ual deles assumir" !reced>ncia. Dor exem!lo, num artigo so0re soldagem de titnio, =O o metal ou o !rocesso 'ue deve assumir !reced>ncia B claro 'ue decises como essa t>m muito a ver com as caracter+sticas da 0ase de dados. 2uma 'ue se;a dedicada exclusivamente ao titnio, o termo titnio tem !ouco ou nen8um valor.C Isso se !arece um !ouco com a!ostar em cães Bou cavalosC de corrida amiHde = mais "cil adivin8ar 'uais os dois animais 'ue terminarão nas !rimeiras duas !osiçes do 'ue adivin8ar 'ual ser" o !rimeiro. e!ois 'ue todos os 15 termos oram atri0u+dos alcançou-se uma !ereita concordncia. Isto se deve a um eeito de RsaturaçãoO. Y" somente um nHmero determinado de termos 'ue se a!licariam de modo !laus+vel a 'ual'uer item, !elo menos se esses termos orem extra+dos de um voca0ul"rio controlado. Se orem atri0u+dos termos em nHmero suciente, aca0ar-se-" !or alcançar uma elevada coer>ncia. M0serve-se, contudo, 'ue a coer>ncia 0aixa entre o n+vel de dois termos e o n+vel de dezesseis termos. Dor exem!lo, de!ois de cinco termos, o DE = 4#5 B,3C, de!ois de dez termos = de 5#1 B,3C, e assim sucessivamente. % relação a!resentada na gura )5 !arece, !ortanto, !laus+vel, em0ora não 8a;a sido conrmada ex!erimentalmente. Delo menos a orma da curva = !laus+vel, se se levam em consideração os resultados alcançados !or muitos indexadores. 2o caso de !oucos indexadores, naturalmente, o decl+nio da coer>ncia seria !rovavelmente menos suave B!or exem!lo, 8averia maior coer>ncia com 'uatro termos do 'ue com tr>sC.
Figura )5 ( 7elação entre coer>ncia e 'uantidade de termos atri0u+dos
Yarris et al. B1955C relatam resultados 'ue dierem um !ouco dos ormulados 8i!oteticamente na gura )5. % coer>ncia oi maior de!ois de 1 termos do 'ue de!ois de 5
cinco, mas declinou nos n+veis de ) e 3, voltando a aumentar 'uando oram atri0u+dos termos. %rmam 'ue encontraram !oucos ind+cios de algum eeito de saturação, mas seus indexadores utilizavam !alavras-c8ave não-controladas e não as selecionavam de um con;unto limitado de termos controlados. Fried e Drevel B1955C desco0riram um decl+nio da coer>ncia com a 'uantidade de termos atri0u+dos, mas Leonard B1964C encontrou indicaçes inconclusivas so0re este !onto - verdadeiro !ara uma 0ase de dados, mas não !ara outra. 2um estudo so0re coer>ncia em 0ases de dados agr+colas, 7eic8 e &iever B1991C encontraram !rova do eeito da exaustividade so0re a coer>ncia numa amostra de artigos indexados com uma m=dia de -9 termos de um tesauro, a coer>ncia oi de )f$ c8egou a 4f numa amostra 'ue !ossu+a uma m=dia de 4-5 termos do tesauro.
Figura )6 ( :eito da 'uantidade de termos atri0u+dos so0re a coer>ncia do indexador Bdois indexadoresC
M segundo ator 'ue inNui so0re a coer>ncia Bgura )4C = o ti!o de voca0ul"rio utilizado na indexação. ncia. Drovavelmente, os estudantes se com!ortarão mais ou menos da mesma orma 'ue um com!utador se com!ortaria ao realizar essa tarea !rocurarão !alavras ou rases 'ue ocorrem re'entemente e#ou a!arecem no t+tulo ou em outros lugares de desta'ue. 2uma segunda eta!a desse exerc+cio, !eço aos estudantes 'ue traduzam a indexação 'ue zeram com termos livres !ara termos selecionados no edical su0;ect 8eadings BeSYC da 2ational Li0rarA o edicine. Kuase com certeza 8aver" uma 'ueda da coer>ncia. 2esta situação, o voca0ul"rio controlado ter" um eeito contr"rio. Isso se d" !or'ue as ex!resses textuais selecionadas nem sem!re serão id>nticas aos termos controlados. Ms estudantes terão diculdade em selecionar os termos controlados a!ro!riados !or'ue carecem de con8ecimentos sucientes de medicina e de sua terminologia e !or'ue alguns dos termos controlados terão ad'uirido um RsignicadoO es!ecial Bindicado em nota ex!licativaC atri0u+do !elos com!iladores do voca0ul"rio. ncia da indexação a longo !razo, mas somente !ode ser a!licado de modo coerente !or indexadores ex!erientes 'ue dominem o conteHdo tem"tico e este;am totalmente amiliarizados com os termos. Mutra coisa !ara a 'ual = !reciso atentar = 'ue um voca0ul"rio controlado deve mel8orar a coer>ncia da indexação em relação a um gru!o de documentos, mas = 0em !oss+vel 'ue a diminua no n+vel de um Hnico documento. Kuer dizer, a terminologia adotada num artigo reveste-se de uma coer>ncia interna -- o autor costuma não em!regar uma variedade de termos !ara descrever o mesmo t?!ico, !elo menos em artigos de natureza t=cnica ou es!ecializada. 0astante !oss+vel, contudo, 'ue 8a;a diverg>ncia entre dois indexadores a res!eito de 'ual o termo controlado a ser adotado !ara re!resentar esse t?!ico. Dor outro lado, autores dierentes em!regam terminologias dierentes, e, desse modo, o voca0ul"rio 54
controlado, ao reduzir o le'ue de o!çes, exerce um eeito 0en=co so0re a coer>ncia da indexação 'uando se trata de um gru!o grande de documentos. Se a coer>ncia interindexadores = 0aixa 'uando duas !essoas indexam itens 'ue em!regam o mesmo voca0ul"rio, ser" natural, o0viamente, 'ue 8a;a coer>ncia ainda menor 'uando os mesmos itens são indexados em dierentes 0ases de dados !or'ue variaçes nos voca0ul"rios utilizados acrescentam outra dimensão ao !ro0lema. Kin B)C, !or exem!lo, reuniu um gru!o de artigos so0re resist>ncia a anti0i?ticos e com!arou a indexação deles no :LI2: com a indexação 0aseada em citaçes eita no Science Eitation Index BZeA Words DlusC. 2aturalmente, a similaridade oi 0aixa, mesmo 'uando a Rsimilaridade !arcialO era o crit=rio adotado, em0ora as tr>s !alavras-c8ave usadas como termos de indexação 'ue ocorreram com mais re'>ncia ossem conceitualmente e'uivalentes aos dois ca0eçal8os de assuntos do :LI2: de maior re'>ncia. Eonv=m salientar, de !assagem, 'ue não = tão sim!les 'uanto !areceria P !rimeira vista azer uma com!aração entre indexação com termos livres e indexação com termos controlados. nticas. Dor exem!lo, considera - se Rcorrente el=tricaO como igual a Rcorrente el=ctricaO, ou como se avalia uma situação em 'ue um indexador escol8e o termoO literatura rancesa medievalO e um outro utiliza Rliteratura medievalO e Rliteratura rancesaO Isso, = claro, nos az remontar P distinção entre an"lise conceitual e tradução. ais adiante se mencionar" o eeito dessas duas eta!as so0re a coer>ncia. Fugmann B194C levanta uma 'uestão muito interessante relativa P coer>ncia. Salienta 'ue, en'uanto os estudos so0re coer>ncia se concentram na seleção de termos !ara determinado documento, a !essoa 'ue 0usca inormação est" mais !reocu!ada com a coer>ncia entre os documentos. Isso im!lica 'ue talvez se;a Htil um ti!o dierente de an"lise de coer>ncia, 'ue mensure a extensão com 'ue o mesmo t?!ico = indexado coerentemente numa 0ase de dados. M terceiro ator identicado na gura )4 corres!onde ao taman8o e P es!ecicidade do voca0ul"rio. Kuanto maior o voca0ul"rio, maior ser" a !ro0a0ilidade de ser es!ec+co, e 'uanto maior or sua es!ecicidade, mais di+cil ser" utiliz"-lo de modo coerente B/inXer, 1955, 195C. Dor exem!lo, 8" mais !ro0a0ilidade de dois indexadores concordarem 'ue um documento trata de corrosão do 'ue de concordarem 'uanto ao ti!o de corrosão 'ue = estudado. Kuanto mais sutis orem os matizes de signicado 'ue um voca0ul"rio !ossa ex!ressar, mais di+cil ser" alcançar-se coer>ncia. 2a min8a avaliação do :L%7S BLancaster, 195aC, inclu+ um 0reve estudo so0re coer>ncia. esco0ri 'ue a coer>ncia na atri0uição de ca0eçal8os de assuntos BeSYC era de 5,1 f 'uando os resultados de tr>s indexadores eram divididos !ro!orcionalmente entre um total de 15 artigos. Kuando eram tam0=m ,utilizados su0ca0eçal8os, a coer>ncia, no entanto, ca+a !ara 3,f. :m estudo anterior vericou-se 'ue os indicadores de unção causavam eeito ainda mais dr"stico na redução da coer>ncia da indexação BLancaster, 195C, resultado esse 'ue oi conrmado !or Sinnett B195C e ullison et al. B1959C. :m seu estudo so0re coer>ncia da indexação em 0ases de dados agr+colas, 7eic8 e &iever B1991C concluem 'ue [% coer>ncia \...] !arece ser mais di+cil de alcançar P medida 'ue aumenta a es!ecicidade do voca0ul"rio^. SlamecXa e Taco0A B1953C azem uma distinção entre voca0ul"rios R!rescritivosO e RsugestivosO. :stes oerecem ao indexador certa margem na escol8a de termos, en'uanto os !rimeiros !raticamente não l8e deixam 'ual'uer o!ção. Eom 0ase em alguns ex!erimentos com voca0ul"rios de dierentes ti!os Bca0eçal8os de assuntos, tesauro, es'uema de classicaçãoC, conclu+ram 'ue % coer>ncia interindexadores mel8ora signicativamente com a utilização de instrumentos de indexação !rescritivos 'ue conten8am um m+nimo de relaçes semnticas vari"veis entre os termos. M em!rego de instrumentos de indexação 'ue am!liem a li0erdade semntica do indexador, no 'ue concerne P escol8a de termos, = !re;udicial P cona0ilidade da indexação. % 'ualidade da indexação tem muito a gan8ar com voca0ul"rios 'ue ormalizem as relaçes de modo a !rescrever uniorme e invariavelmente a escol8a dos termos de indexação B!. 3C.
%ssinale-se 'ue eles !arecem considerar coer>ncia e 'ualidade como mais ou menos e'uivalentes. :ste as!ecto ser" estudado no ca!+tulo seguinte. natural 'ue os voca0ul"rios !rescritivos resultem em maior coer>ncia. e ato, !arece !rov"vel 'ue se alcance o m"ximo de coer>ncia com a atri0uição de termos !r=-im!ressos num ormul"rio de indexação Bcomo = o caso das Reti'uetasO da 2ational Li0rarA o edicineC 'ue lem0rem ao indexador 'ue devem ser utilizados sem!re 'ue orem a!lic"veis. Leonard 55
B1964C a!resentou algumas indicaçes 'ue corro0oram isso, do mesmo modo 'ue FunX et al. B193C. Leininger B)C, 0aseando-se em 5 itens acidentalmente indexados em du!licata na 0ase de dados DsAEI2FM, vericou 55f de coer>ncia na atri0uição de eti'uetas, en'uanto a coer>ncia total Bconsiderados todos os termosC oi de a!enas 44f. M resultado mais sur!reendente oi 'ue s? 8ouve f de coer>ncia na atri0uição de c?digos gen=ricos de classicação. Eom s? )) classes e 134 su0classes, e uma m=dia de a!enas 1,9 atri0uiçes !or registro Ba maioria dos .registros = classicada a!enas numa Hnica classe e !oucos num m"ximo de duasC, seria natural 'ue 8ouvesse maior coer>ncia. % ex!licação mais !rov"vel = 'ue muitos artigos de !sicologia !arecem igualmente relevantes !ara duas ou mais categorias em0ora indexadores dierentes concordem em 'ual de duas ou tr>s categorias classicar um documento, 8averia muito menor concordncia 'uanto P Hnica Rmel8orO categoria. e novo as corridas de galgos e cavalos. M 'uarto ator identicado na gura )4 corres!onde P natureza do conteHdo tem"tico do documento e, mais !articularmente, sua terminologia. de se su!or 'ue ocorra maior coer>ncia na indexação de t?!icos mais concretos B!or exem!lo, o0;etos +sicos, !essoas designadas !elo nomeC, e 'ue ela declinar" P medida 'ue se lidar cada vez mais com a0straçes. /i00o B199C salienta 'ue os autores da "rea de 8umanidades tendem a ser im!recisos em sua terminologia, !reerindo textos RdensosO ao inv=s de leg+veis. :ntretanto, _unde e exter B1959aC não vericaram aumento da coer>ncia com a Racilidade de leitura do documentoO. Eertos materiais !odem suscitar !ro0lemas es!eciais no 'ue tange P coer>ncia da indexação. 2o caso de o0ras de criação, como livros de cção, lmes de longa-metragem e alguns ti!os de otograas, = !rov"vel 'ue 8a;a um n+vel exce!cionalmente elevado de desacordo em relação P'uilo de 'ue trata a o0ra e como index"-la. ierentes gru!os de !essoas terão interesses 0em distintos !or esses materiais. Dor exem!lo, estudiosos das artes e do cinema talvez 'ueiram uma indexação 'ue se;a 0astante dierente da'uela dese;ada !elo !H0lico em geral. arXeA B19C e :nser B1994C a!resentam ind+cios 'ue sugerem 'ue a indexação de imagens !ode !roduzir n+veis de coer>ncia exce!cionalmente 0aixos. M 'uinto ator tem a ver com os indexadores como indiv+duos. 'uase certo 'ue dois indexadores com ormação 0astante similar Beducação, ex!eri>ncia, interessesC ten8am mais !ro0a0ilidade de concordar com o 'ue deve ser indexado do 'ue dois outros com ormação muito dierente. 7elacionados a isso estão o ti!o e a duração do treinamento. Se todos os indexadores !artici!am do mesmo !rograma rigoroso de treinamento, isso contri0ui !ara reduzir a im!ortncia da ormação !r=via como ator 'ue inNui na coer>ncia. /am0=m =O im!ortante o con8ecimento do conteHdo tem"tico com 'ue se lida. Se dois indexadores tiverem 'uase o mesmo n+vel de con8ecimento es!ecializado, serão mais coerentes entre si do 'ue se um deles or muito entendido na mat=ria e o outro tiver a!enas um con8ecimento su!ercial do conteHdo tem"tico. ais im!ortante do 'ue o con8ecimento es!ecializado em si mesmo seria, contudo, o con8ecimento minucioso das necessidades e interesses dos usu"rios a serem servidos. Taco0Ae SlamecXa B195)C encontraram maior coer>ncia entre indexadores ex!erientes do 'ue entre iniciantes 'ue tra0al8avam com !atentes$ os ex!erientes tam0=m usavam menor 'uantidade de termos. Leonard B1964C constatou 'ue a coer>ncia aumentava com a ex!eri>ncia dos indexadores, mas não ac8ou correlação !ositiva entre coer>ncia e ormação educacional. Kuer dizer, maior con8ecimento do conteHdo tem"tico B!resumido a !artir da ormação educacionalC não aumentava a coer>ncia. ZorotXin e Mliver B195C, em ex!erimento com resumos de !sicologia, não desco0riram dierenças signicativas na coer>ncia entre dois gru!os de indexadores, sendo 'ue um deles dominava o conteHdo tem"tico e o outro não. 2este caso, !or=m, o estudo ocorreu so0 v"rias restriçes articiais 'ue iriam inNuir no resultado não oi usado voca0ul"rio controlado, oram em!regados resumos e não artigos com!letos, e os indexadores oram instru+dos a atri0uir exatamente tr>s termos Bnem mais, nem menosC a cada item. ncia do indexador. Inclu+a, !or=m, tantas vari"veis 'ue se torna di+cil inter!retar seus resultados. ados encontrados em Stu00s et al. B1999C ilustram o eeito 'ue um indexador RradicalO Bisto =, at+!icoC !ode !rovocar nos escores de coer>ncia. Mutro ator a!ontado na gura )4 reere-se aos instrumentos auxiliares utilizados !elo indexador. Se um gru!o de indexadores com!artil8ar o mesmo con;unto de erramentas de indexação Bdicion"rios, gloss"rios, manuaisC, 8aver" uma tend>ncia de 'ue estes instrumentos contri0uam !ara mel8orar a coer>ncia no gru!o. M mais im!ortante seria algum ti!o de 56
voca0ul"rio de entradas, ela0orado !elo !r?!rio centro de inormação, 'ue servisse !ara correlacionar os termos 'ue ocorrem nos documentos com os termos controlados a!ro!riados. Finalmente, a extensão do item indexado inNui na coer>ncia 'uanto menor o item, menor ser" a 'uantidade de termos 'ue a ele se a!licarão de modo !laus+vel. 2ão causa es!=cie 'ue Yarris et al. B1955C 8a;am vericado 'ue a coer>ncia era maior na indexação de 'uestes B0reves enunciados textuaisC do 'ue na indexação de artigos de !eri?dicos. 7odgers B1951C, Fried e Drevel B1955C, Leonard B1964C, e YorX B193C tam0=m encontraram ind+cios de coer>ncia declinante com a extensão do documento, en'uanto /ell B1959C constatou 'ue a coer>ncia 'uando se indexava a !artir do texto integral dos artigos era menor do 'ue 'uando se indexava a !artir dos t+tulos ou dos resumos. %oerncia na análise conceitual #ersus coerncia na trad ução
M ti!o de estudo de coer>ncia examinado neste ca!+tulo em!ana a distinção, 'ue se az na indexação, entre as eta!as de an"lise conceitual e de tradução. Dresc8el B196)C, !or=m, !rocurou se!arar essas duas eta!as, a m de determinar se era mais !rov"vel os indexadores concordarem com sua an"lise conceitual do 'ue com a tradução em termos de indexação. Ms resultados de sua !es'uisa indicaram 'ue era muito mais !rov"vel 'ue os indexadores concordassem com o 'ue seria indexado Ban"lise conceitualC do 'ue como os conceitos seriam descritos BtraduçãoC. im!ortante, !or=m, recon8ecer 'ue, nesse estudo, os indexadores não usaram um voca0ul"rio controlado, mas criaram seus !r?!rios Rr?tulos ver0aisO !ara os t?!icos. 7esultados 0em dierentes seriam alcançados se a inNu>ncia normalizadora de um voca0ul"rio controlado 8ouvesse estado !resente. %s guras )-31 mostram exem!los de con;untos de termos de indexação atri0u+dos a artigos !or dois indexadores dierentes. :m todos os casos o voca0ul"rio adotado oi o /8esaurus o :7IE descri!tors. /odos são exem!los reais de eno'ues alternativos na indexação. % indexação oi eita, como dever de casa, !or alunos da @raduate Sc8ool o Li0rarA and Inormation Science da ncia entre indexadores.
Figura ) ( ois eno'ues dierentes na indexação de um artigo intitulado [Kuando os circunstantes a!enas o0servam^
% gura ) = um exem!lo extremo somente um termo em comum entre 15 atri0u+dos. M artigo trata do enQmeno de !essoas 'ue se recusam a intervir 'uando testemun8am um crime. M0serve-se como os dois indexadores encaram o artigo de dierentes !ers!ectivas - & mais do !onto de vista social e legal, e % mais do !onto de vista !sicol?gico. M exem!lo da gura )9 não = muito mel8or. Kuanto aos termos mais im!ortantes, os indexadores concordam a!enas em relação a um deles. M artigo trata de um !rograma, oerecido !or 0i0lioteca !H0lica, !ara instruir !ais de crianças em idade !r=-escolar so0re literatura ade'uada a esse gru!o et"rio. M indexador & v> isso como educação !r=-escolar, em0ora se;am os !ais e não os l8os 'ue rece0am instrução, en'uanto % B!rovavelmente de modo mais corretoC ac8a 'ue = educação de adultos !ais. M indexador &, em0ora estudante de 0i0lioteconomia, não indica 'ue o !rograma acontece numa 0i0lioteca. M indexador %, !or outro lado, não indica 'ue o artigo reere-se a crianças muito !e'uenas. 2ote-se como os dois escol8eram termos relacionados muito !r?ximos interesses de leitura versus atitudes diante 5
da leitura, gosto !ela literatura versus cr+tica liter"ria, materiais de leitura versus seleção de materiais de leitura.
Figura )9 ( ois eno'ues dierentes na indexação de um artigo intitulado [
Isso exem!lica os !ro0lemas inerentes ao uso de um voca0ul"rio controlado 'ue cont=m muitos termos 0astante ans ou !arcialmente coincidentes, !rinci!almente 'uando os indexadores não estão totalmente a !ar do alcance !retendido desses termos. % gura 3 mostra maior coer>ncia, uma vez 'ue dois dos termos mais im!ortantes coincidem. %!esar disso, ocorrem algumas dierenças de tradução. M indexador % ex!ressa Rcursos !?s-graduados de educaçãoO mediante o em!rego dos termos aculdades de educação e ensino su!erior, en'uanto & seleciona aculdades de educação e ensino de !?s-graduação. e igual modo, 'uando & em!rega atitudes dos docentes, % adota o!inies, e 'uando & usa relação !roessor-aluno, % em!rega relação inter!rossional e orientadores !edag?gicos. di+cil acreditar nos resultados da indexação da gura 31. 2ão existe termo algum em comum entre os doze atri0u+dos. ais uma vez demonstram-se a+ claramente os !ro0lemas decorrentes do em!rego de termos ans e#ou coincidentes são usados cinco termos so0re RleituraO, mas todos dierem entre si. 2este caso, !or=m, a indexação de % = 0astante med+ocre não menciona o n+vel educacional e o item = indexado de modo muito gen=rico so0 ensino audiovisual 'uando, es!ecicamente, trata de televisão. Kuando o documento oi indexado ainda não 8avia no tesauro o termo televisão com legenda ec8ada. Ms oito estudantes anQnimos, cu;o tra0al8o = com!arado nas guras )-31, não eram indexadores altamente ex!erientes, em0ora ossem inteligentes e interessados e estivessem motivados. 0astante !rov"vel 'ue indexadores de maior ex!eri>ncia, !rinci!almente com maior tra'ue;o na utilização desse tesauro, 8ouvessem alcançado resultados mais coerentes. e 'ual'uer modo, os exem!los servem !ara ilustrar alguns dos o0st"culos a uma indexação coerente.
Figura 3 ( ois eno'ues dierentes na indexação de um artigo intitulado [Mrientação em cursos de !?s-graduação em educação^
59
Figura 31 ( ois eno'ues dierentes na indexação de um artigo intitulado [/elevisão com legenda ec8ada uma nova erramenta !ara o ensino da leitura^
% gura 3) = outra tra!al8ada. %+ dois estudantes registraram !alavras e ex!resses 'ue re!resentam sua an"lise conceitual de um artigo, antes de tentarem traduzi-la em termos controlados. % com!aração = muito instrutiva. :xceto o ato de am0os os con;untos de termos se reerirem a romances sentimentais, !arecem ter !ouco em comum. % inter!retação de % = Rtran'ilaO e romntica, en'uanto o m+nimo 'ue se !ode dizer de & = 'ue = grosseira. % inclui somente tr>s termos negativos BconNito, dominncia, ressentimentoC, en'uanto & inclui muitos termos radicais. M ato de serem !oss+veis tais inter!retaçes radicalmente dierentes do signicado de um artigo de!e, talvez, a avor do em!rego da indexação como instrumento auxiliar da !sicoan"lise. :m0ora duas ou mais !essoas !ossam não concordar rigorosamente com os termos 'ue serão atri0u+dos a um documento, este enQmeno não = !rivil=gio exclusivo da indexação. Saracevic et al. B19C constataram 'ue os termos em!regados !ara um mesmo !edido !or dierentes es!ecialistas em 0uscas revelavam uma coincid>ncia extraordinariamente reduzida.1 %l=m disso, itens recu!erados !or dierentes es!ecialistas em 0uscas a!resentavam !ouca coincid>ncia e cada es!ecialista costumava encontrar alguns itens relevantes não encontrados !elos outros.) Saracevic sugere a necessidade de 0uscas mHlti!las, eitas !or dierentes !essoas, !ara o mesmo !edido, cu;os resultados se;am reunidos e !ostos numa ordem classicada os itens recu!erados !ela maioria dos es!ecialistas carão no to!o dessa classicação e a'ueles recu!erados a!enas !or um es!ecialista carão na !arte inerior. Dela mesma razão, um m=todo ideal de indexação envolveria um tra0al8o de e'ui!e, alcançando-se consenso so0re cada documento como resultado de discusses entre um gru!o de indexadores. %inda 'ue este m=todo ten8a sido !oss+vel em alguns !oucos locais altamente es!ecializados Bcomo os sistemas es!ecializados existentes dentro do *.S. Datent and /rademarX MceC, ele = excessivamente dis!endioso !ara a maioria das a!licaçes. &roVn et al. B1995C, entre outros, !ro!useram um m=todo Rdemocr"ticoO de indexação de imagens, em 'ue os usu"rios da 0ase de dados de imagens contri0u+am com termos.
Fidel B194C tam0=m vericou 'ue ex!erientes es!ecialistas em 0uscas mostravam !ouca concordncia na seleção de termos a serem em!regados em 0uscas com!lexas. %nteriormente, LilleA B194C e &ates B1966C mostraram 'ue usu"rios de cat"logos em c8as tam0=m costumam não concordar muito 'uanto aos termos a serem utilizados na consulta a esses cat"logos. ) Zatzer et al. B19)C constataram 'ue re!resentaçes dierentes de documentos aziam com 'ue ossem recu!erados dierentes con;untos, os 'uais a!resentavam !ouca du!licidade mesmo 'uando as re!resentaçes eram muito similares. 1
6
Figura 3) ( ierenças na an"lise conceitual de um artigo intitulado [M ato em extinção um estudo dos romances sentimentais^
&ates B195C sugere 'ue a indexação = [indeterminada e !ro0a0il+stica^ e 'ue isso = mais ou menos inevit"vel, estando [arraigado na natureza da mente 8umana^. %o inv=s de lamentar o ato de 'ue talvez ;amais se;a !rov"vel alcançar um elevado n+vel de coer>ncia na indexação, !elo menos 'uando nela estão envolvidos indexadores 8uman9s, devemos concentrar atenção na com!ensação disso na eta!a nal do !rocesso, ou se;a, no momento da 0usca. % 0usca não deve 0asear-se na coincid>ncia exata de termos, mas em m=todos 'ue ordenem os documentos segundo o grau com 'ue coincidem com alguma orma de enunciado de 0usca. % !essoa 'ue executa as 0uscas deve dis!or de diversos instrumentos auxiliares 'ue l8e !ermitam selecionar dentre uma variedade de m=todos !ara geração de associaçes semnticas entre termos. :m0ora muitos estudos so0re coer>ncia 8a;am sido realizados ao longo dos anos, muito !oucas !es'uisas oram eitas so0re !or 'ue dierentes indexadores selecionam dierentes termos, o 'ue = sa0idamente um ti!o mais di+cil de investigação. ois artigos correlatos, de avid et al. B1994C e &ertrand-@astaldA et al. B1994C, versam so0re este !ro0lema, mas c8egam a concluses 0astante ne0ulosas. Indexação coerente não = necessariamente o mesmo 'ue indexação de alta 'ualidade. % 'ualidade da indexação ser" examinada no !r?ximo ca!+tulo, onde tam0=m se az uma com!aração entre 'ualidade e coer>ncia.
61
%ap&tulo @ 0 Aualidade da indexação % indexação não constitui um m em si mesma. ene-se de modo muito !ragm"tico a R0oa indexaçãoO como a indexação 'ue !ermite 'ue se recu!erem itens de uma 0ase de dados durante 0uscas !ara as 'uais se;am res!ostas Hteis, e 'ue im!ede 'ue se;am recu!erados 'uando não se;am res!ostas Hteis. Eoo!er B196C vai um !ouco al=m Tustica-se a atri0uição de um termo a um documento se a utilidade m=dia associada a essa atri0uição or !ositiva, e in;usticada se or negativa B!. 11C.
:le usa a'ui a !alavra RutilidadeO mais ou menos como sinQnimo de R0ene+cioO. Eonorme as relaçes es'uematizadas na gura 1 dão a entender, diversos su0sistemas interagem no controle do desem!en8o de um sistema de recu!eração da inormação. Mutro modo de examinar isso = em termos de uma se'>ncia de eventos 'ue regem o desem!en8o da 0usca. Isso = exem!licado na gura 33. 2a situação t+!ica de um centro de inormação, uma necessidade de inormação des!onta na mente de um usu"rio desse centro e ele vai conversar so0re ela com um es!ecialista em inormação. Dodemos nos reerir ao resultado desse di"logo como um !edido Bisto =, o entendimento !or !arte do es!ecialista da'uilo 'ue o usu"rio realmente !recisaC. Eom 0ase nesse !edido, o es!ecialista em inormação !re!ara uma estrat=gia de 0usca, valendo-se !ara isso de termos de indexação, !alavras do texto ou uma com0inação de am0os. % estrat=gia de 0usca = então conrontada com a 0ase de dados B= claro 'ue, em muitos casos, a estrat=gia de 0usca e o cote;o com a 0ase de dados estarão entrelaçados, !ois a estrat=gia ser" desenvolvida interativamente em lin8aC. Eomo resultado da 0usca certos itens são recu!erados. :stes são !eneirados !elo es!ecialista em inormação, a m de eliminar todo item 'ue l8e !areça evidentemente irrelevante, sendo entregue ao usu"rio um con;unto nal de documentos ou reer>ncias. M diagrama, naturalmente, re!resenta 0uscas RdelegadasO, ou se;a, a'uelas em 'ue os clientes solicitam a um es!ecialista em inormação 'ue localize !ara eles certas inormaçes. :m0ora isso osse a norma 8" uns vinte anos, cada vez mais deixa de ser assim, !ois = crescente o nHmero de !essoas 'ue realizam suas !r?!rias 0uscas em 0ases de dados acess+veis em lin8a, !rinci!almente na'uelas ontes acess+veis na 7ede. Eom exceção do !rimeiro e Hltimo !assos, !or=m, o diagrama ainda re!resenta os atores im!ortantes 'ue aetam o desem!en8o de uma 0usca tem"tica numa 0ase de dados. 2o caso de 0uscas não-delegadas, a necessidade de inormação = diretamente convertida numa estrat=gia de 0usca num terminal sem !assar !ela eta!a intermedi"ria do R!edidoO. *>-se claramente, no diagrama, 'ue muitos atores inNuem na 'ualidade da 0usca, medida, !or exem!lo, !ela revocação e !recisão. %ntes de mais nada, o es!ecialista em inormação !recisa entender o 'ue = 'ue o usu"rio realmente !recisa. Se o !edido or uma re!resentação im!ereita da necessidade de inormação, !assa a ser 'uase irrelevante 'ue todos os demais elementos voca0ul"rio, estrat=gia de 0usca, indexação, etc. - se;am satisat?rios. %dmitindo-se 'ue o !edido se a!roxime razoavelmente da necessidade de inormação, o ator seguinte a inNuir no desem!en8o ser" a 'ualidade da estrat=gia de 0usca. %s !rinci!ais inNu>ncias a este res!eito são ex!eri>ncia, intelig>ncia e criatividade do es!ecialista 'ue az a 0usca. M voca0ul"rio da 0ase de dados, contudo, tam0=m = essencial. Se or adotado um voca0ul"rio controlado, não se !oder" realizar uma 0usca 'ue se;a mais es!ec+ca do 'ue o voca0ul"rio !ermite, em0ora se !ossa alcançar es!ecicidade adicional com o em!rego de !alavras do texto. Inelizmente, = di+cil imaginar todos os termos necess"rios P consecução de uma 0usca com!leta. M !ro0lema em todas as 0uscas = tentar manter o e'uil+0rio entre revocação e !recisão. M 'ue se !recisa comumente = o0ter o m"ximo de revocação, !or=m mantendo um n+vel aceit"vel de !recisão. Kuando a estrat=gia de 0usca = cote;ada com a 0ase de dados, a 'ualidade da !r?!ria 0ase torna-se, evidentemente, um dos atores !rinci!ais a inNuir no desem!en8o. neste !onto, o0viamente, 'ue a 'ualidade da indexação se torna undamental. Ms elementos do voca0ul"rio tam0=m inNuem na indexação, !ois o indexador não !ode lançar mão de termos 'ue não existam no voca0ul"rio.
6)
Figura 33 ( Fatores 'ue inNuem nos resultados de uma 0usca numa 0ase de dados
% ec"cia de uma RtriagemO do resultado, caso se eetue esta o!eração, de!ender" undamentalmente de dois atores 1. :m 'ue medida o es!ecialista 'ue az a 0usca entende a'uilo de 'ue o usu"rio realmente !recisa. ). :m 'ue medida as re!resentaçes de documentos armazenadas na 0ase de dados indicam de 'ue tratam os documentos. 2ão conv=m azer a'ui uma an"lise minuciosa de todos os atores 'ue inNuem no desem!en8o de um sistema de recu!eração, conorme es'uematizado na gura 33, mas a!enas examinar os atores atri0u+veis P indexação. -lo, não 8" como sa0er se o indexador inter!retou e'uivocadamente 'ual seria o assunto do documento, se não entendeu realmente o signicado ou alcance de x, ou se sim!lesmente atri0uiu esse termo !or descuido. Se um indexador deixar de atri0uir 'uando este termo deveria ser atri0u+do, = ?0vio 'ue ocorrerão al8as na revocação. Se, !or outro lado, or atri0u+do A 'uando = 'ue deveria s>-lo, ocorrerão al8as tanto na revocação 'uanto na !recisão. Kuer dizer, o item não ser" recu!erado 'uando de 0uscas de , em0ora devesse s>-lo, e ser" recu!erado em 0uscas de q, 'uando não deveria s>-lo. M descuido 'ue leva P omissão de um termo 'ue deveria ser atri0u+do ao documento !ode ter !roundo eeito nos resultados de uma 0usca, mesmo 'uando o termo omitido a!arentemente não = im!ortante. % gura 3 a!resenta um exem!lo sim!les disso, 0aseado num dos inHmeros 'ue oram revelados durante a avaliação do :L%7S BLancaster, 195aC. M artigo trata do eeito so0re o desenvolvimento do c?rtex cere0ral de nascimento ocorrido em 63
situação de escuridão e !ermanente !rivação da luz. M indexador contem!la todos os as!ectos !rinci!ais, menos o relativo ao desenvolvimento. :sta sim!les omissão ser" de grande im!ortncia. 2este caso, o artigo = considerado altamente relevante !ara um !edido de inormação so0re atores 'ue inNuem no desenvolvimento do sistema nervoso central. M es!ecialista em 0uscas somente usaria o termo RdesenvolvimentoO !ara ter acesso a este t?!ico, !ois seria irreal su!or 'ue !udesse !rever 'ue atores seriam esses, e assim este artigo im!ortante não seria recu!erado. 2o estudo so0re o :L%7S, oram o0servados alguns exem!los de indexadores 'ue em!regaram termos incorretos, !or=m um nHmero 0em maior de casos de omissão de termos im!ortantes !or !arte dos indexadores. :sta = !rovavelmente uma situação comum em outros serviços de inormação.
Figura 3 ( :xem!lo da !erda de um item im!ortante !or c ausa de mera omissão do indexador
%omo reconhecer uma boa indexação
% an"lise eita at= agora neste ca!+tulo im!lica 'ue a 'ualidade da indexação somente !ode ser aerida ex !ost acto, isto =, como resultado da ex!eri>ncia na o!eração de um sistema de recu!eração e mais es!ecicamente sua avaliação. :m grande !arte isso = verdadeiro. ncia de todos os !edidos 'ue serão eitos P 0ase de dados na 'ual o documento se ac8a re!resentado. Mcorrem, !or=m, realmente erros de indexação, e seria !oss+vel ao indexador ex!eriente Bou RrevisorOC desco0rir !elo menos alguns desses erros antes da inclusão de um registro numa 0ase de dados e assim im!or certo controle de 'ualidade ao !rocesso. :sse indexador identicaria os seguintes ti!os de erros 1. M indexador inringe a !ol+tica, es!ecialmente a relativa P exaustividade da indexação. ). M indexador deixa de em!regar os elementos do voca0ul"rio da orma como devem ser utilizados B!or exem!lo, uma com0inação incorreta de ca0eçal8o !rinci!al#su0ca0eçal8oC. 3. M indexador deixa de utilizar um termo no n+vel correto de es!ecicidade. 2a maioria dos casos isso signicar" 'ue o termo selecionado não = o mais es!ec+co existente. . M indexador em!rega um termo o0viamente incorreto, talvez !or'ue não !ossua con8ecimento es!ecializado B!or exem!lo, com0ust+veis l+'uidos !ara oguetes 'uando o documento trata mesmo = de com0ust+veis gasososC. 4. M indexador omite um termo im!ortante. :m !rimeiro lugar, o revisor comumente não des!ender", ao conerir a indexação de um item, tem!o igual ao des!endido !elo indexador. /alvez se;a relativamente "cil recon8ecer um termo incorreto, o 'ual !rovavelmente Rsalta aos ol8osO do indexador ex!eriente, !or=m seria 0astante di+cil !erce0er a omissão de um termo im!ortante, a menos 'ue osse muito ?0vio B!or exem!lo, 'uando o termo a!arece no t+tuloC. !oss+vel testar o tra0al8o dos indexadores de uma maneira mais rigorosa do 'ue sim!lesmente !assando os ol8os !elos termos atri0u+dos, 'ue = o m"ximo 'ue se !ode es!erar de uma o!eração rotineira de c8ecagem. M m=todo mais evidente consiste em realizar uma simulação de uma avaliação real. Eonsegue-se isso da seguinte orma 1. Selecione um gru!o de documentos dentre os 'ue com!em o Nuxo normal de entrada, antes 'ue c8eguem Ps mãos dos indexadores. 6
). Dara cada documento ela0ore, digamos, tr>s 'uestes !ara as 'uais o item se;a considerado uma res!osta im!ortante. em entrada na 0ase de dados, e assim seria necess"ria alguma orma de amostragem. Seria !oss+vel, mas não suciente, azer uma amostragem com!letamente aleat?ria dos registros, !rinci!almente se o +ndice de erros or !rovavelmente 0aixo. Isso exige um !rocesso autom"tico de RmarcarO os registros !ara 'ue se;am ins!ecionados !or es!ecialistas, com 0ase no ato de 'ue tais registros !arecem Rsus!eitosO. /odesc8ini desenvolveu um m=todo engen8oso !ara identicar esses registros sus!eitos B/odesc8ini e Farrel, 199C$ /odesc8ini e /olstenXov, 199C. :sse m=todo vem sendo em!regado na %g>ncia Internacional de :nergia %tQmica, em *iena, !ara o controle de 'ualidade da 0ase de dados I2IS B/odesc8ini, 1996C, e se tornou !oss+vel devido ao ato de os itens inclu+dos na 0ase de dados serem indexados com descritores extra+dos do tesauro I2IS Buma m=dia de a!roximadamente 11 termos !or item em 199C, al=m de serem classicados numa dentre )36 categorias gen=ricas de assuntos. :m ess>ncia, o sistema = ca!az de identicar registros em 'ue os descritores a eles atri0u+dos se;am at+!icos dos descritores ortemente relacionados com a categoria onde oi anteriormente classicado. Se os descritores atri0u+dos a determinado documento, 'ue 8ouver sido colocado na categoria x, orem at+!icos do R!erlO do descritor anterior atri0u+do a x, esse registro ser" um 0om candidato P revisão de controle de 'ualidade, !ois a classicação ou a indexação !ode estar errada. *atores que in?uem na qualidade da indexação
Lamentavelmente não oram muitas as !es'uisas realizadas so0re os atores 'ue a!resentam maior !ro0a0ilidade de inNuir na 'ualidade da indexação. 2a gura 34 a!resentase uma tentativa de identicar esses atores, mas ela se 0aseia mais no senso comum ou na intuição do 'ue em !rovas concretas. Ms indexadores devem ter algum con8ecimento do conteHdo tem"tico tratado e entender sua terminologia, em0ora não !recisem necessariamente ser es!ecialistas no assunto. 2a realidade, algumas instituiçes t>m enrentado !ro0lemas com indexadores 'ue são Res!ecialistasO demais, !ois sua tend>ncia = inter!retar o texto de modo excessivo e talvez extra!olar a'uilo 'ue o autor arma B!or exem!lo, indexar uma a!licação !oss+vel 'ue não este;a identicada es!ecicamente no artigoC ou mesmo revelar !reconceitos ao não indexar armaçes 'ue relutam em aceitar Bver Intner, 19, e &ell, 1991a, !ara coment"rios so0re vi=s e censura na indexaçãoC. % alta de con8ecimento do assunto !ode, contudo, levar P indexação excessiva. Inca!az de distinguir entre dois termos, o indexador talvez atri0ua am0os 'uando 0astaria a!enas um ou a!enas um seria correto. LouXo!oulos B1955C reere-se a isso como indecisão do indexador.
64
Figura 34 ( Fatores 'ue !odem aetar a 'ualidade da indexação
M autor declara-se recon8ecido a Mliver et al. B1955C !ela id=ia 'ue ins!irou esta gura
ai B)C identica cinco est"dios no desenvolvimento de um indexador !rinci!iante, !rinci!iante adiantado, com!etente, !rociente e es!ecialista. :le sustenta 'ue somente o es!ecialista tem ca!acidade !ara [indexar o mesmo documento com o em!rego de dierentes m=todos^. Isso im!licaria, !or exem!lo, 'ue somente um es!ecialista teria a ca!acidade de indexar o documento % !ara a clientela e index"-lo de modo dierente !ara a clientela q. %inda 'ue isso soe a!arentemente !laus+vel, deve-se tam0=m admitir 'ue = !oss+vel !rogramar um com!utador !ara indexar o mesmo texto de dierentes ormas Bisto =, !ara dierentes clientelasC mediante a ligação de ocorr>ncias de !alavras#rases com dierentes con;untos de termos de indexação. claro 'ue um ti!o !articular de es!ecialista = o !r?!rio autor do documento. T" oram realizados alguns estudos so0re o autor como indexador. Dor exem!lo, iodato B191C estudou a coer>ncia na seleção de termos entre tr>s gru!os autores, indexadores e leitores de artigos de matem"tica. :0inuma et al. B193C traduziram as !alavras-c8ave atri0u+das !elo autor !ara os termos de um tesauro e os com!araram com termos ;" atri0u+dos !or indexadores ex!erientes. % indexação oriunda do autor !areceu !roduzir mel8or !recisão !or=m menor revocação. ulvanA B199C examina os !r?s e contras de os !r?!rios autores indexarem seus livros. 7as8eed B199C levou a ca0o estudo similar, com!arando termos atri0u+dos !or autores de artigos de medicina com termos atri0u+dos !or indexadores do :L%7S. :le constatou 'ue os indexadores atri0u+am muito mais termos e 'ue os termos 'ue eles em!regavam eram mais es!ec+cos do 'ue os em!regados !elos autores. Mutros estudos trataram da indexação de livros como unidades inde!endentes. iodato e @andt B1991C constataram 'ue indexadores !rossionais !roduziam +ndices 'ue eram mais com!letos do 'ue os +ndices eitos !elos !r?!rios autores, em0ora as dierenças B!or exem!lo, em nHmero de entradas !or !"gina de textoC não ossem tão grandes 'uanto seria de se es!erar. /am0=m se constatou 'ue os autores a!resentavam deci>ncias na redação de resumos de seus !r?!rios artigos, as!ecto a ser ocalizado em !r?ximo ca!+tulo. M con8ecimento dos interesses dos usu"rios da 0ase de dados = es!ecialmente im!ortante !or'ue a R0oaO indexação deve ser tal8ada Ps necessidades de determinada comunidade, sem!re 'ue !oss+vel. %nos de ex!eri>ncia como indexador tam0=m são um ator 'ue inNui so0re a 'ualidade, da mesma orma 'ue outras caracter+sticas, como a ca!acidade de a !essoa se concentrar, ler ra!idamente e com!reender !rontamente. Finalmente, e talvez o mais im!ortante de tudo, um 0om indexador deve gostar do 'ue az. im!rov"vel 'ue se consiga o0ter uma 0oa indexação de algu=m 'ue detesta o 'ue est" azendo. /am0=m interv>m nisso atores ligados ao documento. %lguns assuntos são de mais di+cil com!reensão do 'ue outros. Eomumente, a teoria = muito mais di+cil do 'ue a !r"tica, como ocorre nas dierenças entre mecnica a!licada e engen8aria. 7elacionado a isso, naturalmente, est" o grau de Rcorres!ond>nciaO entre o conteHdo tem"tico do documento e o con8ecimento ou os interesses do indexador. RL+nguaO !ode ser inter!retada de v"rias ormas. :videntemente, o indexador 'ue não sou0er russo dicilmente !oder"O indexar artigos em russo de modo eciente, a não ser 'ue conten8am resumos claros e com!letos na !r?!ria l+ngua do indexador Bo 'ue não = usualC. Mutro as!ecto concerne P clareza da linguagem do autor. %lguns autores ex!em suas id=ias ou desco0ertas de modo mais claro do 'ue outros, tornando menos di+cil o tra0al8o do indexador. Finalmente, existem alguns atores ligados P a!resentação 'ue inNuirão so0re a 65
maior ou menor acilidade 'ue o indexador ter" !ara desco0rir de 'ue trata o documento o t+tulo = !reciso ou enganador, existe um resumo ou algum outro ti!o de sumarização 'ue reNita integralmente o conteHdo do item natural 'ue os atores ligados ao voca0ul"rio tam0=m inNuam na 'ualidade da indexação. Kuanto mais es!ec+co o voca0ul"rio, mais minuciosos serão os matizes de signicado 'ue !ermite ex!ressar$ e 'uanto mais minuciosos os matizes de signicado, mais di+cil ser" esta0elecer dierenças entre termos muito ans e em!regar estes termos de modo coerente. :lementos sint"ticos adicionais, como su0ca0eçal8os ou indicadores de unção, aumentam a es!ecicidade e com!licam o tra0al8o de indexação. /ermos 'ue se;am am0+guos ou im!recisos B'ue careçam de contexto ade'uado ou notas ex!licativasC são di+ceis de inter!retar e em!regar corretamente, al=m do 'ue o voca0ul"rio deve contar com uma estrutura sucientemente com!leta B!or exem!lo, a estrutura. /@#/:#/7 do tesauro convencionalC 'ue guie o indexador at= o termo mais .ade'uado !ara re!resentar determinado t?!ico. %s dimenses e a 'ualidade do voca0ul"rio de entradas 1 tam0=m serão im!ortantes, do mesmo modo 'ue a dis!oni0ilidade de diversos instrumentos auxiliares ans, como dicion"rios ou gloss"rios es!ecializados. Mutros atores 'ue inNuem na 'ualidade t>m a ver com o !r?!rio !rocesso de indexação. %lguns ti!os de indexação, como a extração de !alavras ou ex!resses do texto, não exigem muita concentração, esorço intelectual ou ex!eri>ncia, en'uanto outros ti!os, !rinci!almente os 'ue exigem o esta0elecimento de relaçes conceituais !recisas Bmediante indicadores de unção ou relacionaisC, encontram-se na extremidade o!osta do le'ue de diculdades. :m geral, = 'uase certo 'ue os indexadores ten8am desem!en8o mais ecaz 'uando rece0em regras e instruçes !recisas do 'ue 'uando tra0al8am em condiçes de com!leta li0erdade. % !rodutividade exigida = outro ator im!ortante. Se or exigido do indexador 'ue d> conta de certo nHmero de itens !or dia, ele !oder" sentir-se !ressionado e isso levar" a erros !or descuido, es!ecialmente se a instituição tiver uma ex!ectativa excessiva de !rodução di"ria. %l=m disso, a indexação exaustiva demanda mais tem!o do 'ue a indexação seletiva. Dor m, a indexação re'uer concentração, e condiçes am0ientais desavor"veis t>m um eeito negativo so0re a exatidão dessa tarea intelectual. Mutra maneira de analisar os atores 'ue inNuem na 'ualidade da indexação diz res!eito Ps diculdades 'ue os indexadores derontam. Mliver et al. B1955C, em levantamento 0aseado em entrevistas, 'ue a0rangeu 51 indexadores, o0servaram 'ue [tomar decises so0re como mel8or descrever o conteHdo dos documentos^ era Bo 'ue não sur!reendeC o !ro0lema mencionado com mais re'>ncia. Inelizmente, este !ro0lema = geral, diuso e rerat"rio a soluçes "ceis. Mutros !ro0lemas im!ortantes mencionados oram Rentender material novo ou descon8ecidoO e alta de termos a!ro!riados nos voca0ul"rios controlados. E8u e MO&rien B1993C estudaram a eta!a de an"lise conceitual da indexação, em !es'uisa da 'ual !artici!aram mais de uma centena de indexadores !rinci!iantes BestudantesC, mas sua !es'uisa 0aseou-se em somente tr>s 0reves artigos, de modo 'ue = di+cil, a !m1ir de seus dados, c8egar a uma conclusão s?lida. + qualidade está relacionada C coernciaD
Kualidade e coer>ncia não são a mesma coisa !ode-se ser coerentemente ruim 0em como coerentemente 0om` %!esar disso, !erce0e-se intuitivamente 'ue deve 8aver uma relação entre coer>ncia e 'ualidade. Dor exem!lo, se tr>s indexadores costumam concordar entre si, !or=m um 'uarto indexa de orma 0astante dierente, a tend>ncia da gente = acreditar no consenso. Eoo!er B1959C, em artigo !ol>mico, 'uestiona o valor da coer>ncia como indicador de 'ualidade. M as!ecto !or ele suscitado = exem!licado com reer>ncia P gura 35. m am0os suas idiossincrasias. 2o entanto, !or essa ou a'uela razão, a visão de mundo de est" mais !r?xima da dos usu"rios do centro, e os termos 'ue atri0ui reNetem mel8or os interesses deles. Dresume-se 'ue sua indexação se;a a mel8or, !elo menos !ara essa clientela es!ec+ca. 2este caso, então, os indexadores 'ue são mais coerentes entre si não !roduzem o mel8or tra0al8o, em0ora não se;am tão ruins 'uanto % cu;a indexação se distancia ainda mais dos interesses dos usu"rios.
1
66
Figura 35 ( Eoer>ncia do indexador relacionada aos interesses dos usu"rios
Eon'uanto essa situação se;a !laus+vel, talvez não se;a assim tão exagerada. di+cil com!reender !or 'ue & e E seriam mais coerentes entre si, a menos 'ue isso reNetisse o ato de serem os indexadores mais ex!erientes. Se o são, a l?gica sugere 'ue são esses dois os 'ue deveriam ter mais con8ecimento acerca dos usu"rios. São muito !oucos os estudos 'ue se relacionam de alguma orma com os argumentos de Eoo!ero. 2o entanto, iodato B191C vericou, de ato, 'ue a coer>ncia entre autores de artigos de matem"tica e indexadores !rossionais era maior do 'ue a coer>ncia entre autores e leitores dos artigos. Leonard B1964C em!reendeu o Hnico esorço s=rio visando a estudar a relação entre 'ualidade e coer>ncia na indexação. RKualidadeO oi denida em termos de ec"cia de recu!eração - a ca!acidade de recu!erar o 'ue = dese;ado e de evitar o 'ue não = dese;ado. Leonard tra0al8ou com duas coleçes se!aradas de dados, 'ue eram su0con;untos de estudos de avaliação anteriores. :ssas coleçes com!reendiam documentos, !edidos, estrat=gias de 0usca e avaliaçes de relevncia. Dara cada !edido con8eciam-se os itens 'ue 8aviam sido ;ulgados relevantes e 'uais os 'ue não 8aviam sido considerados relevantes. Ms con;untos de termos atri0u+dos aos documentos !elos indexadores 'ue !artici!aram do estudo !odiam assim ser com!arados com estrat=gias de 0usca constru+das anteriormente, !ermitindo ao !es'uisador identicar se determinado documento seria ou não recu!erado com determinada estrat=gia. % com!aração entre coer>ncia e ec"cia de recu!eração mostrou-se mais di+cil do 'ue ora anteci!ado. ncia, !or denição, = uma medida 'ue se reere ao tra0al8o de dois ou mais indexadores BLeonard mediu a coer>ncia do gru!o 0em como a coer>ncia de !ar de indexadoresC. Leonard com0inou os escores de Rec"ciaO !ara dois Bou maisC indexadores e em seguida com!arou este escore com a medida de coer>ncia !ara estes indexadores. M escore de ec"cia leva em conta a 'uantidade de documentos relevantes recu!erados e a de documentos irrelevantes recu!erados, e estes escores !odem ser com0inados determinando-se a m=dia dos resultados !ara os dois indexadores ou agregando-os. Se se em!regar o m=todo de agregação, somente serão contados itens singulares, o 'ue, com eeito, considera os dois indexadores como se ossem um indiv+duo Hnico. Leonard o0servou uma relação !ositiva Rde moderada a orteO entre coer>ncia e ec"cia de recu!eração, com uma Rrelação !ositiva claramente denidaO entre coer>ncia e o coeciente de revocação. + utilidade dos estudos de coerncia
% !es'uisa realizada !or Leonard B1964C sugere 'ue de ato existe uma relação !ositiva entre coer>ncia e 'ualidade da indexação, onde R'ualidadeO reere-se P ec"cia de recu!eração. esmo 'ue nen8uma relação 8ouvesse sido desco0erta, os estudos de coer>ncia ainda teriam alguma utilidade. Yoo!er B1955C sugeriu v"rias a!licaçes, inclusive 1. 2a seleção ou treinamento de indexadores. % indexação eita !or treinandos = com!arada com algum !adrão !reesta0elecido. ). 2o controle !ermanente da 'ualidade das atividades de indexação.1
1
Stu00s et al. B1999C examinam como os estudos so0re coer>ncia interindexadores !odem ser utilizados no monitoramento !ermanente da indexação numa instituição. :les com0inam c"lculos de coer>ncia com o em!rego de Rcartas-controleO adotadas em engen8aria industrial.
6
3. Dara desco0rir !ro0lemas na utilização de um voca0ul"rio controlado$ !or exem!lo, identicação de termos ou ti!os de termos 'ue se;am re'entemente em!regados de modo incoerente !or causa de am0igidades ou coincid>ncias de sentido. . Dara desco0rir 'uais'uer !ro0lemas 'ue !ossam existir relativos Ps regras de indexação. 4. Dara determinar se a coer>ncia = ou não menor no tratamento de certas "reas tem"ticas ou ti!os de documentos. 2este ca!+tulo, aceitou-se 'ue 'ualidade de indexação signica o mesmo 'ue Rec"cia de recu!eraçãoO da indexação. 2em todos a denem desta orma. 7olling B191C, !or exem!lo, arma 'ue [Dode-se denir 'ualidade de indexação como o grau de concordncia entre os termos atri0u+dos !elo indexador e um gru!o de termosO ideaisO ou R?timosO.^ :m seguida, ressalta 'ue a mel8or maneira de alcançar o ideal = mediante alguma orma de consenso entre es!ecialistas. M tra0al8o do indexador = com!arado com o consenso, e ele seria R!enalizadoO se não utilizasse termos so0re os 'uais os es!ecialistas 8ouvessem concordado, 0em como se usasse termos so0re os 'uais não tivesse 8avido concordncia. 7olling, 'ue !arece descon8ecer o tra0al8o de Leonard, arma 'ue medidas de ec"cia [não são !ratic"veis^, en'uanto os estudos de coer>ncia [não são con"veis^. :le deende estudos de 'ualidade, 0aseados no m=todo do consenso, em!regando-se os estudos de coer>ncia a!enas !ara !es'uisar RinNu>ncias e tend>nciasO. ais no nal deste ca!+tulo encontra-se um exem!lo da !ontuação da indexação 0aseada nas sugestes de 7olling. *"rios outros !es'uisadores !rocuraram avaliar a indexação ora do contexto do sistema de recu!eração em 'ue ela ocorre. Dor exem!lo, W8ite e @rit8 B196C descrevem uma a0ordagem na 'ual são adotados m=todos externos ao sistema de indexação 'ue este;a sendo estudado, a m de esta0elecer um con;unto de documentos considerados Rsimilares em conteHdoO. :m!regando con;untos desse ti!o Beles os denominam aglomerados de documentos 'ue servem de crit=rioC como 0ase !ara avaliação, examinam tr>s caracter+sticas dos termos de indexação atri0u+dos a itens do con;unto em determinada 0ase de dados 1. % extensão com 'ue os termos unem itens ans. % medida ?0via disso = a 'uantidade de termos 'ue oram a!licados a todos ou P maioria dos itens do con;unto. Ms itens serão tidos como intimamente unidos se v"rios termos de assuntos 8ouverem sido a!licados a todos eles. ). % extensão com 'ue os termos discriminam entre esses con;untos na 0ase de dados. % medida mais ?0viaO disso = a re'>ncia com 'ue termos 'ue se a!licam P maioria dos documentos do con;unto ocorrem na 0ase de dados como um todo 1. /ermos muito comuns não são 0ons discriminadores. Dor exem!lo, no :LI2:, o termo 8umano !ode a!licar-se a cada item num con;unto, mas tem !ouca utilidade !ara se!arar este con;unto de outros, uma vez 'ue se a!lica a inHmeros outros itens da 0ase de dados. Dor outro lado, termos 'ue ocorrem muito raramente na 0ase de dados como um todo serão Hteis em 0uscas altamente es!ec+cas, !or=m terão !ouca serventia na identicação de con;untos um !ouco maiores. 3. % extensão com 'ue os termos discriminam minuciosamente entre documentos distintos. %'ui tam0=m a raridade = uma medida a!lic"vel. o mesmo modo = a exaustividade da indexação um termo !ode a!licar-se a todos os itens de um con;unto, mas não !ode discriminar entre seus mem0ros$ 'uanto mais termos adicionais orem atri0u+dos a cada mem0ro, mais dierenças individuais serão identicadas. Dara examinar a 'ualidade dessa orma, deve-se !rimeiro esta0elecer os con;untos de teste, recu!erar registros !ara os mem0ros de cada con;unto de uma 0ase de dados, e estudar as caracter+sticas dos termos atri0u+dos. W8ite e @rit8 em!regaram essa t=cnica !ara com!arar a indexação de seus con;untos de teste em dierentes 0ases de dados. Eom!arar 0ases de dados dessa maneira = conrmar o !ressu!osto de 'ue os itens do con;unto de teste são de ato similares em seu conteHdo. W8ite e @rit8 em!regaram a co-citação como 0ase !ara esta0elecer seus con;untos de teste, em0ora outros m=todos, inclusive o aco!lamento 0i0liogr"co, tam0=m !ossam ser utilizados. % utilidade desse tra0al8o = limitada !elo ato de 'ue somente oram em!regados aglomerados muito !e'uenos Bna aixa de tr>s a oito itensC. %l=m disso, a validade do m=todo %;ieruXe e E8u B19C criticam o +ndice de discriminação adotado !or W8ite e @rit8 !or'ue não leva em consideração o taman8o da 0ase de dados$ !ro!em uma medida alternativa 'ue leve isso em conta. :m artigo relacionado a esse BE8u e %;ieruXe, 199C, a!licam os crit=rios de avaliação de W8ite#@rit8, com seu !r?!rio +ndice de discriminação modicado, na avaliação da indexação em 0ases de dados de 0i0lioteconomia. 1
69
como teste da indexação eita !or seres 8umanos de!ende inteiramente de se estar dis!osto a aceitar um aglomerado de co-citaçes como sendo um !adrão leg+timo. Doder-se-la a!resentar um argumento convincente, segundo o 'ual aria mais sentido em!regar indexadores es!ecialistas como !adrão !ara aerir a legitimidade do aglomerado de co-citaçes. W8ite e @rit8 armam 'ue o m=todo = Htil !ara um !rodutor de 0ases de dados aerir a 'ualidade da indexação, e a!resentam exem!los de termos 'ue talvez devessem ter sido utilizados !elos indexadores do :LI2: ou acrescentados ao voca0ul"rio controlado. :ssas aeriçes de R'ualidadeO !odem, entretanto, ser eitas de modo mais sim!les con;untos de itens denidos !or um termo ou termos determinados B!or exem!lo, Rsu!ercondutoresO ou Rsu!ercondutividadeO, 'ue ocorram como termos de indexação ou !alavras do textoC são recu!erados de diversas 0ases de dados e sua indexação = com!arada sem o em!rego da cocitação como !adrão. Eom eeito, este ti!o de estudo tam0=m oi eito !elo mesmo gru!o de !es'uisadores BcEain et al., 196C. Dara 11 !edidos ormulados !or es!ecialistas nas ci>ncias m=dicas com!ortamentais, oram eitas 0uscas com!aradas nas 0ases :LI2:, :xcer!ta edica, DSqEI2FM, SEIS:%7EY e SMEI%L SEIS:%7EY. 2as tr>s !rimeiras as 0uscas oram eitas com aC termos controlados, e 0C linguagem natural, e nas 0ases de citaçes oram eitas aC em!regando a linguagem natural dos t+tulos, e 0C em!regando citaçes de itens relevantes con8ecidos como !ontos de entrada. :m0ora o o0;etivo da !es'uisa osse estudar a 'ualidade da indexação do :LI2:, !ouco desco0riu 'ue se traduzisse em recomendaçes P 2ational Li0rarA o edicine 'uanto P !r"tica da indexação, em0ora se zessem recomendaçes so0re o alcance da indexação. %s concluses mais im!ortantes do estudo oram 1C a incor!oração de m=todos de linguagem natural nas estrat=gias de 0usca resultou em mel8oramentos signicativos da revocação em com!aração com o em!rego somente de termos controlados, )C a recu!eração de citaçes deve ser considerada um com!lemento im!ortante !ara a recu!eração 0aseada em termos !or'ue !odem ser encontrados itens relevantes adicionais com o em!rego do m=todo de citaçes, e 3C nen8uma 0ase de dados !ode sozin8a ornecer uma co0ertura com!leta de uma 0i0liograa multidisci!linar com!lexa. + qualidade medida com o empreo de um padrão
:m estudo realizado !ara a 2ational Li0rarA o edicine BLancaster et al., 1995C, desenvolvi um m=todo !ara avaliar a 'ualidade da indexação !ara o :LI2:, seguindo a orientação !ro!osta !or 7olling B191C, 'ue consistia em com!arar o tra0al8o dos indexadores com um R!adrãoO, 'ue seria um con;unto de termos esta0elecido de comum acordo !or indexadores altamente ex!erientes. % gura 36 mostra o exem!lo do !adrão !ara um artigo e a gura 3 mostra os termos selecionados !or dois indexadores dierentes !ara este mesmo artigo.
Figura 36 ( RDadrãoO de indexação !ara um artigo m=dico, mostrando escores relativos P atri0uição de v"rios ti!os de termos
M !adrão re!resenta o consenso de um gru!o de indexadores ex!erientes so0re 'ual seria a indexação RidealO !ara esse item. :les c8egaram a 1 termos.
exem!lo, /MM@7%FI% EMD %M7I_%% DM7 7%IMS , oi selecionado como um termo mais im!ortante, do mesmo modo 'ue a com0inação &%kM#%2M7%LI%:S. 2ote-se 'ue o asterisco a!licado a um su0ca0eçal8o = automaticamente trans!ortado !ara o ca0eçal8o ao 'ual se ac8a ligado.
Figura 3 ( :scores de dois indexadores em com!aração com o !adrão da gura 36
M escore reNete a im!ortncia dos diversos termos e com0inaçes de termos segundo o ;ulgamento dos indexadores es!ecialistas, a sa0er 5 !ontos !or ca0eçal8o de assunto atri0u+do corretamente sem asterisco 5 !ontos !or eti'ueta BP 'ual não se a!licam asteriscosC 3 !ontos !or su0ca0eçal8o sem asterisco 14 !ontos !or ca0eçal8o de assunto sem asterisco 4 !ontos !or su0ca0eçal8o sem asterisco. M escore m"ximo !oss+vel !ara esse item = 143. Isto =, na 8i!?tese muito im!rov"vel de um indexador re!etir exatamente o !adrão, ser-l8e-ia atri0u+do o escore com!leto. Kual'uer desvio do !adrão - não atri0uir um termo necess"rio, não usar o asterisco ade'uadamente, ou em!regar um termo ora do !adrão resulta na !erda de !ontos. 2ote-se como os termos e as com0inaçes de termos realmente im!ortantes contri0uem grandemente !ara o escore. M termo &%kM leva tr>s su0ca0eçal8os, um deles com asterisco. &aço az 14 !ontos !or'ue rece0e um asterisco do su0ca0eçal8o com asterisco %2M7%LI%:S, de modo 'ue o escore total !ara esta com0inação = de 14 !ara o ca0eçal8o !rinci!al com asterisco, cinco !ara o su0ca0eçal8o com asterisco e tr>s cada um !ara os outros dois ca0eçal8os, num total de )5. :sse item oi indexado duas vezes, uma !elo indexador % e uma !elo indexador & Bgura 3C. Dontuar o tra0al8o dos indexadores = um !ouco mais com!lexo !or'ue eles rece0em uma !ontuação !ositiva !ela atri0uição correta dos termos no !adrão e uma !ontuação negativa 1
!ela atri0uição de termos 'ue não se;am do !adrão. Kuando o indexador acerta exatamente o !adrão !ara um termo, o escore !ara esse termo = transerido !ara o escore do indexador. Kual'uer desvio resulta num escore reduzido ou, o 'ue = !ior, num escore negativo. % !ontuação com!leta = a seguinte Eoincid>ncia exata com o !adrão trans!ortar o escore do !adrão -6 !ara ca0eçal8o com asterisco ora do !adrão - !ara su0ca0eçal8o com asterisco ora do !adrão -3 !ara ca0eçal8o sem asterisco ora do !adrão -1 !ara su0ca0eçal8o sem asterisco ora do !adrão !ara um ca0eçal8o com asterisco colocado !elo indexador, !or=m sem asterisco no !adrão Bao contr"rio do 5 se o asterisco não osse atri0u+do !elo indexadorC !ara um ca0eçal8o com asterisco no !adrão, mas não colocado !elo indexador Bao contr"rio de 14 se o asterisco osse atri0u+do corretamenteC -1 !ara su0ca0eçal8o com asterisco no !adrão, mas 'ue o indexador não atri0uiu. uito em0ora isso !areça 0astante com!lexo, não = 0em assim !or'ue, uma vez denido o m=todo de !ontuação, = !oss+vel escrever !rogramas 0em sim!les Be alguns ;" oram escritosC tanto !ara !ontuar o !adrão 'uanto !ara !ontuar o tra0al8o dos indexadores em com!aração com o !adrão. % a!licação de escores P indexação da 2ational Li0rarA o edicine = mais com!lexa do 'ue o seria em muitas outras situaçes, devido ao em!rego de su0ca0eçal8os e P distinção entre descritores mais e menos im!ortantes, de modo 'ue ca tam0=m mais di+cil alcançar um acordo so0re 'uais devam ser os escores. %inda 'ue os escores num=ricos verdadeiros usados nesses exem!los BreaisC se;am considerados um tanto ar0itr"rios, eles de ato reNetem a enormidade !erce0ida de v"rios ti!os de erro indexado. Se tiver 8avido acordo 'uanto aos escores, esse m=todo de avaliação da indexação = 0astante discriminativo. Isto =, reNete claramente os desvios em relação ao !adrão. :m0ora, nesse exem!lo es!ec+co, nem o indexador % nem o indexador & ten8am se sa+do muito 0em, = evidente 'ue % cou mais !erto do !adrão do 'ue &, e os escores reNetem isso. & !erdeu !or ter deixado de ora !or com!leto um termo considerado Rim!ortanteO !elo !adrão e tam0=m !or'ue introduziu v"rios termos externos ao !adrão. Eomo oi antes salientado neste ca!+tulo, a 'ualidade da indexação = mais 0em avaliada no contexto de uma avaliação com!leta do sistema de recu!eração no 'ual são utilizados !edidos de usu"rios reais, como aconteceu no estudo so0re o :L%7S BLancaster, 195aC. 2ão o0stante, a utilização do m=todo do R!adrão-ouroO !ode ser ecaz, es!ecialmente na avaliação do !rogresso de indexadores em ase de treinamento e na com!aração do tra0al8o de um gru!o de indexadores com o de outro gru!o. :sse Hnico exem!lo ilustra tam0=m como a concordncia 'uanto ao uso de eti'uetas = muito mais "cil de alcançar do 'ue a concordncia 'uanto a outros termos, e 'ue 'uanto mais renada or a indexação Bmediante o em!rego de mHlti!los su0ca0eçal8os e asteriscosC mais di+cil ca alcançar acordo total. Susanne Yum!8reA B1994C, da 2ational Li0rarA o edicine, !ro!Qs um m=todo de !ontuação 'ue usa escores de 'ualidade !ara medir a coer>ncia da indexação. 2esse m=todo, de!ois 'ue os indexadores 8a;am sido !ontuados em cote;o com o !adrão, o tra0al8o !ontuado 'ue cada um executou num artigo torna-se o !adrão em com!aração com o 'ual cada um dos indexadores ser" avaliado, cada um !or seu turno, no 'ue tange P coer>ncia. M em!rego desse m=todo !ode ser ilustrado !or meio de um exem!lo sim!les, como o seguinte Indexador + %#a c#d E#c
53 533 144
/otal
1
Indexador B %#a E#c #d : /otal
53 144 53 5
Se % or o !adrão, o indexador & az )9 !ontos Bos escores !ara os termos em 'ue & concorda com %C, de modo 'ue a coer>ncia = ex!ressa como )9#1, ou 6,6. Se & or o !adrão, o escore de % = de )9#, ou 54,9. Kuando as duas com!araçes B% com &, & com %C são com0inadas, a m=dia alcançada = de 5,3. :m0ora engen8oso, não ca totalmente claro 'ual o verdadeiro signicado do escore. &asicamente, em0ora os escores de R'ualidadeO 8a;am sido !reservados, a 'ualidade não est" sendo medida diretamente B!ois o escore de nen8um dos indexadores = com!arado com o !adrãoC. /rata-se sim!lesmente de uma medida alternativa de coer>ncia 'ue, conorme oi sugerido no ca!+tulo anterior, tem !elo menos o m=rito de levar )
em conta a im!ortncia relativa dos termos. Isto =, se um indexador deixar de usar uma com0inação de alta !ontuação utilizada !or outro indexador, isso reduzir" o escore de coer>ncia entre eles muito mais do 'ue o aria a alta de concordncia 'uanto a um termo de 0aixo escore.
3
%ap&tulo E 0 5esumos: tipos e funç$es M resumo = uma re!resentação sucinta, !or=m exata, do conteHdo de um documento. :ndres-2iggemeAer B199C adota denição semel8ante [s rases da introdução seguidas de duas ou tr>s rases das concluses ou resumo do autor !odem dar uma 0oa indicação da'uilo de 'ue trata um artigo de !eri?dico. M verdadeiro resumo, ainda 'ue inclua !alavras 'ue ocorram no documento, = um texto .criado !elo resumidor e não uma transcrição direta do texto do autor. M termo RsumarizaçãoO = 8o;e muito usado !ara designar 'ual'uer !rocesso 'ue !roduza re!resentaçes condensadas de textos e, assim, a!lica-se tanto P redação de resumos 'uanto de extratos. Ms resumos !odem ser caracterizados de inHmeras ormas, inclusive segundo sua extensão. 2a gura 3, !or exem!lo, a!resentam-se dois resumos dierentes, um mais extenso do 'ue o outro. 2ão 8" a0solutamente razão alguma !ela 'ual todos os resumos ten8am a!roximadamente a mesma extensão. :ntre os atores 'ue inNuem na extensão de um resumo temos os seguintes 1. % extensão do item 'ue est" sendo resumido BEraven, 199, no entanto, não encontrou correlação entre a extensão do artigo e a extensão do resumo, !or=m ele tra0al8ou com uma "rea tem"tica muito limitadaC$ ). % com!lexidade do conteHdo tem"tico$ 3. % diversidade do conteHdo tem"tico. Dor exem!lo, um resumo !re!arado !ara os anais de um evento talvez !recise ser 0astante longo se os tra0al8os a!resentados a0rangerem uma am!la gama de assuntos$ . % im!ortncia do item !ara a instituição 'ue ela0ora o resumo. %ssim como ocorre com a exaustividade da indexação, um centro de inormação industrial talvez !recise redigir resumos mais longos dos relat?rios da !r?!ria em!resa do 'ue de outros itens$ 4. % Racessi0ilidadeO do conteHdo tem"tico. :s!ecialmente num serviço de resumos em orma de !u0licação, seria sensato azer resumos mais com!letos de documentos menos acess+veis sicamente Bcomo relat?rios de circulação limitada ou tra0al8os a!resentados em eventosC ou intelectualmente B!or exem!lo, redigidos em l+nguas !ouco con8ecidasC. 5. Eusto. 7esumos longos não cam necessariamente mais caros do 'ue resumos curtos. e ato, talvez demore mais a redação de uma 0oa s+ntese de ) !alavras do 'ue uma de 4. ?0vio, !or=m, 'ue o custo de um serviço de resumos em ormato im!resso aumentaria de modo ex!ressivo se a extensão m=dia dos resumos aumentasse 4f, !or exem!lo. Isso teria reNexo so0re todos os custos, desde a com!osição do texto, at= o !a!el e correio. 6. Finalidade. ncia de !az 'ue inclua a MLD, 0C não avorecer nem Israel nem as naçes "ra0es, cC manter relaçes amistosas com am0os. Ms entrevistados indicaram se estavam sucientemente inormados so0re os %l=m de tudo, o cam!o da indexação e recu!eração de v+deo costuma em!regar RanotaçãoO ao inv=s de RindexaçãoO, o 'ue = im!erdoavelmente enganoso. 1
v"rios gru!os nacionais da região. Figura 39 ( 7esumo indicativo
Isto =, o resumo indicativo mencionaria 'uais os ti!os de resultados alcançados 1C estudo, en'uanto o inormativo aria uma s+ntese dos !r?!rios resultados. Eremmins B1995C ex!lica 'ue os resumos indicativos cont>m inormaçes so0re a nalidade, alcance ou metodologia, mas não so0re os resultados, concluses ou recomendaçes. Dor outro lado, o resumo inormativo inclui inormaçes so0re o0;etivo, alcance e m=todos, mas tam0=m deve conter resultados, concluses ou recomendaçes. Dara algumas nalidades, um 0om resumo inormativo serviria como um su0stituto razo"vel da leitura do documento. 1 im!rov"vel 'ue um resumo indicativo sirva como su0stituto dessa orma. Seu !ro!?sito !rinci!al seria indicar ao leitor do resumo se seria !rov"vel 'ue viessem a 'uerer ler o original. Dor razes ?0vias, os resumos inormativos costumam ser mais longos do 'ue os indicativos. /am0=m são mais di+ceis de redigir. 7ealmente, em0ora comumente se;a !oss+vel redigir um resumo inormativo de um estudo ex!erimental, talvez isso se;a 'uase im!oss+vel no caso de um estudo te?rico ou um texto o!inativo. Dor isso, os resumos inormativos ocorrem com mais re'>ncia nas ci>ncias exatas e tecnologia do 'ue nas ci>ncias sociais ou 8umanidades. :ntrevistas teleQnicas realizadas em 194 com 544 norte-americanos, selecionados !or amostragem !ro0a0il+stica, !roduziram estes resultados a maioria B4-45fC ac8a 'ue deve ser reduzida a a;uda norte-americana a Israel e ao :gito$ a maioria B54fC = avor"vel P !artici!ação norte-americana numa coner>ncia de !az 'ue inclua a MLD$ mais de f consideram im!ortante 'ue os :<% manten8am relaçes amistosas tanto com Israel 'uanto com os !a+ses "ra0es$ 6f acreditam 'ue os :<% não devem avorecer a nen8um dos lados$ a maioria B44fC ac8a 'ue a criação de um :stado !alestino = essencial !ara a !az na região. Ms israelenses são o gru!o nacional mais con8ecido e os s+rios o gru!o menos con8ecido. % situação "ra0e-israelense s? = su!erada !elo conNito na %m=rica Eentral entre os !ro0lemas internacionais mais s=rios enrentados !elos :<%. Figura ( 7esumo inormativo
m em mira. Dor exem!lo, su!on8amos um relat?rio so0re !oluição atmos=rica resumido numa !u0licação destinada a 'u+micos. @rande !arte do resumo, 'ue trata dos as!ectos am0ientais, = meramente indicativa, mas uma !arte dele ser" realmente inormativa B!or exem!lo, a!resentando resultados de an"lises eitas em amostras da atmoseraC. m em mira. Mu se;a, na redação de resumos, 0em como na indexação, a !ergunta norteadora deve ser [Dor 'ue nossos usu"rios !rovavelmente se interessarão !or este item^ Ms resumos !re!arados !or uma instituição !ara serem usados internamente estarão sem!re inclinados !ara as necessidades e interesses locais. % situação = um !ouco mais com!licada no caso de serviços de resumos em orma de !u0licação. Faz-se dierença entre serviços orientados !ara uma disci!lina e os orientados !ara uma missão. Ms !rimeiros 0uscam acender Ps necessidades de uma disci!lina B!or exem!lo, 'u+mica, 0iologia, ci>ncias sociaisC en'uanto os Hltimos !rocuram ir ao encontro das necessidades de determinada indHstria ou gru!o de indiv+duos B!or exem!lo, resumos !ara a indHstria da 0orrac8a ou resumos !ara enermeirosC. % inclinação !ara um assunto = mais relevante e vi"vel no caso de serviços orientados !ara uma missão do 'ue !ara os 'ue se orientam !ara uma disci!lina, !or'ue os interesses dos usu"rios dos !rimeiros costumam ser mais 8omog>neos e es!ecializados do 'ue os interesses dos usu"rios dos Hltimos. Delo menos Isso não est" isento de !erigos. Dor exem!lo, YaAnes et al. B199C a!resentam ind+cios 'ue sugerem 'ue os m=dicos Ps vezes tomam decises so0re o tratamento dos !acientes 0aseados em leituras 'ue não alcançam a totalidade do texto dos artigos m=dicos. :sse risco = agravado !elo tato de estudos recentes mostrarem 'ue os resumos nas revistas m=dicas, mesmo as mais im!ortantes, tendem a ser muito decientes Bver ca!+tulo 9C. 1
4
um estudo mostrou 'ue 0em !ouca inclinação !ara um assunto ocorre em serviços de resumos em ormato im!resso BYerner, 1949C. Mutro ti!o de resumo = o resumo critico. /rata-se, com eeito, de uma Rrecensão cr+tica condensadaO. %!licado a relat?rios, artigos de !eri?dicos e outros itens relativamente 0reves, o resumo cr+tico serve 'uase ao mesmo !ro!?sito de uma recensão cr+tica de livro. M resumo cr+tico = avaliador. M resumidor o!ina so0re a 'ualidade do tra0al8o do autor e !ode at= com!ar"-lo com o de outros. Dor exem!lo, um resumo cr+tico do item mostrado na gura 3 mencionar" as deci>ncias da metodologia utilizada - a maneira como se o0teve a amostra da !o!ulação, o taman8o da amostra, a maneira com as 'uestes oram ormuladas - ou com!arar" os resultados com os de !es'uisas anteriores. Eomo os redatores devem ser es!ecialistas de ato, os resumos cr+ticos são 0astante raros. uas !u0licaçes 'ue anunciam a caracter+stica de incluir resumos cr+ticos são at8ematical 7evieVs e %!!lied ec8anics 7evieVs B%7C. % gura 1 mostra um resumo cr+tico real re!roduzido da Hltima dessas !u0licaçes. 2ote-se 'ue o resumo = assinado e com0ina elementos descritivos e cr+ticos. s. *inalidade dos resumos
Doder+amos mencionar muitas e dierentes nalidades dos resumos. % mais im!ortante, talvez, = 'ue os resumos acilitam a seleção. Mu se;a, a;udam o leitor a decidir se determinado item a!resenta a !ossi0ilidade de satisazer a seu interesse. esse modo, !ou!am tem!o ao leitor, evitando, !or exem!lo, 'ue o0ten8a artigos 'ue não teriam interesse !ara ele. :m alguns casos, tam0=m, um 0om resumo inormativo !ode realmente su0stituir a leitura de um item 'ue se;a de interesse !ara o usu"rio. Ms resumos são !articularmente Hteis !ara esclarecer o conteHdo de documentos escritos em l+nguas 'ue o leitor descon8eça. Tanes B1991C desco0riu, o 'ue não causou sur!resa, 'ue os resumos eram mais ecientes do 'ue outras !artes do registro, como t+tulos e termos de indexação, na avaliação da relevncia de um item.
5
Figura 1 ( :xem!lo de um resumo cr+tico
7e!roduzido de %!!lied ec8anics 7evieVs, 36, 19, com !ermissão da editora
% im!ressão e distri0uição de resumos = um meio ecaz !ara manter as !essoas inormadas a res!eito da 0i0liograa recentemente !u0licada em seus res!ectivos cam!os de interesse Bisto =, !ro!orcionando-l8es um serviço de alerta ou noticação correnteC. Eonorme oi mencionado anteriormente, os resumos 'ue acom!an8am artigos ou relat?rios são Hteis !ara o indexador na medida em 'ue o a;udam a identicar, do modo mais r"!ido !oss+vel, o conteHdo tem"tico dominante do documento. &orXo e &ernier B1964C sugerem 'ue os resumos !odem su0stituir o texto integral nas atividades de indexação, !or=m esta = uma !r"tica nem sem!re conveniente. Finalmente, os resumos desem!en8am atualmente im!ortante !a!el nos sistemas de recu!eração inormatizados !or'ue acilitam a identicação de itens !ertinentes e !ro!orcionam acesso a itens armazenados Bnos sistemas em 'ue o texto dos resumos = armazenado em ormato 'ue se !resta P recu!eraçãoC. Levando em conta tanto a revocação 'uanto a !recisão, oi demonstrado 'ue os !rocessos autom"ticos de recu!eração 0aseados em resumos eram mais ecazes do 'ue a'ueles 0aseados nos textos integrais dos documentos BLam-%desina e Tones, )1C, em0ora ainda altem mais evid>ncias acerca desse !onto. YartleAe &en;amin B199C alegam 'ue os resumos cresceram de im!ortncia ao longo dos anos na medida em 'ue cresceu a literatura cient+ca 2a realidade, a natureza dos resumos alterou-se ao longo dos anos, na medida em 'ue mais e mais artigos cient+cos !assaram a com!etir entre si !ara atrair a atenção dos leitores. Yo;e os leitores !recisam com!ulsar e !es'uisar mais do 'ue o aziam no !assado, e o resumo evolui continuamente como um !ortal de acesso P literatura cient+ca B!. 41-4)C.
2a ci>ncia, salientam eles, os resumos estão cando mais extensos e mais orientados !ara os resultados. Dara certas nalidades, o resumo estruturado = !reer+vel a um resumo em ormato de texto narrativo.
!rocurar es!ecicamente os itens listados. % ela0oração do resumo consiste em colocar os RvaloresO a!ro!riados no ga0arito. Kuer dizer, indicam-se !ara cada artigo o ti!o de irrigação, o ti!o de solo, os !rodutos cultivados, as condiçes clim"ticas e a localização, sendo em!regados c?digos 'ue re!resentam os ti!os de resultados o0tidos. :ste ti!o de resumo = Htil na com!ilação de manuais 'ue sintetizam um grande nHmero de estudos realizados em determinado cam!o. 2o entanto, s? daria certo numa "rea tem"tica em 'ue os elementos essenciais !ermanecessem mais ou menos os mesmos entre os dierentes estudos. _8olXova B1964C descreve como se adotaria a an"lise de acetas !ara criar um resumo estruturado, mas não c8ega a convencer 'uanto P utilidade desse m=todo. YartleA et al. B1995C com!araram resumos estruturados com resumos não-estruturados numa atividade de 0usca de inormação. M0servaram 'ue os su;eitos de seu ex!erimento !odiam usar os resumos estruturados de modo mais ecaz Bisto =, com maior ra!idez e#ou menos errosC na localização de res!ostas a consultas ou na identicação de resumos 'ue ossem !ertinentes a determinado tema. 2o entanto, a orma como usam o termo RestruturadoO = muito dierente da min8a. Dara eles, um resumo estruturado = sim!lesmente o 'ue traz entre t+tulos B8ist?rico, o0;etivo, m=todos, resultados, conclusesC !ara acilitar a r"!ida visualização do texto Be do modo como = 8o;e usado em muitas revistas m=dicasC, en'uanto eu uso o termo !ara designar o resumo redigido em ormato não-narrativo. M ti!o de resumo estruturado da gura ) !oderia conce0ivelmente ser !roduzido com o uso de um !rograma de com!utador !ro;etado !ara identicar e extrair do texto os valores a!ro!riados Bver os coment"rios so0re o m=todo de !reenc8imento de !adrão !ara extração e sumarização de textos nos ca!+tulos 1 e 14. :m alguns lugares, o ti!o de resumo analisado !or YartleA et al. oi sim!lesmente designado como Rresumo mais inormativoO BYaAnes et al., 199$ YaAnes, 1993C, e acredito ser esta uma mel8or denominação. :ste ti!o de resumo estruturado ser" visto com mais vagar no !r?ximo ca!+tulo.
Figura ) ( @a0arito !ara um resumo estruturado
ncia do artigo. &roer diz 'ue essa orma de resumo = mais "cil de examinar e com!reender, e mostra um resumo convencional !ara com!aração Bgura 3C. uma !ro!osta curiosa, mas nunca se !o!ularizou. ncia da inormação
Figura 3 ( 7esumo em Rdiagrama de 0locoO de um artigo 8i!ot=tico ;unto com um resumo RconvencionalO !ara com!aração 7e!roduzido com !ermissão de T.W. &roer, [%0stracts in 0locX diagram orm^, I::: /ransactions on :ngineering Writing and S!eec8. B 1961, Institute o :lectrical and :lectronics :ngineersC
:ste ti!o de sumarização não = um resumo no sentido convencional$ no entanto, as literaturas concisasO certamente guardam uma relação com os resumos. %!resentam muitas a!licaçes !otenciais. Dor exem!lo, seria !oss+vel !roduzir um manual 'ue condensasse o 'ue se con8ece acerca de determinado enQmeno B!or exem!lo, uma doençaC na orma de uma s=rie de enunciados ultraconcisos, sendo cada um desses enunciados aco!lado a uma reer>ncia 0i0liogr"ca 'ue identicaria a onte de onde oi extra+do. 5esumos modulares
:m 195, Yerner and Eom!anA realizou um estudo !ara a 2ational Science Foundation so0re a via0ilidade de Ran"lises de conteHdo modularesO BLancaster et al., 1954C. :las contin8am dois com!onentes resumos modulares e entradas de +ndice modulares. 2as guras -4 a!resenta-se uma amostra disso.
9
Figura ( 7esumos modulares
Ms resumos modulares destinavam-se a ser descriçes com!letas de conteHdo de documentos correntes. Eada um !ossu+a cinco !artes citação, anotação, resumo indicativo, resumo inormativoOe resumo cr+tico. M con;unto ora !lane;ado de modo 'ue um serviço de resumos !odia !rocess"-lo !ara ada!t"-lo a seus !r?!rios re'uisitos com o m+nimo de esorço 'ual'uer resumo seria utilizado na +ntegra, ou os m?dulos teriam o texto reorganizado !ara ormar, !or exem!lo, um resumo !arcialmente indicativo, !arcialmente inormativo, ou um resumo !arcialmente inormativo, !arcialmente cr+tico. % nalidade !rimordial dos resumos modulares era eliminar a du!licação e o des!erd+cio de esorço intelectual envolvidos na ela0oração, de orma inde!endente, de resumos dos mesmos documentos !or v"rios serviços, sem 'ual'uer intenção de im!ingir resumos R!adronizadosO a serviços cu;as exig>ncias variam notavelmente 'uanto P orma e P inclinação !ara um assunto. /anto os resumos 'uanto as entradas de +ndice eram !re!arados !or es!ecialistas no assunto, e a intenção era de 'ue eles conciliariam os re'uisitos de ra!idez de !u0licação com a meticulosidade de resumos !re!arados !or es!ecialistas. Seu ormato e tratamento !adronizados tam0=m reduziriam o !rocessamento re!etitivo e acelerariam o Nuxo de tra0al8o nos serviços de resumos 0eneci"rios.
Figura 4 ( :ntradas de +ndices modulares
%s entradas de +ndices modulares sugeriam termos descritivos, extra+dos de voca0ul"rios de indexação re!resentativos, 'ue !oderiam ser utilizados com!letos, com a!ereiçoamentos 9
ou acr=scimos, !ara indexar o resumo oriundo do !acote modular. Ms voca0ul"rios de indexação re!resentativos, utilizados como ontes !ara as entradas do +ndice modular, seriam extra+dos dos +ndices correntes ou de listas autorizadas dos serviços de resumos e indexação !artici!antes, reNetindo assim os estilos e !ol+ticas de indexação desses serviços. /estou-se essa !ro!osta no cam!o da transer>ncia de calor, !ois, sendo este assunto altamente interdisci!linar, revestia-se de interesse !otencial !ara inHmeros serviços de resumos. Eon;untos de resumos#entradas de +ndice oram !re!arados e su0metidos P a!reciação de diversos serviços !ara 'ue ossem !rocessados rotineiramente. :sses serviços !reenc8eram 'uestion"rios de avaliação da !ro!osta. % conclusão oi 'ue era !oss+vel !roduzir uma an"lise de conteHdo, em orma modular, 'ue seria adotada como entrada !or v"rios serviços de resumos, mas 'ue a maioria deles relutava em a0rir mão de sua autonomia a m de !m1ici!ar do ti!o de centro reerencial im!l+cito no m=todo modular.
Figura 5, Darte 1 ( Eom!aração de minirresumo, resumo de autor e resumos !u0licados em E8emical %0stracts e &iological %0stracts Bver a !arte ) da guraC
7e!roduzido de Lunin B1956C com !ermissão da rexel
Eraven B196C analisa um m=todo modular 0astante dierente. 2este caso, um analista marca e codica um texto !ara ormar uma Rre!resentação intermedi"riaO 'ue !ode então ser usada, de modo sem i-autom"tico, !ara !roduzir resumos tal8ados Ps necessidades de dierentes !H0licos.
91
Figura 5, Darte )
Finirresumos
M termo RminirresumoO = 0astante im!reciso. Signicaria sim!lesmente um resumo curto. a orma como oi em!regado !or Lunin B1956C, no entanto. o termo reere-se a um resumo altamente estruturado destinado essencialmente a 0uscas eitas em com!utador. /rata-se, com eeito, de um ti!o de cruzamento entre um resumo e uma entrada de +ndice, e Lunin o dene como um [+ndice-resumo leg+vel !or com!utador^. Ms termos utilizados no resumo são extra+dos de um voca0ul"rio controlado e reunidos numa se'>ncia es!ecicada. Dor exem!lo, o enunciado [:xiste um decr=scimo da 'uantidade de zinco no sangue de seres 8umanos com cirrose do +gado^ seria escrito assim #:E7#_I2EM#S%2@<:#Y<%2MS#EI77MS:#FJ@%M
M0serve-se 'ue o resumidor !rocura ater-se a uma se'>ncia de termos tão !r?xima 'uanto !oss+vel da estrutura normal da rase. M conteHdo de um documento !ode ser descrito com algum detal8e !or meio do em!rego de uma s=rie desses enunciados es'uem"ticos. :m0ora ten8am sido imaginados 0asicamente !ara acilitar as 0uscas !or com!utador, os minirresumos de Lunin tam0=m !odem azer sentido !ara o leitor inteligente. % gura 5, re!roduzida do tra0al8o de Lunin, com!ara os resultados da t=cnica de minirresumos com resumos do $iological A%stracts e do "hemical A%stracts e com o resumo de autor. 5esumos telerácos
% denominação Rresumo telegr"coO = tam0=m im!recisa. :la im!lica uma re!resentação de documento 'ue = a!resentada de modo muito lacQnico não com rases com!letas e semel8ante a um telegrama. 2a realidade, seria a!enas uma cadeia de termos des!rovida de sintaxe. Ms minirresumos de Lunin são de estilo telegr"co. % ex!ressão Rresumo telegr"coO oi em!regada !ara designar um com!onente essencial do !rimitivo sistema de recu!eração com!utadorizado desenvolvido na Western 7eserve
9)
%ap&tulo G 0 + redação do resumo %ssim como acontece com a indexação, s? se a!rende a ser um 0om resumidor com a !r"tica. M m"ximo 'ue se !ode azer num livro como este = oerecer algumas diretrizes gerais. : tam0=m como acontece na indexação, o 0om resumidor a!render" a ler !assar os ol8os num documento !ara identicar ra!idamente os !ontos im!ortantes. Eremmins B1995C trata, com detal8es, de como ler um artigo !ara ca!tar os !ontos mais im!ortantes do modo mais eciente !oss+vel e a!resenta algumas regras com esta nalidade. :m grande !alie isso = evidente !or si mesmo e, de 'ual'uer modo, indiv+duos dierentes !reerem t=cnicas dierentes !ara !enetrar no mago de um texto. :m suma, as caracter+sticas de um 0om resumo são 0revidade, exatidão e clareza. M resumidor deve evitar redundncia. M resumo deve, !rinci!almente, ser estruturado a !artir das inormaçes contidas no t+tulo do item e não re!eti-las. Dor exem!lo, o t+tulo do artigo usado como exem!lo nas guras 3, 39 e = [Des'uisa nacional de o!inião !H0lica so0re as atitudes norte-americanas acerca do Mriente =dio^. % !rimeira lin8a de um resumo !u0licado desse artigo diz Ms resultados de uma !es'uisa realizada em evereiro de 194 so0re as atitudes !H0licas norte-americanas acerca do Mriente =dio.
claro 'ue isso !ouco acrescenta ao t+tulo, exceto a data. 2ote-se como os resumos das ilustraçes 3, 39 e !artem do t+tulo sem re!eti-la. M. resumidor tam0=m deve omitir inormaçes 'ue o leitor !rovavelmente ;" con8eça ou não l8e interessem diretamente. Isso inclui inormaçes so0re antecedentes ou atos de teor 8ist?rico, como, !or exem!lo, o motivo 'ue levou P realização do estudo ou dados so0re a ex!eri>ncia da em!resa 'ue o executa. &orXo e &ernier B1964C salientam 'ue ca0e ao resumidor indicar o 'ue o autor ez e não o 'ue tentou azer, mas não conseguiu ou o 'ue !retende azer no uturo. Kuanto menor, mel8or ser" o resumo, desde 'ue o sentido !ermaneça claro e não se sacri'ue a exatidão. Dalavras desnecess"rias como Ro autorO ou o artigoO são omitidas. Dor exem!lo, corta-se R:ste artigo examina... R !ara R:xamina...O. %0reviaturas e siglas convencionais são usadas sem!re 'ue or !rov"vel 'ue os leitores as con8eçam B!or exem!lo, MLDC. :m outros casos, !ode-se usar uma a0reviatura desde 'ue seu signicado se;a ex!licitado. Dor exem!lo \...] no 'uadro da Eoo!eração Dol+tica :uro!=ia BED:C. %s realizaçes \...] !or !arte da ED: \...]
Ms resumos em alguns cam!os cient+cos c8egam a em!regar muitas a0reviaturas. %!esar de economizar es!aço, isso diminui a inteligi0ilidade e, realmente, exige mais tem!o do leitor. % des!eito da necessidade de 0revidade, os resumos devem ser auto-sucientes$ não se lograr" um dos !rinci!ais o0;etivos do resumo se o leitor tiver de consultar Ro original !ara entender o resumo` mel8or evitar o ;argão. %s !alavras de um ;argão !odem signicar coisas dierentes !ara gru!os dierentes de leitores e não ser com!reendidas de maneira alguma !or certas !essoas. %lguns resumidores ac8am 'ue devem mudar as !alavras usadas !elo autor. %inda 'ue a !ar"rase se;a re'entemente necess"ria !ara se o0ter 0revidade, nada se tem a gan8ar, na 0usca de originalidade, com a mudança das !alavras em!regadas !elo autor. 2a realidade, = "cil distorcer o signicado do original ao !rocurar, deli0eradamente, !or motivos estil+sticos, encontrar ex!resses sucedneas. :ste as!ecto = vigorosamente enatizado !or Eollison B1961C im!ortante 'ue o resumidor em!regue, tanto 'uanto !oss+vel, o voca0ul"rio do autor$ a !ar"rase = !erigosa e !ode conduzir o leitor a lin8as de racioc+nio 'ue não eram a'uelas !retendidas !elo autor B!. 11C.
2o entanto, Eraven B199C constatou 'ue os resumos !ouco em!regam [se'>ncias literais de !alavras dos textos com!letos^, em0ora seu estudo osse circunscrito a uma "rea tem"tica muito restrita. M resumo = algo utilit"rio e não !recisa ser uma o0ra de arte, em0ora Eremmins B19)C acredite 'ue os resumos devam ter RelegnciaO al=m de clareza e !recisão. % norma norte-americana so0re resumos B@uidelines or a0stracts, 1996C es!ecica 'ue os ver0os devem ser usados na voz ativa B!or exem!lo, RMs indicadores de unção diminuem a revocaçãoO e não R% revocação = diminu+da !elos indicadores de unçãoOC sem!re 'ue !oss+vel, 93
mas 'ue a !assiva !ode ser utilizada !ara Renunciados indicativos e mesmo !ara enunciados inormativos em 'ue se deva destacar o rece!tor da açãoO. 1 :sta restrição = muito im!recisa e = mel8or es'uec>-la na maioria dos casos o tem!o ver0al !reerido ser" ?0vio !or razes de estilo. &orXo e E8atman B1953C e Weil B196C sugerem 'ue se em!reguem os ver0os no !ret=rito !ara a descrição de !rocessos e condiçes ex!erimentais e no !resente !ara concluses resultantes das ex!eri>ncias. M 'ue = l?gico as atividades relatadas !or um autor são coisas do !assado, en'uanto os resultados e as concluses ainda !ertencem ao !resente. &orXo e &ernier B1964C são mais ex!l+citos ao recomendar a voz ativa e o !ret=rito !ara resumos inormativos, e a voz !assiva e o !resente !ara resumos indicativos. %t= 8o;e oram ela0oradosO muitos con;untos de regras so0re redação de resumos. /alvez o con;unto mais conciso de !rinc+!ios destinados P ela0oração de resumos se;a o !roduzido !elo eense ocumentation Eenter B195C, re!roduzido na gura 6. :m !oucos e 0reves enunciados sintetiza as regras adotadas !elo centro so0re o 'ue incluir, o 'ue não incluir, 'ual a extensão 'ue o resumo deve ter e 'ual o ti!o de terminologia a ser adotado. ndice 1 deste livro.
Figura 6 ( Drinc+!ios !ara redação de resumos, do eense ocumentation Eenter B195C 7e!roduzidos com !ermissão do eense /ec8nical lnormation Eenter
%onteHdo e formato
M 'ue se deve incluir num resumo de!ende muito, = claro, do ti!o de !u0licação 'ue se tem em mira. nase P tese ou concluses do autor, tomando o cuidado de mencionar os !er+odos, localidades geogr"cas e !ersonalidades envolvidos.) :m "reas tem"ticas es!ecializadas, o resumidor !ode rece0er instruçes so0re certas coisas a serem !rocuradas nos artigos e destac"-las com clareza nos resumos. Isso !ode incluir itens tão diversos 'uanto dosagem de um medicamento, condiçes clim"ticas, idade dos indiv+duos, ti!os de solo, e'uaçes em!regadas ou o elemento com!onente de uma liga. Ms resumos costumam ser de redação mais "cil 'uando o conteHdo tem"tico trata de o0;etos concretos, e são de redação mais di+cil 'uanto mais a0strato ou ne0uloso or o assunto. % maioria dos resumos = a!resentada no ormato convencional de reer>ncias 0i0liogr"cas seguidas do texto do resumo. :m algumas !u0licaçes, no entanto, o resumo !recede a reer>ncia 0i0liogr"ca, e sua !rimeira lin8a = realçada de alguma orma, como no exem!lo seguinte % norma 0rasileira so0re resumos - 2&7 5), da %ssociação &rasileira de 2ormas /=cnicas B%&2/C - tam0=m !receitua o em!rego da voz ativa, sem trazer menção ao uso da voz !assiva B2./.C ) /i00o B199)C mostrou 'ue as normas !u0licadas relativas P redação de resumos são muito mais !ertinentes Ps ci>ncias do 'ue Ps 8umanidades. 1
9
% I@7%kM : M-:-M&7% : Mk%&IK<: D%7% %S I2%S % F7IE% M S
:sta = uma orma de a!resentação mais atraente, muito !arecida com o ca0eçal8o de uma mat=ria de ;ornal, e 'ue !ode ca!tar a atenção do leitor sem grande esorço. Weil et al. B1953C reerem-se a isso como resumo Rorientado !ara o leitorO, resumo Rde t?!ico rasal em !rimeiro lugarO ou resumo Rorientado !ara resultadoO Bem0ora o t+tulo não ten8a de ser necessariamente relacionado aos resultadosC. Se or ade'uado, o t+tulo do artigo !oder" transormar-se nesse ca0eçal8o, vindo em seguida um t?!ico rasal 'ue o desenvolva. Eonsidera-se um resumo com!leto como sendo com!osto de tr>s !artes a reer>ncia, 'ue identica o item resumido$ o cor!o do resumo Bo textoC$ e a assinatura. :ste Hltimo elemento = a atri0uição da origem do resumo as iniciais do resumidor ou a indicação de 'ue o resumo oi ela0orado !elo autor do item, de 'ue se trata de um resumo modicado de autor, ou deriva de uma onte diversa, como, !or exem!lo, outro serviço de resumos. uitos resumos !arecem situar-se na aixa de 1-)4 !alavras, mas, como se disse antes = natural 'ue a extensão varie de acordo com certos atores, como o taman8o do !r?!rio documento, o alcance de seu conteHdo tem"tico, a im!ortncia 'ue l8e = atri0u+da, sua dis!oni0ilidade +sica e acessi0ilidade intelectual B!or exem!lo, itens de di+cil localização, como tra0al8os a!resentados em eventos, ou em l+nguas !ouco con8ecidas, seriam resumidos com mais detal8es do 'ue outros itensC. &orXo e &ernier B1964C sugerem 'ue os resumos da literatura cient+ca deveriam ter comumente entre um d=cimo e um vig=simo da extensão do original, em0ora 7esniXop e ol0A B196)C indi'uem 'ue um trig=simo talvez se;a mais comum. &orXo e &ernier B1964C nos dão um consel8o Htil !ara a se'>ncia do conteHdo M cor!o do resumo !ode ser ordenado de modo a !ou!ar o tem!o do leitor. % colocação das concluses em !rimeiro lugar satisaz ao leitor e !oder" dis!ens"-lo de continuar a leitura. :le !ode aceitar ou re;eitar as concluses sem 'ue !recise con8ecer os resultados em 'ue se 0asearam. M desenvolvimento das inormaçes vir" em Hltimo lugar. *ericou-se ser desnecess"rio rotular cada !arte do resumo, como, !or exem!lo, concluses, resultados ou m=todos$ normalmente os leitores sa0em 'ual = a !arte 'ue estão lendo. % ordenação das !artes do cor!o do resumo = eita com a mesma nalidade com 'ue se organizam as !artes de uma mat=ria de ;ornal - !ara comunicar a inormação de modo mais r"!ido. 2ão conv=m a0rir !ar"graos. M resumo = 0reve$ deve ex!rimir um racioc+nio 8omog>neo e ser redigido como um Hnico !ar"grao B!. 59C.
e ato, a tend>ncia recente tem sido no sentido de dividir os resumos em !edaços menores mediante a a0ertura de !ar"graos e at= mesmo o uso de entre t+tulos. Isso tem sido vericado !rinci!almente em !eri?dicos de medicina. ncia da inormação, e 'ue estuda esta mesma situação, = mostrado na gura . :sse ti!o de resumo !assou a ser con8ecido como Rresumo estruturadoO, em0ora a orma como esta ex!ressão se;a a+ em!regada se;a 0astante dierente da orma como a utilizo. Euriosamente, desde 19, = !rov"vel encontrar na literatura m=dica um nHmero maior de artigos so0re RresumosO do 'ue na literatura de ci>ncia da inormação. 7esumos RestruturadosO de artigos m=dicos oram !u0licados !ela !rimeira vez na revista Annals o Internal Medicine, 'ue solicitava aos autores 'ue !re!arassem os resumos conorme um ormato 'ue l8es era !rescrito, tendo sido denidas regra 0astante a!uradas !ara sua redação Bver, !or exem!lo, YaAnes et al, 199C. % gura 9 cont=m uma s+ntese do ti!o de inormação a ser inclu+da, mas as instruçes aos autores são muito mais detal8adas. 2ão oi sem !ol>mica 'ue os resumos estruturados oram introduzidos nos !eri?dicos de medicina. YaAnes et al. B199C sugerem 'ue a ormatação muito r+gida !ode estimular alguns autores a reivindicar mais do 'ue seria ca0+vel. Dor exem!lo, se 8ouver um entre t+tulo m=todo ou delineamento ex!erimental, !ara !render a atenção do leitor, isso !ode levar alguns a alardear um eno'ue mais rigoroso do 'ue o 'ue seria realmente ;ustic"vel. Froom e Froom B1993a, 0C mostraram 'ue os resumos estruturados dos %nnals o Internal edicine nem sem!re contin8am todas as inormaçes exigidas nas instruçes !ara os autores, mesmo 'uando as inormaçes solicitadas estavam !resentes no !r?!rio artigo. YaAnes B1993C critica esse estudo, mas sua cr+tica não = convincente. /addio et al. B199C, 0aseando-se em estudo mais am!lo, co0rindo 3 resumos extra+dos de tr>s !eri?dicos, vericou 'ue os resumos estruturados a!resentavam maior !ro0a0ilidade de conter inormaçes mais com!letas de im!ortncia !ara a !es'uisa do 'ue os resumos não estruturados. Ms as!ectos so0re avaliação serão tratados no !r?ximo ca!+tulo. 94
esmo 'ue os resumos estruturados desse ti!o !ossam ter seus m=ritos, muitas vezes suas !retenses são exageradas. Dor exem!lo, YaAnes et al. B199C alegam 'ue eles [!odem acilitar a avaliação !elos !ares antes da !u0licação, a;udar os leitores 'ue exercem a cl+nica a encontrar artigos 'ue se;am tanto cienticamente corretos 'uanto a!lic"veis P !r"tica !rossional, al=m de !ermitir 0uscas 0i0liogr"cas inormatizadas mais !recisas^, em0ora nem todas essas alegaçes se;am documentadas. interessante 'ue, 'uase na mesma =!oca em 'ue a literatura m=dica desco0ria esse ti!o de resumo, /raVinsXi B199C examinava m=todos similares de redação de resumos em ci>ncia da inormação. :le tam0=m com!arou as caracter+sticas dos resumos assim redigidos com resumos da 0ase de dados I2SD:E. % literatura so0re resumos estruturados continua a crescer. YartleA B199C deende a mais am!la adoção desses resumos em !eri?dicos cient+cos. :le BYartleA, )0C tam0=m argumenta 'ue = !reciso alguma orma de resumo estruturado ;unto Ps revises sistem"ticas da literatura m=dica. %lega 'ue tais resumos devem ser mais "ceis de ler do 'ue os resumos de artigos de !es'uisa m=dica !or'ue as revises sistem"ticas t>m como alvo um !H0lico mais am!lo. 7:S<M %2/:E::2/:S Ms resumos estruturados, 'ue, como este, cont=m v"rios entre t+tulos, su0stitu+ram os resumos tradicionais na maioria dos !eri?dicos m=dicos. :studos de avaliação mostraram 'ue esses resumos normalmente oerecem mais inormaçes, são de mel8or 'ualidade, acilitam a avaliação !elos !ares e, em geral, são 0em-aceitos. M&T:/I*M M o0;etivo dos estudos a'ui re!ortados oi investigar uma outra !oss+vel vantagem dos resumos estruturados, a sa0er, se neles as 0uscas são ou não são mais "ceis de executar. /MM São relatados dois estudos. 2o estudo 1, eetuado numa 0ase de dados eletrQnica, solicitouse a 4) leitores 'ue encontrassem as res!ostas a duas !erguntas eitas a cada um de oito resumos em um ormato Bdigamos, tradicionalC seguidas de duas 'uestes !ara cada um de oito resumos com!ostos no outro ormato. Foram automaticamente registrados os dados de tem!o e erros. 2o estudo ), eetuado numa 0ase de dados im!ressa, solicitou-se a 45 leitores 'ue encontrassem cinco resumos 'ue relatassem determinado ti!o de estudo B!or exem!lo, estudos com escolares e testes de leituraC e de!ois ac8assem mais cinco outros 'ue relatassem outro ti!o de estudo. %l=m disso, a ordem e a!resentação do ormato oram com!ensadas. Ms dados de tem!o e erro oram registrados manualmente. . 7:Sncia assim=tricos !artici!antes 'ue res!onderam !rimeiro aos resumos estruturados res!onderam mais ra!idamente aos resumos tradicionais seguintes do 'ue o zeram os !artici!antes 'ue res!onderam !rimeiro aos resumos tradicionais. EM2EL
7e!roduzido de YartleA et al. B1995C com !ermissão do Tournal o Inormation Science
%rtigos originais 1. M0;etivo aBsC 'uestão BesC exataBsC a0ordadaBsC !elo artigo ). elineamento ex!erimental o delineamento 0"sico do estudo 3. %m0iente a localização e o n+vel da assist>ncia cl+nica . Dacientes ou !artici!antes o modo de seleção e o nHmero de !acientes ou !artici!antes 'ue iniciaram e c8egaram ao m do estudo 4. Intervençes o tratamento ou intervenção exata, se 8ouve algum 5. Drinci!ais medidas de resultado a medida undamental de resultado do estudo !lane;ada antes de iniciada a coleta de dados 6. 7esultados os !rinci!ais ac8ados . Eoncluses as !rinci!ais concluses inclusive a!licaçes cl+nicas diretas. %rtigos de revisão 1. Finalidade o o0;etivo undamental do artigo de revisão ). Fontes de dados um a!an8ado sucinto das ontes dos dados 3. Seleção dos estudos o nHmero de estudos selecionados !ara a revisão e como oram selecionados . :xtração dos dados regras !ara o resumo dos dados e como oram a!licadas
95
4. 7esultados da s+ntese de dados os m=todos de s+ntese de dados e !rinci!ais resultados 5. Eoncluses concluses !rinci!ais, inclusive a!licaçes !otenciais e necessidade de !es'uisas adicionais. Figura 9 ( Inormaçes essenciais de 'ue necessitam os cl+nicos !ara avaliar a relevncia e a 'ualidade de artigos e, !ortanto, !ara sua inclusão em resumos estruturados 7e!roduzido de YaAnes et al. B199C com !ermissão dos % uuals o Internal edicine
ncia individual, !arece des!ro!ositado a!resentar exem!los. Dara a;udar o resumidor em seu tra0al8o, !rinci!almente num !rograma de treinamento, conv=m !re!arar algum ti!o de !lanil8a 'ue o oriente so0re a'uilo 'ue deve !rocurar numa !u0licação. ncias e extra!olaçes razo"veis. 2ão são convenientes associaçes te?ricas im!recisas e 'uestes con;eturais.] Im!ortncia ou utilidade \Im!ortncia e com!et>ncia do tra0al8o realizado. %!licaçes !otenciais.] Limitaçes e deci>ncias \%s 8i!?teses são indevidamente restritivas ou limitantes M modelo te?rico est" muito distante de !oss+vel a!licação !r"tica Y" al8as t=cnicas M eno'ue do !ro0lema im!Qs limitaçes aos resultados Kue grau de com!lexidade oi adotado Youve an"lise suciente dos dados, !rinci!almente 'uanto a !oss+veis erros] Eoment"rios cr+ticos \:ventual erro undamental e magnitude dos erros. :ventual !u0licação anterior desta inormação. :xistem !es'uisas similares e 'ual = a !osição 'ue o !resente Ms t+tulos e descriçes da !lanil8a a'ui exem!licada 0aseiam-se nos utilizados no !ro;eto de resumos modulares de Yerner and Eom!anA BLancaster et al., 1954C. 1
96
tra0al8o ocu!a na 0i0liograa Kuais as caracter+sticas 'ue são !articularmente merit?rias % inter!retação dos resultados = razo"vel]
claro 'ue nem todas essas categorias serão a!lic"veis a todo item a ser resumido e as tr>s Hltimas somente a resumos cr+ticos. SolovOev B1961C estuda o uso, na redação de resumos, deste m=todo 0aseado em 'uestion"rio. Yo;e, naturalmente, = !rov"vel 'ue alguma orma de aux+lio ao !rocesso de redação do resumo, em lin8a e interativo, se;a mais atraente do 'ue a adoção desse ti!o de eno'ue estruturado, ainda 'ue exi0ido em lin8a na tela. Eraven B1995C desenvolveu um !rot?ti!o de sistema destinado a assistir os resumidores e c8egou a test"-lo !elo menos em car"ter !reliminar. M aux+lio P redação de resumos inclui um tesauro como um dos com!onentes BEraven, 1993C. %lguns autores !rocuraram desenvolver diretrizes !ara redação de resumos de certos ti!os de documentos. Dor exem!lo, SolovOev B191C sugere 'ue resumos de teses de doutorado ocalizem os seguintes !ontos im!ortncia atual do assunto, !ro0lema tratado e o0;etivo da !es'uisa, novidade cient+ca, metodologia, resultados e concluses Binclusive im!lementação dos resultadosC. :m0ora de modo um tanto conuso e, !or isso, com trec8os de di+cil inter!retação, o Eentro de ocumentação so0re 7eugiados do %lto Eomissariado das 2açes ncia ao Restilo da casaO Bextensão, estrutura, convençes ortogr"cas e de !ontuaçãoC e, o 'ue = mais im!ortante, o grau com 'ue ele atende Ps necessidades do usu"rio.
Figura 4 ( Fundamentos da redação de resumos
7e!roduzido do <2YE7 7eugee ocumentation Eentre B194C, com !ermissão do Eentro de ocumentação so0re 7eugiados do %lto Eomissariado das 2açes
Foram desenvolvidos RmodelosO mais ormais do !rocesso de redação de resumos B!or exem!lo, !or Zarasev, 196C. :m0ora tais modelos contri0uam !ara nosso entendimento das eta!as !ercorridas intuitivamente !elo resumidor, !arecem ser de !ouco valor !r"tico !ara os resumidores. esmo 'ue se recon8eçam alguns !rinc+!ios gerais im!l+citos no tra0al8o de resumir, = claro 'ue cada resumidor ter" seu !r?!rio modo de im!lementa-los. Eom eeito, :ndres2iggemeAer B199, 199C admitiu ter identicado 43 estrat=gias dierentes, com 0ase na gravação em ta dos !rotocolos 'ue a!enas seis resumidores !ensavam em voz alta. Ms as!ectos te?ricos dos resumos e sua redação são a0ordados mais amiHde !or autores euro!eus, !rinci!almente :ndres-2iggemeAer B199C e Dinto. :sta autora a!resenta, num livro em es!an8ol BDinto, )1C, um estudo com!leto so0re redação de resumos em seu contexto ling+stico mais am!lo. :ncontram-se verses !arciais em Dinto B1994C e Dinto e Lancaster B1999C. :la tam0=m analisou o !a!el da semi?tica, l?gica e !sicologia cognitiva na an"lise de conteHdos textuais BDinto, 199C. Dinto e @"lvez B1999C analisam a redação de resumos em termos de !aradigmas comunicacionais, +sicos, cognitivos e sist>micos. 9
5esumidores
Ms resumos !odem ser !re!arados !elos !r?!rios autores dos documentos, !or outros es!ecialistas dos res!ectivos assuntos ou resumidores !rossionais. uitos !eri?dicos cient+cos exigem 'ue os autores !re!arem resumos 'ue acom!an8em seus artigos. crescente o a!roveitamento destes resumos !elos serviços de resumos im!ressos, 'ue assim não !recisam redigi-los de novo. Igual ao 'ue acontece na indexação, o resumidor !recisa ter con8ecimento do conteHdo tem"tico tratado no documento, em0ora não !recise ser um es!ecialista. 7e'uisito im!ortante = a ca!acidade de redigir e editorar textos, e um truno !recioso !ara o resumidor = a a!tidão de ler e com!reender com ra!idez. &orXo e &ernier B1964C advertem 'ue os autores não necessariamente redigem os mel8ores resumos dos !r?!rios artigos. Ms autores comumente não !ossuem ormação e ex!eri>ncia em redação de resumos, 0em como carecem do con8ecimento das regras adotadas nessa atividade. %s !u0licaçes de resumos mais !restigiosas comumente conseguem recrutar como resumi dores es!ecialistas numa "rea, 'ue aceitam o encargo de redigir resumos em sua es!ecialidade sem remuneração ou a troco de 8onor"rios modestos. &orXo e &ernier armam 'ue [Kuem a!rendeu a redigir resumos e tam0=m = es!ecialista num cam!o do con8ecimento redige os mel8ores resumos^, armação contra a 'ual = di+cil argumentar. Eomo os es!ecialistas comumente são volunt"rios, talvez se;a di+cil deles o0ter !ontualidade na redação dos resumos. M resumidor !rossional custa caro, mas = !ontual e !ode azer um excelente tra0al8o 'uando lida com "reas do con8ecimento 'ue não l8e se;am totalmente descon8ecidas. %tualmente autores e editoras contam com !oucos incentivos !ara ReneitarO os resumos de modo a tornar o tra0al8o 'ue isso envolve mais atraente do 'ue de ato =. Drice B193C argumentou 'ue isso !oderia tornar-se um !erigo num am0iente com!letamente eletrQnico Bver ca!+tulo 15C. %s editoras gostariam de estimular o uso dos resumos !or'ue !rovavelmente seriam remuneradas com 0ase nisso. Ms autores gostariam de am!liar sua utilização, se este ator se tornasse, o 'ue não seria im!oss+vel, um crit=rio a ser adotado em decises relativas P !romoção e esta0ilidade no em!rego. M voc"0ulo s!oong ou s!amming oi usado !ara designar o eneitamento de !"ginas da 7ede de modo a aumentar sua recu!era0ilidade Bca!+tulo 15C. % redação de resumos e a indexação são atividades intimamente relacionadas e 8" ortes razes !ara 'ue se;am reunidas. !e'uena a distncia entre a eta!a de an"lise conceitual da indexação e a !re!aração de um resumo aceit"vel. %l=m disso, a disci!lina adicional im!osta !ela redação do resumo a;uda na decisão so0re o 'ue deve ser inclu+do e o 'ue !ode ser omitido na indexação. M ato de am0as as atividades envolverem uma com0inação de leitura e !assar de ol8os = outro motivo !elo 'ual = eciente reuni-las, delas se incum0indo uma mesma !essoa, sem!re 'ue isto or vi"vel. Aualidade e coerncia na redação de resumos
Tamais dois resumos do mesmo documento serão id>nticos se orem redigidos !or !essoas dierentes ou !ela mesma !essoa em momentos dierentes o conteHdo descrito ser" o mesmo, mas a orma de descrev>-lo ser" dierente. % 'ualidade e a coer>ncia são um !ouco mais vagas 'uando se a!licam a resumos do 'ue 'uando se a!licam P indexação. %!arentemente existem duas acetas !rinci!ais concernentes P 'ualidade 1. Ms RargumentosO essenciais do documento são !ostos em relevo no resumo ). :sses argumentos são descritos exata, sucinta e ine'uivocamente :m certa medida, !ortanto, a 'ualidade da redação de resumos = aerida segundo crit=rios 'ue são muito similares aos adotados na avaliação da indexação. % !rimeira eta!a da redação de resumos corres!onde, realmente, como na indexação, P an"lise conceitual - 'uais os as!ectos a realçar - e a segunda eta!a corres!onde P tradução dessa an"lise conceitual em rases BnormalmenteC. % 'ualidade da an"lise conceitual !ode ser aeri da, !rovavelmente, em cote;o com as instruçes relativas a conteHdo 0aixadas !ela instituição !ara a 'ual o resumo = redigido. Dor exem!lo 1. Foram inclu+dos o m0ito e a nalidade do tra0al8o ). Ms resultados oram indicados ou resumidos 3. %s concluses do autor oram resumidas 99
e assim !or diante. Doder-se-", então, avaliar a coer>ncia entre dois resumos, neste n+vel conceitual, no 'ue tange ao grau com 'ue os resumidores estiveram de acordo 'uanto aos !ontos a incluir. % avaliação da 'ualidade da ase de RtraduçãoO, no !rocesso de ela0oração do resumo, = um !ouco mais com!licada, !or'ue exatidão, am0igidade e 0revidade são crit=rios um tanto su0;etivos. ncia na ase de tradução do !rocesso de ela0oração do resumo existe a !ossi0ilidade de tratar a mesma 'uestão de v"rias ormas dierentes, cada uma delas exata e ine'u+voca e, talvez, igualmente sucinta.
Figura 41 ( 7esultados 8i!ot=ticos de um teste de !revisi0ilidade de relevncia
M teste denitivo de um 0om resumo consiste sim!lesmente em !erguntar Rser" 'ue ele !ermite ao leitor !rever com exatidão se um item resumido = ou não relevante !ara seus interesses atuaisO 2o 'ue tange a um leitor es!ec+co e uma necessidade de inormação es!ec+ca, = !oss+vel testar isso com 0ase, digamos, em 4 resumos co!iados na im!ressora em res!osta a uma 0usca em lin8a. Ms resultados do estudo seriam os mostrados na gura 41 os resumos sugeriam 'ue 14 itens seriam relevantes, mas a!enas 1) se conrmaram como tal. %l=m disso, se se constatar 'ue nem todos os 1) considerados relevantes a !artir do texto oram tam0=m ;ulgados relevantes a !artir dos resumos, estes teriam al8ado de am0os os modos sugeriram 'ue alguns itens eram relevantes 'uando não o eram, e 'ue outros não eram relevantes 'uando o eram. :sse ti!o de estudo, naturalmente, = um tanto di+cil de azer. %demais, seus resultados a!licam-se a!enas a determinado usu"rio e determinada necessidade de inormação$ mude-se o usu"rio ou a necessidade de inormação e os resultados mudarão. % maioria dos usu"rios de serviços de resumos, ou 0ases de dados em lin8a, ;" ter" !assado !ela situação, talvez com relativa re'>ncia, 'uando um resumo des!erta o a!etite !or um documento 'ue aca0a sendo muito dierente do 'ue se es!erava. :ntão, os resumos rustraram esses usu"rios, em0ora talvez tivessem atendido de modo 0astante ade'uado a outros usu"rios. % utilidade dos resumos na !revisão da relevncia de documentos !ara determinado usu"rio ser" examinada com mais detal8es no ca!+tulo seguinte. :m0ora ten8am sido realizados v"rios estudos de !revisi0ilidade de relevncia, são muito !oucas as !es'uisas so0re as atividades dos resumidores. Eom eeito, ;" oram realizados mais estudos so0re avaliação de extratos do 'ue de resumos. Dor exem!lo, tanto 7at8 et al. B1951 0C 'uanto :dmundson et al. B1951C desco0riram 'ue as !essoas não eram muito coerentes Bcom os outros ou consigo mesmasC ao selecionar de um texto as rases 'ue consideravam como os mel8ores indicadores de seu conteHdo. :dmundson et al. B1951C sugerem v"rios m=todos de avaliação de resumos 1. Tulgamento intuitivo, su0;etivo$ ). Eom!aração com um resumoO idealO$ 3. eterminação da medida em 'ue !erguntas de teste so0re um documento !odem ser res!ondidas !elo resumo$ . 7ecu!era0ilidade do documento !elo resumo. claro 'ue os resumos são avaliados !elos editores e outras !essoas 'ue tra0al8am nos centros de inormação ou nas editoras, !rovavelmente utilizando o m=todo intuitivo. !rov"vel 'ue, 'uanto mais se utilizar a 0usca em texto livre em lugar da indexação eita !or seres 8umanos, crescer" a im!ortncia do m=todo de avaliação 0aseado na Rrecu!era0ilidadeO. Ms crit=rios !ara aerir a Rrecu!era0ilidadeO de um resumo não são necessariamente os mesmos utilizados !ara avali"-lo com 0ase na !revisi0ilidade da relevncia Bver as consideraçes so0re RKuestes de com!ati0ilidadeOC. *inson8aler B1955C !ro!e m=todos com!ortamentais !ara avaliar a 'ualidade de resumos com 0ase na Rvalidade de conteHdoO ou Rvalidade !revis+velO. 2um estudo de validade de conteHdo, os su;eitos ;ulgam o grau com 'ue o documento e o resumo são RsimilaresO, em!regando talvez uma escala de similaridade de sete !ontos. %lternativamente, !ode-se 1
a!licar um teste !ara determinar em 'ue medida um resumo discrimina documentos, es!ecialmente 'uando seu conteHdo tem"tico = 0astante similar. *inson8aler !ro!e, !ara medir a discrimina0ilidade, um teste em 'ue os su;eitos examinam um documento e em seguida !rocuram identicar o resumo corres!ondente num ol8eto 'ue cont=m resumos. em corretamente a relevncia dos documentos. *inson8aler sugere um teste de cruzamento em 'ue um gru!o de !essoas avalia a relevncia de um con;unto de documentos !ara um enunciado de !edido de 0usca e, em seguida, de!ois de um intervalo de tem!o ade'uado, az o mesmo com os resumos dos documentos. M segundo gru!o de !essoas !rocede em se'>ncia inversa, !rimeiro avaliando os resumos e de!ois os documentos. at8is B196)C !ro!Qs 'ue os resumos ossem avaliados com 0ase num Rcoeciente de dadosO BEC. M E = ex!resso !ela ?rmula E#L, onde E = um Rator de conservação de dadosO e L um Rator de conservação de extensãoO. E = uma medida do grau com 'ue todos os RconceitosO Bat8is reere-se a eles como Relementos de dadosOC do documento são conservados no resumo. L = sim!lesmente o nHmero de !alavras do resumo dividido !elo nHmero de !alavras do documento. M E = um valor num=rico, e, 'uanto maior o valor, mel8or. :le avorece a concentração e a com!ressão ca!acidade de conservar todos os elementos essenciais do texto como m+nimo de !alavras. el8ora-se o valor aumentando-se a 'uantidade de elementos de dados !resentes ou reduzindo-se a 'uantidade de !alavras no resumo. at8is sugere 'ue um valor de E inerior P unidade indicaria um resumo de 'ualidade inaceit"vel. /rata-se de m=todo criativo, em0ora de!enda totalmente da ca!acidade de identicar Relementos de dadosO. at8is !ro!e 'ue se;am identicados mediante crit=rios sint"ticos. %ssim como 'ual'uer outro ti!o de texto, os resumos !odem ser avaliados com 0ase na Rlegi0ilidadeO, em!regando-se ?rmulas cl"ssicas de legi0ilidade. ron0erger e ZoVitz B1964C adotaram a ?rmula de acilidade de leitura, de Flesc8, !ara com!arar resumos de 7esearc8 in :ducation com os relat?rios corres!ondentes, e vericaram 'ue os n+veis de legi0ilidade eram signicativamente 0aixos, !rovavelmente !or'ue careciam de redundncia. /am0=m Zing B1965C, adotando um crit=rio RclozeO,1 o0servou 'ue os resumos de E8ild evelo!ment %0stracts eram menos leg+veis do 'ue os itens em 'ue se 0aseavam. YartleA B199C a!licou tanto os escores de legi0ilidade de Flesc8 ) 'uanto testes doze Bcom!reensãoC na com!aração de 'uatro verses dierentes dos mesmos resumos. Sua conclusão oi 'ue os resumos !oderiam ser mel8orados Bisto =, redigidos de modo mais claroC se osse mudado o taman8o do ti!o, se osse estruturado Bem !ar"graos com entre t+tulosC e se ossem reescritos. Dosteriormente, YartleA e SAdes B1995C estudaram as !reer>ncias do leitor 'uanto P dis!osição gr"ca dos resumos estruturados. YartleA B)C identica tr>s atores 'ue inNuem na clareza dos resumos linguagem Blegi0ilidadeC, a maneira como as inormaçes são a!resentadas Bse'encial ou estruturadaC e o estilo gr"co. /am0=m descreve dierentes soluçes gr"cas !ara a a!resentação dos resumos estruturados. Salager-eAer B1991C analisou, de uma !ers!ectiva ling+stica, uma amostra de resumos de artigos m=dicos, tendo c8egado P conclusão de 'ue metade deles era Rmal-estruturadaO Bisto =, !ossu+a deci>ncia de discursoC. ncia de discursoO !ode incluir coisas do ti!o dis!ersão conceitual B!or exem!lo, resultados relatados em dierentes lugares do resumoC como tam0=m omissão de um elemento im!ortante B!or exem!lo, o o0;etivo da !es'uisaC do resumo, o autor sugere 'ue os resumos 'ue !adeçam desses deeitos serão menos ecientes na transmissão de inormaçes. &orXo e &ernier B1964C a!resentaram a'uela 'ue talvez se;a a lista mais a0rangente de !oss+veis crit=rios de avaliação de resumos, como se v> a seguir 1.
/=cnica e teste de leitura em 'ue, num texto, são omitidas !alavras !ro!ositalmente e segundo um !adrão denido B!or exem!lo, toda 'uinta !alavraC. Ms es!aços em 0ranco deixados serão !reenc8idos !elos su;eitos 'ue estiverem sendo avaliados. B2./.C ) M escore de acilidade de leitura de Flesc8 \Flesc8 7eading :ase B7.:.C] considera a extensão das rases e a extensão das !alavras no texto. % ?rmula original = 7.:. { )5,34 - ,5V - 1, 14s Bonde V = o nHmero m=dio de s+la0as em 1 !alavras e s = o nHmero m=dio de !alavras !or raseC. Ms escores normalmente situam-se na aixa -1 em 'ue os valores menores reNetem maior diculdade BYartleA, )cC. 1
11
). h medida 'ue a norma 2ISM B%2SIC ou outra norma = res!eitada B'ue = tam0=m tida como um com!onente !rinci!al do m=todo de avaliação recomendado !or at8is B196)C. 1 3. % inclusão de inormaçes im!ortantes e a exclusão de inormaçes sem im!ortncia. . %us>ncia de erros. 4. Eoer>ncia de estilo elegi0ilidade. 5. Drevisi0ilidade da relevncia. 6. Ea!acidade de servir como su0stituto do original Bresumos inormativosC. . %de'uação como onte de termos de indexação. :sta lista, evidentemente, re!resenta v"rios n+veis de crit=rios. Dor exem!lo, todos os crit=rios do terceiro ao 'uinto !rovavelmente seriam levados em conta em 'ual'uer classicação Rglo0alO. s m=todos de avaliação dierentes 1. "oer3ncia. Foram utilizados es!ecialistas de assunto !ara com!arar resumos com 0ase na similaridade da 'uantidade de inormaçes a!resentadas. ). A 4uantidade de redu10o de texto o%tida. 3. 7tilidade. Ms estudantes res!onderam a 'uestes t=cnicas 0aseadas nos artigos de sua "rea de es!ecialização. %lguns deles liam os artigos, outros a!enas os resumos. %s res!ostas dos dois gru!os eram com!aradas. :ste m=todo oi tam0=m usado !or YartleA et al. B1995C !ara com!arar dierentes ti!os de resumos a conclusão oi 'ue os resumos estruturados Bormatados em dierentes !ar"graos, cada um com seu entre t+tuloC !odiam ser usados de modo mais eciente. 2o !rograma /IDS/:7 Bver ca!+tulo 1C, são em!regados dois m=todos de avaliação de resumos 1C utilização do resumo !ara ;ulgar a relevncia dos documentos, e )C utilização do resumo como 0ase !ara a classicação dos documentos Bisto =, classicação 0aseada no resumo em com!aração com a classicação 0aseada nos textos com!letosC. %s avaliaçes da 'ualidade dos resumos !u0licadas nos Hltimos anos t>m se concentrado, na maior !alie, em resumos estruturados. YartleA e &en;amin B199C com!araram resumos tradicionais e estruturados redigidos !or autores de artigos su0metidos a 'uatro !eri?dicos 0ritnicos de !sicologia. :studantes de !sicologia !artici!aram da avaliação. Ms resumos estruturados oram ;ulgados signicativamente mais leg+veis, signicativamente mais longos e signicativamente mais inormativos. Doucos tra0al8os oram realizados !ara avaliar resumos !u0licados em com!aração com os textos a 'ue se reerem. 2o entanto, um Htil estudo desse ti!o oi relatado !or DitXin et al. B1999C. :les avaliaram, dessa orma, resumos !u0licados em seis im!ortantes revistas m=dicas. Ms resumos eram considerados RdecientesO 'uando inclu+am dados dierentes dos dados constantes do !r?!rio artigo ou deixavam de incluir dados !or com!leto. Eom 0ase nesses crit=rios, uma 'uantidade signicativa de resumos oi considerada deciente, cerca de 1f na revista 'ue corres!ondia ao mel8or caso e 5f no !ior caso. :m decorr>ncia desse estudo o T%% BTournal o t8e %merican edical %ssociationC introduziu um !rograma de mel8oria de 'ualidade BWinXler, 1999C. Foram adotados os seguintes crit=rios 1. Ms entre t+tulos do resumo são coerentes com o ormato de resumo estruturado. ). Ms dados no resumo são coerentes com o texto, ta0elas e guras. 3. Ms dados ou inormaçes do resumo estão !resentes no texto, ta0elas ou guras. . Fornece os anos de estudo e a duração do acom!an8amento. 4. Ms resultados das Drinci!ais edidas de 7esultados são a!resentados na seção de 7esultados Bevitar inormaçes seletivasC. 5. Ms resultados são 'uanticados com numeradores, denominadores, odds ratios \razes de c8ances, razes de dierenças] e intervalos de conança, onde isso or a!ro!riado. 6. %!resentam-se sem!re 'ue !oss+vel, dierenças a0solutas e não dierenças relativas B!or exem!lo, R% mortalidade 0aixou de 5f !ara 3fO ao inv=s de R% mortal idade 0aixou 4fO. . 2o caso de ensaios randomizados, a an"lise = identicada como intentto-treat ou an"lise de !aciente avali"vel. 1
*er tam0=m, !or=m, os coment"rios so0re normas no ca!+tulo 9.
1)
9. Dara levantamentos, o +ndice de res!ostas = ornecido em 7esultados ou elineamento. 1. Dara an"lise multivariada, os atores controlados no modelo são mencionados de modo 0em sucinto. 11. %s concluses resultam de inormaçes contidas no resumo. :sses crit=rios são agora adotados !ara rever e. corrigir resumos. WinXler relatou uma mel8oria im!ressionante da 'ualidade a!?s a im!lantação desse !rograma, e DitXin et al. B)C, em !es'uisa inde!endente, tam0=m constataram not"vel mel8oria, em0ora não no n+vel im!ressionante citado !or WinXler. %nteriormente, DitXin e &ranagan B199C relataram como resultado de um ensaio randomizado controlado, 'ue instruçes es!ec+cas dadas aos autores 'ue estavam revisando seus manuscritos não oram ecazes !ara diminuir as deci>ncias dos resumos. Darece 'ue enviar aos autores instruçes so0re a 'ualidade dos resumos não =, em si, garantia de mel8oria, em0ora tais instruçes se;am ecazes 'uando usadas !elos editores de revistas na avaliação dos resumos. YartleA B)aC com!arou a exatidão de resumos estruturados com a de resumos RtradicionaisO de um mesmo gru!o de artigos su0metidos !ara !u0licação nas revistas da &ritis8 DsAc8ological SocietA. Isso oi !oss+vel !or'ue os autores 8aviam enviado resumos tradicionais ao su0meter os originais, !or=m, de!ois 'ue os tra0al8os oram aceitos !ara !u0licação, oi-l8es exigido 'ue a!resentassem verses estruturadas. YartleA relata !oucas inexatides em 'ual'uer um dos ti!os de resumos, e 'ue os estruturados não eram mel8ores nem !iores do 'ue os outros. :sse Hltimo resultado talvez não sur!reenda muito, !ois a maioria dos autores sim!lesmente converteu o resumo original !ara a orma estruturada. ais di+cil de ex!licar = esses resumos de !sicologia !arecerem mais exatos do 'ue os resumos de medicina dos estudos de DitXin. M valor de !revisi0ilidade dos resumos Bisto =, sua ca!acidade de indicar a relevncia do item de 'ue deriva !ara os interesses de algum usu"rioC = examinado no !r?ximo ca!+tulo. Auest$es de compatibilidade
Y" 4 anos, a Hnica razão existente !ara 'ue ossem redigidos resumos era a de criar a re!resentação de um documento 'ue seria lida !or seres 8umanos. :ntretanto, os resumos são 8o;e utilizados com uma segunda nalidade !ro!orcionar uma re!resentação 'ue sirva !ara 0uscas eitas !or com!utador. Inelizmente, essas duas nalidades não são inteiramente com!at+veis. Dara os o0;etivos da recu!eração, a redundncia = conveniente. Kuer dizer, um t?!ico estar" mais 0em re!resentado se o or de v"rias ormas. Dor exem!lo, a inclusão dos sinQnimos Rasas de vQo livreO e Rasas deltasO em alguns resumos aumenta a !ro0a0ilidade de o item ser recu!erado - um consulente usar" RvQo livre e o outro !oder" !ensar em Rasa deltaO. Dara o leitor 8umano, !or outro lado, = mel8or 8aver coer>ncia do 'ue redundncia. 2a realidade, o usu"rio se sentir" muito conuso se as mesmas id=ias orem descritas de dierentes ormas no resumo. Dara os o0;etivos da recu!eração, 'uanto mais longo or o resumo mel8or ser". Delo menos, 'uanto mais longo or o resumo mais !ontos de acesso !ro!orcionar", e 'uanto mais !ontos de acesso 8ouver maior ser" o !otencial de alta revocação na recu!eração. %o mesmo tem!o, temos de admitir 'ue !rovavelmente 8aver" !erda de !recisão 'uanto mais extenso or o resumo mais as!ectos Rsecund"riosO do documento serão introduzidos e maior ser" o !otencial de alsas associaçes Bver ca!+tulos 5, 11 e 1C. Dara o leitor 8umano, a 0revidade = certamente conveniente. :la tam0=m conv=m !ara os assinantes de serviços im!ressos, !ois resumos mais longos geram !u0licaçes mais caras. Dara o leitor 8umano, = Htil a menção de as!ectos negativos !or exem!lo, R!or=m exclui consideraçes so0re custosO inorma ao leitor so0re o 'ue não deve es!erar encontrar no documento. % inclusão da !alavra RcustosO no resumo ar", evidentemente, com 'ue ele se;a recu!erado em 0uscas nas 'uais o custo se;a um as!ecto im!ortante - exatamente a situação na 'ual esse resumo não deveria ser recu!erado. Dara os o0;etivos da recu!eração, tam0=m = mel8or evitar certas !alavras ou ex!resses. % locução comum Rlançar mão deO criar" !ro0lemas em muitas 0ases de dados, !ois levar" P recu!eração de itens so0re a !arte do cor!o 8umano - mão - e a Nexão ver0al Rco0reO, do ver0o Rco0rirO, ar" recu!erar itens so0re o metal co0re. Dortanto, !ara uma recu!eração mais ecaz, os resumidores devem evitar termos 'ue sa0idamente causarão !ro0lemas desse ti!o. %t= mesmo as convençes relativas a !ontuação e sintaxe, 'ue t>m sentido !ara o leitor 8umano, !odem criar !ro0lemas !ara o com!utador. Su!on8amos, !or exem!lo, uma rase 'ue termine com a !alavra R!reci!itaçãoO seguida imediatamente !or outra 'ue comece com a 13
!alavra R"cidosO. :m muitos sistemas este item ser" recu!erado durante uma !es'uisa so0re R!reci!itação de "cidosO , em0ora nada ten8a a ver com este assunto. Ms miniresumos de Lunin B1956C Bver ca!+tulo anteriorC, ao contr"rio do resumo convencional, destinam-se 0asicamente a acilitar as 0uscas !or com!utador. :m0ora !ossam ser inter!retados !or usu"rios inteligentes, são denitivamente mais di+ceis de ler e entender, e se ignora como um enunciado es'uem"tico como esse seria aceito !elos usu"rios de um sistema de recu!eração. /udo isso a!onta !ara o ato de 'ue um resumo RidealO !ara o leitor !ode não ser ideal !ara as 0uscas inormatizadas. as, at= onde se !ode !rever, os resumos continuarão a servir a am0as as nalidades. esmo 'ue a im!ortncia dos serviços im!ressos ven8a a declinar, os resumos ainda serão necess"rios como um !roduto intermedi"rio em 0uscas inormatizadas. ncias de o!iniã9 utilize a linguagem do autor, não utilize a linguagem do autor$ utilize linguagem id>ntica P linguagem dos termos de indexação atri0u+dos, utilize linguagem 'ue com!lemente os termos atri0u+dos, e assim !or diante. % regra mais sensata talvez se;a a 'ue es!ecica 'ue o resumo deve incluir termos relevantes 'ue altem nos descritores e no t+tulo. uitas vezes, esses serão termos mais es!ec+cos do 'ue os do voca0ul"rio controlado. &oot8 e MO7ourXe B1996C estudaram resumos estruturados de medicina num contexto de recu!eração da inormação. Dor meio da im!ortação de registros do :LI2:, conseguiram criar duas 0ases de dados em 'ue !odiam azer 0uscas, sendo uma de resumos com!letos e a outra de resumos segmentados em v"rios com!onentes Bo0;etivos, delineamento, concluses, e assim !or dianteC da estrutura. %s 0uscas eitas na 0ase de dados segmentadas, naturalmente, o0tiveram maior !recisão, !or=m menor revocação. Ms consulentes tam0=m tiveram diculdade !ara decidir em 'uais segmentos azer as 0uscas. 2omoto e atsumoto B)1C deendem a avaliação da 'ualidade de resumos !roduzidos automaticamente Bna realidade, extratosC em termos de 'uão satisat?ria seria a !ossi0ilidade de su0stituir os textos integrais nas tareas de recu!eração da inormação. :les !arecem acreditar 'ue esta id=ia se originou com eles, 'uando, de ato, = 0astante antiga. O boletim interno
M ato de 8aver 0ases de dados 0i0liogr"cos em !raticamente todos os cam!os do con8ecimento e de em alguns deles 8aver v"rias 0ases de dados concorrentes não elimina inevitavelmente a necessidade de um 0oletim de resumos destinado P clientela interna de uma instituição. M centro de inormaçes de uma em!resa ou outro ti!o de organização em 'ue 8a;a um orte !rograma de !es'uisas !ode alme;ar !roduzir seu !r?!rio 0oletim em virtude de 1. Ms !eri?dicos de resumos existentes não serem sucientemente atuais na co0ertura de materiais undamentais e do maior interesse !ara a instituição. ). 2en8uma 0ase de dados, isoladamente, em ormato im!resso ou eletrQnico a0ranger, !rovavelmente, todos os materiais de interesse !ara a instituição. 2a realidade, muitas 0ases de dados são relevantes !ara os interesses da instituição 'uando se tem em conta a diversidade de conteHdo tem"tico e de ormas documentais. 3. 2en8uma 0ase de dados externa a0ranger" certos materiais de im!ortncia e, de modo mais evidente, os relat?rios internos da !r?!ria instituição literatura de a0ricantes, material !u0licit"rio dos concorrentes, etc. Dara otimizar os !rocedimentos em!regados na !rodução do 0oletim i nterno, ser" !reciso identicar os materiais 'ue serão resumidos diretamente. :stes certamente incluirão os relat?rios internos da !r?!ria em!resa e materiais externos considerados de es!ecial im!ortncia. Dor exem!lo, algu=m !ertencente ao 'uadro de !essoal do centro !oder" examinar todas as !atentes novas e !re!arar resumos da'uelas 'ue se revistam de !oss+vel interesse !ara a em!resa - o 'ue = em si mesmo, uma arte. *alendo-se dos m=todos a serem examinados no ca!+tulo seguinte, ser" identicada umaO lista 0"sicaO de !eri?dicos 'ue 'uase com certeza, são extraordinariamente !rodutivos no 'ue concerne aos interesses da instituição. :sses !eri?dicos tam0=m serão resumidos diretamente. 1
!oss+vel 'ue as ontes analisadas dessa orma regularmente !roduzam !or 8i!?tese, de a 9f da 0i0liograa a ser inclu+da no 0oletim interno. Dara elevar essa co0ertura 0em acima do n+vel de 9f ser" !reciso utilizar ontes im!ressas de car"ter mais gen=rico. Ms mem0ros da e'ui!e 'ue analisa os !eri?dicos !ertencentes P lista 0"sica P !rocura de artigos de interesse devem tam0=m examinar os serviços de indexação#resumos em ormato im!resso 'ue orem a!ro!riados. Isto revelar" outros itens relevantes, como, !or exem!lo, os 'ue a!arecem em ontes 'ue não são ad'uiridas !or assinatura diretamente.
Figura 4) ( 7egras, destinadas a resumidores, concernentes Ps caracter+sticas de recu!era0ilidade dos resumos 7e!roduzidas de Fidel B195C com !ermissão de :merald
Dode-se !erguntar !or 'ue, em )3, algu=m consultaria serviços secund"rios im!ressos ao inv=s de regularmente azer 0uscas em lin8a nas 0ases de dados a!ro!riadas. :ste seria o modo de atuação !reerido de uma instituição cu;os interesses estivessem claramente delimitados e 'ue !udessem ser ex!ressos de orma 0astante a0rangente numa estrat=gia de 0usca. %lgumas organizaçes, !or=m, t>m tal diversidade de interesses 8eterog>neos 'ue se torna muito di+cil localizar itens de interesse !otencial, salvo mediante consulta a am!las seçes de ontes !u0licadas. %demais, a serendi!idade desem!en8a a'ui im!ortante !a!el um 0om es!ecialista em inormação !ode identicar itens relevantes !ara uma em!resa 'ue talvez este;am ora de seu !erl de interesse, como, !or exem!lo, uma nova a!licação !otencial !ara um !roduto da em!resa. e 'ual'uer modo, o 0oletim interno ser" com!ilado mediante a an"lise tanto de ontes !rim"rias 'uanto secund"rias, estas com!lementando a co0ertura das anteriores. 2um grande centro de inormação, a e'ui!e res!ons"vel !ela an"lise da literatura incluiria algumas !essoas 'ue teriam como tarea !rinci!al o exame de materiais estrangeiros, a redação de resumos no vern"culo e a realização de traduçes integrais de itens ;ulgados 0astante im!ortantes. 14
Kuanto P redação mesma dos resumos, as !essoas incum0idas disso economizarão muito tem!o ao azerem marcaçes no texto do !r?!rio documento, a m de 'ue a entrada de dados se;a eita diretamente da !u0licação. :m alguns casos ser" !oss+vel utilizar diretamente os resumos de autor, ou necessitarão de alguma alteração, como cortes ou acr=scimos. :m outros casos, !ode-se ela0orar um RresumoO !ereitamente satisat?rio extraindo-se !orçes do texto, talvez da !arte corres!ondente Ps concluses ou resultados. 2aturalmente, sem!re 8aver" alguns itens 'ue exigirão a redação de resumos originais, se;a !or'ue não exista um resumo satisat?rio, se;a !or'ue o !rocesso de ela0oração do extrato = inade'uado, ou !or'ue algum as!ecto de grande interesse !ara a em!resa, !or=m de interesse secund"rio !ara o autor, !recisa ser ressaltado. Ms resumos !re!arados !ara uso interno !odem ser disseminados de v"rios modos. estes, o mais comum = um 0oletim du!licado mecanicamente e 'ue se;a editado com regularidade. /endo em vista 'ue o mesmo !ode ser considerado como um instrumento de inormação da maior im!ortncia !ara a em!resa, deveria, se !oss+vel, ser editado semanalmente. Ms resumos seriam organizados em seçes 'ue !ermaneceriam mais ou menos constantes, ao longo das semanas, de modo a acilitar a consulta. Seria inclu+do um sum"rio anal+tico, com indicação de seçes e su0seçes.
encionou-se a inclinação !ara um assunto no ca!+tulo anterior. Kuando uma !u0licação de resumos = !ro;etada !ara ser utilizada !or um gru!o de !essoas 'ue !ossuem interesses claramente denidos e es!ecializados Bcomo seria o caso de um 0oletim internoC, = conveniente, sem dHvida, 'ue cada resumo se;a moldado aos interesses !recisos do gru!o. Isso oi recon8ecido no !ro;eto de an"lises de conteHdo modulares BLancaster et al., 1954C descrito no ca!+tulo 6. Dara 'ue essas an"lises tivessem 9 m"ximo de utilidade !ara um gru!o diversicado de serviços secund"rios, !ro!Qs-se 'ue incor!orassem Rm?dulos tem"ticosO. ndice ) exem!lica o m=todo o resumo 0"sico so0re contato de c8ama = com!lementado com !ar"graos 'ue relacionam o 15
tra0al8o a interesses em siologia e medicina, P indHstria de !l"sticos, P indHstria da 0orrac8a e Ps indHstrias de rou!as de !roteção e aeron"utica.
16
%ap&tulo 0 +spectos da a#aliação M tema da avaliação = tratado em diversos ca!+tulos deste livro. M ca!+tulo 1, !or exem!lo, reere-se aos crit=rios de avaliação dos resultados de 0uscas realizadas numa 0ase de dados, en'uanto o ca!+tulo 5 ocaliza a 'ualidade da indexação e os crit=rios segundo os 'uais essa 'ualidade !ode ser aerida. % indexação e a redação de resumos não são atividades 'ue devam ser consideradas como ns em si mesmas. São os resultados dessas atividades 'ue devem ser avaliados e isso somente !ode ser eito no contexto de determinada 0ase de dados, se;a ela em ormato im!resso ou eletrQnico. 2esse contexto, a indexação = avaliada como 0em-sucedida 'uando !ermite a 'uem realiza as 0uscas localizar itens de 'ue !recisa sem ter de examinar muitos de 'ue não !recisa. Ms resumos são 0em-sucedidos 'uando !ermitem !rever corretamente 'uais os documentos 'ue serão Hteis a um consulente e 'uais não serão, ou se são Hteis como su0stitutos do documento em 0uscas textuais. ncia o usu"rio !ode aerir 'uais os itens 'ue serão e os 'ue não serão Hteis . Atualidade. Ms itens !u0licados recentemente são recu!er"veis, ou atrasos na indexação#redação e resumos !rovocam uma situação em 'ue os itens recu!erados mostram resultados de !es'uisas RantigosO ao inv=s de RnovosO %obertura
% avaliação da co0ertura de uma 0ase de dados = 0astante semel8ante P avaliação da com!leteza do acervo de uma 0i0lioteca em relação a um assunto. 2a realidade, o acervo de livros de uma 0i0lioteca = em si mesmo uma 0ase de dados, do mesmo modo 'ue o cat"logo da 0i0lioteca - um = uma 0ase de dados de arteatos, e o outro, uma 0ase de dados de re!resentaçes desses arteatos.
ali se encontram 1)#), o 'ue nos d" uma co0ertura estimativa de 61f. M ato de os )1tens não serem todos os itens !u0licados so0re su!ercondutores não = im!ortante$ tratase, em certo sentido, de um con;unto Rre!resentativoO de itens so0re su!ercondutores e constitui uma amostra !ereitamente leg+tima !ara se usar na estimativa de co0ertura. Seria !oss+vel, o0viamente, azer o !ercurso inverso, em!regando itens extra+dos do :ngineering Index !ara avaliar a co0ertura do D8Asics %0stracts. essa orma tam0=m se determina o grau de du!licidade e exclusividade de dois Bou maisC serviços, como se ac8a re!resentado no diagrama no nal deste !ar"grao. M0t>m-se esses resultados extraindo-se de % uma amostra aleat?ria de itens so0re su!ercondutores e cote;ando-os com &, e extraindo-se de & uma amostra aleat?ria de itens so0re su!ercondutores e cote;ando-os com %. :ssas amostras nos !ermitiriam estimar a co0ertura de % B11#) ou cerca de 9f no exem!lo 8i!ot=tico acimaC, a co0ertura de & B15#) ou cerca de fC, o grau de du!licidade entre os serviços B19#) ou cerca de 64fC, e a exclusividade Bcerca de 15f dos itens inclu+dos !or %, ou se;a, 3)#), a!arecem exclusivamente nesse serviço en'uanto a cira com!ar"vel !ara & est" um !ouco a0aixo de 1f B19#)CC. M mesmo ti!o de resultado seria alcançado, e so0 certos as!ectos mais acilmente, se extra+ssemos uma amostra de uma terceira onte, c, !ara estimar a co0ertura, a du!licidade e a exclusividade de % e &.
2as consideraçes acima, !ressu!Qs-se a avaliação de uma 0ase de dados em ormato im!resso. Ms !rocedimentos não dieririam de modo signicativo caso ossem a!licados a uma 0ase de dados em ormato eletrQnico. maçante, sem dHvida, dar entrada a talvez centenas de nomes de autores, a m de determinar a co0ertura de uma onte em lin8a. % solução deste !ro0lema est" em realizar, inicialmente, uma am!la 0usca !or assunto Bde 'ual'uer modo necess"ria, se se 'uiser determinar a recu!era0ilidade$ ver coment"rios adianteC, e, em seguida, azer 0uscas com!lementares !or autor. %dotando o mesmo exem!lo, extrair-se-ia uma amostra de itens indexados so0 S
os +ndices de 199 Be talvez at= !osterioresC ou 1995 Be mesmo, em alguns casos, anterioresC, tendo em vista 'ue a 2ational Li0rarA o edicine não ter" necessariamente indexado os documentos na mesma =!oca em 'ue o ez a :xcer!ta edica Foundation. %o agir assim, !ode-se, evidentemente, ter alguma id=ia da atualidade relativa das duas erramentas. ais adiante, neste ca!+tulo, trataremos da 'uestão da atualidade. Y" outra onte 'ue !ode ser utilizada !ara avaliar a co0ertura de uma 0ase de dados as reer>ncias 0i0liogr"cas 'ue a!arecem nos artigos de !eri?dicos. *oltando ao exem!lo ;" citado, su!on8amos 'ue identicamos uma 'uantidade de artigos !u0licados recentemente em !eri?dicos cient+cos 'ue tratam de leucemia elina. %s reer>ncias 0i0liogr"cas inclu+das nesses artigos serão usadas !ara com!or uma 0i0liograa a ser a!licada na avaliação da co0ertura do Index edicus ou de um dos +ndices da :xcer!ta edica. Y" uma evidente dierença entre utilizar itens retirados de 0i0liograas so0re leucemia elina Bou itens indexados so0 esse termo em alguma erramenta 0i0liogr"caC e utilizar reer>ncias 0i0liogr"cas de artigos de !eri?dicos os !rimeiros, !rovavelmente, serão itens 'ue tratam de leucemia elina de !er si en'uanto os Hltimos são as ontes de 'ue necessitam os !es'uisadores 'ue atuam na "rea da leucemia elina. !rov"vel 'ue estas Hltimas ontes ultra!assem 0astante o assunto es!ec+co e, de ato, a0ran;am um am!lo setor das ci>ncias 0iol?gicas e talvez at= de outros cam!os. M avaliador !ode o!tar !or excluir 'uais'uer itens 'ue l8e !areçam !eri=ricos ao t?!ico da avaliação ou inclu+-los, com a ;usticativa de 'ue uma erramenta 0i0liogr"ca, !ara 'ue se;a Htil !ara o !es'uisador desse assunto, deve !ro!orcionar acesso a todos os materiais ans necess"rios P undamentação de sua !es'uisa. 2a avaliação de uma 0ase de dados 'ue se restrin;a 'uase exclusivamente a artigos de !eri?dicos Bcomo = o.caso do Index edicusC, !oder-se-la tomar um atal8o ?0vio !ara c8egar a uma estimativa de co0ertura. /endo extra+do uma amostra de outra onte, ou ontes, identicar-se-iam os artigos de !eri?dicos e de!ois sim!lesmente se aria uma c8ecagem !ara vericar se esses !eri?dicos são regularmente a0rangidos !elo Index edicus. Eom toda a !ro0a0ilidade isso daria uma estimativa de co0ertura razo"vel. Se se 'uisesse ser mais !reciso, entretanto, os itens da amostra Bou !elo menos um su0con;unto extra+do aleatoriamenteC seriam c8ecados !or nome de autor, devido ao ato de certos !eri?dicos serem indexados a!enas seletivamente, e de alguns artigos Be talvez asc+culos com!letos de alguns !eri?dicosC 'ue deveriam ter sido indexados não o serem !or algum motivo.1 M atal8o 'ue !assa !elos t+tulos dos !eri?dicos = menos Htil !ara a avaliação da co0ertura de uma 0ase de dados 'ue inclua itens !u0licados de todos os ti!os, e não tem utilidade alguma no caso de uma 0ase de dados altamente es!ecializada 'ue !rocure incluir tudo so0re determinado assunto, de 'ual'uer onte, sem se restringir a determinado con;unto de !eri?dicos. Y" v"rias razes !oss+veis 'ue ;usticam uma avaliação de co0ertura. Dor exem!lo, um centro de inormação 'uer sa0er se determinada 0ase de dados, como a do E8emical %0stracts, co0re de orma exaustiva sua "rea de es!ecialização ou se !recisaria recorrer a v"rias 0ases de dados !ara conseguir co0ertura mais com!leta. /am0=m o !rodutor de uma 0ase de dados !ode estar interessado em sa0er em 'ue medida ela co0re satisatoriamente determinada "rea. 2este caso, seria im!ortante determinar 'uais os ti!os de !u0licaçes 'ue oerecem maior co0ertura e os 'ue oerecem menor co0ertura. Dara tanto, seria !reciso classicar os itens a0rangidos e os não a0rangidos, segundo certas caracter+sticas, como ti!o de documento, l+ngua, lugar de !u0licação e t+tulo do !eri?dico. % !artir desses dados !oder-se-la determinar como seria !oss+vel mel8orar a co0ertura de modo a !ro!orcionar a mel8or relação custo-ec"cia. %o estudar a co0ertura de 0ases de dados = im!ortante estar atento ao enQmeno da dis!ersão. :ste enQmeno !re;udica as 0ases de dados altamente es!ecializadas, 0em como a 0i0lioteca ou centro de inormação muito es!ecializado, e avorece a 0ase de dados, 0i0lioteca ou centro de teor mais geral. *e;amos, !or exem!lo, um centro de inormação so0re %IS, cu;a meta se;a colecionar a 0i0liograa desse assunto de modo exaustivo e assim criar uma 0ase de dados a0rangente. %s dimenses deste !ro0lema são exem!licadas nas guras 43-49 'ue se 0aseiam em 0uscas eitas na 0ase :LI2: em 19. % gura 43 mostra 'ue somente ) artigos de !eri?dicos so0re %IS oram !u0licados at= o nal de 19)$ no ano de 196 esta 0i0liograa alcançou 41 itens. :m 19), toda a 0i0liograa de %IS se limitava a tr>s idiomas, !or=m, em 196, eram )4 as l+nguas utilizadas e 4 os !a+ses 'ue contri0u+am !ara essa literatura Bguras 4 e 44C. ais elo'ente = a gura 45, 'ue mostra 'ue toda a 0i0liograa de %IS se ac8ava em a!enas 1 !eri?dicos em 19), mas em 196 a !artici!ação era de 'uase 1 ) !eri?dicos` Dor exem!lo, /8or!e B196C, ao estudar a literatura de reumatologia, o0teve uma estimativa de co0ertura !ara o Index edicus com 0ase nos t+tulos de !eri?dicos 'ue oi um tanto dierente da'uela 0aseada nos artigos dos !eri?dicos. &rittain e 7o0erts B19C tam0=m a!resentam indicaçes so0re a necessidade de estudar a co0ertura e a du!licidade no m0ito dos artigos. 1
11
/odos esses exem!los demonstram o enQmeno da dis!ersão. h medida 'ue cresce, a 0i0liograa de um assunto torna-se cada vez mais dis!ersa Bmais !a+ses !resentes, mais l+nguas utilizadas, mais !eri?dicos 'ue !u0licam, maior variedade de documentosC e, !ortanto, mais di+cil de identicar, coletar e organizar.
Figura 43 ( Erescimento da literatura cient+ca so0re %IS, 19)-196 BFonte :LI2:C
Figura 4 ( Literatura so0re %IS co0ertura !or idioma, 19)-196 BFonte :LI2:C
Figura 44 ( Literatura so0re %IS co0ertura !or !a+s, 19)-196 BFonte :LI2:C
Figura 45 ( 2Hmero de !eri?dicos 'ue !u0licam artigos so0re %IS, 19)-196 BFonte :LI2:C
111
Figura 46 ( is!ersão da literatura de !eri?dicos so0re %IS em 196 BFonte :LI2:C
o as!ecto mais im!ressionante da dis!ersão diz res!eito P se!aração de artigos entre os t+tulos de !eri?dicos. Foi &radord 'uem !rimeiro o0servou este enQmeno, em 193, enQmeno ao 'ual nos reerimos atualmente como Lei da is!ersão de &radord. :la est" demonstrada nitidamente na gura 46, 'ue a!resenta a dis!ersão de artigos de !eri?dicos so0re %IS no !er+odo 19)196. M !rimeiro !eri?dico da lista !artici!ou com 44 tra0al8os num !er+odo de seis anos, o segundo com 341 tra0al8os e o terceiro com 36 tra0al8os. M0serve-se 'ue dois !eri?dicos contri0u+ram com 56 tra0al8os cada um, dois com 6 cada um, e assim sucessivamente at= o m da lista, onde temos 4) !eri?dicos 'ue !artici!aram com a!enas um Hnico artigo cada um !ara a 0i0liograa de %IS durante seis anos. &em mais de um terço da literatura ac8a-se concentrado em a!enas 14 !eri?dicos. Dara alcançar o terço seguinte, = !reciso, no entanto, acrescentar mais 1)3 !eri?dicos, en'uanto o terço nal ac8a-se dis!erso em mais de mil !eri?dicos adicionais. :sta distri0uição !ro!orciona uma demonstração elo'ente da lei dos rendimentos decrescentes. Isso = revelado de modo ainda mais n+tido na gura 4, 'ue re!resenta gracamente a !ercentagem de artigos em com!aração com a !ercentagem de !eri?dicos 'ue contri0u+ram com artigos. 2ote-se 'ue, P medida 'ue se ascende na curva, a dis!ersão de artigos entre os t+tulos de !eri?dicos cresce em !ro!orção a!roximadamente geom=trica o !rimeiro terço dos artigos em 14 !eri?dicos, o segundo em 1)3 !eri?dicos B14 x ,)C, e o terço nal em 1 !eri?dicos Bnuma a!roximação grosseira, 14 x ,) )C. :sta = uma distri0uição ti!icamente 0radordiana. evidente 'ue um centro de inormação 'ue este;a ormando uma 0ase de dados so0re o assunto %IS não !oder" montar este serviço a!oiando-se na assinatura direta de todos os !eri?dicos 'ue !u0licam artigos de interesse. Eontudo, a lista desses !eri?dicos em ordem de nHmero de artigos !u0licados Bgura 46C !ode ser utilizada !ara identicar uma lista 0"sica de !eri?dicos 'ue mereçam ser ad'uiridos e examinados sistematicamente. % gura 49 mostra como seria o to!o dessa lista, com 0ase em dados de 19)-196. %t= 'ue !onto dessa lista ordenada c8egaria o centro de inormação = algo 'ue de!enderia em !arte de seus recursos nanceiros. :ntretanto, mesmo dis!ondo de recursos ilimitados, o centro não !oderia ad'uirir todos os !eri?dicos 'ue !u0licam artigos so0re %IS. 2a medida em 'ue se desce na lista ordenada, diminui a !revisi0ilidade dos t+tulos dos !eri?dicos. %ssim, os dez t+tulos do to!o em 19)-196 talvez continuem ocu!ando essa !osição durante os !r?ximos cinco anos. Isso, 11)
!or=m não = garantido. 2o caso da %IS, !or exem!lo, existem atualmente novos !eri?dicos dedicados exclusivamente a este assunto e 'ue !rovavelmente virão a a!arecer entre os dez do to!o da lista durante o !er+odo de 196 em diante, talvez at= ocu!ando o !rimeiro lugar. 2o entanto, = 0astante !rov"vel 'ue todos os !eri?dicos da gura 49 continuarão entre os mais !rodutivos so0re %IS ainda !or algum tem!o. Ms !eri?dicos na aixa intermedi"ria da distri0uição Bisto =, a!roximadamente os do meio da ta0ela da gura 46C são muito menos !revis+veis !oderão ou não continuar !u0licando artigos relacionados P %IS. MS t+tulos 'ue a!arecem no != da ta0ela são 0astante im!revis+veis um !eri?dico 'ue ten8a !u0licado somente um artigo so0re %IS em cinco ou seis anos talvez nunca mais ven8a a !u0licar outro artigo so0re o mesmo assunto. %o !rocurar ormar uma 0ase de dados es!ecializada em %IS, !ortanto, o centro de inormação co0rir" uma !arte dessa literatura !or meio de assinatura direta - talvez uns 1 !eri?dicos, mais ou menos - e identicar" os outros itens 'ue tratam de %IS mediante 0uscas sistem"ticas em outras 0ases de dados de mais am!lo alcance :LI2:, &IMSIS, etc.
Figura 4 ( @r"co da dis!ersão da literatura so0re %IS
Figura 49 ( Deri?dicos cient+cos 'ue !u0licaram a maioria dos artigos so0re %IMS, 19)-196 BFonte :LI2:C
artAn B1956C e artAn e Slater B195C realizaram os estudos Rcl"ssicosO so0re co0ertura de serviços de indexação#resumos, !or=m 8", na 0i0liograa, muitos outros tra0al8os so0re co0ertura ou du!licidade. Dor exem!lo, @oode et al. B196C com!araram a co0ertura do :!ile!sA %0stracts, um !roduto da :xcer!ta edica Foundation, com a do Index edicus, en'uanto WilXinson e Yollander B1963C com!araram a co0ertura do Index edicus e do rug Literature Index. ois estudos zeram uma com!aração entre &iological %0stracts, E8emical %0stracts e :ngineering Index e seus e'uivalentes em ormato eletrQnico Wood et al. B196)C com!araram a co0ertura das tr>s ontes em termos de t+tulos de !eri?dicos, en'uanto Wood et al. B1963C as com!araram em termos de artigos de !eri?dicos selecionados !ara co0ertura. /alvez o maior estudo so0re du!licidade oi o relatado !or &earman e Zun0erger B1966C, 'ue analisaram 1 serviços dierentes e 'uase )5 !eri?dicos !or eles indexados, tendo tratado da du!licidade e exclusividade de co0ertura. :m0ora o Index edicus ten8a sido analisado mais vezes do 'ue 'ual'uer outra onte, a &i0liogra!8A o %griculture oi tema do estudo mais intensivo so0re co0ertura. :m dois 113
relat?rios ans, &ourne B1959a, 0C com!arou a co0ertura dessa onte com a de 14 outros serviços e calculou sua co0ertura de t?!icos es!ec+cos, em!regando !ara isso as 0i0liograas 'ue acom!an8am os ca!+tulos de anu"rios de revisão da literatura. ontgomerA B1963C estudou a co0ertura da literatura de toxicologia em E8emical %0stracts, &iological %0stracts, Index edicus, :xcer!ta edica, E8emical &iological %ctivities e Science Eitation Index. :ste oi um estudo inusitado, !ois coletou um con;unto de 163 reer>ncias da literatura de toxicologia B195-1959C ;unto a ))1 mem0ros da SocietA o /oxicologA e as utilizou como 0ase !ara com!aração das diversas ontes. MOEonnor e eadoVs B195C estudaram a co0ertura de astronomia no D8Asics %0stracts, @ilc8rist B1955C, a co0ertura da literatura de documentação Bes!ecicamente itens so0re a avaliação de sistemas de inormaçãoC em seis serviços, e Fridman e Do!ova B196)C, a co0ertura de !rimatologia ex!erimental no 7eerativnAi Turnal. &rittain e 7o0erts B19C tratam da du!licidade no cam!o da criminologia, e 7o0inson e Yu B191C com!aram a co0ertura de 0ases de dados no cam!o da energia. :dVards B1965C incluiu a co0ertura como um as!ecto de seu estudo so0re +ndices em 0i0lioteconomia e ci>ncia da inormação. La &orie et al. B194C estudam a du!licidade em 'uatro serviços secund"rios em 0i0lioteconomia # ci>ncia da inormação, 0aseando-se em t+tulos de !eri?dicos, e com!aram os t+tulos co0ertos !or esses serviços com a'ueles co0ertos !or seis serviços nas ci>ncias, inclusive ci>ncias sociais. Mutros !es'uisadores estudaram a co0ertura de determinados ti!os de !u0licaçes B!or exem!lo, Yanson e Tanes B1951C realizaram uma !es'uisa so0re a co0ertura, !or !arte de v"rios serviços, de tra0al8os a!resentados em eventos, e M!!en8eim B196C examinou a co0ertura de !atentes !elo E8emical %0stractsC, ou a co0ertura de um assunto altamente es!ec+co B!or exem!lo, o estudo de SmalleA B19C so0re a com!aração de duas 0ases de dados do !onto de vista de sua co0ertura da 0i0liograa so0re condicionamento o!eranteC. Ms estudos de co0ertura são menos comuns 8o;e em dia, mas de vez em 'uando a!arece algum na literatura. &roVn et al. B1999C, !or exem!lo, com!aram a co0ertura do Eurrent Index to Tournals in :ducation com o :ducation Index. :studos de co0ertura ou du!licidade não são necessariamente meros exerc+cios intelectuais. %lguns são realizados visando a o0;etivos denidos, dos 'uais o mais evidente = como mel8orar a co0ertura de algum serviço. Mutra nalidade desses estudos = a identicação de uma Rlista 0"sicaO de !eri?dicos em determinado cam!o, identicados !elo ato de serem todos considerados merecedores de indexação !or v"rios serviços dierentes.
Dara 'uem estiver !rocurando inormaçes so0re determinado assunto, ser" im!ortante a co0ertura de uma 0ase de dados so0re esse assunto, !rinci!almente se tiver de azer uma 0usca exaustiva. :videntemente, a recu!era0ilidade tam0=m = im!ortante$ considerando 'ue uma 0ase de dados inclui n itens so0re um assunto Bo 'ue se !ode esta0elecer !or meio de um estudo de co0erturaC, 'uantos desses itens ser" !oss+vel recu!erar ao azer uma 0usca na 0ase de dados Isso = com!rovado mediante um estudo 'ue = com!lementar a uma !es'uisa so0re co0ertura. Su!on8amos 'ue 'ueremos estudar a co0ertura e a recu!era0ilidade de uma variedade de assuntos 'ue se situam no m0ito da 0ase de dados %@7IEML%. Dara cada um de dez assuntos, temos um con;unto de itens 0i0liogr"cos Besta0elecido !or um dos m=todos antes descritosC e, !ara cada con;unto, sa0emos 'uais os itens 'ue se ac8am e os 'ue não se ac8am inclu+dos no %@7IEML%. Dara cada assunto ter+amos uma 0usca realizada !or um es!ecialista em inormação con8ecedor do %@7IEML%, e aerir+amos a recu!era0ilidade com 0ase na !ro!orção de itens con8ecidos 'ue o es!ecialista conseguir recu!erar. Dor exem!lo, na !rimeira 0usca so0re insetos danin8os P so;a, sa0emos 'ue existem itens so0re este t?!ico 'ue se ac8am inclu+dos no %@7IEML%. M es!ecialista, contudo, somente conseguiu encontrar 5 desses itens, ou se;a, uma revocação Bver ca!+tulo 1C de a!enas 64f. claro 'ue este ti!o de estudo testa não a!enas a 0ase de dados e sua indexação, mas tam0=m a ca!acidade da !essoa 'ue az a 0usca. M eeito desta vari"vel !ode ser atenuado azendo-se com 'ue a mesma 0usca se;a eita de modo inde!endente !or v"rios es!ecialistas em inormação, a m de determinar 'ue resultados em m=dia !odem ser es!erados de uma 0usca so0re o assunto. Ms resultados !oderiam ser tam0=m considerados como !ro0a0ilidades !or exem!lo, 4# oram encontrados !or todos os tr>s es!ecialistas B!ro0a0ilidade de recu!eração 1,C, 5# !or dois dos tr>s es!ecialistas B!ro0a0ilidade de recu!eração ,55C, 11
# # !or a!enas a!enas um dos es!eci es!eciali alista stass B!ro0a B!ro0a0il 0ilida idade de de recu! recu!era eraçã ção o ,33C, ,33C, e )# )# !or nen8um deles B!ro0a0ilidade de recu!eração zeroC. zeroC. M0serve-se 'ue a recu!era0ilidade BrevocaçãoC = avaliada somente tendo em conta os itens con8ecidos !or anteci!ação como relevantes !ara o assunto da 0usca e 'ue se ac8am inclu+dos na 0ase de dados. % 0usca so0re !ragas de insetos 'ue atacam a so;a !ode recu!erar um total de )1tens, dos 'uais, digamos, 14 !arecem relevantes. Se a!enas 5 dos itens Rcon8ecidos como relevantesO orem recu!erados, a estimativa de revocação = de ,64 o 'ue im!lica 'ue os 14 itens recu!erados re!resentam a!roximadamente 64f do total de itens relevantes !resentes na 0ase de dados. M coeciente de revocação, evidentemente, reere-se a!enas a uma dimensão da 0usca. % m de esta0elecer um coeciente de !recisão Bver ca!+tulo 1C, seria !reciso 'ue todos os itens recu!erados ossem de algum modo, avaliados 'uanto P sua relevncia B!or exem!lo, !or um gru!o de es!ecialistas no assuntoC. m relação direta com Rsu!ercondutoresO B!or exem!lo, !odem re!resentar a!licaçes do !rinc+!io da su!ercondutividadeC. su!ercondutividadeC. %l0rig %l0rig8t 8t B1969C B1969C reali realizo zou u minuci minucioso oso estudo estudo desse desse ti!o ti!o em!re em!regan gando do o Index Index edicu edicus. s. &uscas simuladas, eitas so0re dez assuntos dierentes, revelaram 'ue, em m=dia, teriam de ser consul consultad tados os termos termos dier dierent entes es !ara !ara recu! recu!era erarr todos todos os itens itens 'ue se sa0ia sa0ia sere serem m relev relevant antes es !ara !ara deter determin minado ado assunt assunto. o. :m0ora :m0ora alguns alguns estive estivesse ssem m ligado ligados, s, !or meio meio da estrutura 8ier"r'uica ou de remissivas do voca0ul"rio do sistema, muitos não a!resentavam essa essa ligaçã ligação, o, e seria seria im!ro im!rov"v v"vel el 'ue mesmo mesmo um es!eci es!eciali alista sta em 0uscas 0uscas,, !ersis !ersisten tente te e 8a0ilidoso, viesse a consult"-los. % gura 51 mostra um exem!lo do tra0al8o de %l0rig8t. 2a reali realidad dade, e, somen somente te um es!eci es!eciali alista sta em 0uscas 0uscas 'ue osse osse muito muito inteli inteligen gente te e !ersis !ersisten tente te o0teria alta revocação numa 0usca so0re esse t?!icos no Index edicus. %ssim como os artigos estão dis!ersos !elos t+tulos de !eri?dicos, os itens so0re um assunto inclu+dos numa 0ase de dados estão dis!ersos so0 muitos termos dierentes. o 'ue mostra graca gracamen mente te a gura gura 5). 5). !oss+v !oss+vel el 'ue, 'ue, !ara !ara determ determina inado do assunt assunto, o, se encont encontre re uma !ercen !ercentag tagem em relat relativa ivamen mente te alta alta de itens itens relev relevant antes es so0 um !e'uen !e'ueno o nHmero nHmero de termos termos R?0viosO R?0viosO B!or exem!lo exem!lo,, S
114
Figura Figura 5 ( :xem!lo 8i!ot=tico da distri0uição de itens so0re Rsu!ercondutoresO Rsu!ercondutoresO so0 termos num +ndice im!resso
Figura Figura 51 ( istri0uição de itens so0re imunologia celular no !orco so0 termos no Index edicus %!ud %l0rig8t B1969C com !ermissão do autor 1
Figura Figura 5) ( is!ersão de itens so0 termos de indexação
:sta an"lise so0re simulaçes oi deli0eradamente sim!licada !elo ato de, em grande !arte, ter su!osto 'ue uma 0usca teria a!enas uma Hnica aceta ou, !elo menos, seria uma 0usca eita num +ndice im!resso onde s? se !ode consultar um termo de cada vez. % simulação de uma 0usca numa 0ase de dados em lin8a, 'ue comumente envolve mais de uma aceta, ser" um !ouco mais com!licada. Dor exem!lo, numa 0usca so0re !ragas de insetos 'ue atacam a so;a, temos de admitir 'ue s? se recu!eraria algum item se ele estivesse indexado so0 um termo designativo de RinsetoO 0em como so0 um termo 'ue indicasse Rso;aO. %l0rig8t B1969C realizou o estudo de recu!era0ilidade mais com!leto, utilizando, !or=m, uma Hnica onte, o Index edicus. artAn B1956C e artAn e Slater B195C examinaram a 1
Dara a tradução destes termos, ver escritores em Ei>ncias da SaHde BeESC em 8tt!##decs.0vs.0r#.
115
dis!ersão de material relevante so0 termos de indexação em v"rios serviços im!ressos, e &ourne B1959a, 0C tam0=m deu atenção P dis!ersão em seus estudos so0re a &i0liogra!8A o %griculture. Earroll B1959C estudou estudou a dis!ersão da literatura de virologia no &iological %0stracts e encontrou tra0al8os so0re essa "rea dis!ersos em ) seçes dessa erramenta al=m das 'ue se reer reeriam iam direta diretamen mente te P virolo virologia gia.. MOEonn MOEonnor or e eadoV eadoVss B195C B195C encont encontrar raram am dis!er dis!ersão são semel8ante da literatura de astronomia astronomia no D8Asics %0stracts. avison e att8eVs B1959C examinaram a recu!era0ilidade de itens so0re com!utadores em es!ectrometria de massa em 11 serviços, 0em como a co0ertura desse assunto !or !arte dess desses es serv serviç iços os.. /8or /8or!e !e B196 B196C C calc calcul ulou ou a revo revoca caçã ção o e a !rec !recis isão ão de 0usc 0uscas as so0r so0re e reumatologia no Index edicus, e *irgo B196C utilizou o tema otalmologia !ara com!arar a recu!eração da 0ase de dados :L%7S com a de seu !rinci!al !roduto, o Index edicus. Ta8oda e Stursa B1959C com!araram as !ossi0ilidades de recu!eração de um +ndice de assuntos de Rentrada HnicaO com um +ndice 0aseado em !alavras-c8ave dos t+tulos, qerXeA B1963C com!arou com!arou as !ossi0ilidades de recu!eração de um +ndice ZWIE com o :ngineering Index e o &usiness Deriodicals Index, e Farradane e qates-er qates-ercer cer B1963C avaliaram o etais %0stracts Index !or meio de 0uscas simuladas. . ncia B!or exem!lo, tem!o de 0uscaC no desem!en8o da tarea. ncia de uso. Ms estudos mais com!letos so0re desem!en8o da recu!eração em +ndices im!ressos oram oram relat relatado adoss !or Zeen B1965C B1965C,, tendo tendo como como assunt assunto o a 0i0lio 0i0liotec tecono onomia mia e a ci>nci ci>ncia a da inor inormaç mação ão.. %s 0uscas 0uscas oram oram eitas eitas !or estuda estudante ntess e os resul resultad tados os avalia avaliados dos 'uanto 'uanto a revocação, !recisão e tem!o de 0usca. Zeen B19660C tam0=m a!resentou uma an"lise de estrat=gias de 0usca a!licadas a +ndices im!ressos. EonaVaA B196C desenvolveu um valor 'uantitativo Hnico !ara ex!ressar o m=rito de um +ndice im!resso, o Eoeciente de
% an"l an"lis ise e a'ui a'ui eit eita a so0r so0re e aval avalia iaçã ção o da recu recu!e !era ra0i 0ili lida dade de adot adotou ou um !res !ressu su!o !ost sto o im!ortante o de 'ue = !oss+vel recon8ecer um item RrelevanteO a !artir das inormaçes so0re esse item contidas na 0ase de dados. :stas inormaçes com!reendem com!reendem 1. M t+tu t+tulo lo do item item ). M t+tulo t+tulo mais mais uma uma lista lista de termos termos de indexaçã indexação o 3. M t+t t+tul ulo o mais mais um um res resum umo o . M t+tulo t+tulo mais mais os os termo termoss mais mais o resum resumo o :m geral, 'uanto mais extensa or a re!resentação mais !istas ornecer" so0re se um item ser" ou não de interesse !ara o usu"rio. % inormação m+nima !ro!orcionada !or uma 0ase de dados, seria o t+tulo do item. M grau com 'ue o t+tulo reNete satisatoriamente o conteHdo tem"tico de!ende em grande medida do ti!o de !u0licação. :m geral, os artigos de !eri?d !eri?dico icoss cient+ cient+co coss costu costumam mam trazer trazer t+tulo t+tuloss 0asta 0astante nte descri descritiv tivos, os, en'uan en'uanto, to, no outro outro extremo, as mat=rias de ;ornais a!resentam t+tulos atraentes e 'ue !rendem a atenção, mas 116
não são muito descritivos de seu conteHdo. %s !u0licaçes t=cnicas ou comerciais tam0=m se inclinam !elo t+tulo atraente o Tournal o etals a!resenta t+tulos muito descritivos, sendo menos !rov"vel encontr"-los numa revista como Iron %ge. Ms t+tulos, evidentemente, não são a!resentados isoladamente. 2um +ndice im!resso, !or exem!lo, exem!lo, o t+tulo se situa no contexto do termo de indexação so0 o 'ual a!arece. M t+tulo Rn se'>ncia cia de regis registr tros os de exten extensã são o crescente, com os resultados mostrados no nal deste !ar"grao. 2essa situação 8i!ot=tica, o solici solicitan tante, te, ao examin examinar ar o texto texto integr integral al dos artigo artigoss de !eri?d !eri?dico icos, s, consid considera era 1 como como relevantes e 15 como não relevantes. Suas !revises de relevncia mel8oraram P medida 'ue cresc crescia ia a extens extensão ão da re!r re!rese esenta ntação ção do docume documento nto.. em0ora em0ora o acr=sc acr=scimo imo de termos termos de indexação ao resumo não ten8a sido dierente do uso do resumo sozin8o. %t= mesmo o mel8or sucedneo Bt+tulo mais resumoC não oi !ereito su0-re!resentou os itens relevantes e su!erre!resentou os irrelevantes.
7egistro a!resentado /+tulo do artigo /+tulo do artigo mais t+tulo do !eri?dico !eri?dico /+tulo do artigo Be do !eri?dicoC !eri?dicoC mais lista de termos de indexação /+tulo do artigo Be do !eri?dicoC !eri?dicoC mais resumo /+tulo do artigo Be do !eri?dicoC !eri?dicoC mais resultado e termos de indexação /exto /exto integral dos dos artigos
Itens a!resentados
Itens considerados nitidamente irrelevantes
Itens considerados relevantes ou !ossivelmente relevantes
3 3
1) 13
1 1
3
14
14
3
1
1)
3
1
1)
3
15
1
Des'uisas so0re o eeito de sucedneos de documentos na !revisi0ilidade da relevncia oram eitas !or diversos estudiosos, inclusive 7at8 et al. B1951 aC, 7esnicX B1951C, Zent et al. B1956C, Am B1956C, S8ireA e Zureerst B1956C, Saracevic B1959C, arcus et al. B1961C e Zeen B1965C. arcus et al. demonstraram claramente 'ue a RindicatividadeO de um sucedneo de documento est" diretamente relacionada P sua extensão em nHmero de !alavras. Dor outro lado, = 0em !rov"vel 'ue 8a;a uma extensão ideal 'ue não seria econQmico ultra!assar, !elo menos !ara ns de !revisi0ilidade. YagertA B1956C, !or exem!lo, vericou 'ue, em0ora a extensão de um resumo mel8orasse as !revises de relevncia, o eeito do aumento da extensão do resumo era sur!reendentemente sur!reendentemente discreto. Des'uisas so0re a utilidade dos resumos na !revisão da relevncia dos documentos !ressu!em, geralmente, 'ue o resumo = uma !eça inde!endente do documento, 'ue a!arece num serviço de resumos im!ressos ou na sa+da de uma o!eração de recu!eração. /8om!son 11
B1963 B1963C, C, no entant entanto, o, estudo estudou u a utiliz utilizaçã ação o e a utilid utilidade ade dos resumos resumos 'ue acom!a acom!an8a n8am m os documentos Bno in+cio de artigos de !eri?dicos ou de relat?rios t=cnicosC. :le coletou dados so0re decises 'uanto Ps atitudes tomadas !or engen8eiros e cientistas de tr>s la0orat?rios militares em relação a documentos 'ue !assavam !or suas mesas no curso das atividades rotineiras durante um !er+odo de 'uatro semanas. 2ão !Qde conrmar se as decises 'uanto Ps atitud atitudes es tomada tomadass em relaç relação ão aos docume documento ntoss 'ue contin contin8am 8am resum resumos os ocorr ocorriam iam mais mais ra!idamente do 'ue as decises em relação P'ueles sem resumos. %l=m disso, 'uando os su;eitos do ex!erimento voltaram a rece0er c?!ias do documento, !osteriormente, !ara um Rree Rreexam xame e !onder !onderado adoO, O, suas suas decis decises es anteri anterior ores es 'uanto 'uanto P relev relevnc ncia ia de docume documento ntoss 'ue contin8am resumos não a!resentaram maior !ro0a0ilidade de concordncia com as decises !osteriores mais !onderadas do 'ue ora constatado !ara os documentos sem resumos. :stes resultados não lançam dHvida so0re a utilidade dos resumos de !er si ou mesmo so0re a util utilid ida ade dos dos resum esumos os 'ue 'ue acom!a om!an8 n8am am artig rtigo os ou rela elat?ri t?rio os Bum Buma vez vez 'ue são são re'entemente adotados ou modicados !or serviços secund"riosC, mas realmente sugerem 'ue os resumos !odem ter um uso limitado nas decises de seleção inicial. uitos dos indiv+duos a 'uem são enviadas !u0licaçes !reerem ;ulgar a relevncia delas !ara seus interesses atuais !assando os ol8os no texto, examinando as ta0elas ou guras, ou mesmo c8ecando as reer>ncias 0i0liogr"cas B!or exem!lo, !ara conerir se oram citados`C. % 'ualidade dos resumos como tais = examinada no ca!+tulo , en'uanto o t?!ico relativo P ela0oração autom"tica de resumos = tratado no ca!+tulo 14. :m estu estudo do mais mais rece recent nte, e, Salt Salton on et al. al. B199 B1996C 6C com! com!ar ara a resu resumo moss de docu docume ment ntos os com!lexos ela0orados automaticamente com 0ase na extração em !ar"graos com !rocesso simila similar, r, eito eito !or seres seres 8umano 8umanos, s, de extra extração ção em !ar"gr !ar"grao aos. s. :les :les ;usti ;usticam cam o m=todo m=todo autom"tico com o argumento de 'ue um resumo ela0orado automaticamente = tão !rov"vel 'ue coincida com um resumo !re!arado !or seres 8umanos 'uanto um resumo !re!arado !or uma !essoa coincida com um resumo !re!arado !or outra !essoa. Droces ocesso soss seme semel8 l8an ante tess ora oram m em!r em!reg egad ados os na aval avalia iaçã ção o de trad traduç uçe ess eit eitas as automaticamente ou !or seres 8umanos. &reV e /8om!son B199C, !or exem!lo, argumentam 'ue [as 0oas traduçes tenderão a ser mais similares entre si do 'ue as traduçes ruins^. +tualidade
% atualidade ou R!restezaO = uma medida da velocidade com 'ue novas !u0licaçes são inclu+das num serviço de indexação#resumos. indexação#resumos. /rata-se /rata-se de um crit=rio 'ue os usu"rios !erce0em imediatamente, !ois a data de !u0licação de um +ndice im!resso = con8ecida e a data Bou !elo menos o anoC da !rimeira edição de cada item inclu+do i nclu+do consta de sua reer>ncia 0i0liogr"ca. % atua atuali lida dade de = meno menoss a!ar a!aren ente te !ara !ara usu" usu"rio rioss de sist sistem emas as em lin8 lin8a, a, mas mas aind ainda a assi assim m = !erce!t+vel. :ssa :ssa visi0i visi0ilid lidade ade = desas desastr tros osa a !or'ue !or'ue comume comumente nte leva leva as conclu conclus ses es 'ue não são v"lidas. ncia 8umana = !erce0er casos exce!cionais, e outra tend>ncia = dar Ps ex!ectativas um !eso indevido ao azer um ;ulgamento. M usu"rio de um volume de resumos im!re im!resso ssoss tem a o!ortu o!ortunid nidade ade de exami examinar nar inHmer inHmeras as reer reer>nc >ncias ias ao mesmo mesmo tem!o tem!o.. %o !erce0er 'ue algumas corres!ondem a materiais !u0licados 8" talvez dois ou tr>s anos, ele in;u in;ust sti ica cada dame ment nte e conc conclu luii 'ue 'ue o servi erviço ço = em gera gerall muit muito o lent lento o na iden identi tic caç ação ão e !rocessamento !rocessamento de novos itens. :xistem muitos motivos !elos 'uais " inclusão de uma reer>ncia num ar'uivo sore atraso atrasos. s. M interv intervalo alo entre entre a im!re im!ress ssão ão de um !eri?d !eri?dico ico e seu seu rece0 rece0ime imento nto !elo !elo serviç serviço o secund"rio !ode ser longo devido a razes de ordem geogr"ca ou econQmica$ !or exem!lo, um serviço norte-americano rece0e os !eri?dicos dos :<% !elo correio !oucos dias de!ois de sua im!ressão, !or=m os !eri?dicos estrangeiros !odem levar de seis a sete semanas !ara c8egar a esse !a+s. Eertos ti!os de materiais, como os anais de eventos, são di+ceis de localizar e, uma vez localizados, são de a'uisição tra0al8osa. ocumentos escritos em certas l+nguas demandam mais do 'ue o tem!o m=dio !ara serem !rocessados, devido P escassez de tradutores 'ualicados. ateriais R!eri=ricosO, o 'ue comumente signica materiais a!arecidos em !eri?dicos e outras !u0licaçes 'ue não se;am examinados rotineiramente !elo serviço, tomam mais tem!o !ara serem localizados do 'ue os materiais da lista 0"sica, uma vez 'ue re'entemente s? são identicados 'uando da consulta a outros serviços secund"rios e, !or isso, sorem uma du!la s=rie de atrasos no !rocessamento. %lguns serviços contam com sistemas de !rocessamento mais "geis do 'ue outros, e alguns atrasos são im!ut"veis P ineci>ncia do sistema. Kuando um serviço de indexação#resumos = utilizado !ara noticação corrente, a avaliação 'ue dele az o usu"rio = inNuenciada !elo nHmero de itens dos 'uais ele ;" tem con8ecimento !r=vio e 'ue constam do asc+culo mais recente. % !resença de alguns 119
itens ;" con8ecidos costuma estimular a conança na eci>ncia do serviço, mas a !resença de um nHmero excessivo desses itens a0ala a conança em sua atualidade. o !onto de vista do avaliador, a atualidade = muito atraente como crit=rio de ec"cia. % atualidade = relativamente "cil de medir, sendo incontest"vel 'uando medida, !or'ue não de!ende de ;u+zos su0;etivos. % Hnica inNu>ncia 'ue o avaliador exerce so0re a medida = na escol8a das datas 'ue serão usadas. 2o caso de 0ases de dados im!ressas, a data de a!arecimento da reer>ncia = normalmente tida como a data de !u0licação do serviço. 2o caso de um serviço em lin8a, a data ser" a'uela em 'ue a reer>ncia oi inclu+da na 0ase de dados, mas esta data nem sem!re !ode ser conrmada retros!ectivamente. s mais !r?ximo. M dia eetivo em 'ue a !u0licação oi editada somente ser" con8ecido se zer uma consulta P editora. Inelizmente, a data na ca!a de um !eri?dico nem sem!re = con"vel, !ois alguns são !u0licados no m>s anterior ao m>s nominal de edição, e a maioria a!arece !osteriormente P data nominal de edição. % data em 'ue a !u0licação se torna dis!on+vel =, em alguns !a+ses, uma alternativa 'ue não a!resenta !ro0lemas. :m0ora essa data - data de dis!oni0ilidade - realmente não meça a atualidade de um serviço, ela nos d" uma medida da atualidade eetiva do !onto de vista dos usu"rios do !a+s onde são registradas as datas de dis!oni0ilidade. 2os :<%, as datas de dis!oni0ilidade de !eri?dicos seriam as datas de seu rece0imento !ela Li0rarA o Eongress ou outra das 0i0liotecas nacionais. :ssas datas a!arecem carim0adas nas ca!as dos !eri?dicos, ou !rovavelmente existam num registro de controle mantido !ela 0i0lioteca. Dode-se assim medir o intervalo de tem!o entre a dis!oni0ilidade de um !eri?dico nos :stados ncia !or algum serviço secund"rio. :stritamente alando, deve-se considerar a data de dis!oni0ilidade do serviço secund"rio ao inv=s da data de sua edição, !or=m raramente se verica uma grande dierença entre elas. % atualização da 0ase de dados eletrQnica normalmente se d" antes da atualização do +ndice im!resso ao 'ual se relaciona. % coleta de dados im!lica a o0tenção de uma amostra aleat?ria de itens extra+dos do asc+culo mais recente de um serviço secund"rio, anotando-se a data de edição Bou atualizaçãoC do serviço, a isto acrescentando os dados originais de edição ou dis!oni0ilidade, normalmente retirados de uma onte dierente. Se exigir, como conv=m re'entemente, 'ue se;a eita uma an"lise !or l+nguas, !a+ses de origem e ormas de !u0licação B!or exem!lo, artigos de !eri?dicos, teses e monograasC, as dimenses da amostra deverão ser maiores do 'ue seriam se dese;asse a!enas uma estimativa glo0al da atualidade. % atualidade = !rovavelmente a caracter+stica de um serviço secund"rio mais "cil de ser medida. /am0=m = !rov"vel 'ue se;a a menos im!ortante. %s editoras talvez se interessem !ela atualidade como medida da ec"cia de suas atividades, mas os usu"rios, em0ora re'entemente ex!ressem a vontade de 'ue o serviço se;a "gil, talvez se im!ressionem menos com isso. Kuando se leva em consideração o intervalo de tem!o decorrido entre a conclusão de uma !es'uisa e sua !rimeira !u0licação, a demora adicional acarretada !ela utilização de um serviço secund"rio !ara localizar essa !es'uisa = relativamente !e'uena. =ormas
:m teoria, um m=todo ?0vio !ara azer a avaliação de +ndices e resumos e com!ar"-los com as normas existentes. 2o mundo angl?ono, as normas !ertinentes são %2SI#2ISM _39.1-1996 @uidelines or a0stracts Breeditada em ))C %2SI#_39.-19 &asic criteria or indexes ISM 999 1995 @uidelines or t8e content, organization, and !resentation o indexes ISM 4953-194 B:C et8ods or examining documents, determining t8eir su0;ects, and selecting indexing terms &S 36 19 Dre!aring indexes to 0ooXs, !eriodicals, and ot8er documents &S 54)9 19 :xamining documents, determining t8eir su0;ects, and selecting indexing terms
1)
M0serve-se 'ue essas normas tendem a enocar o !roduto ao inv=s do !rocesso os +ndices e os resumos ao contr"rio da indexação e da redação de resumos. %!enas a ISM 4953 e a &S 54)9 ocalizam o !rocesso, :m virtude de estar voltadas !ara o as!ecto mais di+cil da indexação - decidir 'ual = realmente a Rmat=ria index"velO de um documento - são, !or v"rios motivos, as mais Hteis de todas as normas 'ue lidam com a an"lise conceitual dos documentos. 2a realidade, em0ora essas dierentes !u0licaçes se;am editadas !or organizaçes de normalização, = di+cil consider"-las como verdadeiras normas. ncia P tração igual a xC. claro 'ue a indexação e a redação de resumos são atividades 'ue não são nem exatas nem de cum!rimento o0rigat?rio Bexceto so0 condiçes muito limitadas, como, !or exem!lo, os re'uisitos 'ue se;am exigidos !elos editores de um !eri?dicoC. % im!recisão e a evidente su0;etividade da indexação estão 0em demonstradas no ato de a comissão de desenvolvimento de normas da 2ISM, incum0ida de rever a %2SI _39. , não ter c8egado a acordo 'uanto a uma norma e s? ter conseguido !roduzir um relat?rio 'ue [servisse como um recurso atual so0re indexação^ B@uidelines or indexes, 1996C. Dor conseguinte, esse relat?rio sim!lesmente !ossui um nHmero de relat?rio e não uma designação ocial de norma z39. di+cil com!reender tanta sutileza, !ois, como se disse antes, normas de verdade não !odem Be !rovavelmente não devemC ser im!ostas a atividades intelectuais, e a maioria das RnormasO tem outra denominação BRdiretrizesO ou Rcrit=riosOC. Kual'uer 'ue se;a a orma como se;am c8amadas, essas normas não são sucientemente !recisas !ara serem usadas na avaliação de +ndices ou resumos, ou na indexação e redação de resumos, exceto no n+vel mais su!ercial. %demais, as normas de indexação se concentram 0asicamente nos +ndices im!ressos em geral e nos +ndices de nal de livro, em !articular. Outros aspectos concernentes C a#aliação
*"rios outros m=todos oram em!regados !ara analisar o desem!en8o e o uso de +ndices im!ressos. Dor exem!lo, /orr et al. B1955C descrevem 'uatro m=todos 'ue !odem ser adotados !ara Ro0servarO os usu"rios de +ndices 1C azer com 'ue o usu"rio manten8a um registro escrito dos !rocessos de racioc+nio e da estrat=gia 'ue em!rega ao azer uma 0usca, )C azer com 'ue o es!ecialista em 0uscas utilize um gravador de ta com a mesma nalidade, 1 3C azer com 'ue um o0servador acom!an8e a 0usca, e C em!regar a o0servação 8umana com0inada com uma cmara !ara estudar como os +ndices são utilizados. :sses !es'uisadores vericaram ser di+cil conseguir a coo!eração dos Rusu"rios reaisO com esses estudos, o 'ue tam0=m oi a ex!eri>ncia de Yall B196)C. Mutros !es'uisadores em!regaram entrevistas ou 'uestion"rios !ara o0ter as o!inies de usu"rios relativas a v"rios serviços de indexação#resumos, inclusive Yall B196)a, 0C, Zeen B1965C, rage B1959C e EluleA B195C. %o tratar da recu!era0ilidade, este ca!+tulo deteve-se mais nos serviços im!ressos de indexação e resumos do 'ue na recu!eração em 0ases de dados eletrQnicas. Isso reNete !arcialmente o oco do !resente livro indexação e redação de resumos ao inv=s de outros as!ectos da recu!eração da inormação. :videntemente, os m=todos adotados !ara estudar co0ertura, !revisi0ilidade e atualidade são !ertinentes a todos os ti!os de 0ases de dados, im!ressas ou eletrQnicas. Ms estudos de co0ertura e de atualidade são com!letamente o0;etivos, e os estudos de !revisi0ilidade um tanto menos. Ms estudos de recu!era0ilidade são inerentemente su0;etivos, !ois de!endem de decises 8umanas a res!eito de 'uais itens são relevantes Bou !ertinentesC) e 'uais não são. %o estudar a ec"cia da recu!eração, !recisa-se utilizar uma medida 'ue reNita a !ro!orção dos itens relevantes 'ue são recu!erados durante uma 0usca Bcoeciente de revocaçãoC, 0em como alguma medida do custo da recu!eração dessa !arcela da literatura relevante. M coeciente de !recisão = comumente em!regado como uma medida indireta do custo, !ois reNete o nHmero de itens 'ue o usu"rio de algum modo deve examinar a m de identicar n itens 'ue l8e se;am Hteis. Mutra medida indireta do custo = a extensão es!erada da 0usca, descrita !or Eoo!er B195C. 2aturalmente, !ode-se medir o custo de uma maneira mais direta levando-se em conta todos os custos da 0usca, inclusive o tem!o do es!ecialista em 0uscas e os custos de acesso P 0ase de dados Bver, !or exem!lo, :1c8esen, 196C. M custo da 0usca ser" então relacionado ao nHmero de itens relevantes Bou 1
Zeen B19660C tam0=m utilizou esta t=cnica. % 'uestão da relevncia # !ertin>ncia oi examinada !or muitos autores. *er, !or exem!lo, Wilson B1963C, SVanson B195C, Lancaster e Warner B1993C, e izzaro B199C. )
1)1
!ertinentes, ou Hteis ou RnovosOC recu!erados$ o Rcusto !or reer>ncia relevante recu!eradaO = uma 0oa medida da relação custo-ec"cia da 0usca. %s medidas de ec"cia, como a revocação e a !recisão Bou outras descritas, !or exem!lo, !or 7o0ertson, 1959C, são a!lic"veis a estudos de recu!eração em 'ual'uer ti!o de 0ase de dados, tanto em ormato im!resso 'uanto eletrQnico. 2o entanto, 'uando estudamos a ec"cia da recu!eração, torna-se 0astante di+cil isolar os eeitos da indexação#redação de resumos de outros atores, tais como o voca0ul"rio da 0ase de dados, as estrat=gias de 0usca em!regadas e a interação usu"rio#sistema. Isso oi mencionado de !assagem no ca!+tulo 5. Foge aos !ro!?sitos deste livro descrever detal8adamente a metodologia da avaliação Bmensuração da !recisão, c"lculo da revocação, an"lise de diagn?stico !ara determinar as causas exatas das al8as de revocação e !recisãoC. :ste assunto = tratado de modo com!leto em Lancaster e Warner B1993C. %s avaliaçes de serviços im!ressos de indexação#resumos, ou seus e'uivalentes eletrQnicos, são menos comuns atualmente do 'ue antes, em !arte !or'ue agora se dedica mais atenção aos estudos relacionados com a 7ede B!or exem!lo, avaliaçes de mecanismos de 0uscas ou s+tios da 7edeC. 2ão o0stante, ainda se !u0licam algumas avaliaçes. :xem!los disso são os tra0al8os de &roVn et al. B1999C, 'ue com!araram a co0ertura do Eurrent Index to Tournals in :ducation com o :ducation Index, e os de &rettle B)1C, 'ue com!arou dierentes 0ases de dados do !onto de vista da co0ertura de inormaçes so0re a rea0ilitação de !ortadores de doença mental grave, e @reen B)1C, 'ue incluiu a co0ertura B;unto com a atualidadeC numa avaliação de 0ases de dados de !eri?dicos de mHsica. %m0os conclu+ram 'ue seriam necess"rias mHlti!las 0ases de dados !ara uma co0ertura ade'uada desses assuntos. %zgaldov B1959C identicou alguns crit=rios 'ue !odem ser em!regados !ara avaliar a 'ualidade de +ndices im!ressos. /ais crit=rios são ade'uação B'ue a0range toda uma gama de !ro!riedades, 'ue incluem co0ertura, caracter+sticas do voca0ul"rio usado na indexação, 0em como certos atores de!endentes da indexação, como a exaustividade e a coer>nciaC, generalidade B'ue diz res!eito essencialmente P diversidade de 0uscas 'ue !odem ser eitasC, ergonomicidade Bacilidade de usoC, !resteza B'uão atualizada = a onteC, e custo. :le ressalta, muito corretamente, 'ue M mais eciente +ndice im!resso ser" um racasso !ara os usu"rios, se seu !armetro de conveni>ncia \ergonomicidade e !resteza] or 0aixo, e, vice-versa, um +ndice 'ue or sim!les e "cil de usar gran;ear" am!la !o!ularidade mesmo 'ue seu desem!en8o na recu!eração não se;a muito alto B!. )1C.
:sta citação serve como um 0om intr?ito ao ca!+tulo 1, 'ue trata das caracter+sticas de v"rios serviços im!ressos de indexação e resumos.
1))
%ap&tulo /J 0 F
ncia 0i0liogr"ca so0 mais de um ca0eçal8o. Dor exem!lo, a !rimeira entrada so0 o su0ca0eçal8o administration dosage Bgura 53C !rovavelmente ser" du!licada so0 MS/:M%7/Y7I/IS. 3. % com0inação de ca0eçal8o, su0ca0eçal8o e t+tulo do artigo normalmente !ro!orciona uma imagem relativamente clara da'uilo de 'ue trata um item. . ois ti!os de remissivas a!arecem no +ndice im!resso see \ver] = usada !ara ligar termos considerados sinQnimos ou 'uase sinQnimos e see related \ver em relação a isto] !ara ligar termos intimamente relacionados. Dara se o0ter, contudo, um 'uadro com!leto da rede de associaçes entre os termos utilizados, = !reciso consultar dois outros instrumentos Medical su%&ect headings BMeS;C e MeS; tree structures. % gura 5 mostra um exem!lo de uma !"gina do MeS;. M0serve-se como o MeS; a!resenta a remissiva see Be sua rec+!roca 0em como as remissivas see related Brec+!roca 7C em!regadas !ara ligar dois termos semanticamente relacionados, normalmente !ertencentes a 8ierar'uias dierentes. /alvez ainda mais im!ortante, a cada ca0eçal8o do MeS; = atri0u+do um ou mais nHmeros de classicação !ara indicar onde ele a!arece nas estruturas 8ier"r'uicas em "rvore Bgura 54C. %ssim, em0ora o voca0ul"rio utilizado !ela Bational i%rary o Medicine se;a 0astante rico em associaçes, o Index Medicus não = auto-suciente, !ois nele não a!arecem as associaçes. Dortanto, = uma onte Htil em 0uscas relativamente es!ec+cas, mas di+cil de usar em 0uscas de car"ter mais gen=rico 'ue exi;am a consulta a muitos ca0eçal8os dierentes. % gura 55 mostra exem!los de entradas do +ndice de autores do "umulated Index Medicus. M0serve-se 'ue se tem a'ui uma estrutura totalmente auto-suciente, !ois não se trata de um +ndice da seção de assuntos. 2a realidade, !ara 'ual'uer item encontrado no +ndice de autores = re'entemente 0astante di+cil determinar 'uais são os ca0eçal8os de assuntos so0 os 'uais ele a!arece. 2ote-se tam0=m 'ue o +ndice de autores, ao contr"rio da seção de assuntos, arrola todos os autores de cada artigo e traz o t+tulo do artigo na l+ngua original B!elo menos !ara l+nguas escritas com ala0eto romanoC, não em tradução. M "umulated Index Medicus não = mais !u0licado, mas o Index Medicus mensal, sim. Ms v"rios Jndices im!ressos editados !ela Y.W. Wilson Eo. Bdos 'uais são 0ons exem!los o :eader@s ncia ao acesso em lin8a e, em alguns casos, as ediçes im!ressas, ou !artes delas, oram interrom!idas !elas res!ectivas editoras. 1
1)3
remissivas do ti!o see. ierem do Index Medicus !or adotarem muito mais remissivas see also \ver tam0=m] !ara ligar termos semanticamente relacionados, tornando um tanto mais "cil a realização de 0uscas gen=ricas 'ue envolvam v"rios ca0eçal8os dierentes. Dor exem!lo Bver gura 56C, o usu"rio 'ue consulte o termo %@2:/MYq7Mq2%IES Bno Applied Science and echnology lndex C = inormado de 'ue deve !rocurar tam0=m so0 DL%S%, DL%S% W%*:S e Sq2EY7M/7M2 7%I%/IM2. M !ngineering Index tam0=m organizava suas entradas so0 ca0eçal8os es!ec+cos e su0ca0eçal8os e inclu+a tanto remissivas do ti!o see 'uanto do ti!o see also. Yo;e, !or=m, as reer>ncias são arran;adas so0 descritores sem su0ca0eçal8os Bver gura 5C.
Figura 53 ( :xem!lo de entradas do "umulated Index Medicus B1995C
% !rinci!al dierença entre este +ndice e os 'ue oram anteriormente exem!licados =, o0viamente, o ato de incluir resumos. Eada resumo rece0e um nHmero de identicação exclusivo. M +ndice de autores, então, = um verdadeiro +ndice do arran;o !or assuntos, remetendo do nome do autor !ara os nHmeros dos resumos aos 'uais esse nome est" associado. %demais, como muitas entradas acumular-se-ão so0 os ca0eçal8os do volume anual, tam0=m existe um +ndice mais es!ec+co de assuntos. % gura 59 mostra entradas do +ndice de assuntos de 1993, 'ue em!rega tanto descritores controlados Bem ti!o negritoC 'uanto termos de texto livre Bem ti!o norma`C. M +ndice reere-se Ps entradas tanto no volume anual BnHmeros 'ue começam com %C 'uanto nos asc+culos mensais BnHmeros 'ue começam com C. M0serve-se como uma das entradas da gura 59 relaciona-se com a entrada 6354
1)
da gura 5, !ro!orcionando acesso a este item so0 o !onto de acesso alternativo &:% DL%S% I2/:7%E/IM2S.
Figura 5 ( :xem!lo de entradas do Medical su%&ect headings B1995C
uitos dos +ndices im!ressos Bmas de modo algum todosC 0aseiam-se em alguma orma de voca0ul"rio controlado - um tesauro ou uma lista de ca0eçal8os de assuntos. M voca0ul"rio utilizado !elo :ngineering Index = o :ngineering Index t8esaurus. /ais voca0ul"rios controlados são de grande valia !ara 'uem estiver consultando o +ndice im!resso, !rinci!almente em casos onde o !r?!rio +ndice inclui !ouca estrutura de remissivas, como acontece no Index edicus.
1)4
Figura 54 ( :xem!lo de entradas da estrutura 8ier"r'uica B ree structuresC do Medical su%&ect headings B1995C
Figura 55 ( :xem!lo de entradas do +ndice de autores do "umulated Index Medicus
1)5
9ndices classicados
:xistem 0asicamente dois ti!os de +ndices classicados. 2um deles, as entradas a!arecem so0 nHmeros de classicação altamente es!ec+cos extra+dos de um es'uema de classicação geral ou es!ecializado. :ste oi o m=todo adotado !elo i%rary and Inormatíon Science A%stracts BISAC at= 1993. 2o LIS% as entradas eram dis!ostas segundo um es'uema de classicação acetada dedicado ao cam!o es!ecializado da 0i0lioteconomia e ci>ncia da inormação. % gura 6 mostra algumas entradas relativas a cederrom. M0serve-se como a notação relativa a 0ases de dados em ormato de cederrom B_;;cC = su0dividida !or meio de notaçes de outras !artes da classicação B :n/ CticC, a m de oerecer maior es!ecicidade, e como uma legenda textual = em!regada !ara ex!licar cada notação es!ec+ca. % gura 61 a!resenta exem!los de entradas do +ndice ala0=tico de assuntos, inclusive algumas relativas aos itens mostrados na gura 6. M0serve-se como os termos em!regados como legendas textuais na gura 6 tornam-se !ontos de entrada no +ndice de assuntos. M !rinc+!io adotado = o da indexação em cadeia Bver ca!+tulo C$ cada n+vel da cadeia 8ier"r'uica = indexado a !artir do mais es!ec+co at= o mais gen=rico
Figura 56 ( :xem!lo de entradas do Applied Science and echnology Index , 195 Eo!Arig8t | 195 0A t8e Y.W. Wilson Eo. aterial re!roduzido com !ermissão da editora
1)6
Figura 5 ( :xem!lo de entradas do volume anual do !ngineering Index B1993C Eo!Arig8t | 1993 0A :ngineering Inormation Inc. 7e!roduzido com !ermissão de :ngineering Inormalion Inc.
1)
Figura 59 ( :xem!lo de entradas do +ndice de assuntos do !ngineering Index B1993C Eo!Arig8t | 1993 0A :ngineering Inormation Inc. 7e!roduzido com !ermissão de :ngineering Inormation Inc.
1)9
Figura 6 ( :xem!lo de entradas do i%rary and Inormation Science A%stracts Bantes de 1993C 7e!roduzido com !ermissão do editor
Eost 0enet analAsis, Inormation services, ata0ases, E-7MS, Eom!uterized inormation storage and retrieval Inormation services, ata0ases, E-7MS, Eom!uterized inormation storage and retrieval ata0ases, E-7MS, Eom!uterized inormation storage and retrieval Eom!uterized inormation storage and retrieval Besta entrada mais gen=rica não a!arece na gura 61C DSqELI/ Bo nome de uma 0ase de dadosC na gura 6 não oi um termo de indexação genu+no no LIS% e, !or isso, não deu origem a uma entrada no +ndice de assuntos, em0ora ten8a originado uma entrada no +ndice de nomes !r?!rios 'ue = se!arado do de assuntos. :n'uanto o LIS% em!regava um es'uema de classicação es!ecializada, outros +ndices im!ressos se 0aseavam em es'uemas gerais, dos 'uais a Elassicação ecimal
13
Figura 61 ( :xem!los de entradas do +ndice de assuntos do i%rary and Inormation Science A%stracts Bantes de 1993C 7e!roduzido com !ermissão do editor
M "hemical A%stracts assemel8a-se ao LIS% !or'ue as entradas são organizadas so0 categorias e su0categorias tem"ticas. M +ndice de assuntos, no entanto, = 0astante dierente, estando 0aseado no !rinc+!io de articulação Bver ca!+tulo C cadeias de termos atri0u+dos !or indexadores 8umanos são mani!uladas de orma !adronizada de modo a !ro!orcionar um gru!o de !ontos de acesso coerentes !ara cada item Bgura 64C, :m0ora esse +ndice articulado de assuntos a!areça somente nas acumulaçes do E8emical %0stracts, em cada asc+culo semanal = !u0licado um +ndice de !alavras-c8ave Bver gura 65C. M E8emical %0stracts tam0=m inclui um +ndice de ?rmulas 'u+micas Bver gura 66C.
131
Figura 6) ( Eategorias de assuntos usadas !elo i%rary and Inormation Science A%stracts B1996C 7e!roduzido com !ermissão do editor
13)
Figura 63 ( :xem!lo de entradas do i%rary and Inormation Science A%stracts 7e!roduzido com !ermissão do editor
Outros &ndices
% maioria dos outros serviços de indexação#resumos em ormato im!resso são variaçes dos ti!os ;" exem!licados. M Sociology o !ducation A%stracts, dierentemente do i%rary and Inormation Science A%stracts e do "hemical A%stracts, sim!lesmente lista os resumos em ordem num=rica sem agru!"-los so0 categorias gen=ricas de assuntos. M +ndice de assuntos, descrito como um R+ndice de !alavras-c8ave modicadoO, indexa os resumos so0 !alavrasc8ave ou ex!resses 'ue a!arecem no t+tulo ou no !r?!rio resumo. /am0=m são indexados os nomes !r?!rios. % gura 6 mostra exem!los de dois resumos, e a gura 69 a!resenta exem!lo de entradas de +ndice, inclusive algumas corres!ondentes aos resumos da gura 6 B!or exem!lo, 0lacX dro!outs \evasão escolar entre negros], class cutting \c"0ula na escola], com!ulsorA education \ensino com!uls?rio]C.
133
Figura 6 ( :xem!lo de entradas do +ndice de assuntos do i%rary and Inormation Science A%stracts 7e!roduzido com !ermissão do editor
%s inHmeras revistas de resumos !u0licadas na s=rie da :xcer!ta edica B:lsevier Science Du0lis8ersC tam0=m agru!am os itens so0 categorias gen=ricas de assuntos. Ms +ndices de assuntos são altamente es!ec+cos. /odos os termos atri0u+dos Bextra+dos de um tesauroC !or indexadores a!arecem em cada entrada do +ndice. % maior !arte desses termos tornam-se !ontos de entrada no +ndice, sendo os outros termos mantidos como modicadores. Ms modicadores são ordenados ala0eticamente em duas se'>ncias termos 'ue se tornarão !ro!riamente !ontos de entrada !recedem os termos 'ue são a!enas modicadores e não servirão como !ontos de entrada. % gura mostra um exem!lo disso. M0serve-se como a cadeia de termos unciona como uma es!=cie de minirresumo, oerecendo uma clara indicação Bna maioria dos casosC da'uilo de 'ue trata cada item. Ms +ndices de assuntos da :xcer!ta edica são examinados com mais detal8es no ca!+tulo .
13
Figura 64 ( :xem!lo de entradas do +ndice de assuntos do "hemical A%stracts 7e!roduzido com !ermissão do E8emical %0stracts Service
134
Figura Figura 65 ( :xem!lo de entradas do +ndice de !alavras-c8ave do "hemical A%stracts 7e!roduzido 7e!roduzido com !ermissão do E8emical %0stracts Service
% maioria dos +ndices ala0=tico-es!ec+cos organiza as reer>ncias 0i0liogr"cas so0 ca0eçal8os de assuntos, Ps vezes com su0ca0eçal8os, e entradas re!etidas so0 dois ou mais ca0eçal8os Bcomo no Index MedicusC, ou organizam os resumos so0 ca0eçal8os de assuntos e adotam alguma orma de +ndice 'ue !ro!orciona !ossi0ilidades alternativas de acesso !or assunto a itens isolados Bcomo no !ngineering Index C. C. Y" variaçes deste m=todo ala0=ticoes!ec+co.
135
Figura 66 ( :xem!lo de entradas do +ndice de ?rmulas do E8emical %0stracts 7e!roduzido 7e!roduzido com !ermissão do E8emical %0stracts Service
Dor exem!lo, o antigo &ritis8 /ec8nologA Index B&/IC, conorme oi descrito no ca!+tulo , utilizava entradas de +ndice ormadas !or uma cadeia de termos controlados numa Rordem sistem"ticaO. *e;a-se exem!lo disso na gura )) Bca!+tulo C. ncia 0i0liogr"ca a!arecia somente em um Hnico lugar do +ndice, o 'ual era determinado !ela se'>ncia em 'ue os termos eram com0inados. Mutras !ossi0ilidades eram criadas mediante um mecanismo sistem sistem"ti "tico co de remis remissiv sivas as 0asead 0aseado o nos !rinc+ !rinc+!io !ioss da indexa indexação ção em cadeia cadeia.. Dor exem! exem!lo, lo, usaram-se remissivas do ti!o see \ver] !ara gerar !ontos de acesso alternativos !ara os itens so0re so0re Ra0ri Ra0ricsO csO \tecid \tecidos] os] exem! exem!li licad cados os na gura gura )) Ba !artir !artir de termos termos como como Rnis8 Rnis8ing ingOO \aca0amento], RdAeingO \tingimento], RlaminatingO \laminação], etc. 2ote-se tam0=m como este +ndice liga entre si termos considerados semanticamente relacionados BRrelated 8eadings R \ca0eç \ca0eçal8 al8os os relac relacion ionado ados]C s]C.. :m0ora :m0ora os !rinc+ !rinc+!io !ioss em 'ue se 0aseia 0aseia a index indexaçã ação o ten8am ten8am !erman !ermaneci ecido do os mesmos mesmos,, uma versão versão !oster !osterior ior dessa dessa !u0lic !u0licaçã ação, o, denomi denominad nada a Eurre Eurrent nt /ec8nologA /ec8nologA Index BE/IC, adotou um m=todo algo dierente de a!resentação das reer>ncias. reer>ncias. :sta :sta modi modic caç ação ão oi oi adot adotad ada a !ara !ara econ econom omiz izar ar es!a es!aço ço e evit evitar ar as !"gi !"gina nass com com uma uma com!osição muito so0recarregada 'ue eram caracter+sticas do &/I. %s dierenças de leiaute entre o &/I e o E/I são exem!licadas na gura 1.
136
Figura 6 ( :xem!lo de resumos de Sociology o !ducation A%stracts 7e!roduzido com !ermissão de /aAlor Francis U8tt!##VVV.tand.co.uX
Figura Figura 69 ( :xem!lo de entradas de +ndice do Sociology o !ducation A%stracts 7e!roduzido com !ermissão de /aAlor Francis U8tt!##VVV.tandco.uX
:ste +ndice encontra-se 8o;e em seu terceiro ormato, 'ue inclui resumos, e o t+tulo atual = A%stracts in Be8 echnologies and !ngineering. % inclusão de resumos exigiu uma grande 13
mudança de ormato, e a !u0licação agora se assemel8a muito com o ormato atual do i%rary and Inormation Science A%stracts.
Figura Figura ( :xem!lo de entradas do +ndice de assuntos do !pilepsy A%stracts 7e!roduzido 7e!roduzido com !ermissão de :lsevier Science Du0lis8ers :ste +ndice = caracter+stico dos +ndices de assuntos !roduzidos na s=rie !xcerpta Medica
*"rios "rios +ndices +ndices im!resso im!ressoss adotaram adotaram o D7:EIS D7:EIS BDreserv BDreserved ed Eontext Eontext Index Index SAstemC. SAstemC. n reer>ncia cia 0i0liogr"c 0i0liogr"ca a a!arecia a!arecia so0 todos todos os termosO termosO im!ortant im!ortantesO esO 'ue ocorressem num enunciado de assuntos, cada um deles sendo RdesviadoO \s8unted] !ara a !osição de entrada conorme descrito no ca!+tulo . Dor exem!lo, a segunda entrada !ara RagressãoO \aggression], na gura ), = re!etida so0 RDu!ilsO \alunos] e so0 RDrimarA sc8oolsO \escolas !rim"rias]. esde 195, o D7:EIS não = mais utilizado como 0ase da indexação do $ritish !ducation Index.
Figura Figura 1 ( ierenças na a!resentação de reer>ncias entre o $ritish echnology Index B$ IC IC e o "urrent echnology Index B"IC de um item so0re cadin8os \ladles] !ara ornos a arco el=trico \arc urnaces] na !rodução de aço \ steel] M autor agradece a /om :dVards, ex-editor do Eurrent /ec8nologA Index, !or este exem!lo. %m0os os exem!los são re!roduzidos com a gentil !ermissão de E S%
139
Figura Figura ) ( :xem!lo de entradas D7:EIS do $ritish !ducation lndex 7e!roduzido 7e!roduzido com !ermissão da &ritis8 Li0rarA
9ndices de citaç$es
M Institute or Scientic Inormation BISIC !u0lica atualmente tr>s +ndices de citaçes o e o Arts and ;umanities Science "itation Index , o Social Sciences "itation Index e ;umanities "itation Index . :m virtude de serem 0astante dierentes dos outros outros +ndices im!ressos descritos neste ca!+tulo, merecem atenção P !arte. % utilidade undamental de um +ndice de citaçes = encontrar !ara determinado item 0i0liogr"co, 'ue se;a do con8ecimento de 'uem az a 0usca, itens !osteriores 'ue o citaram. % gura 3 a!resenta alguns exem!los de entradas do Social Sciences "itation Index Bos Bos outros +ndices de citaçes o0edecem aos mesmos !rinc+!iosC. Su!on8amos 'ue sa0emos 'ue um arti artigo go de W.:. .:. Lam0 Lam0er ert, t, 'ue 'ue come começa ça na !"gi !"gina na do Journal o A%normal A%normal and Social Psychology , volume 5, 195, = altamente relevante !ara um interesse de !es'uisa atual. &uscando no SSEI so0 o nome do autor Bgura 3C localizamos esse artigo e encontramos outros, !osteriores a ele, 'ue o citaram. 2este exem!lo o artigo = citado !or dois outros itens !u0licados em 199 B!or ;ogg e !or SpearsC. % gura 3 oi extra+da da seção "itation Index \+ndice \+ndice de citaçes] do Social Sciences "itation Index . M0serve-se 'ue, so0 o nome de cada autor, as entradas a!arecem em ordem de data data de !u0lic !u0licaçã ação. o. Dara os itens itens citant citantes es a!rese a!resenta ntam-s m-se e a!enas a!enas sucint sucintas as inor inormaç maçes es 0i0liogr"cas. Dara conseguir dados 0i0liogr"cos mais com!letos devemos nos dirigir a outra seção do SS"I, o Source Index \+ndice \+ndice de ontes]. Dor exem!lo, o item citante da autoria de S!ears oi !u0licado no !uropean Journal o Social Psychology , volume 19, 199, e começa na !"gina 11. Dara o0ter inormaçes 0i0liogr"cas mais com!letas Bt+tulo e nHmeros de !"ginas com!letosC temos de !rocurar so0 seu nome no Source Index . Ms +ndices de ontes do Social Sciences "itation Index e e do Arts and ;umanities ;umanities "itation B!or=m não do Science "itation Index C ornecem, !ara cada item inclu+do, uma lista das Index B!or=m reer>ncias reer>ncias 0i0liogr"cas 'ue a!arecem no nal do artigo Bver, !or exem!lo, exem!lo, a gura C. 2os +ndices de citaçes, uma orma original de +ndice de !alavras-c8ave oerece uma a0ordagem tem"tica dos itens citantes BontesC. enominado Permuterm Su%&ect Index \+ndice \+ndice de assuntos assuntos Dermuterm] Dermuterm],, 0aseia-s 0aseia-se e em !alavras-c !alavras-c8ave 8ave 'ue ocorrem ocorrem nos t+tulos dos itens citantes. % gura 4 mostra um exem!lo de entrada so0 termos 'ue começam com a raiz Rde0tO \d+vida], conorme a!arecem nos t+tulos de diversos itens citantes. 2ote-se 'ue são em!regada em!regadass algumas algumas !alavras !alavras com!osta com!ostass B!or exem!lo exem!lo,, Rde0t-na Rde0t-nancedO ncedO \nanciad \nanciado o !ela d+vida d+vida], ], 0em como como !alavr !alavras as sim!le sim!les. s. Eada Eada entrad entrada a mostr mostra, a, em ordem ordem ala0= ala0=tic tica, a, outras outras !alavras-c8ave 'ue ten8am ocorrido ;unto com ela nos t+tulos dos itens citantes. %ssim, um item so0 :&/S Bde autoria de @iguereC trata das d+vidas do /erceiro undo, outro Bde autoria de @areldC trata das d+vidas intelectuais, e assim !or diante. M0serve-se 'ue as entradas se re!et re!etirã irão o so0 so0 cada cada !alavr !alavra-c a-c8av 8ave e im!ort im!ortant ante e do t+tulo t+tulo B!or B!or exem! exem!lo, lo, uma entra entrada da so0 a !alavra-c8ave R/8ird WorldO \/erceiro undo] ser" modicada !elo termo Rde0tsO \d+vidas]. 1
evidente 'ue a ec"cia deste ti!o de +ndice de assuntos de!ende inteiramente da 'ualidade descritiva dos t+tulos usados na sua geração e da 8a0ilidade de 'uem az a 0usca, uma vez 'ue não se adota nen8uma orma de controle de voca0ul"rio.
Figura 3 ( :xem!lo de entradas do Social Sciences "itation lndex
7e!roduzido com !ermissão do Social Sciense Eitation Index. Eo!Arig8t | 199 0A t8e Institute or Scientic lnormation | D8iladel!8ia, D%,
Figura ( :xem!lo de entrada do +ndice de ontes do Social Sciences "itation Index 7e!roduzido com !ermissão do Social Science Eitation Index. Eo!Arig8t | 199 0A t8e Institute or Scientic Inormation | D8iladel!8ia, D%,
11
Figura 4 ( :xem!lo de entrada do +ndice de assuntos Permuterm do Social Sciences "itation Index
7e!roduzido com !ermissão do Social Sciences Eitation Index. Eo!Arig8t | 19 0A t8e lnstitute or Scientic lnormalion } D8iladel!8ia, D%,
%s v"rias !artes 'ue com!em esses +ndices de citaçes azem com 'ue se;am !oderosas erramentas de 0usca 0i0liogr"ca. :les ense;am dierentes m=todos de 0usca. Dode-se iniciar uma 0usca com a reer>ncia 0i0liogr"ca de um item sa0idamente de interesse ou começ"-la com uma !alavra-c8ave. %s !alavras-c8ave levam a outras !alavras-c8ave !oss+veis e os t+tulos dos itens citantes tam0=m sugerem !alavras-c8ave adicionais 'ue seriam Hteis na 0usca. /omando-se um exem!lo 8i!ot=tico, uma 0usca !or !alavra-c8ave no SSEI de 1995 levaria a um item altamente relevante 'ue seria investigado visando P identicação de itens !osteriores 'ue o tivessem citado. :stes, !or sua vez, !oderiam sugerir outras !alavras-c8ave 'ue levariam a outros documentos 'ue tam0=m seriam investigados em 0usca de citaçes !osteriores, e assim sucessivamente numa s=rie de iteraçes. 2os +ndices de citaçes em 'ue o +ndice de ontes inclui as reer>ncias 0i0liogr"cas Bver gura C, são !oss+veis outras ormas de iteração. Dor exem!lo, uma 0usca so0re um item sa0idamente de alta relevncia !ode levar a um item citante altamente relevante. %lgumas das reer>ncias no item citante serão então investigadas !ara localizar outros itens 'ue as citem, e assim sucessivamente. Ms +ndices de citaçes im!ressos !ossuem 0ases de dados e'uivalentes em ormato eletrQnico. :stes e muitos outros +ndices mencionados neste ca!+tulo, são 8o;e acess+veis !ela 7ede. M !rinc+!io da citação - um item 0i0liogr"co 'ue cita BreerenciaC um anterior - tam0=m !ode ser adotado !ara ligar !u0licaçes !or outros meios - mediante aco!lamento 0i0liogr"co ou co-citação Bver ca!+tulo 14C. Mutro !roduto 0astante con8ecido do Institute or Scientifc lnormation = o "urrent/ "ontents , !u0licação semanal, editado em v"rias seçes 'ue a0rangem dierentes assuntos, 'ue re!roduz as !"ginas de sum"rios de uma am!la gama de !eri?dicos. % gura 5 mostra um exem!lo. Eada asc+culo do "urrent "ontents inclui um +ndice de !alavras-c8ave 0astante sim!les, como mostra a gura 6$ um dos termos desse exem!lo BglucoseC \glicose] tem relação com um dos itens da gura 5. M0serve-se 'ue o +ndice inclui algumas ex!resses e nomes, 0em como !alavras-c8ave sim!les. Eada entrada leva a uma !"gina do "urrent "ontents e a um nHmero de !"gina do !eri?dico ali re!resentado. Dor exem!lo, uma das entradas so0 RglucoseO remete ao item 'ue começa na !"gina 3)1 do asc+culo de dezem0ro de 199 de Applied and !nvironmental Micro%iology Bgura 5C. :ste +ndice sim!les = usado de duas ormas. :videntemente, !ode-se sim!lesmente investigar todas as reer>ncias a determinada !alavra-c8ave. 2o entanto, um es!ecialista em 0uscas mais ex!eriente, 'ue estiver !rocurando inormaçes mais es!ec+cas, !oder" o!tar !or com0inar !alavras-c8ave. Dor exem!lo, se algu=m estivesse 0uscando artigos so0re glicose no contexto de leveduras, com!araria os nHmeros 'ue a!arecem so0 o termo glucose \glicose] com os 'ue a!arecem so0 yeast e yeasts \levedura, leveduras], !ara vericar se algum nHmero ocorre so0 am0os os termos. :m caso !ositivo, talvez esse nHmero se rera a itens 'ue tratam !recisamente do t?!ico da 0usca, inclusive um dos artigos 'ue a!arecem na gura 5. Isso corres!onde, 0asicamente, a uma variante do sistema 7niterm Bou !elo menos a im!lementação desse 1)
sistema na !r"ticaC, conorme se mencionou no ca!+tulo ). M sistema 7niterm oi uma das !rimeiras ormas de sistema de recu!eração !?s-coordenado. %onclusão
2este ca!+tulo oram exem!licados dierentes m=todos de im!lementação de um serviço de indexação#resumos em ormato im!resso. :m0ora umas !essoas !reram um m=todo e outras !essoas !reram outro, nen8um m=todo =, i!so acto, mel8or do 'ue o resto. Isso de!ende muito de como o serviço ser" utilizado.
Figura 5 ( :xem!lo de !"gina do "urrent "ontents
7e!roduzido com !ermissão do Eurrent Eontents. Eo!Arig8l | 199 0A t8e Institute or Scientic Inormation } D8iladel!8ia, D%.
13
Figura 6 ( :xem!lo de entradas do +ndice de !alavras-c8ave do "urrent "ontents
7e!roduzido com !ermissão do Eurrent Eontents. Eo!Arig8t | 199 0A t8e Institute or Scientic Inormation } D8iladel!8ia, D%,
Dara atender Ps nalidades da noticação corrente \serviço de alerta], as erramentas 'ue em!regam alguma orma de m=todo classicado normalmente serão su!eriores aos +ndices ala0=tico-es!ec+cos, !elo menos na medida em 'ue o es'uema de classicação corres!onda aos interesses de um gru!o de usu"rios. Dor exem!lo, algu=m interessado em se manter a !ar dos novos avanços no cam!o da !arasitologia em geral certamente ac8ar" o $iological A%stracts, 'ue dedica uma seção a este t?!ico, mais Htil do 'ue o Index Medicus , onde as reer>ncias ao assunto !rovavelmente estarão dis!ersas so0 uma am!la variedade de ca0eçal8os de assuntos. 2o entanto, !ara algu=m 'ue ten8a interesse em se manter noticado correntemente so0re assuntos altamente es!ec+cos, o m=todo ala0=tico-es!ec+co seria, de ato, mais conveniente. Dor exem!lo, o Index Medicus !rovavelmente seria um instrumento muito Htil !ara se manter atualizado a res!eito da 0i0liograa so0re retinite !igmentosa, !or exem!lo. %o considerar esses diversos instrumentos como dis!ositivos de 0usca e recu!eração, = evidente 'ue !assam a ter inNu>ncia nisso todos os atores de desem!en8o analisados em outra !arte deste livro. Kuer dizer, a ec"cia de um +ndice im!resso como erramenta de 0usca de!ender" do nHmero de !ontos de acesso 'ue !ro!orcionar, da es!ecicidade do voca0ul"rio em!regado na indexação, da 'ualidade e coer>ncia da indexação e da extensão com 'ue essa erramenta oereça a;uda !ositiva a 'uem az a 0usca B!or exem!lo, !or meio da ligação entre si de termos semanticamente relacionadosC. evido ao ato de os +ndices da !xcerpta Medica !ro!orcionarem maior nHmero de !ontos de acesso tem"tico !or item do 'ue o Index Medicus, !rovavelmente !ro!iciarão uma mel8or revocação. Dor outro lado, como o Index Medicus indexa cada item somente so0 os termos Rmais im!ortantesO, = 0em !rov"vel 'ue oereça maior !recisão. Ms serviços im!ressos 'ue incluem resumos são su!eriores aos 'ue não os incluem, em virtude de !ro!orcionarem mais inormaçes 'ue a;udam o usu"rio a decidir se determinado item realmente l8e ser" Htil. Isso = es!ecialmente valioso no caso de itens 'ue se;am di+ceis de encontrar ou de itens escritos em l+nguas descon8ecidas !or !arte de 'uem az a 0usca. 2o entanto, os resumos nem sem!re são essenciais. Dor exem!lo, a com0inação do t+tulo de um item com o ca0eçal8o de assunto e o su0ca0eçal8o so0 os 'uais a!arece, como no exem!lo do Index Medicus , re'entemente 0asta !ara indicar sua relevncia !otencial. Finalmente, = ?0vio 'ue +ndices 0aseados a!enas nas !alavras do t+tulo !ro!orcionam um m=todo de recu!eração 0astante limitado. Eontudo, mesmo esses +ndices t>m suas vantagens. Dor exem!lo, uma 0usca altamente. es!ec+ca 'ue envolva, digamos, um nome !r?!rio, realmente seria mais "cil de ser eetuada num +ndice 0aseado em !alavras do t+tulo do 'ue num outro 0aseado num voca0ul"rio controlado de car"ter gen=rico. %l=m disso, 'uando se recu!eram itens durante 0uscas 0aseadas em !alavras-c8ave dos t+tulos, e desde 'ue a !alavra-c8ave se;a altamente es!ec+ca, existe uma c8ance muito grande de esses itens serem RrelevantesO. 1
:m virtude de a maioria dos 0i0liotec"rios e outros !rossionais da inormação ser de o!inião 'ue os +ndices im!ressos são mais "ceis de usar, muitas vezes eles !ressu!em 'ue essa se;a uma verdade universal. e ato, inHmeros estudos demonstraram 'ue o !H0lico leigo !ode enrentar diculdades ao usar ou mesmo com!reender o Rmais sim!lesO dos +ndices, como os 'ue v>m no nal dos livros Bver, !or exem!lo, LiddA e Tyrgensen, 1993a,0C. urante a Hltima d=cada, mais ou menos, oi eito um esorço visando a tornar os serviços de indexação e resumos mais Rsim!lesO, como se viu !elo a0andono de um m=todo de classicação acetada no i%rary and Inormation Science A%stracts e do D7:EIS no $ritish !ducation lndex . 2o entanto, tornar essas erramentas mais amig"veis !ara o usu"rio talvez não se;a a salvação delas. M ato de muitas 0i0liotecas estarem cancelando as assinaturas das ediçes im!ressas, dando !reer>ncia ao acesso Ps verses eletrQnicas, sugere 'ue ontes desse ti!o em ormato im!resso talvez ten8am 8o;e uma ex!ectativa de vida muito curta.
14
%ap&tulo // 0 %omo melhorar a indexação :m todo este livro, deixou-se ex!l+cito, em geral, 'ue o resultado nal da indexação de um documento = uma sim!les lista de termos, Ps vezes selecionados de um voca0ul"rio controlado, 'ue, em con;unto, descrevem o conteHdo tem"tico analisado no documento. Eom re'>ncia, todos os termos dessa lista são considerados em != de igualdade Bisto =, o indexador não es!ecica 'ue alguns são mais im!ortantes do 'ue outrosC e, comumente, não se identicam 'uais'uer relaçes ex!l+citas entre os termos. % indexação, !or=m, = um !ouco mais com!lexa do 'ue isso aos termos !odem ser atri0u+dos !esos 'ue reNitam a !erce!ção 'ue o indexador tem de sua im!ortncia, e#ou ser eito um esorço no sentido de acrescentar um !ouco de RsintaxeO aos termos, de modo 'ue suas inter-relaçes se tornem mais claras. Indexação ponderada
@rande !arte da indexação de assuntos im!lica uma sim!les decisão 0in"ria um termo = ou não = atri0u+do a um documento. :m0ora isso sim!li'ue o !rocesso de indexação, cria, eetivamente, alguns !ro0lemas !ara o usu"rio de uma 0ase de dados, 'ue ca im!ossi0ilitado de ar'uitetar uma estrat=gia de 0usca 'ue ven8a a dierençar itens em 'ue um assunto rece0a um tratamento su0stancial da'ueles em 'ue o mesmo assunto se;a tratado de orma 0astante secund"ria. 2a indexação !onderada, o indexador atri0ui a um termo um valor num=rico 'ue reNete sua o!inião so0re a im!ortncia desse termo !ara indicar de 'ue trata determinado documento. Eomumente, 'uanto mais dominante or o assunto, ou mais detal8es o documento contiver a res!eito dele, maior ser" o !eso. *e;amos, !or exem!lo, uma escala num=rica de cinco !ontos, em 'ue cinco se;a o escore mais alto. %!licando-a ao item exem!licado na gura 3, os termos MDI2IM Dj&LIE%, D:SKncia de M7I:2/: IM e LJ:7:S DMLJ/IEMS, os itens em 'ue am0os os termos tivessem um !eso igual a cinco B!eso total igual a dezC seriam im!ressos ou exi0idos em !rimeiro lugar, vindo em segundo lugar os itens com o escore nove, e assim !or diante at= os itens cu;o escore osse a!enas dois. Y" muito 'ue a atri0uição de !esos num=ricos aos termos = deendida !or aron Baron Zu8ns, 195$ aron et al., 1949$ aron, 19C, 'ue se reere a esse ti!o de indexação como R!ro0a0il+sticoO. %!esar dessa deesa, descon8eço 'ual'uer sistema convencional de recu!eração Bisto =, 0aseado em indexação eita !or seres 8umanosC 'ue adote !esos num=ricos exatamente dessa orma, em0ora a !onderação de termos este;a im!l+cita em certos sistemas de recu!eração autom"ticos ou semi-autom"ticos, como o S%7/ Bver ca!+tulo 14C. 2o entanto, algumas 0ases de dados realmente incor!oram uma t=cnica de !onderação sim!les ao distinguir entre descritores Rmais im!ortantesO e Rmenos im!ortantesO, o 'ue e'uivale P adoção de uma escala num=rica de dois valores. :sta !r"tica !ode ser vinculada P !rodução de um +ndice im!resso, onde os descritores mais im!ortantes são a'ueles so0 os 'uais um item a!arece no +ndice im!resso, e os menos im!ortantes são encontrados somente na 0ase de dados em ormato eletrQnico. o 'ue azem, !or exem!lo, a 2ational Li0rarA o edicine BIndex Medicus e a 0ase de dados :LI2:C, o 2ational /ec8nical Inormation Service B2/ISC e o :ducational 7esources Inormation Eenter B:7IEC. esmo esse m=todo sim!les de !onderação traz certa Nexi0ilidade Ps 0uscas, antes citada. Kuem az as 0uscas !ode es!ecicar 'ue somente se;am recu!erados os itens em 'ue um termo Bou termosC a!areça 15
como descritor mais im!ortante. %lternativamente, o0t=m-se uma ordenação inci!iente dos resultados, como em m mm
Isto =, itens em 'ue dois termos, usados !or 'uem az a 0usca numa relação e, e sendo am0os descritores mais im!ortantes BC, virão em !rimeiro lugar, seguidos da'ueles em 'ue a!enas um dos dois se;a um descritor mais im!ortante, e de!ois !or a'ueles em 'ue am0os se;am somente descritores menos im!ortantes BmC. %lguns serviços de inormação ultra!assaram uma escala de !onderação de dois !ontos. 2o &IMSIS, !or exem!lo, 8ouve =!oca em 'ue eram atri0u+dos ca0eçal8os conceituais \Eonce!t Yeadings] em 'ual'uer um de tr>s Rn+veis de >naseO !rim"rio Bo item a!arece so0 este ca0eçal8o em +ndices im!ressosC, secund"rio B>nase com!arativamente orteC, e terci"rio B>nase secund"riaC B*ledutsStoXolov, 196C. M0serve-se 'ue a indexação !onderada, de ato, oerece a 'uem az a 0usca a ca!acidade de variar a exaustividade da indexação. *oltando P gura 3, = !oss+vel 'ue os !rimeiros cinco termos listados se;am considerados descritores mais im!ortantes, e os nove restantes se;am considerados menos im!ortantes. 2esse caso, a estrat=gia de 0usca 'ue es!ecicasse a!enas descritores mais im!ortantes e'uivaleria, com eeito, a azer a 0usca em n+vel de indexação menos exaustivo. im!ortante recon8ecer a dierença entre indexa10o ponderada , do ti!o a'ui descrito, e %usca com termos ponderados . :sta Hltima nada tem a ver com a indexação !onderada. %o contr"rio, reere-se P ela0oração de uma estrat=gia de 0usca cu;a l?gica = orientada !or !esos num=ricos e não !or o!eradores 0ooleanos. Dor exem!lo, a estrat=gia de 0usca assumiria o seguinte ormato /ermo % & E : F
Deso 1 1 ) ) 1 1
Limiar { )
M menor !eso aceit"vel = ), o 'ue signica 'ue os termos % e & devem estar. am0os !resentes num registro antes de ser recu!erado. 2o entanto, um registro !ode exceder o !eso m+nimo BlimiarC de modo 'ue, com!reensivelmente, alguns registros terão um escore de )5 Bse todos os seis termos estiverem !resentesC, outros, )4, e assim !or diante. :sses itens com escores elevados viriam em !rimeiro lugar numa sa+da im!ressa. /em-se assim uma sa+da ordenada !or escores, mesmo sem usar 'ual'uer !onderação dos termos de indexação. :ste m=todo de 0usca em 0ases de dados oi muito comum em sistemas de !rocessamento em lotes, !rinci!almente nos voltados !ara a isseminação Seletiva de Inormaçes BS1C. , !or=m, muito menos indicado !ara 0uscas no modo em lin8a. M m=todo ideal de !onderação im!licaria 'ue uma e'ui!e zesse a indexação Bver ca!+tulo 4C e os termos com 'ue concordassem todos os indexadores teriam !eso maior, e os 'ue ossem atri0u+dos !or um indexador teriam !eso menor. *illarroel et al. B))C !ro!em esse m=todo num am0iente de 0i0lioteca digital. Isso !ressu!e um registro de texto com!leto com um cam!o destinado a termos atri0u+dos !elos usu"rios. Ms usu"rios do registro !oriam em desta'ue !artes do texto digital 'ue ;ulgassem im!ortantes e isso levaria P revisão dos !esos relativos aos termos de indexação Bou, de ato, as !r?!rias !alavras do textoC. uitos sistemas Rautom"ticosO incluem ormas de !onderação 'ue !ermitem a ordenação da sa+da segundo um crit=rio. Sistemas desse ti!o são examinados no ca!+tulo 14. 2a maioria dos casos, os sistemas de !rocessamento autom"tico !onderam segundo crit=rios de re'>ncia re'>ncia de ocorr>ncia de um termo num texto e#ou de ocorr>ncia numa 0ase de dados como um todo$ ou outros m=todos 'ue oram ex!erimentados, inclusive o em!rego de crit=rios !osicionais B!or exem!lo, a 'ual distncia um do outro se encontram dois termos num textoC. Zeen B1991C com!arou dierentes m=todos e concluiu 'ue a associação de m=todos com0inados !rovavelmente oereça mel8ores resultados.
16
4los entre termos
%o examinar de novo a gura 3, vericar-se-" 'ue o documento ali re!resentado seria recu!erado durante v"rias 0uscas !ara as 'uais ele não constituiria realmente uma res!osta a!ro!riada. %lgumas dessas recu!eraçes !oderiam ser evitadas com o em!rego da indexação !onderada ou com a redução da exaustividade da indexação. Dor exem!lo, 'ual'uer uma das duas soluçes evitaria a recu!eração desse documento numa 0usca de inormaçes so0re l+deres !ol+ticos em geral, !ara a 'ual esse item somente teria uma utilidade muito secund"ria. Mutras recu!eraçes indese;"veis seriam causadas !or alsas associaçes, casos em 'ue os termos 'ue azem com 'ue um item se;a recu!erado não t>m realmente relação alguma entre si no documento. ncia de alsas associaçes desse ti!o aumenta com a extensão do registro Bisto =, com o nHmero de !ontos de acesso ou com a exaustividade da indexaçãoC. ncias de Daz, Mriente =dio, Mrganização !ara a Li0ertação da Dalestina
e assim !or diante. M0serve-se 'ue todos os termos de cada se'>ncia guardam relação direta entre si e 'ue alguns a!arecem em v"rias dessas se'>ncias. Eada uma dessas se'>ncias - ou elos - = identicada com um caractere alanum=rico inclu+do na !r?!ria 0ase de dados. 2um sistema de recu!eração em lin8a isso estaria associado ao nHmero do documento no ar'uivo invertido. %ssim, o documento 1)) !ode ser segmentado em 1))#1, 1))#), 1))#3, e assim !or diante. Isso !ro!orciona a 'uem az a 0usca a o!ortunidade de es!ecicar 'ue dois termos coocorram não s? no registro do documento mas tam0=m em determinado elo dentro desse registro, evitando, !ortanto, muitas das alsas associaçes do ti!o :S/%MS <2IMS#LJ:7:S DMLJ/IEMS. ncia de relaçes indese;"veis e mel8orar a recu!eração. Williams B199C reerese a isso como Rindexação !or trec8osO \ passage2level indexing]. Isso ser" examinado no ca!+tulo 1. Indicadores de função
:m0ora os elos se;am ecazes ao evitar certas recu!eraçes indese;"veis, não resolverão todos os !ro0lemas. %lguns termos !odem estar diretamente relacionados entre si num documento, e assim a!arecerem no mesmo elo, mas não estarem relacionados da orma como 'uem az a 0usca gostaria 'ue estivessem. % gura 3 nos mostra de novo excelente exem!lo disso o item em 'uestão !oderia muito 0em ser recu!erado numa 0usca so0re atitudes do Mriente =dio em relação aos :stados
1
relativamente elementar, um nHmero razoavelmente !e'ueno de indicadores de unção resolver" a maioria deles. Ms elos e unçes oram introduzidos em sistemas de recu!eração, simultaneamente, no in+cio da d=cada de 195, 'uando os sistemas !?s-coordenados ainda eram relativamente novos e a recu!eração inormatizada engatin8ava. urante certo !er+odo, esteve muito em voga indexar com o em!rego tanto de elos 'uanto unçes, em grande !arte devido P inNu>ncia do :ngineers Toint Eouncil B:TEC, 'ue introduziu um con;unto de indicadores de unção Bver gura C 'ue teve am!la aceitação. :sse ti!o de indexação altamente estruturada não gozou de estima !or muito tem!o. 2ão s? era muito caro, !or'ue os indexadores !recisavam de muito mais tem!o !ara execut"-lo, como tam0=m cou evidente ser extremamente di+cil de a!licar, com coer>ncia, os indicadores de unção. Se ;" = muito di+cil Bver ca!+tulo 4C o0ter coer>ncia com m=todos de indexação relativamente sim!les, essa diculdade aumenta enormemente 'uanto mais ex!l+cito o indexador tiver de ser ao ex!ressar as relaçes entre os termos. Ms !ro0lemas não são tão grandes 'uando se raciocina somente com dois ou tr>s termos ao mesmo tem!o. %miHde, !or=m, = muito di+cil identicar todas as relaçes a!lic"veis a um gru!o maior de termos. %demais, o acr=scimo de um termo a um gru!o !ode alterar de algum modo as relaçes, criando a necessidade de mudança nos indicadores de unção ou, no m+nimo, aumento do nHmero de unçes a!lic"veis a cada termo. 2o caso dos indicadores de unção do :TE, os !ro0lemas se agravavam !or'ue um deles, a unção , não era a0solutamente um indicador relacional, mas, ao contr"rio, um meio de !onderar o termo mais im!ortante. %s !essoas incum0idas das 0uscas derontavam tantas diculdades ao identicar as unçes 'ue o indexador teria atri0u+do a um termo 'ue aca0avam, com re'>ncia, !or omitir totalmente as unçes, o 'ue e'uivale a exigir 'ue um termo a!areça em 'ual'uer unção e nega !or com!leto a utilidade do recurso. Ms !ro0lemas acarretados !elo em!rego de elos e indicadores de unção em sistemas de recu!eração oram estudados minuciosamente em outros tra0al8os BLancaster, 195$ Sinnett, 195$ ontague, 1954$ *an Mot et al., 1955$ ullison et al., 1959C.
19
Figura ( M sistema de indicadores de unção do :TE
7e!roduzido com !ermissão da %merican %ssociation o :ngineering Societies
%inda mais ela0orado do 'ue o m=todo de indexação do :TE, 'ue em!rega elos e unçes, era o m=todo de Rc?digo semnticoO na recu!eração introduzido !elo Eenter or ocumentation and Eommunication 7esearc8 da Western 7eserve s. Foram eitos ormul"rios es!eciais !ara an"lise de assuntos, !ara a;udar o indexador no registro de as!ectos im!ortantes do conteHdo tem"tico na orma de resumo telegr"co. 2ele, os termos eram codicados mediante um Rdicion"rio de c?digos semnticosO. % 0ase do c?digo semntico era um RradicalO semntico. Ms radicais B8avia cerca de )4 no sistemaC re!resentavam conceitos relativamente gen=ricos. Eada radical rece0ia um c?digo de 'uatro d+gitos ormado !or tr>s caracteres com um es!aço !ara inter!olação de um 'uarto caractere, como nestes exem!los E-/L EatalAst \Eatalisador] E-/7 Eontainer \7eci!iente] E-// Eutting and drilling \Eorte e !eruração] - amage \ano] -FL eNection \esvio]
Ms termos !articulares eram ormados !ela inserção do R infxoO de uma letra no radical semntico e talvez o acr=scimo de um suxo num=rico. Dor exem!lo, % re!resentava tanto R8oundO \lesão] 'uanto Rdecay O \deterioração], onde = o radical semntico de RdamageO \dano] e o inxo % sim!lesmente re!resenta Ris aO \= um]. :m outras !alavras, Rles0oO = um ti!o de dano. %crescenta-se um suxo num=rico a!enas !ara distinguir termos 'ue !ossuam radicais e estrutura de inxos id>nticos$ o suxo não tem em si mesmo im!ortncia semntica. 2a gura 9 est" a lista com!leta de inxos. M uso deles com um radical !ermite ex!ressar v"rios matizes de signicado. Dor exem!lo, R%agO \saco] e R%arrelO \0arril] eram am0os re!resentados !or "A:, onde o inxo A indica 'ue são ti!os de reci!ientes. R Side 8allO \!arede lateral] era re!resentado !or "I:, onde o inxo indica !arte de reci!iente.
onde -E re!resenta Inormação L-E/ re!resenta :letricidade -EY re!resenta is!ositivo /-72 re!resenta /ransmissão
: 1 = o suxo exclusivo 'ue distingue o termo de outros B!or exem!lo, o tel=graoC 'ue ten8am os mesmos atores semnticos. Dode-se com0inar at= 'uatro c?digos semnticos !ara ormar o c?digo de um conceito es!ec+co. % : I M K < * W q _
14
= um = eito de = !arte de = eito de v"rios az uso de, = !roduzido, !or meio de = usado !ara, !roduz BamiHde usado \em ingl>s] !ara ver0os terminados em ingC age so0re causa, inNuenciado !or, sore a ação de Bre'entemente usado \na l+ngua inglesa] !ara ver0os 'ue terminam em edC caracteriza-se !ela aus>ncia de est" ligado a, caracterizado !or, caracteristicamente assemel8a-se a, mas não =
D
caracteriza-se !or um aumento de caracteriza-se !or uma redução de
Figura 9 ( Inxos semnticos do sistema da Western 7eserve
Ms termos num resumo telegr"co são relacionados sintaticamente entre si !or meio de indicadores de unção. 2a gura 9 a!resenta-se uma lista deles.
cristal metal liga 0er+lio 8exagonal muito denso el"stico
Kue indica 'ue cristais de ligas met"licas, es!ecicamente o 0er+lio, estão de algum modo sendo !rocessados, e suas !ro!riedades são R8exagonais muito densosO e Rel"sticosO. 2ote-se o em!rego, neste sistema, de Runçes com!an8eirasO. ZM* e ZW* são unçes com!an8eiras ou em!arel8adas. Se uma = atri0u+da a um termo, = 'uase certo encontrarmos sua com!an8eira atri0u+da a um segundo termo, !ara lig"-los e indicar a exata relação entre eles. %ssim, indica-se 'ue RcristalO, segundo a unção ZM*, tem uma !ro!riedade 'ue l8e oi atri0u+da. :ssas !ro!riedades atri0u+das são Rel"sticoO e R8exagonal muito densoO, conorme indicado !ela unção ZW*. %l=m dos indicadores de unção, o sistema adotava um m=todo altamente ela0orado de ligação dos termos Be unçesC nos resumos telegr"cos. :ssa ligação era o0tida !or meio de v"rios n+veis de R!ontuaçãoO 1. Su0locução. /ermo ao 'ual se anexava um ou mais indicadores de unção. ). Locução. Eon;unto de termos !roximamente relacionados em determinada relação. %dmite-se um nHmero nito de !adres de locução. Dor exem!lo Z% ZKT Z%Y
B!rocessoC Bmeio de !rocessoC Bcondição de !rocessoC
3. Frase. com!osta de locuçes e tam0=m ormada segundo es'uemas !adronizados. Dor exem!lo, uma rase !ode a0ranger um !roduto e sua a0ricação ou um material testado e as !ro!riedades determinadas !ara ele. . Dar"grao. /rata-se de um con;unto de rases e !ode ser coextensivo com o !r?!rio resumo. tam0=m usado !ara distinguir com!letamente t?!icos dierentes num Hnico resumo telegr"co. % gura 91 mostra um resumo telegr"co com!leto como seria registrado em meio eletrQnico, a!resentando !ontuação, unçes e atores semnticos. %o azer uma 0usca nesse sistema, a ormulação do !edido era convertida numa estrat=gia com!osta de atores semnticos e indicadores de unção. *"rios Rn+veisO, corres!ondentes P !ontuação dos resumos telegr"cos, eram utilizados !ara limitar os crit=rios a termos 'ue ocorressem em certas unidades. Dor exem!lo, o n+vel de 0usca solicita sim!lesmente 'ue determinado termo este;a associado a determinado indicador de unção. Isso corres!onde P su0locução na !ontuação do resumo telegr"co. Z:T Z
material !rocessado com!onente !rinci!al com!onente secund"rio !ro!riedade atri0u+da a !ro!riedade atri0u+da !rocesso meio de !rocesso condição de !rocesso !ro!riedade inNuenciada ou determinada !or !rocesso !ro!riedade inNuenciada !or Z%L ator 'ue inNuencia Z%D
141
ZWT
!roduto
Figura 9 ( Indicadores de unção do sistema da Western 7eserve
M sistema Western 7eserve era 0astante engen8oso e ex!ressava matizes de signicado muito sutis. Dossu+a grande Nexi0ilidade. Dodiam-se azer 0uscas com grande !recisão, usando !ontuação, unçes e atores semnticos es!ec+cos. %lternativamente, !ermitia 0uscas com relativa am!litude B!ara o0ter alta revocaçãoC ao se ignorar esses dis!ositivos e usar a estrutura dos c?digos semnticos como recurso de generalização B!or exem!lo, usando o conceito geral - !ara RdanoO sem!re 'ue ocorresse como com!onente num c?digo com!lexoC.
Figura 91 ( 7esumo telegr"co armazenado em ormato eletrQnico
Fonte DerrA e Zent B194C, /ools or mac8ine literature searc8ing.. Eo!Arig8t | 194, To8n WileA. Sons. Inc. 7e!roduzido com !ermissão de To8n WileA Sons Inc.
Inelizmente, o sistema era excessivamente articioso !ara a nalidade a 'ue se destinava. :ra de a!licação com!licada, e tanto a indexação 'uanto a ormulação da 0usca eram o!eraçes demoradas e dis!endiosas. % ex!eri>ncia !osterior nos ensinou 'ue, na maioria das a!licaçes visando P recu!eração da inormação, não se !recisa do n+vel de com!lexidade inerente ao sistema Western 7eserve. :ra um sistema muito com!lexo e caro !ara 'ue osse economicamente vi"vel, e aca0ou sendo !osto de lado !ela %merican SocietA or etals em avor de um m=todo mais sim!les e com mel8or relação custo-ec"cia. Subcabeçalhos
M m=todo de indexação altamente estruturado, exem!licado !elo em!rego de elos e unçes ou !elo c?digo semntico, !redominou no in+cio da d=cada de 195, 'uando os sistemas inormatizados ainda se ac8avam num est"dio de desenvolvimento muito !reliminar. Eonsiderava-se im!rescind+vel, então, o0ter resultados muito !recisos na recu!eração, evitando-se a 'ual'uer custo recu!erar itens irrelevantes. M exem!lo a0surdo 'ue se colocava com re'>ncia era o da necessidade de se distinguir entre Cenetian %linds \;anelas venezianas] e %lind Cenetians \venezianos cegos]` M a0surdo do exem!lo = ?0vio 'ual a !ro0a0ilidade de artigos so0re am0os os assuntos a!arecerem na mesma 0ase de dados e 'uanta 0i0liograa, se;a 'ual or, existe a res!eito de venezianos cegos Yo;e em dia, recon8ece-se e se aceita o ato de 'ue ocorrerão recu!eraçes indese;"veis, devidas a associaçes alsas ou es!Hrias. 2o entanto, sua ocorr>ncia = comumente tida como se mantendo dentro de limites aceit"veis. 2a avaliação do :L%7S BLancaster, 195aC, cerca de 1f de a!roximadamente 3 al8as de !recisão 'ue ocorreram em 3) 0uscas oram causados !or relaçes am0+guas entre termos. %dmite-se, comumente, 'ue = mel8or aceitar algumas al8as desse ti!o do 'ue tentar evit"-las com o em!rego de m=todos de indexação mais ela0orados e custosos. Ms !ro0lemas decorrentes das associaçes alsas ou am0+guas são atualmente menos graves do 'ue o eram 8" 3 ou anos !or'ue existe, na maioria dos sistemas, um alto n+vel de !r=-coordenação. /ais !ro0lemas são mais comuns em sistemas 0aseados na indexação com uma Hnica !alavra B
14)
D7MT:/M : %:7M2%*:S
= muito menos am0+gua, e a com0inação D7MT:/M : %:7M2%*:S D7MT:/M %SSIS/IM DM7 EMD%M7
!arece totalmente ine'u+voca.
M termo D7MT:/M não s? se ac8a ligado ex!licitamente a %:7M2%*:S mas seu em!rego como su0ca0eçal8o im!lica realmente a relação mais !rov"vel entre o termo %:7M2%*:S e o termo EMD%M7:S Bisto =, 'ue os com!utadores são em!regados como erramentas de tra0al8o no !ro;eto de aeronavesC. % 2ational Li0rarA o edicine oi muito 0em-sucedida ao em!regar su0ca0eçal8os exatamente dessa orma. :m alguns casos, os su0ca0eçal8os se com!lementam entre si. %ssim, a com0inação IS:%S: #EY:IE%LL q I2
im!lica 'ue a doença oi causada !elo medicamento q, en'uanto a com0inação IS:%S: #7<@ /Y:7%Dq \oença x#Kuimiotera!ia] 7<@ q#/Y:7%D:utico]
ex!ressa uma relação com!letamente dierente entre e q. :m0ora a !rinci!al ;usticativa !ara uso de su0ca0eçal8os dessa orma osse acilitar a utilização do Index Medicus im!resso, com!rovou-se 'ue eles oram ecazes ao reduzir as am0igidades tam0=m nas 0uscas na 0ase de dados eletrQnica. %inda 'ue a indexação com com0inaçes de ca0eçal8os !rinci!ais#su0ca0eçal8os se;a indiscutivelmente menos coerente do 'ue a indexação 'ue em!rega somente ca0eçal8os !rinci!ais BLancaster, 195aC, os su0ca0eçal8os a!resentam menos !ro0lemas do 'ue os indicadores de unção, e, ao contr"rio destes, são de com!reensão imediata !or !arte dos usu"rios. "ispositi#os da linuaem de indexação
:sses dis!ositivos ( !onderação, elos e indicadores de unção - são considerados dispositivos de precis0o !or'ue !ossi0ilitam 'ue se aumente a !recisão durante uma 0usca numa 0ase de dados. Mutros dis!ositivos, como o controle de sinQnimos, !or outro lado, são denominados dis!ositivos de revocação !or'ue tendem a mel8orar a revocação. % s=rie com!leta desses dis!ositivos = Ps vezes denominada dispositivos da linguagem de indexa10o B7aitt, 19$ Lancaster, 195C. Isso = um !ouco enganoso alguns desses dis!ositivos, como os su0ca0eçal8os e o controle de sinQnimos, constituem, de ato, com!onentes essenciais de uma linguagem de indexação, en'uanto outros, como os elos ou a !onderação, são 0astante inde!endentes da linguagem de indexação. Mu se;a, são o!eraçes 'ue se a!licam aos termos 143
'uando da indexação e não com!onentes de um voca0ul"rio controlado. Doder-se-la, com eeito, se!arar os dispositivos da linguagem de indexa10o dos dispositivos de indexa10o , mas isso seria considerado uma 0izantinice. Ms dis!ositivos de indexação examinados neste ca!+tulo são todos eles dis!ositivos de !recisão, com exceção de certos com!onentes do c?digo semntico. Fundamentalmente, um dis!ositivo de !recisão aumenta o taman8o do voca0ul"rio em!regado na indexação, en'uanto um dis!ositivo de revocação reduz seu taman8o. Dor exem!lo, uma escala de !onderação de cinco !ontos !raticamente aumenta o taman8o do voca0ul"rio !or um ator de cinco. %o inv=s de se ter um Hnico termo, LJ:7:S DMLJ/IEMS, !or exem!lo, agora se t>m cinco termos LJ:7:S DMLJ/IEMS 4, LJ:7:S DMLJ/IEMS , e assim !or diante. Ms elos e os indicadores de unção causam eeito similar. Mutra maneira de examinar isso = em termos do taman8o da classe os dis!ositivos de !recisão criam um maior nHmero de classes menores, en'uanto os dis!ositivos de revocação criam um nHmero menor de classes maiores Bgura 9)C.
Figura 9) ( Ms dis!ositivos de !recisão criam classes menores$ os dis!ositivos de revocação criam classes maiores.
Darece !rov"vel 'ue a necessidade de uma a0ordagem altamente estruturada da indexação, es!ecialmente o em!rego de alguma orma de indicador relacional, variar" de um cam!o !ara outro. Isso realmente ;amais c8egou a ser estudado, em0ora @reen B1996C 8a;a examinado a a!lica0ilidade de estruturas relacionais P indexação no cam!o das 8umanidades. :xistem analogias no !rocessamento inormatizado de textos !ara recu!eração Bver ca!+tulos 1 e 14C, em 'ue a an"lise \!arsing] do texto !ara evidenciar as su0ordinaçes sint"ticas e'uivale ao uso de indicadores de unção ou outros indicadores relacionais. :m0ora essa an"lise sint"tica se;a !rovavelmente necess"ria aos sistemas 'ue !rocuram res!onder !erguntas a !artir diretamente do texto, não existe com!rovação real de 'ue ela se;a necess"ria no caso dos re'uisitos menos rigorosos relativos P recu!eração de textos ou !assagens de textos. %demais, a an"lise sint"tica !or com!utador ainda est" longe de !ereita Bconald, 199)C e esse n+vel de !rocessamento seria di+cil de ;usticar, com argumentos de custo-ec"cia, na maioria das a!licaçes de recu!eração.
14
%ap&tulo /3 0 "a indexação e redação de resumos de obras de cção % indexação de assuntos conta com uma 8ist?ria muito longa, acumulou uma vasta ex!eri>ncia e a 0i0liograa 8o;e existente so0re o tema = res!eit"vel. nciaO, no 'ue concerne P indexação, oi examinada al8ures, !or exem!lo, aron B1966C, Yutc8ins B196C e SVit et al. B196C, en'uanto De;tersen B1969C e &eg8tol B199C a0ordaram es!ecicamente a Ratin>nciaO da cção. *"rios as!ectos da atin>ncia de textos em geral são analisados !or :co B1969C e /roitsXil B1969, 191C. :sses autores levantam v"rias 'uestes te?ricas ou los?cas so0re o signicado da atin>ncia, as 'uais não !rocurarei re!etir a'ui. Dara os o0;etivos do momento, em!regarei a ex!ressão Rtrata deO como e'uivalente a Rca!az de inormar so0reO. Mu se;a, se certas !essoas !uderem a!render algo so0re agricultura !or interm=dio da leitura de um livro ou assistindo a um lme, eu diria 'ue o livro BlmeC Rtrata deO agriculturas % indexação de um lme document"rio 'ue a0orde alguma t=cnica agr+cola não = essencialmente dierente da indexação de um livro, artigo de !eri?dico ou relat?rio t=cnico so0re agricultura. Segundo nossa denição, tudo !ode ser considerado como se tratasse de agricultura. Dode, !or=m, um lme de cção 'ue !or acaso ten8a como locação uma azenda ser considerado como se tratasse de agricultura, !rinci!almente se a agricultura or algo com!letamente acidental em relação ao enredo do lme Dode um lme 'ue, de !assagem, ocaliza a agricultura ser considerado como se tratasse de agricultura Se, !or acaso, o 8er?i de um lme = um agricultor, isto az com 'ue o lme trate de agricultura Ser" 'ue isso o az ser um lme 'ue trata de agricultores % indexação de 'ual'uer ti!o de o0ra de cção - se;a ela uma !eça teatral, um romance ou um lme - a!resenta !ro0lemas 'ue são, realmente, um tanto dierentes dos !ro0lemas 'ue envolvem a indexação de o0ras não-liter"rias. Ms dois ti!os são criados com o0;etivos dierentes o !rimeiro, undamentalmente, !ara entreter ou suscitar emoçes, o segundo, undamentalmente, !ara veicular inormaçes. M ato de o !rimeiro ti!o transmitir alguma inormação concreta = algo acidental em ace do o0;etivo !rinci!al do ve+culo de comunicação. M ato de o segundo ti!o !oder, de vez em 'uando, entreter = igualmente algo ortuito em relação ao o0;etivo !rinci!al do ve+culo de comunicação. Se atri0uirmos o termo %@7IEm locação numa azenda, ). Eontar 'uantos desses lmes ;" oram realizados, a m de estudar tend>ncias da !rodução cinematogr"ca durante certos !er+odos, ou 3. Identicar o t+tulo de um lme 'uando o m"ximo 'ue a gente se lem0ra = 'ue ele se !assava numa azenda ou numa comunidade de agricultores. % segunda dessas !ossi0ilidades sugere alguma a!licação !ara ns acad>micos. % !rimeira sugere uma orma de uso em R!roduçãoO B!or exem!lo, !rodutores de cinema ou televisão 'ue !rocuram desco0rir como um acontecimento, lugar, !essoa, atividade ou !rossão oi re!resentado !or outrosC. M terceiro ti!o de 'uestão re!resenta um uso mais !o!ular. /rata-se, no entanto, do ti!o de consulta 'ue = 'uase certo a!arecer no de!artamento de reer>ncia de uma 0i0lioteca !H0lica. 2a medida em 'ue surgem 'uestes desse ti!o, !arece inteiramente ;ustic"vel alguma orma de indexação tem"tica de lmes de cção, mesmo 'ue estes não se;am realmente considerados como se Rtratassem doO conteHdo tem"tico im!l+cito nos termos de indexação. :xatamente o mesmo argumento !ode ser 144
levantado em relação a alguma orma de Ra0ordagem tem"ticaO da literatura de cção. M romance )* *** l9guas su%marinas !ouco contri0ui, se = 'ue contri0ui, !ara nosso con8ecimento so0re su0marinos. im!rov"vel 'ue algu=m considere sensatamente 'ue esse romance Rtrata deO su0marinos. 2o entanto, a indexação tem"tica da literatura de cção tem sua utilidade. %lgu=m !ode legitimamente 'uerer sa0er R'uais os romances !assados em su0marinos^, R'uantos romances se !assaram em su0marinosO, R'ual oi o !rimeiro romance 'ue aconteceu num su0marinoO ou R'ual oi a'uela o0ra antiga amosa 'ue !reviu o desenvolvimento de su0marinosO Isso não deve ser encarado como se estiv=ssemos a sugerir 'ue lmes e romances não t>m su0stncia, não t>m atin>ncia. M lme Patton 2 re%elde ou herEiF trata evidentemente do general Datton. Eontinuaria tratando de Datton mesmo 'ue contivesse !ouca exatidão 8ist?rica. % maioria dos es!ectadores concordaria em 'ue o lme mostra a am0ição de Datton. Se isso az com 'ue o lme trate de am0ição ou ;usti'ue sua indexação so0 o termo %&IkM = uma 'uestão inteiramente dierente. M lme tam0=m mostra a guerra travada com tan'ues. Isso signica 'ue ele trata de guerras com tan'ues :le trata de generais, de estrat=gia militar Dode-se consider"-lo como se tratasse da Inglaterra ou da França s? !or'ue !artes do lme se !assam nesses dois !a+ses e um !onto de vista !r"tico, evidentemente, o 'ue estamos examinando =, de ato, uma relação entre uma o0ra e os termos de indexação atri0u+dos !ara re!resentar essa o0ra. Kuando atri0u+mos um termo de indexação a um livro ou artigo de !eri?dico estamos admitindo, em 'uase todos os casos, 'ue a o0ra veicula alguma inormação so0re o t?!ico re!resentado !or esse termo. 2o caso de uma o0ra de cção, !or outro lado, !ode-se atri0uirl8e um termo de indexação !or outros motivos, !rinci!almente !ara re!resentar 1. Seu tema central ou temas. ). M 'ue ela !ode exem!licar, talvez casualmente. 3. M am0iente em 'ue ela se situa. 2a realidade, os dois !rimeiros motivos acima não são, = claro, signicativamente dierentes. Delo menos, a Hnica dierença diz res!eito P extensão com 'ue o tema = tratado. M am0iente do lme !ode ter dimenses es!aciais, tem!orais e de R!ersonagensO. % dimensão es!acial !ode ser 0astante !recisa - Digalle, Daris ou França - ou im!recisa - uma Noresta, um rio, uma comunidade rural. % dimensão tem!oral, igualmente, !ode ser !recisa !or exem!lo, a 7evolução Francesa - ou mal denida B!or exem!lo, o s=culo I ou Rantes de EristoOC. % dimensão de R!ersonagensO reere-se ao am0iente criado !elos ti!os de !ersonagens re!resentados. M ato de o !ersonagem !rinci!al de um lme ou romance ser uma enermeira não az com 'ue tratem necessariamente de enermagem ou mesmo de enermeiras. 2o lme 5outor Jivago/ ara a!arece em dierentes momentos como estudante universit"ria, enermeira e 0i0liotec"ria. M lme, de ato, não, trata de nen8um desses !a!=is, !ois dicilmente seria !oss+vel v>-lo como um re!osit?rio de inormaçes so0re eles. Dor outro lado, em certo sentido, Bunca te amei Bhe $ro8ningversionC !ode ser visto como uma o0ra 'ue trata de mestres e ensino, !ois as relaçes entre !roessor e aluna são undamentais no enredo. M ensino não = sim!lesmente um RornamentoO ou uma im!osição do am0iente. e um !onto de vista !ragm"tico nada disso = realmente im!ortante. % 'uestão undamental não = se uma o0ra trata de enermagem, utiliza a enermagem como exem!lo ou am0iente, mas se o termo de indexação :2F:7%@: l8e deve ser a!licado. ncia da indexação demonstraram 'ue não = !rov"vel 'ue dierentes indexadores concordem inteiramente so0re 'uais termos devam ser atri0u+dos a determinado item, mesmo 'uando o conteHdo tem"tico de 'ue ele trata se;a razoavelmente concreto. 2o caso de o0ras de cção, !rovavelmente = muito menor a !ossi0ilidade de 'ue ven8a a existir concordncia. Isso seria es!ecialmente verdadeiro no caso em 'ue a o0ra de cção trata undamentalmente de alguma emoção ou 'ualidade - ciHme, am0ição ou co0iça, !or exem!lo. %s o0ras de cção !ossuem outra caracter+stica im!ortante 'ue com!lica a indexação tem"tica seu cam!o de ação = essencialmente a0erto. Isto =, não 8" limites de ato !ara a'uilo 'ue !odem re!resentar. 2este sentido, a indexação dessas o0ras tem algo em comum com a catalogação de assuntos numa grande 0i0lioteca geral ou a indexação de um ;ornal de conteHdo gen=rico. Delo menos tem mais em comum com isso do 'ue com um am0iente de assuntos mais restrito, como a indexação de uma coleção de itens em agricultura ou educação. M voca0ul"rio usado na indexação deve tam0=m ser a0erto, !ois constantemente estão sendo 145
eitos lmes e romances 'ue tratam de !ersonalidades, acontecimentos e lugares 'ue não oram anteriormente a0ordados !or esses meios. uas im!ortantes consideraçes relativas P indexação de assuntos são 1. Kuem deve azer a indexação, e ). % 'uais diretrizes os indexadores devem o0edecer. 2a indexação de o0ras es!ecializadas em uma "rea de assunto delimitada, = evidente 'ue se torna necess"rio algum n+vel de con8ecimento es!ecializado. M grau desse con8ecimento es!ecializado 'ue ser" necess"rio de!ender", em grande medida, do grau de 8ermetismo do conteHdo tem"tico e de sua terminologia. Derce0e-se intuitivamente 'ue a indexação em matem"tica ou mecnica a!licada talvez exi;a maior dom+nio do assunto do 'ue a indexação, !or exem!lo, na "rea de trans!ortes, cu;a terminologia a!resenta maior !ro0a0ilidade de ser con8ecida do !H0lico em geral.
+ cção em particular
:m0ora a maioria dos exem!los usados at= agora estivesse relacionada a lmes, os mesmos argumentos e !rinc+!ios são a!lic"veis a romances e outras o0ras de cção em ormato im!resso. %!esar de alguns autores, notadamente De;tersen Bver De;tersen, 1969, 19C$ De;tersen e %ustin, 193, 19C terem realizado ex!erimentos com a indexação de cção, ao longo de muitos anos, o interesse !elo tema aumentou notavelmente na Hltima d=cada, a !onto de ter levado a %merican Li0rarA %ssociation a !u0licar RdiretrizesO so0re a 'uestão Bncias com a classicação de o0ras de cção em 0i0liotecas !H0licas. Sa!! B195C tam0=m examina os m=todos adotados em certas ontes im!ressas, como o Short Story Index , o "umulated Giction Index e o Giction "atalog. :m0ora essas !u0licaçes realmente indexem os enredos so0 mais de um ca0eçal8o, !adecem das desvantagens dos +ndices im!ressos em geral ( não !ermitem ao usu"rio com0inar ca0eçal8os numa 0usca. %ssim, seria !oss+vel identicar 8ist?rias !oliciais e 8ist?rias 'ue se !assam na E8ina, mas seria muito mais di+cil identicar 8ist?rias !oliciais 'ue se !assam num am0iente c8in>s. Mlderr B1991C salientou !or 'ue a indexação de o0ras de cção = im!ortante !ara as 0i0liotecas 2unca = "cil res!onder a !erguntas do ti!o Rvoc> tem algum romance !olicial 'ue se !asse em IoVaO ou Rexiste algum romance atual so0re a morte ou Rvoc> !oderia me sugerir um romance so0re o esorço de guerra em territ?rio ingl>s durante a Segunda @uerra undialO B!. xiiiC.
@uard B1991C tam0=m analisa as ormas de a0ordar a cção de 'ue !recisam os usu"rios t+!icos de uma 0i0lioteca, e YaAes BI 99)0C a!resenta os resultados de algumas ex!eri>ncias so0re Racesso mel8orado ao cat"logoO de o0ras de cção em 0i0liotecas, detendo-se !rinci!almente no tem!o destinado P catalogação e nos ti!os de ca0eçal8os necess"rios. 7anta B1991C a!resenta uma !ers!ectiva dierente, argumentando 'ue o acesso tem"tico a o0ras de cção = necess"rio !ara acilitar v"rias modalidades de estudos liter"rios. ncia emocional 0. cognição e inormação . %cessi0ilidade a. legi0ilidade 0. caracter+sticas +sicas c. orma liter"ria M es'uema oi adotado, na inamarca, na indexação de v"rias 0ases de dados em lin8a, e mais recentemente no cat"logo interativo em lin8a con8ecido como &ooX Youse. Dermite azer 0uscas a !artir de dados 0i0liogr"cos, !alavras-c8ave controladas, termos de classicação, e !alavras#ex!resses constantes de uma anotação em linguagem natural. % gura 93 Bextra+da de De;tersen, 199)C mostra uma entrada com!leta do &ooX Youse. % gura 14
9 = um exem!lo anterior, com a indexação com!leta de um romance !or meio de !alavrasc8ave.
Figura 93 ( :xem!lo de entrada da 0ase de dados de cção &ooX Youse 7e!roduzido de De;tersen B199)C com !ermissão de :merald
Figura 9 ( :xem!lo de um romance indexado com o em!rego do m=todo de De;tersen 7e!roduzido de De;tersen e %ustin B193C com !ermissão de :merald
ncia de e $ !ela exist>ncia de % e c. M sistema de De;tersen !ermite, de ato, realizar 0uscas !or Rlivro-modeloO, isto =, localizar um romance RsimilarO a outro 'ue oi considerado divertido. RSimilarO !oderia ser em termos de cen"rio, tema, !onto de vista do autor, ex!eri>ncia emocional, e assim !or diante. &eg8tol B199C = um tanto cr+tico do es'uema de indexação de De;tersen, revindicando mel8ores resultados !ara uma classicação alternativa e muito anterior BWalXer, 194C, em0ora 0aseada na an"lise detal8ada de um Hnico romance, e !ro!ondo um es'uema minucioso de sua !r?!ria autoria, 'ue em!regava um m=todo de classicação acetada. % !u0licação da %merican Li0rarA %ssociation so0re indexação de o0ras de criação B
em ormato de tesauro, !or=m 0aseado nos ca0eçal8os de assuntos da Li0rarA o Eongress, 'ue !ode ser em!regado !ara indexar cção, !eças de teatro e outros g>neros. M voca0ul"rio a0range a!enas ti!os de o0ras B!or exem!lo, !oesia 8ist?rica, lmes de 8orror, romances 8ist?ricosC$ os usu"rios são encamin8ados a outras ontes, a m de vericar a orma correta dos nomes dos !ersonagens, dos nomes de lugares e outros !ontos de acesso. %s diretrizes 'ue realmente a!arecem na !u0licação da %L% são 0astante im!recisas. %l=m de termos !ara ormas, as diretrizes contem!lam a atri0uição de termos !ara !ersonagens, am0ientes e Rt?!icosO. M am0iente reere-se tanto a lugares 'uanto a !er+odos, e devem ser adotados su0ca0eçal8os de orma B!or exem!lo, Daris BFrançaC - DoesiaC. %s diretrizes es!ecicam 'ue os nomes de !ersonagens ct+cios e lend"rios Bao contr"rio de !essoas reaisC somente devem ser usados ['uando surgirem com desta'ue em tr>s ou mais o0ras^. :m0ora um indexador relativamente culto !rovavelmente sai0a 'ue S8erlocX Yolmes e 2arnia a!arecem em muitas o0ras, como !oderia algu=m sa0er 'ue um detetive ou um lugar menos amosos se encontram em !elo menos tr>s o0ras, a menos 'ue esse algu=m tivesse P mão v"rias dessas o0ras imediatamente. :, al=m do mais, o 'ue 8" de tão es!ecial no nHmero Rtr>sO %s diretrizes da %L% so0re Racesso t?!icoO são ainda mais vagas %tri0ua tantos ca0eçal8os t?!icos 'uantos orem ;ustic"veis !elos assuntos da o0ra. %s so0reca!as dos livros e as recenses são uma 0oa onte de inormação !ara identicar de 'ue trata uma o0ra. Easo não existam, uma t=cnica muitas vezes eciente = R!assar os ol8osO no texto !ara identicar seu conteHdo t?!ico. Ms temas de o0ras de cção, identicados na cr+tica liter"ria, !odem ser ex!ressos com ca0eçal8os dos "S; re!resentativos de 'ualidades ou conceitos.
e ato, o ol8eto da %L% não serve a nen8um !ro!?sito Htil, !ois as diretrizes são muito vagas e 8" um tesauro mais com!leto e mel8or BMlderr, 1991C. :m novem0ro de 1991, o MELE e a Li0rarA o Eongress deram in+cio a uma ex!eri>ncia de catalogação coo!erativa de assuntos em textos de cção, dramaturgia e outras o0ras de criação. *"rias 0i0liotecas !H0licas e universit"rias !artici!aram do MELE#LE Fiction Dro;ect contri0uindo !ara a com!lementação de registros %7E de um con;unto de itens selecionados. Foram a eles acrescentados termos relativos tanto a g>nero 'uanto a assunto Bca0eçal8os de assuntos LEC. ais de 14 registros LE%7E oram com!lementados !elo MELE e as 0i0liotecas !artici!antes. %l=m disso, oram tam0=m com!lementados registros 0i0liogr"cos eitos !or algumas das 0i0liotecas !artici!antes, e muitas !ro!ostas de ca0eçal8os de assuntos oram su0metidas P Li0rarA o Eongress, 'ue a!rovou mais de mil dessas !ro!ostas, em sua maioria ca0eçal8os !ara !ersonagens de cção BWest0erg, 1996C. M !ro;eto oi conclu+do em 1999. :m 1996, a $ritish Bational $i%liography !assou a incluir entradas de o0ras de cção com ca0eçal8os de assuntos t?!icos, 0em como ca0eçal8os de g>nero e orma 0aseados nas diretrizes da %L% Bac:Van, 1996C. !rov"vel 'ue as o0ras de cção a!resentem diculdades maiores !ara o indexador do 'ue outros ti!os de !u0licaçes. % coer>ncia !rovavelmente ser" at= menor, a menos 'ue se;a adotado um voca0ul"rio controlado de termos gen=ricos, 0em !e'ueno, !rinci!almente se o indexador tiver de ex!ressar o R!onto de vistaO do autor. % indexação da literatura de cção B!or exem!loC !arece inerentemente mais su0;etiva do 'ue a indexação de !eri?dicos ou livros es!ecializados 'ue tratam de cção. Mutro !ro0lema = 'ue não = a0solutamente "cil, !ara os o0;etivos da indexação, azer a leitura !or alto de o0ras de cção, e o indexador não conta com o aux+lio dos t+tulos e entre t+tulos tem"ticos, 'ue 'uase certamente encontra em muitos outros ti!os de !u0licaçes BTonaX, 196C. Mlderr B1991C identica os !ro0lemas com 0astante clareza % catalogação de o0ras de cção exige imaginação.
15
e_elar-/iedman B1995C estudou a acti0ilidade de em!regar inormaçes ornecidas !ela editora B!or exem!lo, as constantes da so0reca!a ou da ca!aC como onte de termos re!resentativos de !ersonagens, am0iente, g>nero e t?!ico. :m geral, ela considerou 'ue isso era satisat?rio !ara a maioria dos itens, !or=m a amostra em 'ue se 0aseou era muito !e'uena. oVn B1994C examina alguns dos !ro0lemas com 'ue ela se derontou na atri0uição de ca0eçal8os de assuntos a o0ras de cção. Sua ex!eri>ncia sugere ser im!rov"vel 'ue o exame su!ercial de um romance ou a conança nas inormaçes ornecidas !ela editora !ossam esclarecer 'uais se;am realmente os temas 'ue a o0ra ilustra. &eg8tol B199C oerece o levantamento mais com!leto dos !ro0lemas da indexação de o0ras de cção, inclusive a 'uestão da Ratin>nciaO, al=m de a!resentar seu !r?!rio m=todo. 2ielsen B1996C, recorrendo ao cam!o da cr+tica liter"ria e dos estudos liter"rios, argumenta 'ue a indexação e redação de resumos de cção constitui uma orma de inter!retação liter"ria. %rma 'ue as a0ordagens da indexação de cção, inclusive a de De;tersen, concentram-se no 'u> trata o livro e !ouca atenção dedicam a como a 8ist?ria = contada. :le menciona alguns elementos, como o estilo, a narrativa, o modo discursivo e a com!osição, como alguns dos elementos do as!ecto relativo ao como da cção. 2ielsen oerece maiores inormaçes so0re 'uais os ti!os de coisas a serem considerados na indexação do as!ecto relativo ao como de um romance -<3nero/ su%g3nero/ tipo literário. BKual o ti!o de literaturaC -!strutura narrativa/ enredo. BDor exem!lo, trata-se de uma estrutura sim!les ou com!lexa
:m0ora a indexação desses as!ectos revista-se de utilidade !ara os estudiosos da literatura, = im!rov"vel 'ue ven8a a ter muito interesse !ara os leitores t+!icos de o0ras de cção. %demais, esse ti!o de indexação exigiria uma an"lise textual minuciosa 'ue somente um es!ecialista em literatura !oderia !ro!orcionar. Isso seria inutilmente dis!endioso em 'ual'uer a!licação 'ue tivesse uma dimensão signicativa. /ra0al8os so0re indexação e resumos de o0ras de cção são tam0=m o0;eto de uma s=rie de artigos de Saal1i B1999, )a,0, ))C. ncia de indexação oi realizado em cinco 0i0liotecas !H0licas nlandesas. Einco romances iguais oram indexados !or tr>s 0i0liotec"rios e tr>s usu"rios de cada 0i0lioteca. Ms termos oram extra+dos de um tesauro nland>s !ara indexação de cção e os indexadores oram solicitados a redigir resumos dos romances antes de index"-los. M0viamente, a coer>ncia oi 0aixa e 8ouve variaçes muito grandes de um indexador !ara outro 'uanto ao nHmero de termos atri0u+dos. Ms indexadores 0i0liotec"rios atri0u+ram menos termos do 'ue os usu"rios e oram mais coerentes entre si. 2o entanto, o valor de sua coer>ncia oi de a!enas 19,9f em com!aração com 1),f dos usu"rios. Ms romances mais Rcom!lexosO B!or exem!lo, os de ostoievsXiC oram indexados com mais termos do 'ue os menos com!lexos B!or exem!lo, de SimenonC. Ms resumos variaram de taman8o de )3 a 15 !alavras Bm=dia de 5C. Eerca de 64f dos 3)5 dierentes RelementosO dos resumos lidavam com conteHdo Bcomo temas, am0ientes e !ersonagensC, 11,9f, com a estrutura do romance, 4,4f, com a ex!eri>ncia su0;etiva da leitura, e 4,)f, com a cr+tica ou avaliação do romance. Ms usu"rios oram mais avaliadores#cr+ticos do 'ue os 151
0i0liotec"rios BSaarti, )a,0C. Saarti B1999C trata de tesauros !ara a indexação de cção e, em !articular, do tesauro nland>s. :ste exame da 'uestão !artiu da 8i!?tese de 'ue as o0ras ccionais são indexadas em alguma orma de 0ase de dados. &radleA B199C examina uma situação am a essa a necessidade de +ndices nas !r?!rias o0ras de cção. :m0ora se;a deens"vel a inclusão de +ndices no nal de certas o0ras, como, !or exem!lo, cl"ssicos renomados, certos romances 8ist?ricos e outros tra0al8os ccionais 'ue !ossam ser o0;eto de !es'uisas cient+cas, o estudo de &radleA mostrou 'ue oi !ouco o interesse demonstrado !or romancistas, cr+ticos, leitores ou editoras. &ell B19910C identica os !ro0lemas es!eciais im!l+citos na ela0oração de +ndices de romances. :la salienta 'ue dar a entender a Rsutileza e com!lexidadeO da intenção de um romancista = muito mais di+cil do 'ue ex!ressar de 'ue trata uma o0ra de não-cção. 5edação de resumos
%s o0ras de cção, tanto 'uanto outros ti!os de !u0licaçes, !recisam ser resumidas B'uando não se;a, !ara acilitar sua indexaçãoC, !or=m as caracter+sticas dos res!ectivos resumos ou sino!ses são 0astante dierentes das caracter+sticas dos resumos de !u0licaçes cient+cas examinados anteriormente neste livro.
Figura 94 ( uas sino!ses !oss+veis de %s aventuras de Pedro/ o "oelho, de &eatrix Dotter %!ud Zrieger B191C, com modicaçes, e com !ermissão do autor
São muito !oucas as diretrizes existentes so0re !re!aração de sino!ses de literatura de cção. % editora de Masterplots Bagill, 1965C oerece alguma orientação, mas de uma orma muito geral Dro;etado undamentalmente !ara consulta, o ormato de %S/:7DLM/S = estruturado e !adronizado, a m de oerecer o m"ximo de inormação da orma mais r"!ida. Eada uma das s+nteses = !recedida de dados de reer>ncia cuidadosamente vericados e enunciados sucintamente, os 'uais inormam num relance o ti!o de o0ra, autoria, ti!o de enredo, =!oca do enredo, lugar e data da !rimeira edição. :m seguida encontra-se uma lista dos !ersonagens !rinci!ais e as relaçes entre eles, o 'ue muitas vezes = uma caracter+stica 0astante Htil. e!ois vem a Er+tica, uma an"lise 0reve e incisiva do livro original. Finalmente segue-se o resumo do enredo, a!resentado como uma 8ist?ria com!leta e isenta de citaçes da o0ra original B!. vC.
:m Masterplots II Bagill, 195C oi adotado um ormato um !ouco dierente \...] ;unto com uma s+ntese do enredo, com re'>ncia se examinam os recursos narrativos e se estuda a construção dos !ersonagens de orma mais !rounda do 'ue antes - um as!ecto 'ue = Htil !ara os estudantes mais ;ovens. %l=m disso, identicam-se e se analisam os !rinci!ais temas do romance em 'uestão, e o >xito em geral dos esorços do autor = comumente analisado num resumo inter!retativo B!. vii-viiiC.
% gura 95 a!resenta um exem!lo de Masterplots II. % edição revista de Masterplots II BZellman, )C adota uma a0ordagem mais estruturada da sino!se do enredo Bconceitualmente similar a um resumo estruturadoC com 'uatro com!onentes :nredo, Dersonagens, /emas e Signicados, e Eontexto Er+tico. Seu em!rego = descrito da seguinte orma 15)
:sta an"lise começa com um resumo dos !rinci!ais elementos do enredo da o0ra e continua com seçes se!aradas 'ue a examinam em !roundidade. % seção RMs DersonagensO examina as motivaçes e o desenvolvimento das !essoas retratadas$ R/emas e SignicadosO examina as !reocu!açes maiores da o0ra$ e REontexto Er+ticoO avalia o lugar da o0ra na tradição liter"ria norte-americana e sintetiza 'ual oi sua rece!ção. Eada ver0ete termina com uma 0i0liograa comentada 'ue orienta o leitor !ara outras ontes recentes de estudo B!. vC.
De;tersen B199C admite tr>s estruturas ling+sticas 0"sicas !ara identicar e ex!ressar o conteHdo de o0ras ccionais Bver gura 96C. :sse es'uema !ode ser em!regado !ara orientar a redação de anotaçes, como no exem!lo a!resentado, e essas anotaçes são uma onte ?0via de termos de indexação Hteis. :la adverte, no entanto, 'ue [uma descrição com!leta do conteHdo tem"tico !ode exigir a com0inação de v"rias estruturas^.
153
Figura 95 ( :xem!lo de uma entrada de Masterplots II B195C
7e!roduzido de Masterplots II %merican Fiction Series, volume I, !. 15-16. Eom !ermissão da editora, Salem Dress Inc. Eo!Arig8t | 195, Salem Dress Inc.
Figura 96 ( :struturas ling+sticas !ara orientar a anotação e indexação de cção
7e!roduzido de De;tersen B199C com !ermissão da :7@M2-*erlag r. Y.-T. ietric8
15
%ap&tulo /7 0 Bases de dados de imaens e sons
% ca!acidade de armazenar, em ormato digital, em 0ases de dados, 'ual'uer ti!o de imagem, e es!ecialmente de !oder acessar mil8es delas na 7ede, causou im!ressionante ressurgimento do interesse !or imagens em geral e, em !articular, !or modos de index"-las. isse Tyrgensen B)1C so0re essa revolução :ncontramo-nos, ao 'ue !arece, no !onto cr+tico de im!ortante movimento 8ist?rico de retorno ao 'ue se !oderia c8amar o !rimado da imagem. %o longo dos Hltimos s=culos, as !alavras oram a orma !rivilegiada de comunicação e o meio !reerido de educação. m rearmando sua !rimazia como mensageiros instantneos e !oderosos B!. 95C.
/udo 'ue oi dito so0re indexação neste livro, at= a'ui, limitou-se a textos escritos. claro 'ue descrever imagens com !alavras ainda = im!ortante. Imagens digitais, !or=m, tam0=m !odem ser indexadas BautomaticamenteC e recu!eradas !or atri0utos intr+nsecos, como cor, orma e textura. Ms termos 'ue distinguem os dois m=todos não são de todo coerentes, mas a descrição de imagens, com !alavras, eita !or seres 8umanos, denomina-se em geral indexação %aseada em conceitos , e a indexação de imagens !or seus atri0utos intr+nsecos = %aseada em conteHdos B7asmussen, 1996C. Earacter+sticas como cor, orma e textura são amiHde denominadas características de nível %aixo. %s características de nível alto são descriçes da imagem 0aseadas em !alavras.1 &esser B1996C c8amou a atenção !ara o !ro0lema da indexação relativa a imagens da seguinte orma Eomo as coleçes de imagens !ossuem muito !oucas inormaçes textuais 'ue originalmente as acom!an8em, nossos sistemas tradicionais de recu!eração não se a!licam acilmente a elas \...] Ms museus, 'ue, coletivamente, a0rigam um dos maiores con;untos de imagens 'ue eetivamente v>m acom!an8adas de texto, muitas vezes atri0uem termos a uma imagem 'ue não são a0solutamente Hteis !ara o leigo B!. )C.
% recu!eração de imagens diere mais de !erto da recu!eração de textos !or'ue os usu"rios de 0ases de dados !odem 'uerer !es'uisar so0re uma am!la variedade de caracter+sticas, 'ue vão desde as muito exatas Bnomes de artistas, t+tulos de !inturasC at= as muito im!recisas Borma, cor, texturaC. %o tratar de determinada a0ordagem, uma 0ase de dados con8ecida como essas caracter+sticas como n+veis vari"veis de a0stração. Ms n+veis !rinci!ais são mostrados na gura 9, 'ue e8rotra ex!lica da seguinte orma 2os n+veis mais ineriores estão imagens de 0ases de dados ou imagens-exem!lo. 2o n+vel seguinte de descrição, uma imagem = caracterizada em termos de suas !ro!riedades, como cores de Hltimo !lano#!rimeiro !lano, cores dominantes, 8istogramas e !ro!riedades de textura. % descrição de imagens em termos de o0;etos - tais como regies da imagem, segmentos de limite e contornos - e relaçes entre eles orma o n+vel seguinte de a0stração. Segue-se o n+vel de a0stração em 'ue as imagens são descritas em termos de o0;etos gen=ricos, relaçes e conceitos, como 8omem, cão, carro, multidão, 8orizonte, cre!Hsculo, nu0lado, colorido e sorriso. 2o n+vel mais elevado de a0stração, as imagens são descritas em termos de casos es!ec+cos de o0;etos do mundo gen=rico. Dor exem!lo, um 8omem !ode ser descrito como Toão da Silva, uma cadela !ode ser descrita como Lassie, uma imagem !ode ser descrita como o 8orizonte da cidade de São Francisco. %s descriçes de imagens em %lguns autores, como ostaa B199C, distinguem entre indexação ver0al Bisto =, re!resentação textual de uma imagemC e indexação 0aseada em imagens Ba extração de caracter+sticas, e, !ortanto, !ontos de acesso, da !r?!ria imagemC, e isso !arece ser uma dierenciação clara, exceto, naturalmente, 'ue um Hnico sistema de recu!eração !ode incluir am0os os ti!os. 1
154
'ual'uer um desses n+veis de a0stração !odem ser multin+veis e ser derivadas das descriçes nos n+veis ineriores de a0stração, ou associadas a elas B!. 51C.
Figura 9 ( Drinci!ais n+veis de a0stração na 0ase de dados de um museu de arte %!ud e8rotra B1996C com !ermissão do consel8o diretor da
%s 0uscas numa 0ase de dados de imagens nos n+veis m=dios de a0stração envolvem Rrecu!eração de imagens 0aseada em conteHdoO. Eontinua e8rotra !ara caracterizar os re'uisitos da seguinte orma 1. "onsultas 4ue n0o envolvam processamentoanálise de imagens ( nestas consultas, não 8" necessidade de !rocessamento ou an"lise de imagens da 0ase de dados, e não são a!resentadas imagens de consulta. :xem!los 1C recu!ere todas as imagens 'ue conten8am !elo menos um autom?vel em rente de uma casa, )C recu!ere otograas 'ue conten8am um 8omem sorrindo. %s descriçes sim0?licas Bextra+das automaticamente e#ou es!ecicadas !elo usu"rioC relativas Ps imagens da 0ase de dados são em!regadas !ara selecionar as imagens dese;adas. :ssas consultas !odem ser !rocessadas !or meio dos m=todos tradicionais. ). "onsultas 4ue envolvam processamentoanálise de imagens ( estas consultas envolvem uma ou v"rias imagens 'ue são !rocessadas !ara extrair delas as inormaçes sim0?licas dese;adas a elas relacionadas. % descrição extra+da = com!arada com a descrição de imagens da 0ase de dados, a m de selecionar imagens 'ue satisaçam Ps exig>ncias es!ecicadas. :xem!los 1C recu!ere todas as imagens 'ue conten8am um ou v"rios o0;etos similares a determinada imagem de consulta em termos de cor da imagem e caracter+sticas textuais B!. 51-5)C. ?0vio 'ue os dierentes n+veis de a0stração mostrados na gura 9 re!resentam, de cima !ara 0aixo, !ro0lemas de indexação crescentemente com!lexos e crescentemente incomuns. %s re!resentaçes exclusivamente textuais das imagens !ossuem evidentes limitaçes. Yeller B196C mostra um exem!lo muito radical do registro catalogr"co de uma !intura de Dicasso Bgura 99C. M !rimeiro gru!o de elementos do registro re!resenta dados RexatosO so0re a !intura, mas o segundo gru!o, 'ue se reere ao 'ue ali se ac8a re!resentado, e como = re!resentado, al=m de ser uma 'uestão de inter!retação, oerece uma visão 0astante im!ereita de como ela =. /am0=m não inclui outros atri0utos im!ortantes, !rinci!almente as cores. Sc8roeder B1999C descreve como tr>s dierentes RcamadasO de indexação são a!licadas Ps imagens no @eneral otors edia %rc8ives o0;etos Ba'uilo 'ue = re!resentado - !or exem!lo, um camin8ão E8evrolet ano 1934C, estilo B!or exem!lo, uma otograa Rim!arcialO versus uma otograa RatraenteO de um ve+culoC e im!licaçes B!or exem!lo, ilustra a grande dura0ilidade do ve+culoC. !rov"vel 'ue a indexação de imagens !or meio de descriçes ver0ais se;a ainda mais su0;etiva e, !ortanto, mais incoerente do 'ue a indexação de textos. Y" ind+cios de 'ue isso se;a verdade BarXeA, 19C. Isso levou &roVn et al. B1995C a sugerir a !oss+vel utilidade de uma a0ordagem Rdemocr"ticaO da indexação, em 'ue os usu"rios das imagens sugerem seus !r?!rios termos de indexação, e a azer ex!eri>ncias com esse m=todo. *"rios autores deendem a cola0oração dos usu"rios na indexação de 0ases de dados de v+deos. Liu e Li B))C, !or exem!lo, !ro!em um sistema em 'ue os termos 'ue a!arecem nas 0uscas dos 155
usu"rios tornar-se-iam termos de indexação relativos aos trec8os de v+deo 'ue recu!eram B!rovavelmente a!enas os considerados RrelevantesOC. di+cil c8egar a um acordo so0re a indexação de imagens !or'ue = di+cil 8aver conco concord rdnci ncia a 'uanto 'uanto ao 'ue uma imagem imagem realm realment ente e mostra mostra.. S8ato S8atord rd B195C B195C az uma distinção entre de 'ue = uma imagem e do 4ue ela trata. 2o !rimeiro caso, lida-se com coisas concretas B!or exem!lo, exem!lo, a imagem mostra uma mãe com os l8osC, en'uanto no segundo caso lida-se mais com a0straçes B!or exem!lo, a imagem mostra mis=ria, sorimento, deses!eroC. :m artigo !osterior BLaAne, 199C, ela identica v"rios ti!os de Ratri0utosO na indexação de imagen imagens, s, em0ora em0ora sugira sugira 'ue disci! disci!lin linas as dier dierent entes es !odem !odem 'uere 'uererr utiliz utilizar ar atri0u atri0utos tos muito muito dierentes na indexação de um acervo de imagens. :la acentua a im!ortncia de em!regar a indexação !ara ormar gru!os Hteis de imagens ao inv=s de !ensar somente em imagens tratadas de modo isolado. Zrause B19C trata com certa minHcia do !ro0lema da indexação de acervos de imagens. :le concorda com a distinção entre de e do 4ue trata, mas adota nomes dierentes, a sa0er, as!ectos rígidos \hard] e exíveis \sot ] da imagem.
Figura Figura 99 ( :xem!lo do registro catalogr"co de uma !intura
%!ud Yeller B196C com !ermissão do Strong useum, 7oc8ester, 2q :sta gura oi re!roduzida re!roduzida em Scott B19C
Svenonius B199C argumenta 'ue, em0ora algumas imagens B!or exem!lo, em textos m=dicosC destinem-se a transmitir inormaçes, essa não = de ato a nalidade de !inturas e outras ormas art+sticas. :m0ora algumas re!resentem !essoas ou o0;etos 'ue !odem ser descritos ver0almente, outras sãoO lingisticamente indeterminadasO. arXeA B19C, S8atord B195C, Svenonius B199C, van der Starre B1994C e :nser B1994C, entre outros, reerem-se ao tra0al8o do 8istoriador da arte DanosXA, 'ue sugeriu 'ue uma imagem !odia ser analisada do !onto de vista !r=-iconogr"co, iconogr"co e iconol?gico. 2uma ex!eri>ncia de 'ue !artici!aram 1 !essoas, de antecedentes variados, :nser constatou 'ue a mesma imagem seria indexada em todos os tr>s n+veis. Dor exem!lo, uma cena da torre :ipel rece0eria termos nos n+veis !r=-iconogr"co Btorre, rio, "rvoreC, iconogr"co Btorre :ipel, rio SenaC e iconol?gico Bromantismo, =rias, emoçãoC. M grande nHmero de termos atri0u+dos a uma Hnica imagem B1 !essoas atri0u+ram 11 termos P cena de DarisC, argumenta :nser, indica a necessidade de indexação exaustiva. Mr0ac8 B199C = um dentre v"rios autores 'ue acentuaram a necessidade de indexar uma coleção de imagens do !onto de vista de determinado gru!o de usu"rios. :m suas !r?!rias !alavras 156
% meta da an"lise tem"tica = ca!turar a ess>ncia de uma imagem ou gru!o de imagens - seu conteH conteHdo do e temas temas mais mais im!ort im!ortant antes es - ao mesmo mesmo tem!o 'ue !ermane !ermanece ce alerta alerta !ara !ara elementos 'ue sa0idamente se;am de interesse es!ecial !ara a clientela do re!osit?rio B!. 1C.
Dara certas exig>ncias, como, !or exem!lo, recu!eração recu!eração de uma imagem 'ue ilustre uma emoção, a indexação de 0ases de dados de imagens tem algo em comum com a indexação de o0ras de cção, como vimos no ca!+tulo !recedente. +bordaens baseadas no conteHdo
*"rios sistemas oram desenvolvidos !ara !ermitir a 0usca de imagens !or meio de caracter+sticas de n+vel 0aixo, como orma, cor e textura. 2a maioria dos casos, o com!utador B!ossivelmente com a;uda 8umanaC extrai das imagens caracter+sticas Hteis de n+vel 0aixo e reco recodi dic ca a esse essess dado dadoss numa numa orm orma a sim0 sim0?l ?lic ica, a, mais mais "ci "cill de ser ser usad usada a em o!er o!eraç açe ess !osteriores de indexação e recu!eração. M sistema K&IE BKuerA 0A Image EontentC, desenvolvido !ela I&, est" sendo em!regado em car"ter ex!erimental em diversas a!licaçes BFlicXner et al., 1994C. Yolt e YartVicX B199C, 'ue o utilizaram num contexto de 8ist?ria da arte, descrevem seus recursos da seguinte orma M K&IE oerece v"rias ormas de consultas de imagens. %s duas mais gerais são como Rconsulta de o0;etoO ou Rconsulta de imagemO. %s consultas de o0;etos recu!eram imagens 'ue cont>m o0;etos 'ue coincidem com es!ecicaçes de consulta, do ti!o Rlocalize ormas vermel8a vermel8ass e circula circularesO resO,, en'uanto en'uanto as consulta consultass de imagens imagens 0uscam a coincid> coincid>ncia ncia com caracter+sticas totais de imagens, do ti!o Rencontre imagens 'ue !ossuam !rinci!almente tonali tonalidad dades es de verme vermel8o l8o e azulO. azulO. Dara eetua eetuarr consul consultas tas de o0;eto o0;etos, s, estes estes devem devem ser identicados em cada cena, normalmente de modo manual, traçando um es0oço deles antes da consu consulta lta.. M !roce !rocesso sso de es0oça es0oçarr os o0;eto o0;etoss e em seguid seguida a !roce !rocessa ssarr atri0u atri0utos tos ou caracter+sticas de cada o0;eto e cada imagem como um todo denomina-se classicação de imagens. Y" erramentas 0"sicas de desen8o, como retngulo, eli!se, !ol+gono, !incel e uma erramenta de contornos ativos \ sna-e tool], 'ue traça o contorno das imagens selecionadas.
M K&IE !ermite a realização de 0uscas 'ue envolvam cores, texturas e ormas, 0em como o assunto assunto re!resent re!resentado ado numa !intura. !intura. /am0=m am0=m !ermite !ermite consulta, consulta, !or exem!lo exem!lo,, BRencontr BRencontre e outras otograas como estaOC. Yolt e YartVicX relatam 'ue 0uscas so0re ormas em !inturas !odem enrentar enormes !ro0lemas. iversos outros sistemas de recu!eração 0aseados em conteHdo oram desenvolvidos, em0ora em0ora não se ten8a ten8a clare clareza za so0re so0re 'uais 'uais são Ro!era Ro!eracio cionai naisO sO e 'uais 'uais são são sim!le sim!lesme smente nte ex!erimentais. ncia de ormas ainda estão muito a'u=m da !ereição. :, conorme Dicard e inXa B1994C salientam, a an"lise de ormas não resolve todos os !ro0lemas de consulta, !or exem!lo - algumas imagens !rocuradas Bum cam!o, "gua, multides, ogoC não !ossuem uma orma 0em-denida, e devem, ao contr"rio, ser cote;adas !ela RtexturaO. :les examinam a0ordagens de identicação de Rregies visualmente similaresO numa numa oto otogr gra aa, a, em!r em!reg egan ando do cara caract cter er+s +sti tica cass como como Rdir Rdirec ecio iona nali lida dade de,, !erio !eriodi dici cida dade de,, alea aleato torie rieda dade de,, rust rustic icid idad ade, e, regul egular arid idad ade, e, as!e as!ere reza za,, dist distri ri0u 0uiç ição ão da cor, cor, cont contra rast ste e e com!lexidadeO. M sistema ex!erimental 'ue desenvolveram !rocura imitar o com!ortamento 8umano no recon8ecimento de cenas visualmente similares. Dicard B1995C trata ainda da textura da visão em recu!eração de imagens, en'uanto e8rotra e @arA B1994C, e8tre et al. B1996 B1996CC e Tagad Tagadis8 is8 B1995 B1995CC trata tratam m do !ro0l !ro0lema ema do recon recon8ec 8ecime imento nto de ormas ormas.. :m Mgle Mgle e Stone0raXer B1994C e Smit8 e E8ang B19960C encontram-se exem!los de sistemas em 'ue um dos !rinci!ais com!onentes = a !es'uisa de cores. e8rotra B1996C analisa alguns dos !ro0lemas !resentes na re!resentação e 0usca de ormas de imagens, e Yuang et al. B1996C estudam a orma, cor e textura como !ro0lemas de indexação e recu!eração. M analisador de imagens !or eles descrito consegue !rocessar um 8ist 8istog ogra rama ma de cor cor !ara !ara uma uma imag imagem em,, 0em 0em como como uma uma medi medida da de text textur ura a 0ase 0asead ada a em as!ereza, contraste e direcionalidade. % segmentação de imagens = o0tida !or meio de uma t=cnica de agru!amento. % !osição relativa desses agru!amentos !ermite 0uscas nas 0ases de dados 'ue envolvam cor, textura e 15
caracter+sticas es!aciais B!or exem!lo, Ruma região vermel8a acima e P direita de uma grande região azulOC. ForsAt8 et al. B1996C a!resentam um am!lo e Htil !anorama so0re o uso de caracter+sticas de cor, textura e geometria na recu!eração em grandes 0ases de dados de imagens. e8tre et al. B199C a!resentam um m=todo !ara o agru!amento de imagens 'ue se 0aseia numa com0inação de caracter+sticas de orma e cor. M grau de coincid>ncia entre 'ual'uer !ar de imagens !ode ser com!utado e ex!resso numericamente, !ermitindo, assim, consultas !or exem!lo Bou se;a, = !oss+vel !es'uisar imagens similares a outra ;" selecionadaC. %legam um grande sucesso em ex!eri>ncias de recu!eração, mas tra0al8aram com 0ases de dados muito !e'uenas B!or exem!lo, exem!lo, uma delas !ossu+a 4 imagens de logomarcasC. logomarcasC. im!ortante recon8ecer, contudo, 'ue a maioria dos usu"rios de 0ases de dados de imagens !rovavelmente não ar" 0uscas so0re as!ectos mais a0stratos, como cor, orma e textura, em0ora !ossam em!reg"-los !ara limitar ainda mais uma 0usca. Yuang et al. B1996C assim coloca a 'uestão :m muitas a!licaçes de sistemas de recu!eração de multim+dia, os usu"rios raramente usam caracter+sticas de imagens de n+vel 0aixo Bisto =, orma, cor, texturaC diretamente !ara consul consultar tar a 0ase 0ase de dados. dados. %o contr" contr"rio rio,, o usu"ri usu"rio o intera interage ge com o sistem sistema a median mediante te conceitos de n+vel su!erior B!or exem!lo, !raia, Noresta, Nores amarelas, cre!HsculoC !ara es!ecicar determinado conteHdo de imagem B!. 114C.
:x!eri>ncias realizadas !or conald et al. B)1C sugerem 'ue a cor !ode ser um crit crit=r =rio io de clas classi sic caç ação ão e 0usc 0usca a 0ast 0astan ante te Htil Htil !ara !ara o usu" usu"ri rio o 'ue 'ue não não ten8 ten8a a em vist vista a determinada imagem. iversos sistemas oerecem a !ossi0ilidade de consulta, !or exem!lo, ou Rrecu!eração de similaridadeO. Zurita e Zato B1993C descrevem v"rias a!licaçes ex!erimentais, !or exem!lo exem!lo 1. %o ser eito eito o !edido !edido de regis registr tro o de uma marca, marca, ela !ode !ode ser escanea escaneada da !or um de!artamento de !atentes e cote;ada com uma 0ase de dados de marcas existentes.1 ). Dara consultar consultar 0ases de dados de museus ou museus de arte, o usu"rio !ode es0oçar es0oçar uma imagem B!or exem!lo, de uma !aisagem ou !arte de uma !aisagemC e o sistema !es'uisar" as !inturas 'ue mais se !areçam com essa imagem.) iLoreto et al. B1994C analisam tra0al8o 'ue = um tanto similar ao de Zurita e Zato em0ora em am0iente totalmente diverso. Seu sistema ex!erimental de inormação geogr"ca, R0aseado a!enas na re!resentação !ict?rica de uma consultaO, !ossi0ilita uma !es'uisa 'ue !ode envolver a utilização de atri0utos geom=tricos, relaçes to!o l?gicas e distncias. 2em todos os sistemas 0aseados em conteHdo estão centrados em imagens em sua totalidade. Eontinuam sendo realizadas !es'uisas so0re m=todos !ara re!resentação e 0uscas em regies se!aradas de uma imagem Bver, !or exem!lo, og8addam et al., )1C.
M m=todo 0aseado em regies tem a vantagem de !ermitir crit=rios menos estritos !ara o cote;o de imagens uma Hnica região numa imagem !ode ser com!arada com v"rias regies em outra imagem. esmo 'ue duas imagens não coincidam !ereitamente em sua totalidade, talvez coincidam razoavelmente 0em no n+vel de região. Tones e 7oAd8ouse 7oAd8ouse B1994C descrevem um curioso sistema, 0aseado em casos, !ara indexação e recu!eração de dados meteoro l?gicos. iante de uma situação clim"tica atual, o meteorol meteorologist ogista a !ode !es'uisar !es'uisar condiçes condiçes similares similares em situaçes situaçes !assadas. !assadas.
% indexação#recu!eração de marcas tam0=m = tratada !or Wu et al. B1994C e 7avela e Luo B)C, entre outros. &enois-Dineau et al. B1996C descrevem um m=todo similar no 'ual as imagens de edi+cios !odem ser recu!eradas !elo cote;o com um Res0oço sintetizadoO.
)
159
Ms autores descrevem seu m=todo de indexação da seguinte maneira Eada caso re!resenta uma atia de tem!o !ara a 'ual se dis!e de dados meteorol?gicos. :sses :sses dados dados dis!on dis!on+ve +veis is !ara !ara n?s inclue incluem m imagen imagenss de sat=li sat=lite te armaz armazena enadas das tanto tanto em ormato digital 'uanto em disco laser, um ar'uivo de documentos e cam!os num=ricos \...] %lguns exem!los de cam!os num=ricos incluem !ressão, tem!eratura, umidade relativa, velocidade dos ventos e vorticidade relativa, tudo dis!on+vel em 1 n+veis dierentes da atmosera. \M sistema] 8o;e !ossui 3,4 anos de dados com intervalos de 1) 8oras, 'ue constituem uma 0ase com cerca de ) 4 casos. :stamos concentrados atualmente numa região 'ue co0re cerca de uma oitava !arte do glo0o, tendo como centro a %ustral"sia. Drevemos 'ue mais 1 anos de dados logo estarão dis!on+veis !ara n?s, o 'ue nos !ermitir" ex!andir a 0ase de casos !ara cerca de 1 casos. entro de alguns anos, as rean"lises de dados 8ist?ricos \...] deverão !roduzir con;untos de dados 'ue a0rangerão um !er+odo desde a Segunda @uerra undial at= os dias atuais, o 'ue !ermitir" a construção de uma 0ase de dados com mais de 35 casos do !assado. \M sistema] recu!era casos !or meio do cote;o de consultas eitas !elo usu"rio com rEtulos de índice ex!licitamente re!resentados. %s consultas identicam caracter+sticas es!ec+cas de n+vel n+vel alto alto da situaç situação ão atual atual 'ue 'ue !areça !areçam m ser meteor meteorolo ologic gicame amente nte im!ort im!ortant antes es !or exem!lo, sistemas de 0aixa e alta !ressão. Ms r?tulos de +ndice são re!resentaçes das caracter+sticas de n+vel alto da situação do tem!o em cada caso. /anto 'uanto !oss+vel, \o sistema] sistema] extrai extrai essas essas caracter+s caracter+sticas ticas autom"tica autom"tica ou sem i-automat i-automaticam icamente ente dos dados dados 0rutos. %tualmente estamos nos concentrando em certas caracter+sticas, como as m+nimas e m"ximas locais, 'ue são "ceis de extrair automaticamente automaticamente \...] B!. 41C.
Figura Figura 1 ( Eonsulta ormulada a uma 0ase de dados meteorol?gicos. % consulta !ede um com!lexo sistema de 0aixa !ressão so0re a 2ova _elndia com sistemas de alta !ressão a leste e oeste %!ud Tones 7oAd8ouse, 7oAd8ouse, [lntelligent retrieval o arc8ived meteorological meteorological data^ I!!! !xpert , 1B5C, 1994, 4-46. | 1994. I:::
Eorridoni et al. B199C descrevem um m=todo de recu!eração de !inturas !or meio da Rsemntica das coresO. :m ess>ncia, as !inturas são segmentadas em regies 'ue !ossuam dierentes caracter+sticas caracter+sticas crom"ticas. % 0ase de dados !ode então ser consultada !ara localizar !inturas 'ue a!resentem determinadas !ro!riedades crom"ticas crom"ticas e caracter+sticas es!aciais. :x!eri>ncias 'uanto ao em!rego da textura na indexação e recu!eração de otograas a=reas são descritas !or 7amseA et al. B1999C. M o0;etivo deles era ela0orar um RtesauroO de texturas Be talvez outras caracter+sticas das otograasC 'ue os usu"rios !udessem consultar em lin8a. lin8a. Kuando Kuando o usu"ri usu"rio o encont encontras rasse se uma textu textura ra 'ue corr corres! es!ond onderia eria ao elemen elemento to !rocurado B!or exem!lo, uma !ista de aero!ortoC, ele !oderia utilizar o sistema !ara consultar imagens e encontrar as 'ue a!resentassem texturas similares. similares. %lternativamente, seria !oss+vel em!regar em!regar consultas consultas,, !or exem!lo exem!lo$$ isto =, o usu"rio usu"rio solicitari solicitaria a ao sistema sistema 'ue !rocura !rocurasse sse otograas 'ue a!resentassem texturas similares Ps de outra 'ue ;" tivesse em mãos. a e an;unat8 B199C estudam a segmentação e recu!eração de otograas a=reas 0aseadas em texturas. _8u e E8en B)C c8amam atenção !ara o ato de 'ue um sistema ideal de imagens !recisa ter condiçes de azer 0uscas so0re caracter+sticas de n+vel 0aixo Bcomo cor, orma e 16
texturaC de uma imagem, mesmo 'ue a consulta eita !elo usu"rio este;a em n+vel muito mais elevado B!or exem!lo, encontrar todas as imagens 'ue conten8am !omaresC. Se o usu"rio selecionar selecionar alguma caracter+ caracter+stica stica B!or exem!lo exem!lo,, !omarC !omarC numa otograa otograa a=rea, o sistema sistema ex!erimental de _8u e E8en !rocurar" outras imagens 'ue !areçam conter caracter+sticas similares. M sistema em!rega a!enas textura na com!aração de imagens. Sua ex!ectativa = de 'ue resultados muito mel8ores seriam o0tidos se a com!aração se 0aseasse na orma e na cor, 0em como na textura. % indexação de imagens 0aseada em !alavras e eita !or seres 8umanos = cara, e !or isso isso oram oram eitas eitas v"rias v"rias sugest sugestes es so0r so0re e como como a index indexaçã ação o 0asead 0aseada a em conce conceito itoss seria seria eetuada automaticamente, ou, !elo menos, com a;uda do com!utador. @oodrum et al. B)1C sugerem como caracter+sticas de n+vel 0aixo das imagens seriam usadas !ara agru!ar essas imagens de modo a !ossi0ilitar a R8erançaO de termos. Imaginemos uma coleção de imagens 'ue 8a;a sido indexada com termos atri0u+dos !or seres 8umanos. % essa 0ase de dados acrescenta-se novo lote de imagens. %s t=cnicas de agru!amento com!aram as imagens rec=m c8egadas B!or exem!lo, exem!lo, !ela ormaC com as 'ue ;" se encontram na 0ase de dados. Se a nova imagem K or or muito !arecida com a imagem antiga A, termos A seriam atri0u+dos a K tam0=m tam0=m,, ou, !elo !elo menos, menos, a!rese a!resenta ntados dos como como sugest sugestes es !ara index indexaçã ação o de K . Dro!em Dro!em tam0=m 'ue esse ti!o de com!aração se;a adotado nas atividades de controle de 'ualidade. Isto =, se a imagem K e e a imagem > Rossem Rossem !arecidasO, mas os seres 8umanos 8ouvessem indexado am0as de modo muito dierente, o sistema criaria um alerta 'ue aria com 'ue ossem examinadas mais cuidadosamente. Dor m, !ro!em 'ue os usu"rios de uma 0ase de imagens se;am solicitados a a!resentar uma descrição do uso 'ue !retendem dar a uma imagem BM< gru!oC e 'ue essas descriçes orneceriam termos 'ue seriam Hteis !ontos de acesso em uturas recu!eraçes, DatricX et al. B1999C e Frost B)1C tam0=m !ro!useram ormas de indexação !orO 8erançaO.
161
Figura 11 ( ois ma!as meteorol?gicos recu!erados em res!osta P consulta da gura 1 %!ud Tones 7oAd8ouse, [Intelligent retrieval o arc8ived meteorological data^, I::: :x!ert, 1 B5C, 1994, 4-46. | 1994. I:::.
Dara imagens !resentes num contexto textual B!or exem!lo, num ;ornalC, talvez se;a !oss+vel extrair automaticamente !artes do texto 'ue ex!li'uem a imagem. /ra0al8os nessa lin8a oram descritos !or Sri8ari B1993, 1994a, 0, 1996C e 2aXamura et al. B1993C, entre outros. :stes Hltimos estudam a integração de inormaçes do texto com inormaçes da imagem Bneste caso um diagrama encontrado num manual ou numa enciclo!=diaC. :m seu tra0al8o, como no de 7a;ago!alan B199C, o texto = usado !ara ex!licar o diagrama. Dor exem!lo Bsegundo 7a;ogo!alanC, a armação Ro disco est" rolando camin8o a0aixoO !ode esclarecer muito o 'ue estiver re!resentado num diagrama 'ue = com!letamente est"tico. *"rios sistemas ex!erimentais RanotarãoO Bisto =, indexarãoC imagens 0aseados em !alavras-c8ave 'ue ocorram no texto em volta da imagem. *er, !or exem!lo, Li0erman et al. B)1C. Sri8ari volta-se !ara !ro0lemas mais di+ceis e sua !es'uisa = muito mais com!lexa, recorrendo ao cam!o do recon8ecimento da ala 0em como aos do !rocessamento da linguagem natural e com!reensão da imagem. a imagem de uma !aisagem numa estação de tra0al8o e a descreve BindexaC mediante uma com0inação de entrada de dados com o mouse Ba!ontamentoC e linguagem alada. ncia P indexação e 0uscas em v+deos em a!licaçes de intelig>ncia militar. EarricX e Watters B1996C a!resentam um m=todo !ara !ro0lema am o recon8ecimento autom"tico de associaçes entre dierentes m+dias, como no recon8ecimento de 'ue determinada otograa se relaciona com determinada not+cia. Darece !rov"vel 'ue alguns usos das 0ases de dados de imagens serão tão im!recisos 'ue somente !ermitirão os m=todos de !es'uisas aleat?rias ou 0uscas iterativas. -lo Bc8ama-o de Rconsultas incrementaisOC M usu"rio 'ue estiver P !rocura de certas inormaçes, !or exem!lo, acerca de uma !essoa de 'uem tem uma vaga lem0rança, es!ecica coisas im!ortantes 'ue ele recorda so0re a !essoa \ver gura 1)]. :sta es!ecicação talvez diga 'ue ela tem ol8os grandes, 0oca grande, ca0elo longo e testa !e'uena. Eom 0ase nessas inormaçes, recu!eram-se otograas de !essoas 'ue nelas se en'uadrem. M usu"rio !oder", então, selecionar a 'ue mais se a!roxime de sua consulta e modicar a consulta se;a es!ecicando caracter+sticas se;a em!regando na otograa erramentas de edição gr"ca e de imagens. Isso rena a imagem de consulta, 'ue = então enviada ao sistema !ara 'ue orneça novos candidatos P satisação da consulta. %ssim, a consulta = ormulada de modo gradativo, começando com a id=ia vaga original. :sse !rocesso ser" conclu+do 'uando o usu"rio considerar-se satiseito B!. 61C.
Drice et al. B199)C avaliam um m=todo de 0usca iterativa Bretroalimentação de relevnciaC !ara a recu!eração de imagens, mas 0aseado em descriçes textuais das imagens ao inv=s de 0uscas de coincid>ncia de !adres das !r?!rias imagens. @udivada et al. B1995C tratam da retroalimentação de relevncia em relação P Hltima situação. Eiocca e Sc8ettini B1999C a!resentam um m=todo de modicação de 0usca autom"tica 0aseado nas caracter+sticas de n+vel 0aixo das imagens selecionadas !elo usu"rio como Hteis e das selecionadas como nãoHteis. 7oVe e colegas da <.S. 2aval Dostgraduate Sc8ool ormam um gru!o de !es'uisa 'ue se concentrou na indexação de otograas e outras imagens. Seu m=todo em!rega uma com0inação de texto Blegendas de gurasC e !rocessamento de imagem em n+vel de !ix=is.
*"rios m=todos de recon8ecimento de otograas de rostos são analisados na literatura. Dor exem!lo, 7icXman e Ston8am B1991C !ro!em um m=todo 0aseado em rede neural. M !ro0lema tam0=m = a0ordado !or Wu et al. BT 994C, Dentland B1996C, Li et al. B1996C, Yaed e Levine B)1C e Fleuret e @eman B)1C.
16)
otograas 'ue azem !arte de !"ginas da 7ede B7oVe e @uglielmo, 1993$ 7oVe, 199, 1995$ 7oVe e FreV, 1995, 1996$ @uglielmo e 7oVe, 1995C.
Figura 1) ( Eonsulta incremental numa 0ase de dados de imagens
%!ud Tain B1996C com !ermissão do consel8o diretor da
@auc8 et al. B1999C descrevem um sistema - *ISIM2 - 'ue atri0uir" trec8os de v+deo a categorias 0aseadas nos termos 'ue ocorrem em suas legendas. M es'uema de classicação adotado cont=m cerca de ) categorias. Ms v+deos 'ue c8egam !odem ser cote;ados com !ers de interesses dos usu"rios mediante este con;unto de categorias. *ailaAa et al. B)1C desenvolveram !rocedimentos !ara colocação de imagens em categorias 0aseadas em suas caracter+sticas de n+vel 0aixo. Ms ex!erimentos 'ue descrevem em!regam uma 0ase de dados 'ue cont=m 'uase 6 otograas de viagens de =rias :s!ecicamente, estudamos a classicação 8ier"r'uica de imagens de viagens de =rias$ no n+vel mais alto, elas são classicadas como internas ou externas$ as externas são ainda classicadas como ur0anas ou naturais$ !or m, um su0con;unto de imagens naturais = classicado nas classes de cre!Hsculo, Noresta e montan8a B!. 116C.
% classicação 0aseia-se na distri0uição da cor e caracter+sticas da orma. *"rios gru!os de !es'uisa v>m estudando m=todos !ara indexação de coleçes de !inturas e outros o0;etos de arte. Dor exem!lo, MzaXi et al. B1995C descrevem uma a0ordagem 'ue incor!ora inormaçes so0re o 'ue = re!resentado B!or exem!lo, orientação es!acialC 0em como so0re atores est=ticos, como cor e estilo. :ncontram-se na literatura tra0al8os 'ue lidam com !ro0lemas mais com!lexos da recu!eração de imagens. Dor exem!lo, Erom! e orrnan B199)C examinam um m=todo !ara lidar com dados de sensoriamento remoto o0tidos !or sat=lites em ?r0ita, e @udivada e 7ag8avan B1994C identicam situaçes com!lexas, em mat=ria de recu!eração, relativas a certos ti!os de 0ases de imagens, inclusive a re!resentação e recu!eração de imagens tridimensionais BRrecu!eração !or volumeOC e Rrecu!eração !or movimentoO B!or exem!lo, encontrar uma imagem 'ue mostra determinada açãoC. @eisler et al. B)1C descrevem tra0al8o em curso na ncia mostrou, com certeza, 'ue ainda estamos longe de resolver esse !ro0lema 0"sico B!. xiC.
163
Imaens na 5ede Fundial
natural 'ue atualmente se este;a dando muita atenção a maneiras de mel8orar a recu!eração de imagens na 7ede undial. % maioria dos mais im!ortantes mecanismos de 0uscas realmente oerece recurso 'ue restringe uma 0usca ver0al P recu!eração de imagens. 2o entanto, as !es'uisas atuais tratam de !rocessos mais com!lexos, como a identicação autom"tica de imagens. ncias do texto. % segunda eta!a dessa !es'uisa = a identicação autom"tica de legendas !ara essas otograas. :ssa não = uma tarea sim!les, !or'ue, na !"gina da 7ede, as legendas !odem estar se!aradas das otograas, e Ps vezes inseridas em texto maior. % localização de legendas = eita !or meio do em!rego de [c8aves multimodais 'ue incluem as !alavras es!ec+cas utilizadas, a sintaxe, o leiaute circundante da !"gina da 7ede, e a a!ar>ncia geral da imagem associada^. Ms autores reivindicam [um sur!reendente grau de sucesso^ de !rocedimentos 'ue evitam o !rocessamento da imagem com!leta e !rocessamento total da linguagem natural. *"rios gru!os de !es'uisas v>m tra0al8ando so0re recon8ecimento de otograas de !essoas na 7ede. Ms m=todos !odem 0asear-se no recon8ecimento acial e ocorr>ncia do nome no texto, ou uma com0inação de am0os Bver, !or exem!lo, %slandogan e qu, )C. %gneV et al. B1996C descrevem um m=todo ex!erimental de consulta, !or exem!lo, !ara 0usca de imagens na 7ede undial. M sistema localizar" as imagens, ar" sua indexação B!or cor, taman8o e outros atri0utosC e armazenar" os +ndices num servidor. Smit8 e E8ang B1996aC estudam outro m=todo de indexação de imagens na 7ede, 'ue em!rega tanto atri0utos textuais 'uanto visuais. 5esumos de imaens
% !re!aração de um resumo, ou outro ti!o de sucedneo, de uma imagem a!resenta !ro0lemas es!eciais, !rinci!almente no caso de imagens em movimento, como os !rogramas de televisão. &asicamente, são !oss+veis dois ti!os de resumos uma descrição ver0al do v+deo Bum resumo 0astante convencionalC ou um resumo 'ue se;a ele !r?!rio uma imagem. :m0ora se;a !oss+vel ela0orar resumos textuais 'ue sintetizem as açes dos lmes ou transmisses de televisão Bcomo o demonstra o cat"logo do %merican Film InstituteC, talvez se;a mel8or, em certos casos, dis!or de um resumo visual de cenas do !r?!rio lme. @eisler et al. B)1C salientam 'ue os resumos de v+deo !odem ter o ormato de imagens est"ticas ou em movimento. %ssim se reerem aos resumos de imagens est"ticas Slide sho8s/ story%oards e tiras de lmes \ flmstrips] são exem!los desse ti!o \...] 2ormalmente as !essoas extraem os 'uadros-c8ave \ -eyrames] de cada tomada !ara re!resent"-la e em seguida arran;am todos os 'uadros-c8ave ou um su0con;unto deles !ara ormar o resumo. Ms m=todos de seleção de 'uadros-c8ave e agru!amento ou montagem deles variam, em dierentes !ro;etos B!. 5C.
: acrescentam
@eisler et al. alegam 'ue ainda = !reciso !es'uisar 0astante so0re como as !essoas interagem com os videorresumos. ing et al. B1999C com!araram tr>s ti!os de videorresumos - 'uadro-c8ave, ver0al B!alavra-c8ave#raseC e uma com0inação de am0os - com 0ase na com!reensão ver0al Ba 16
ca!acidade de a !essoa a!reender a id=ia !rinci!al de um trec8o de v+deo a !artir do resumoC e Ra ess>ncia visualO \ visual gisting]. 2o Hltimo, oram mostradas imagens aos su;eitos do teste, algumas extra+das do v+deo de origem e outras não, tendo sido solicitado a eles 'ue selecionassem as 'ue !ertenciam ao v+deo de origem. /ra0al8o relacionado a este oi relatado !or /se et al. B1999C, 'ue estudaram os eeitos de dierentes visualizaçes de 'uadrosc8ave no desem!en8o do usu"rio em tareas de localização de inormação. Ms usu"rios consideraram a visualização est"tica B story%oardC mais "cil de utilizar do 'ue a visualização dinmica Bslide sho8C, em0ora não 8a;am sido encontradas dierenças no desem!en8o da tarea. @oodrum B)1C com!arou 'uatro ti!os de sucedneos de v+deos Bt+tulo, !alavras-c8ave, 'uadros est"ticos e 'uadros-c8aveC cote;ando as decises de semel8ança !ara cada sucedneo com as decises de semel8ança !ara os v+deos re!resentados, na 8i!?tese de 'ue o mel8or sucedneo = a'uele cu;o Rma!aO de semel8ança mais se a!roxima do ma!a dos !r?!rios v+deos. Youve maior concordncia dos sucedneos 0aseados em imagens do 'ue dos 'ue se 0aseavam em textos. @oodrum, no entanto, conclui 'ue 8" necessidade de am0os Darece claro 'ue, a!esar de os sucedneos 0aseados em imagens terem alcançado, em geral, mel8or desem!en8o, os sistemas de recu!eração de v+deo não devem excluir as re!resentaçes textuais. Eada ti!o de sucedneo tem uma contri0uição exclusiva a dar P !erce!ção, !elo usu"rio, do conteHdo inormacional, e deve ser inclu+do como !arte de um sistema com!leto de recu!eração de inormaçes visuais B!. 11C.
Lien8art et al. B1996C descrevem, da seguinte maneira, seu m=todo de ela0oração de resumos de v+deos M algoritmo de resumos 'ue desenvolvemos !ode ser su0dividido em tr>s !assos consecutivos \...] 2o !rimeiro. !asso, segmentação e an"lise do v+deo, o v+deo de entrada = segmentado em suas tomadas e cenas. %o mesmo tem!o, identicam-se se'>ncias de 'uadros com eventos es!eciais, como um texto 'ue a!arece na se'>ncia de cr=ditos, tomadas em close2up dos atores !rinci!ais, ex!loses e tiros. 2o segundo !asso, seleção dos trec8os, selecionam-se trec8os do v+deo !ara inclusão no resumo. M terceiro, montagem dos trec8os, monta-os em suas se'>ncias nais e !roduz o leiaute de a!resentação$ este !asso envolve a denição da ordem dos trec8os do v+deo, o ti!o de transição entre eles e outras decises de edição B!. 45C.
Foram desenvolvidos sistemas !ara selecionar automaticamente 'uadros-c8ave de v+deos e incor!or"-los numa interace de 0usca ou consulta em 0ases de dados de v+deos Bver, !or exem!lo, @irgenso8n et al., )1C. Isso e'uivale mais ou menos a colocar resumos numa interace 'ue acilite as 0uscas e a consulta de textos. *"rios gru!os de !es'uisa estão tra0al8ando no desenvolvimento de resumos de se'>ncias de v+deo 'ue se;am ecazes e RdinmicosO. :xem!lo disso = o tra0al8o de 2am e /eVX B))C, 'ue critica os resumos de v+deos 'ue de!endem de arran;os est"ticos de 'uadros-c8ave a!resentados em tela Hnica. /ais resumos não R!reservam a natureza dinmica do !assar do tem!oO do conteHdo do v+deo. Dro!em um m=todo de sumarização 1 'ue !roduza um resumo dinmico do v+deo. Isso seria conseguido !or meio de um !rocesso de amostragem 'ue selecionaria segmentos do lme com 0ase na 'uantidade de RatividadeO re!resentada. M resumo do v+deo Ra!resenta o conteHdo essencial dos dados !resentes no v+deo !or meio de uma r"!ida re!rodução se'encialO. +tributos da imaem
M grande aumento do interesse !ela indexação e recu!eração de imagens suscitou inHmeros estudos so0re como as !essoas v>em as imagens ou reagem a elas. :sses estudos destinam-se a desco0rir 'uais os ti!os de a0ordagem 'ue as !essoas necessitarão na recu!eração de imagens e 'uais os ti!os de termos 'ue serão Hteis !ara descrever e indexar imagens. Tyrgensen B199C solicitou a mestrandos 'ue Rdescrevessem tareasO, a m de identicar atri0utos de imagens 'ue seriam Hteis na indexação e recu!eração. Foram mostradas aos estudantes as mesmas seis imagens e l8es oi solicitado 'ue redigissem uma Rdescrição sim!lesO de cada uma, 0em como uma consulta !ara a 'ual a imagem seria uma res!osta coincidente. Tyrgensen relata 'ue em0ora os atri0utos 'ue ocorriam com mais re'>ncia Btermos !ara o0;etos e !essoas re!resentadas, !artes do cor!o, rou!as, cor e 2o sentido dicionarizado de resumir . SumariLa10o, no sentido de ela0oração autom"tica de resumos, = em!regada !or es!ecialistas lus?onos da "rea da ling+stica com!utacional. B2./.C 1
164
localizaçãoC ossem !revis+veis e coerentes com estudos anteriores, os termos 'ue descreviam a R8ist?riaO na otograa oram usados muito mais do 'ue seria natural. Yeidorn B1999C estudou a descrição em linguagem natural de o0;etos Bneste caso, otograas de "rvores NoridasC criada !or !essoas ['ue tentavam descrever o0;etos de orma sucientemente minuciosa !ara 'ue o ouvinte recon8ecesse o o0;eto num con;unto de o0;etos similares^. :le desco0riu 'ue os !artici!antes aziam grande uso de analogias em suas descriçes B!or exem!lo, uma !lanta 'ue !arecia uma 0or0oletaC. @oodrum e S!inX B1999C examinaram mais de um mil8ão de consultas !or imagens eitas !or )11 usu"rios de um Hnico mecanismo de 0usca na 7ede, o :EI/:. Eonstataram 'ue, em m=dia, 8avia 3,6 termos !or consulta e 'ue a grande maioria de termos em!regados eram exclusivos, com mais da metade ocorrendo a!enas uma vez. Frost B)1C estudou usu"rios 'ue aziam 0uscas numa 0ase de imagens, 'uando estavam dis!on+veis tanto as o!çes visuais 'uanto ver0ais. Ms su;eitos da !es'uisa eram estudantes, uncion"rios e mem0ros do cor!o docente de uma universidade. % 0ase de dados inclu+a imagens relativas P /erra e Ps ci>ncias es!aciais. ncia entre os construtos !essoais R'ue os !artici!antes em!regaram !ara distinguir as otograas umas das outras^. MOEonnor et al. B1999C realizaram ex!eri>ncias em 'ue estudantes eram solicitados a o0servar imagens selecionadas e registrar as reaçes 'ue sentiam diante dessas imagens. % 8i!?tese su0;acente era 'ue essas reaçes seriam uma onte Htil de descritores !ara a organização de uma coleção de imagens, de modo a acilitar a recu!eração utura Bisto =, indexação centrada no usu"rioC. Foi !edido aos estudantes 'ue redigissem legendas e tam0=m anotassem !alavras ou rases 'ue descrevessem o 'ue a imagem contin8a e o 'ue sentiram diante das imagens. ncia, não incomum, de anton+mia uma rase em!regada !or um estudante !ara descrever uma imagem era 'uase diametralmente o!osta P em!regada !or outro estudante B!or exem!lo, um !ato R'ue a!enas nadavaO, na visão de um estudante, era visto !or outro como se estivesse Rnuma missãoOC. :m0ora o uso de termos de RreaçãoO talvez se;a Htil na indexação e recu!eração de imagens, !elo menos como su!lemento a termos mais convencionais, descritivos Bcomo R!atoO e Rlago RC, = claro 'ue teriam de ser ornecidos !or uma amostra re!resentativa de o0servadores, a m de ca!tar dierentes inter!retaçes e !ontos de vista. Eom 0ase em an"lise de 'uais os ti!os de termos 'ue os usu"rios de uma amostra em!regariam ao o0servar imagens selecionadas, @reisdor e MOEonnor B))C concluem 'ue [termos de consulta de 0ase aetiva#emocional !arecem ser uma categoria descritiva im!Mliante na recu!eração de imagens^. di+cil entender a l?gica de tal armativa. Ms termos aetivos#emocionais Bentre os exem!los citados estão R0onitoO, Rsem!re ;ovemO, RelizO, RorteO, RmelancoliaOC devem certamente corres!onder a reaçes totalmente de!endentes do momento tem!oral. Isto =, se a !essoa A ;ulga 'ue determinada imagem sugere a id=ia de RorteO, 8aver" alguma !ro0a0ilidade de sua reação ser a mesma de!ois de um ano Ms autores não !rocuraram estudar a esta0ilidade desse ti!o de reação ou mesmo a coer>ncia da reação entre um gru!o grande de !essoas, de modo 'ue carecem !or com!leto de 0ase 'ue sustente sua conclusão. %demais, = muito di+cil acreditar na !ro0a0ilidade de usu"rios de uma 0ase de imagens azerem grande uso desses termos em 0uscas reais. R:stou P !rocura de uma otograa de "rvores 'ue sugira a id=ia de RorteOO !arece ser algo com!letamente im!laus+vel. E8oi e 7asmussen B))C recorreram a mem0ros dos cor!os docente e discente de !?sgraduação de de!artamentos de 8ist?ria de duas universidades em seu estudo so0re crit=rios !ara determinar a relevncia de uma imagem !ara uma necessidade de inormação. %s consultas situavam-se no cam!o da 8ist?ria norte-americana. 2aturalmente, a Rto!icalidadeO Bisto =, a imagem guarda relação com a tarea do usu"rioC oi o crit=rio mais im!ortante nos ;ulgamentos de relevncia, em0ora outros crit=rios, como 'ualidade e clareza da imagem, tam0=m ossem im!ortantes. Eomo tam0=m oi notado em muitos estudos nessa "rea, as 165
concluses a 'ue c8egaram os autores são relativamente triviais. Dor exem!lo, concluem 'ue = mais !rov"vel 'ue os usu"rios ;ulguem a relevncia das imagens a !artir das !r?!rias imagens do 'ue a !artir das descriçes textuais dessas imagens :m !rimeiro lugar, os sistemas de recu!eração devem !ermitir aos usu"rios com!ulsar e com!arar um con;unto de imagens recu!eradas, !ois a visualização das imagens torna mais "cil os ;ulgamentos de relevncia B!. 614C.
/am0=m concluem 'ue a retroalimentação de relevncia !ode ser mais im!ortante na recu!eração de imagens do 'ue na de textos. :m0ora isso !ossa ser verdadeiro, não oram coletados dados 'ue undamentem tal conclusão. Eonorme documentado antes neste ca!+tulo, v"rios sistemas ex!erimentais de ato incor!oram a retroalimentação de relevncia. E8en B)1 a, 0C estudou as consultas ela0oradas !or estudantes !ara localizar imagens necess"rias P !re!aração de tra0al8os nais de curso no cam!o da 8ist?ria da arte. E8en az 'uestão de nos dizer 'ue os estudantes [raramente usaram os conceitos de cor, orma e textura em suas consultas^, im!licando, talvez, 'ue essas caracter+sticas de n+vel 0aixo seriam !ouco !ertinentes P recu!eração de imagens em 8ist?ria da arte. Dor=m os temas atri0u+dos aos estudantes B!or exem!lo, o !a!el de *eneza na 8ist?ria da arteC não eram do ti!o 'ue !rovavelmente exigiria, na recu!eração, uma a0ordagem 0aseada em conteHdo. %l=m do mais, nen8um sistema de recu!eração de imagens oi realmente utilizado no estudo, e as ontes de imagens dis!on+veis !ara os estudantes Berramentas im!ressas e s+tios da 7edeC não oram !ro;etadas !ara !ermitir 0uscas 0aseadas em conteHdo, de modo 'ue camos a imaginar !or 'ue essa conclusão viria a merecer 'ual'uer desta'ue. /urner B1994C com!arou os termos 'ue os usu"rios selecionaram !ara a!licar a imagens Bneste caso tomadas de lmes cinematogr"cosC com termos ;" associados com as imagens na indexação ou em descriçes escritas da tomada. :le encontrou alto n+vel de concordncia. Zeister B199C contri0uiu com uma !roveitosa an"lise dos ti!os de consultas eitas a uma 0ase de dados de imagens, neste caso estam!as e otograas m=dicas de interesse 8ist?rico, e Sutclipe et al. B1996C estudaram estrat=gias de 0usca de inormaçes adotadas !or usu"rios de 0ases de dados de multim+dia. Yastings B1994a, 0, cC estudou os ti!os de !ontos de acesso de 'ue !recisam os 8istoriadores da arte. e!ois de o0servar uma !e'uena coleção de imagens de !inturas, os 8istoriadores oram entrevistados com a nalidade de determinar, entre outras coisas, 'ual o ti!o de !onto de acesso 'ue l8es seria Htil. Mrnager B1996C estudou as necessidades de ;ornalistas no uso de um ar'uivo de imagens de ;ornal. Tyrgensen B1995C constatou 'ue su;eitos solicitados a descrever imagens tin8am maior !ro0a0ilidade de selecionar atri0utos R!er!=tuosO Bisto =, caracter+sticas 0astante exatas, tais como o0;etos re!resentados e sua corC ao inv=s de Rinter!retativosO B!or exem!lo, estilo art+stico ou RclimaO de uma !inturaC ou atri0utos RcriativosO Bisto =, reação !essoal P !intura, como ;ulg"-la eia ou !ertur0adoraC. 2o entanto, 'uando instados !or meio de um Rga0aritoO 'ue a!resentava uma s=rie de atri0utos de todos os ti!os, os su;eitos mostravam maior diversidade dos atri0utos selecionados. :la conclui, a !artir disso, 'ue a indexação ecaz de imagens re'uer o em!rego de uma am!la gama de atri0utos !erce!tuais, inter!retativos e reativos. %om base em conceitos ou em conteHdoD
LaAne B))C = 0astante cr+tico dos m=todos com!letamente autom"ticos de indexação de imagens Kuem ou o 'ue az a an"lise do assunto numa o0ra de arte Y" alguns anos surgiu um orte interesse !ela an"lise inormatizada de imagens, e oram encetadas v"rias tentativas de a!licar t=cnicas de recon8ecimento de !adres e m=todos iterativos P identicação e recu!eração de imagens relevantes. %t= agora, nen8um desses esorços teve >xito na recu!eração de imagens de gru!os 8eterog>neos ou na identicação de o0;etos, como cavalos, 'ue !odem ser re!resentados em diversas !oses, a !artir de muitos ngulos dierentes e so0 variadas condiçes de iluminação. Ms sistemas inormatizados são mais 0em-sucedidos na an"lise de con;untos 8omog>neos de imagens e na seleção de imagens com 0ase exclusivamente na cor, com!osição e textura. /ais elementos são relativamente "ceis de codicar e, !ortanto, de identicação relativamente "cil !elo com!utador. Foi a!arentemente com grande esorço 'ue alguns sistemas tiveram algum sucesso na identicação de ti!os de imagens, como !aisagens, 'ue tendem a a!resentar certas caracter+sticas comuns de cor e com!osição. as = seguro dizer 'ue a recu!eração de imagens 0aseada em conteHdo - ou se;a, inormatizada - ainda est" longe de vir a ser Htil, mesmo remotamente, !ara 8istoriadores e !es'uisadores de arte. \...] Darece 'ue, !or ora, o ideal seria deixar o 8omem azer o 'ue sa0e azer e o com!utador azer o 'ue sa0e azer. :m
166
outras !alavras, 'ue o 8omem identi'ue os assuntos de uma imagem art+stica e 'ue o com!utador identi'ue cor, orma e com!osição. Dor exem!lo, se o indexador 8umano identicasse os assuntos de imagens de arte, o com!utador analisaria, se necess"rio, um grande con;unto recu!erado de imagens do mesmo assunto B!or exem!lo, RcatedraisO, RdançaO, Rsarc?agosOC em 0usca de semel8anças de orma, cor ou com!osição B!. 1-14C.
% maioria dos autores !arece concordar com 'ue a recu!eração ecaz de imagens exige tanto m=todos 0aseados em conceitos 'uanto 0aseados em conteHdo, as!ecto esclarecido !or Mrnager B199C :m0ora a id=ia de dar entrada a uma imagem-consulta ten8a muitos argumentos 'ue a recomendam, essas imagens-consulta nem sem!re su0stituem a orça descritiva das !alavras, 'ue !odem ser mel8ores !ara alguns conceitos a0stratos. di+cil !erce0er como seria !oss+vel criar uma imagem-consulta 'ue re!resentasse, !or exem!lo, Rdes!ovoamento de !e'uenas aldeias norueguesasO ou RciHmeO B!. )1C.
EaVXell B1993C ocalizou o mesmo t?!ico %s imagens-consulta su0stituirão as imagens descritas com !alavras P medida 'ue as t=cnicas orem sendo a!ereiçoadas, em0ora nem todos os conceitos !ossam ser assim consultados de modo mel8or. Eonsultas do ti!o RKuais as !inturas 'ue mostram sen8oras !ortando medal8asO, ou RY" alguma !intura do s=culo *II onde a!areçam animais de estimaçãoO seriam 0em-sucedidas. as conceitos a0stratos talvez se;am mais 0em ex!ressos !or meio de !alavras usadas como descritores B!. 9C.
/urner B199C salientou 'ue, mesmo 'ue se !ossa ter acesso muito r"!ido a uma imagem Bneste caso 'uadros de lmes cinematogr"cosC, isso não exclui a necessidade de acesso a uma descrição textual %l=m do mais, muitas vezes o texto unciona como um guia da imagem. :m muitos casos, consultar uma sino!se a;uda o o0servador a inter!retar a imagem$ !or exem!lo, talvez se;a Htil sa0er 'ue o trem 'ue a !essoa o0serva = o :x!resso do Mriente, ou 'ue a avela 'ue a!arece na tela ca 0em na !erieria de Kuito. :m outras !alavras, o texto de uma sino!se visual !ode !ro!orcionar inormaçes Hteis 'ue não estão dis!on+veis na imagem. %ssim, em0ora se;a certamente conveniente ter acesso instantneo P imagem, isso não dis!ensaria a necessidade de uma sino!se textual B!. 6C.
2o mesmo dia!asão, @reen e Zlas=n B1993C descrevem as ex!eri>ncias da Sveriges /elevision \/elevisão Sueca] com a indexação de !rogramas de televisão, !or meio, exclusivamente, de descriçes textuais. /odas as cenas com mais de dez segundos de extensão são descritas com anotaçes em texto livre, como, !or exem!lo 7ua de eira, a!in8ada de gente. &arraca de eira, laran;as, maçãs, uvas, !>ssegos.
/rant B1994C assevera 'ue [a descrição textual !ermanece sendo a c8ave da recu!eração de imagens^, acentua a necessidade de uma norma so0re como descrever imagens em 0ases de dados de imagens e menciona tra0al8o realizado visando ao desenvolvimento dessa norma. ostaa e illon B1995C testaram uma interace de um sistema de recu!eração de imagens 'ue !ossu+a recursos tanto !ara 0uscas visuais 'uanto ver0ais. Eonclu+ram 'ue era !rov"vel 'ue seus su;eitos B1 estudantesC utilizassem mais o m=todo ver0al do 'ue o visual, e sua sugestão era de 'ue isso !oderia ser devido 0asicamente P alta de amiliaridade com o m=todo visual. Mgle e Stone0raXer B1994C, ao analisar sua ex!eri>ncia com um grande sistema de recu!eração de imagens na
Rconsulta !or descrição su0;etivaO, 'ue envolve a indexação das !inturas com ad;etivos R'ue re!resentem Rim!ressesO do o0servador B!or exem!lo, R'uenteO, R0ril8anteO, R;a!onizadoOC. o mesmo modo, iLoreto et al. B1994C incor!oram recursos de consulta tanto visuais 'uanto descritivos em seu sistema de recu!eração geogr"ca. EaVXell B199C oi um dos 'ue ocalizaram o !ro0lema da recu!eração 0aseada exclusivamente em conteHdo Kuanto mais com!lexas as imagens mais di+cil ca !ara o usu"rio !roduzir um exem!lo visual utiliz"vel, e mais di+cil se torna eetuar o cote;o de !adres. /alvez se;a !reciso cote;ar !adres tridimensionais$ isso aumenta as diculdades. % ordem de diculdade cresce ainda mais se o usu"rio estiver interessado em recu!erar imagens 'ue conten8am determinado o0;eto dentro de uma imagem. Dor exem!lo, se o usu"rio 'uiser recu!erar Rtodas as imagens onde 8ouver um autom?velO, não seria muito di+cil re!resentar um carro com o aux+lio dos !rogramas atualmente dis!on+veis 'ue incor!oram ar'uivos de clip art B'ue cont>m uma grande seleção de o0;etos desen8adosC e !rogramas do ti!o Rerramenta de desen8oO. Kuando a Rconsulta-imagemO = su0metida P 0ase de dados !ara eetuar a com!aração, dever" ser !oss+vel recu!erar um carro 'ue este;a em 'ual'uer imagem, inde!endentemente de como este;a re!resentado e !osicionado - tarea 'ue não = im!oss+vel, mas atualmente lenta, 'ue exige o uso, intensivo e caro, de com!utadores B!. 1)9C.
claro 'ue 8" grande diversidade nas a!licaçes de recu!eração de imagens e = !rov"vel 'ue nem todas ten8am muito a gan8ar com alguma orma de indexação 0aseada em conteHdo. s estrelas triangulares amarelas dis!ostas em anel... Eonsulta ti!o es0oço desen8ado P mão encontrar imagens 'ue !areçam com determinado desen8o... Eonsulta !or exem!lo encontrar imagens 'ue !areçam determinada imagem... B!. 19C •
•
•
•
•
2o entanto, ele salienta a seguir 'ue a maioria dos usu"rios de imagens estar" mais interessada em 0uscas em Rsemntica de n+vel altoO #%&eto cont=m uma lesão :ela10o do o%&eto cont=m uma lesão !erto do l+'uido cere0ros!inal "lima uma imagem eliz empougar noite em qosemite B!. 19-)C • • • •
:nser B)C argumenta 'ue as 0uscas 0aseadas em conceitos continuarão a !redominar so0re as exig>ncias dos usu"rios em coleçes de ar'uivos de imagens, mas 'ue demandas menos tradicionais !or inormaçes visuais B!or exem!lo, coincid>ncia de im!resses digitais e logomarcas, recon8ecimento acial, classicação 0aseada em textura de imagens geol?gicasC exigem um m=todo 0aseado em conteHdo. M ideal = um sistema 8+0rido - em 'ue uma 0usca ver0al se;a usada !ara recu!erar imagens relevantes e estas !ossam então ser usadas !ara !rocurar imagens semel8antes com 0ase em caracter+sticas de conteHdo. :m conclusão, o m=todo. ideal de recu!eração de imagens talvez se;a a'uele 'ue com0ine acesso convencional !or meio de texto Btermos de indexação ou narrativa descritivaC com o cote;o de imagens. %ssim, uma 0usca com !alavras B0atal8a, ata'ue, lutaC recu!eraria uma imagem de determinado ti!o de cena e esta, !or sua vez, !oderia ser usada como insumo !ara localizar outras iguais.
sem os r?tulos ver0ais. Dara uma an"lise das vantagens e caracter+sticas dos tesauros visuais, nas 0uscas em 0ases de imagens, ver Yogan et al. B1991C. E8u B)1C, com 0ase em an"lise 0i0liom=trica da literatura, conclui 'ue não se vericou suciente interação entre os 'ue tra0al8am com a a0ordagem 0aseada em conteHdo e os 'ue tra0al8am com a 0aseada em conceito, em0ora a situação !ossa estar mel8orando. Fetadados e #ocabulários de indexação
% recu!eração de "udio a!resenta desaos 'ue são ainda maiores do 'ue os a!resentados !ela recu!eração de imagens. M cam!o !ode ser rigorosamente dividido em recu!eração de ala e recu!eração de mHsica Bem0ora outros ti!os de sons !ossam tam0=m estar !resentes em alguns casosC. Lu B)1C oerece um levantamento conciso e Htil desse cam!o, em0ora este;a agora um !ouco desatualizado, !ois os novos !rogressos ocorrem muito ra!idamente. :m virtude de uma tril8a sonora longa !rovavelmente a!resentar v"rios com!onentes de "udio - ala, mHsica e, !ossivelmente, outros sons B!or exem!lo, gritos de animais ou ondas lam0endo a !raiaC - o !rimeiro !asso consiste em classicar os v"rios com!onentes, e Lu descreve m=todos 'ue !odem ser usados !ara se conseguir isso automaticamente. Ms !rimitivos sistemas de recon8ecimento de ala somente !odiam uncionar com voca0ul"rios limitados e um nHmero limitado de alantes, !or=m, desde então, deu-se um not"vel avanço. Ms sistemas atuais são !re!arados mediante a gravação de se'>ncias de alas de um grande nHmero de alantes. a ase de !re!aração \ training ] resultam v"rios !rodutos, dos 'uais o mais im!ortante = um dicion"rio de !alavras com suas !ronHncias !oss+veis. ncia de !alavras 'ue a!resentar" a mel8or coincid>ncia ser" emitida como texto gravado. :sta ex!licação est" um tanto sim!licada Bem !rimeiro lugar, a unidade de ala usada !ara com!aração est" em n+vel inerior ao da !alavra - um onemaC mas serve como id=ia geral. %!licam-se os sistemas de recon8ecimento de ala !ara converter a !alavra alada em texto 'ue !ode ser !rocessado do mesmo modo 'ue outro texto o = !ara ns de recu!eração. Kuer dizer, = !oss+vel extrair !alavras#ex!resses 'ue uncionarão como termos de indexação ou azer 0uscas no texto inteiro com o em!rego dos ti!os de !rocedimento descritos no ca!+tulo 1. M desem!en8o dos sistemas de recon8ecimento de ala varia segundo alguns atores, tais como a mat=ria alada Bvariando, !or exem!lo, de nHmeros a not+cias geraisC, se;a a ala 'ue resulta da leitura ou de uma conversa es!ontnea, e o taman8o do voca0ul"rio envolvido. Lu B)1C salienta 'ue o recon8ecimento de algarismos !ode ser su!erior a 99f, mas 'ue o recon8ecimento de uma conversa teleQnica comum !ode cair !ara 4f. Ms !ro0lemas da recu!eração de documentos alados oram enunciados, de modo muito sucinto, !or Wec8sler et al. B)C, da seguinte orma M !rinci!al !ro0lema 'uando se a!lica o recon8ecimento de ala P recu!eração de documentos alados est" na exatidão do resultado do recon8ecimento. M recon8ecimento autom"tico de ala = uma tarea di+cil e, !or conseguinte, seus resultados muitas vezes cont>m grande 'uantidade de erros de reconhecimento. % !recisão do recon8ecimento de!ende !rinci!almente da 1C 'uantidade e 'ualidade dos dados acHsticos de prepara10o \training data], )C 'uantidade e g>nero dos dierentes alantes, 3C 'uantidade de unidades a serem recon8ecidas, e C do am0iente de gravação dos documentos alados. %demais, não 8" !ausas acHsticas entre !alavras na ala cont+nua, ao contr"rio dos es!aços em 0ranco num texto. Ms erros de recon8ecimento normalmente degradam a ec"cia de um sistema de recu!eração de documentos alados. São estrat=gias !ara su!erar tal !ro0lema 1C mel8orar a !recisão do recon8ecimento de ala, o 'ue re'uer enorme 'uantidade de dados de !re!aração e tem!o, e#ou )C desenvolver m=todos de recu!eração 'ue se;am mais tolerantes a erros B!. 163-16C.
1
ncia. 2o entanto, os onemas não são realmente !artes de !alavras !or'ue, na ala, as !alavras re'entemente Nuem ;untas, de modo 'ue as unidades recon8ecidas são se'>ncias de onemas. Isto =, o documento alado = transormado em se'>ncias on>micas, 0em como a consulta em!regada !ara interrogar a 0ase de dados. M tra0al8o de Wec8sler et al. B)C = caracter+stico das !es'uisas atuais so0re recu!eração de se'>ncias on>micas. natural 'ue os !rogramas de !rocessamento de ala ten8am mel8or desem!en8o no recon8ecimento de !alavras existentes BR in2voca%ulary OC num cor!us de !re!aração \training cor pus] do 'ue no recon8ecimento de !alavras não encontradas antes BR out2o2voca%ulary OC. Srinavasan e DetXovic B)C ex!licam
% decom!osição de voc"0ulos em su0voc"0ulos, isto =, onemas, normalmente mel8ora o recon8ecimento de !alavras !resentes no voca0ul"rio, em0ora não necessariamente o de !alavras ausentes do voca0ul"rio. Ms eeitos de !alavras ausentes do voca0ul"rio na recu!eração de documentos alados oram estudados !or Woodland et al. B)C. &roVn et al. B)1C relata +ndices de erros de !alavras de )f no caso de conversas teleQnicas de um Hnico alante, e um +ndice de cerca de 19f na ala !re!arada Bou se;a, não es!ontneaC de um locutor de not+cias em estHdio. Ms autores inormam 'ue os erros de !alavras variaram de 34 a 54f no caso de Rdados de ala do mundo realO, a de!ender de certos atores, como ru+do de undo, acHstica deciente e !artici!ação ou não de alantes nativos. :m0ora a redundncia com!ense alguns erros, = !rov"vel 'ue a recu!eração 'ue 0astante !re;udicada no caso de R"udio do mundo realO. &roVn et al. relatam valores de revocação da ordem de )5f e valores de !recisão !or volta de 16f !ara esse ti!o de a!licação, em0ora resultados muito mel8ores B!or exem!lo, !recisão de 5 a 6fC se;am alcançados em coleçes de teste menores com +ndices de erros de !alavras na aixa de 1 a 3f. %!esar dos not"veis !rogressos alcançados no recon8ecimento de ala, ainda ocorrem erros de transcrição em !ro!orção s=ria. Eomo salientam oreno et al. B))C Ms sistemas de recu!eração devem com!ensar os ) a 3f de +ndice de erros de !alavras 'ue normalmente ocorrem 'uando recon8ecedores de ala 'ue tra0al8am com grandes voca0ul"rios transcrevem "udio sem restriçes como notici"rios radioQnicos ou ala inormal B!. 4-49C.
%llan B))C, no entanto, alega 'ue mesmo altos +ndices de erros de transcrição !odem ser aceit"veis em a!licaçes de recu!eração esmo com um +ndice de erros de recon8ecimento de f, a ec"cia de um sistema comum de recu!eração de documentos cai a!enas 1f B!. 5C.
:le ex!lica 'ue isso se deve a v"rias razes 1C !alavras não recon8ecidas talvez não se;am necessariamente !alavras im!ortantes !ara a recu!eração$ )C redundncia Bse uma !alavra não or recon8ecida num lugar, !oder" ser recon8ecida em outroC$ 3C sinQnimos ou !arassinQnimos da !alavra não recon8ecida !odem ocorrer e ser recon8ecidos. 11
oreno et al. B))C oerecem um 0om a!an8ado so0re os atuais recursos !ara o recon8ecimento de ala Ms sistemas de recon8ecimento de ala 0aseados em !alavras adotam voca0ul"rios !reesta0elecidos 'ue incluem de 5 a 1 voc"0ulos. M sistema não !ode, !or denição, !resumir !alavras ora desse voca0ul"rio. :m0ora um voca0ul"rio de 1 !alavras inclua a maior !arte das !alavras aladas, todo documento inclui !e'uena !orcentagem de !alavras ausentes do voca0ul"rio 'ue !rovavelmente são !ortadoras de conteHdo, e sua não-inclusão !re;udicar" o desem!en8o da recu!eração. Dara contornar tal !ro0lema, o sistema !ode ada!tar o voca0ul"rio mediante o exame de documentos relativos ao tra0al8o. Dor exem!lo, um recon8ecedor de ala usado em sesses de tri0unais usaria documentos ;ur+dicos !ara a!render as !alavras do dicion"rio a!ro!riado. :m0ora esses voca0ul"rios es!ecializados reduzam o nHmero de !alavras ausentes do voca0ul"rio, não garantem sua eliminação B!. 49C.
:, em seguida, salientam 'ue os sistemas 0aseados no recon8ecimento de su0voc"0ulos oerecem vantagens %o inv=s de recon8ecer !alavras aladas, esses m=todos recon8ecem unidades su0voca0ulares - normalmente, onemas ou s+la0as - com as 'uais todas as !alavras são ormadas. M sistema de recu!eração de inormação decom!e os termos de 0usca em suas se'>ncias de su0voc"0ulos constituintes, e então examina os termos recon8ecidos !ara localizar se'>ncias 'ue corres!ondam P unidade de 0usca B!. 49C.
Sing8al e Dereira B1 999C.zeram ex!eri>ncias com a Rex!ansão de documentosO !ara com!ensar erros de transcrição na recu!eração da ala. M m=todo deles inclui a ex!ansão de um texto transcrito mediante o acr=scimo de !alavras de alta re'>ncia 'ue ocorrem em textosO relacionadosO, com!ensando, graças P redundncia, !alavras !erdidas na transcrição. Darece ser um m=todo muito tra0al8oso. &roVn et al. B)1C, cu;o tra0al8o tam0=m traz uma Htil visão da tecnologia de recon8ecimento de ala, descreve !es'uisas da I& so0re a!licaçes de Rmineração de alaO. ncia nos de0ates do nome de um uncion"rio !ode dis!arar uma 0usca nos registros uncionais, a m de recu!erar e tornar dis!on+veis inormaçes, como endereço, teleone, gru!o onde este;a lotado, res!onsa0ilidades, ex!eri>ncia. Mutras instituiçes tam0=m zeram !es'uisas so0re tecnologia de a!oio a reunies. &roVn et al. tam0=m descrevem !es'uisas so0re a mineração de c8amadas de televendas. %s !es'uisas so0re recu!eração de documentos alados são 8o;e acilitadas !ela exist>ncia de uma 0ase de dados de documentos alados no am0iente /7:E B/ext 7etrieval EonerencesC Bver ca!+tulo seguinteC. M corpus /7:E 6 consistia em cerca de 1 8oras de notici"rios radioQnicos, somando cerca de 3. not+cias. Ms gru!os de !es'uisas !artici!antes tra0al8aram com transcriçes desse corpus , de dierentes 'ualidades, inclusive uma !re!arada !or seres 8umanos e considerada !ereita, uma !re!arada !or um sistema de recon8ecimento de ala com cerca de 34f de +ndice de erros de !alavras, e outra com um +ndice de erros !or volta de 4f. Ms gru!os !artici!antes testaram seus m=todos de recu!eração em )3 t?!icos !r=-selecionados de cada transcrição B*oor8ees e Yarman, 1999C. %s !es'uisas so0re interaces de ala em a!licaçes de recu!eração remontam a v"rios anos Bver, !or exem!lo, Smit8 et al., 199C. %0ordagens mais modernas são exem!licadas !elo tra0al8o de Feder e Yo00s B1994C. %o analisar o em!rego da ala 8umana !ara alimentação de dados em com!utador, S8neiderman B)C a!resenta motivos !elos 'uais as limitaçes do ser 8umano B!or exem!lo, adiga, im!aci>ncia, diculdades de corrigir errosC seriam mais im!ortantes do 'ue as limitaçes tecnol?gicas. =todos modernos !ara sintetizar e ar'uivar sons eletronicamente tornam dis!on+vel grande 'uantidade de sons B!or exem!lo, !ara mHsicosC, mas a recu!eração de um som es!ec+co desse ar'uivo constitui grande !ro0lema. Feiten e @nzel B199C descrevem uma a0ordagem da indexação e recu!eração de sons !or meio de redes neurais. M +ndice de recu!eração = criado automaticamente. % ca!acidade de recon8ecer e rotular Bisto =, indexarC sons automaticamente tem muito em comum com o !rocessamento necess"rio !ara recon8ecer imagens automaticamente. Eomo salientam Dicard e inXa B1994C, tanto 8" uma Rtextura de sonsO 'uanto uma textura de imagens. %ssim, seria !oss+vel desenvolver t=cnicas !ara identicar automaticamente certos sons Bum sino a 0adalar, "gua a correr, a!lausosC mediante alguma orma de cote;o de !adres BsonorosC. % recu!eração de sons = analisada em 1)
tra0al8o de &lum et al. B1996C, 'ue descrevem um Rnavegador de sonsO desenvolvido !ara !ossi0ilitar 0uscas diusas em 0ases de dados de "udio. Ms recursos incluem consulta, !or exem!lo, Bisto =, Rencontre sons semel8antes a... RC. 5ecuperação de mHsica
M o0;etivo das a0ordagens modernas da recu!eração de mHsica = [res!onder consultas de mHsica ormuladas musicalmente^ BoVnie e 2elson, )C isto =, !ermitir 'ue se;a eita uma 0usca 0aseada numa entrada musical B!or exem!lo, cantada ou cantaroladaC. % 8ist?ria da recu!eração de inormação musical remonta P d=cada de 195, mas a maioria dos !rogressos alcançados se deu a !artir da d=cada de 199. :ncontra-se condensada nos anais de tr>s sim!?sios internacionais so0re a mat=ria, realizados em ), )1 e )). Ms tra0al8os de ) estão dis!on+veis no s+tio Uhttp:KKciir.cs.umass.eduKmusic3JJJKpapers.html e os de )1 em Uhttp:KKismir3JJ/.indiana.eduKpapers.html. ncias /7:E. % recu!eração de mHsica = mais com!lexa do 'ue a de ala. Lu B)1C divide o cam!o em 1C mHsica estruturada ou sint=tica, e )C mHsica 0aseada em amostras \ sample2%ased ]. 2a !rimeira, as notas musicais são gravadas como algoritmos e linguagens de controle, 'ue torna o cote;o com as consultas Bna orma de uma se'>ncia de notasC relativamente "cil, !elo menos no caso de coincid>ncia exata. % detecção de !assagens Rde mHsica Rsemel8anteO = mais com!licada. uito mais com!lexa = a recu!eração de mHsica 'ue não este;a gravada em ormato estruturado. Lu B)1C reere-se a essa mHsica comoO 0aseada em amostrasO !or'ue ela im!lica o recon8ecimento e extração de samples \amostras] musicais. :le identica duas a0ordagens de indexação#recu!eração. % !rimeira 0aseia-se na extração de Rcaracter+sticas acHsticasO Bcomo audi0ilidade, tom, 0ril8o, largura de 0anda e 8armonicidadeC e 'ue !odem ser calculadas !ara cada R'uadroO da com!osição gravada. ncia de s+m0olos 'ue re!resentam essas alteraçes de tom. %lternativamente, cada nota musical !ode ser re!resentada !or um valor de tom selecionado de um con;unto de valores-O!adrãoO de tom numa 0ase de maior coincid>ncia. e novo, a com!osição musical ser" re!resentada !or uma se'>ncia de caracteres 'ue re!resentam o valor do tom. Li!!incott B))C nos oerece uma descrição 0em Htil e concisa da'uilo 'ue as atuais a0ordagens da recu!eração de mHsica estão !rocurando realizar %ntigamente, os usu"rios 'ue !rocuravam inormaçes so0re mHsica voltavam-se !ara ontes im!ressas 'ue contin8am metadados registrados P mão e ordenados !or t+tulo, com!ositor e outras categorias. M0viamente, os m=todos de acesso reNetiam t=cnicas de recu!eração da =!oca, 0aseadas em material im!resso !ara recu!eração de inormação 0i0liogr"ca, e tam0=m !ressu!un8am algum con8ecimento musical !r=vio ou a !resença de um 0i0liotec"rio. @rande !arte das !es'uisas atuais so0re recu!eração automatizada de inormação musical 0aseia-se em caracterizaçes da !r?!ria mHsica, ao inv=s de inormaçes so0re ela. Dor exem!lo, ao inv=s de solicitar uma 0usca !or t+tulo da com!osição, o usu"rio entra com uma consulta no ormato de "udio e recu!era resultados similares a essa consulta. %s im!licaçes !ara os usu"rios comuns de sistemas de recu!eração de mHsica 0aseados em conteHdo são im!ortantes, !ois não = !reciso o con8ecimento 0i0liogr"co !r=vio de uma com!osição musical$ ao contr"rio, 0astar", !ara ns de recu!eração, um trec8in8o de mHsica a Nuir na mente do usu"rio B!. 136C.
:ste tra0al8o = uma ?tima s+ntese de v"rios m=todos 'ue v>m sendo !es'uisados. Liu e /sai B)1C salientam 'ue % maneira mais direta de 'ue um usu"rio leigo dis!e !ara consultar as 0ases de dados de mHsica = cantarolar uma com!osição como uma consulta-exem!lo !ara recu!erar o0;etos musicais similares B!. 45C.
13
m a!roximadamente a mesma extensão de uma consulta eita com mHsica cantarolada. 2a indexação e recu!eração de mHsica, = !reciso distinguir entre mHsica monoQnica Bnen8uma nota começa at= 'ue a nota atual ten8a terminado de soarC e a mHsica !oliQnica Buma nota !ode começar antes 'ue a anterior termineC. % mHsica !oliQnica = mais comum, !or=m mais com!lexa !ara as o!eraçes de indexação e recu!eração. DicXens B)1C descreve os !ro0lemas de seleção de caracter+sticas !ara indexação e recu!eração de mHsica !oliQnica. iversas a0ordagens da indexação e recu!eração de mHsica !oliQnica oram a!resentadas. *er, !or exem!lo, oveA B)1C e oraisamA e 7ger B)1C. oVnie e 2elson B)C descrevem um m=todo de recu!eração de mHsica 0aseado no tom, es!ecicamente a dierença entre dois tons, con8ecida como RintervaloO. %s melodias de uma coleção de cançes olcl?ricas oram [convertidas em re!resentaçes de um Hnico intervalo de melodias monoQnicas^. :stas oram então ragmentadas em su0seçes designadas Rn-gramasO, 'ue são usadas !ara ormar R!alavras musicaisO. Isso !ermite uma a0ordagem da recu!eração 'ue se assemel8a P 0usca de !alavras na recu!eração de textos e !ossi0ilita 'ue se;a a!licado um sistema de !rocessamento 0aseado em textos Bo S%7/ de SaltonC 'ue !ermite recu!eração em ordem de !rov"vel relevncia. !oss+vel tam0=m usar entrada em ormato de "udio !ara 0uscas em 0ase de dados de !artituras musicais. c2a0 et al. B)C descrevem um m=todo !ara recu!erar !artituras de uma 0ase de dados em res!osta a R!oucas notas entoadas ou cantaroladas num microoneO. % interace adotada transcreve a entrada acHstica em notação musical comum 'ue !ode ser usada !ara cote;o se'encial e recu!eração de mHsica em ordem de !rov"vel relevncia. Seu !rot?ti!o R!rova de conceitoO oi testado numa 0ase de dados de cançes olcl?ricas. Eonclu+ram 'ue 2ão = uma em!resa sim!les azer 0uscas em grandes 0ases de dados de mHsica e recu!erar itens em 'ue ocorra um determinado tema ou se'>ncia de notas, tendo em vista !rinci!almente as im!recises 'ue ocorrem 'uando as !essoas entoam melodias, mas isso est" com certeza ao alcance da tecnologia atual B!. 113C.
&Ard e EraVord B))C zeram uma revisão do estado atual dos con8ecimentos a res!eito da indexação e recu!eração de mHsica e conclu+ram 'ue o !rogresso alcançado nessa "rea oi muito limitado %!esar de ex!ressivo nHmero de !ro;etos de !es'uisa 8aver se voltado !ara a recu!eração de inormação musical, nas Hltimas tr>s d=cadas, esse cam!o ainda est" muito imaturo. Doucos dizem res!eito P mHsica com!lexa B!oliQnicaC$ os m=todos de avaliação ainda estão numa eta!a de desenvolvimento muito !rimitiva$ nen8um dos !ro;etos enrenta o !ro0lema de 0ases de dados 'ue são, realisticamente, de grande escala. uitos dos !ro0lemas a serem enrentados se devem P natureza da !r?!ria mHsica. :ntre eles estão as 'uestes ligadas P !erce!ção 8umana e P cognição da mHsica, es!ecialmente no 'ue tange P recon8eci0ilidade da rase musical \...] e o !ressu!osto comum de 'ue 0uscas so0re o tom Bou contorno do tomC !rovavelmente 0astariam !ara atender a todas as nalidades \...] talvez se;a verdadeiro !ara a maior !arte da mHsica monoQnica Bde uma s? vozC, mas = certamente inade'uado !ara mHsica !oliQnica Bde muitas vozesC. esmo no caso monoQnico !ode levar a resultados e'uivocados. M ato, 8" muito admitido em !ro;etos 'ue dizem res!eito P mHsica monoQnica, de 'ue uma !assagem recon8ec+vel normalmente não = id>ntica ao !adrão de 0usca signica 'ue 'uase sem!re = necess"ria uma coincid>ncia a!roximada, mas tam0=m isso se torna seriamente com!licado !elas demandas da mHsica !oliQnica. Kuase todos os m=todos de recu!eração da inormação de textos a!?iam-se na identicação de unidades a!roximadas de sentido, isto =, !alavras.
Sistemas multim&dias
%t= agora este ca!+tulo tratou da recu!eração de imagens e da recu!eração de sons. 2o entanto, tam0=m estão em curso !es'uisas so0re !ro0lemas de indexação e recu!eração relativos a a!resentaçes verdadeiramente multim+dias, como as transmisses de televisão.
!rot?ti!o desse sistema !ossui recursos !ara sumarização1 e indexação. M autor descreve o !rimeiro deles da seguinte orma % sumarização = uma re!resentação estrutural do conteHdo em linguagem alada 'ue = muito !oderosa e Nex+vel como +ndice !ara gerenciamento de inormaçes 0aseadas em conteHdo. :ste resumo, 'ue = !roduzido automaticamente !elo sistema, inclui caracter+sticas extra+das, como nomes de !essoas, lugares e organizaçes mencionados no transcrito, 0em como as identidades e localizaçes dos alantes na gravação B!. 9C.
M Nuxo cont+nuo de !alavras = automaticamente segmentado em R!assagens 'ue são tematicamente coerentesO e cada !assagem = indexada mediante a atri0uição autom"tica de Rr?tulos t?!icosO extra+dos de um con;unto !reesta0elecido de mais de 4 desses r?tulos. :stes são classicados em ordem de !ro0a0ilidade de ade'uação e são atri0u+dos a cada !assagem os r?tulos de classicação mais alta. Im!ortante !ro;eto de indexação e recu!eração de multim+dia = a Inormedia igital *ideo Li0rarA da Earnegie ellon
Wactlar et al. armam ser !oss+vel um +ndice de erros inerior a )f no recon8ecimento de ala e 'ue a transcrição de um notici"rio !ode a!arecer na 0ase de dados duas 8oras e meia de!ois de 8aver sido transmitido. &roVn et al. B)1C oerecem mais esclarecimentos M !ro;eto de !es'uisa Inormedia criou uma 0i0lioteca digital de um mil8ão de mega0Ates em 'ue descritores o0tidos automaticamente !ara v+deo são utilizados na indexação, segmentação e acesso ao conteHdo da 0i0lioteca. Eom0ina recon8ecimento de ala, !rocessamento de imagens e t=cnicas de com!reensão da linguagem natural !ara o !rocessamento autom"tico de v+deo, a m de !roduzir uma s+ntese \ s-im] visual, 'ue diminui o tem!o de visualização sem !erda de conteHdo. Merece tr>s maneiras de visualização dos resultados das 0uscas 'uadros-!Qster \ poster rames], tiras de lme e s+nteses. % visualização em 'uadros-!Qster a!resenta os resultados da 0usca em ormato de 'uadros!Qster, em 'ue cada 'uadro re!resenta um R!ar"graoO de v+deo. % visualização em tiras de lme reduz a necessidade de visualizar cada !ar"grao de v+deo em sua totalidade ao oerecer !"ginas de story%oard !ara r"!ida visualização. %s su0seçes mais relevantes do !ar"grao de v+deo são exi0idas como cenas-c8ave e as !alavras-c8ave são nitidamente marcadas. % recu!eração com0inada de !alavras e ones tam0=m oi investigada no !ro;eto Inormedia, onde se utilizou um +ndice invertido !ara transcrição on=tica, 'ue inclui su0se'>ncias on=ticas de tr>s a seis ones. 2a recu!eração o +ndice de documentos com !alavras e a transcrição on=tica são !es'uisados em !aralelo e os resultados são undidos. :x!eri>ncias com um corpus de cerca de 4 not+cias dos notici"rios da %&E e da E22 BEa0le 2eVs 2etVorXC, com o em!rego de +ndices com0inados de !alavras e ones, resultou numa !recisão m=dia de ,56 com um desem!en8o glo0al de ,5f do de um sistema de recu!eração de texto com!leto. 2o caso, !or=m, de "udio do mundo real com alto +ndice de erros de !alavras de 6-f, registrou-se uma 'ueda dr"stica da !recisão e revocação !ara ,1 6 e ,)5, res!ectivamente B!. 99-99C.
Ms !ro0lemas im!licados na criação autom"tica de resllmos de di"logo alado são 0em analisados !or _ec8ner B)1C. 1
14
Ms recursos de 0uscas de imagens do sistema Inormedia incluem detecção de cor Bo usu"rio es!ecica cores e regies de interesse a serem !rocuradas entre as imagensC. *er Wactlar et al. B1999C. Datel e Set8i B1995C descrevem m=todos 'ue desenvolveram !ara classicar segmentos de lmes cinematogr"cos mediante !rocessamento de "udio. e in+cio, o sistema somente !odia identicar categorias gen=ricas Bcomo, !or exem!lo, Rmusical RC, !or=m os autores sugerem 'ue ele !oderia ser mais a!rimorado de modo a identicar es!ecicamente ti!os de cenas Bcena de ação, cena de dança, cena romntica, e assim !or dianteC. Dosteriormente BDatel e Set8i, 1996C estenderam sua !es'uisa P identicação dos alantes B!or exem!lo, atores em trec8os em v+deo de lmesC. %dami et al. B)1C !ro!em um sistema 'ue oerece acesso a documentos multim+dias !or meio de erramentas an"logas Ps de um livro im!resso uma descrição 8ier"r'uica do conteHdo do item Bsimilar a uma !"gina convencional de sum"rioC ade'uada !ara !es'uisa, e um R+ndice anal+ticoO 0aseado em !alavra-c8ave Ban"logo ao +ndice do nal de um livroC. Sua !es'uisa tem !or o0;etivo !roduzir essas erramentas de modo autom"tico, e mostram um exem!lo 0aseado na an"lise de um ;ogo de ute0ol. @auvain et al. B)1C descrevem um sistema de !artil8amento e transcrição autom"ticos de transmisses de televisão e r"dio. Segmentos de não-ala das transmisses são identicados e removidos BautomaticamenteC e os segmentos restantes são agru!ados e rotulados de acordo com a largura de 0anda e o g>nero. ncia de uma m=dia de erros de !alavras de )f. %onclus$es
Youve muito !rogresso na indexação e recu!eração de imagens na Hltima d=cada, e algum avanço se deu na indexação e recu!eração de sons. Ms inHmeros estudos realizados so0re a reação do o0servador Ps imagens são, contudo, de 'ualidade vari"vel. %lguns são Hteis. as outros, es!ecialmente os realizados como !es'uisa !ara redação de teses, deixam muito a dese;ar. :m0ora se;am a!resentadas minuciosas an"lises de dados, um nHmero muito grande desses estudos c8ega a concluses 'ue não são nem mesmo a0ordadas !elos dados coletados, dando a im!ressão de 'ue as concluses oram denidas antes da realização de 'ual'uer estudo. Ms cam!os da recu!eração de imagens e sons atra+ram muitos !es'uisadores 'ue não !ossu+am 'ual'uer ex!eri>ncia anterior com a recu!eração de textos. isso resultou o surgimento de uma nova terminologia !ara id=ias muito antigas, o 'ue, na realidade, = muito lament"vel. alar naturalmente, com um voca0ul"rio virtualmente ilimitado B!. )9C
era totalmente irreal da maneira como oi ormulada. Yaas B1995C, citando 7udnicXA, levanta uma 'uestão im!ortante 'ue = !ertinente Ps !ers!ectivas nessa "rea Y" uma dierença entre recon8ecimento de ala e com!reensão de ala o recon8ecimento de ala re'uer 'ue um sistema identi'ue as !alavras numa ex!ressão oral, en'uanto a com!reensão de ala re'uer 'ue um sistema tam0=m tr"te dos !ro0lemas ligados P com!reensão da linguagem natural, como an"ora, eli!se e outros enQmenos do discurso. M recon8ecimento de ala = Htil !ara tareas estruturadas, como entrada de dados e emissão de comandos sim!les, mas um di"logo, de 'ual'uer ti!o, exige com!reensão de ala B!. 9C.
% com!reensão da ala 8umana !elo com!utador não = uma !ers!ectiva 'ue este;a !resente no 8orizonte imediato. esmo no seio da comunidade de !es'uisadores desse cam!o, 8" uma am!la diverg>ncia de o!inies 'uanto ao 'ue oi alcançado !ela tecnologia de recon8ecimento de ala e o 'ue !oder" suceder no curto !razo. Levinson B1994C, !or exem!lo, acredita 'ue ainda se !assar" muito tem!o antes 'ue sur;am sistemas de real valor comercial 15
% o!inião da maioria assegura 'ue logo os mel8oramentos t=cnicos tornarão o recon8ecimento de ala 0aseado em grandes voca0ul"rios comercialmente vi"vel !ara a!licaçes es!ec+cas. in8a !revisão \...] = 'ue os mel8oramentos t=cnicos surgirão de modo !enosamente lento, mas 'ue dentro de a 4 anos o recon8ecimento de ala com n+veis de desem!en8o dos seres 8umanos estar" oni!resente. Isto =, !rogressos t=cnicos incrementais resultarão, em curto !razo, numa tecnologia r"gil de valor comercial relativamente modesto em mercados muitos es!eciais, en'uanto im!ortantes avanços tecnol?gicos resultantes de uma verdadeira mudança de !aradigma na ci>ncia su0;acente !ossi0ilitarão Ps m"'uinas mostrar n+veis 8umanos de com!et>ncia na comunicação !or meio da linguagem alada. Isso, !or sua vez, resultar" num vasto mercado de incalcul"vel valor comercial B!. 994C.
2o entanto, Srinavasan e &roVn B))C risam 'ue, em0ora a tecnologia da ala estivesse lenta !ara encontrar a!licaçes comerciais, !arece 'ue agora est" !ronta !ara decolar comercialmente % conectividade da 7ede, a tecnologia sem o e os dis!ositivos !ort"teis de mão com0inados com o recon8ecimento ecaz de ala 0aseado na gram"tica \...] - !odem nalmente levar o recon8ecimento de ala a ter a im!ortncia de um mercado de massa B!.3C.
%rmativas exageradas tam0=m ocorrem no cam!o da recu!eração de imagens. uitos !es'uisadores nesse terreno são com!letamente ing>nuos em suas crenças e ex!ectativas. Dara citar somente um exem!lo, @u!ta e Tain B1996C, num estudo !anormico da recu!eração de imagens, Htil !or outros motivos, estimula-nos da seguinte orma Ms usu"rios !odem agora extrair, armazenar e recu!erar conteHdo inormacional R0aseado em imagensO - metadados e atri0utos visuais - de m+dia visual de modo tão "cil 'uanto a !rocura de documentos textuais B!. 61C.
%'ueles 'ue vimos tra0al8ando nessa "rea 8" mais de anos sa0emos 'ue a recu!eração de documentos textuais est" muito longe de ser "cil em 0ases de dados de !orte signicativo. im!ortante admitir 'ue as !es'uisas so0re recu!eração de imagens ou sons de!endem muito mais das t=cnicas de indexação autom"tica do 'ue da indexação eita !or seres 8umanos. Dor isso, as a0ordagens 'ue serão o0;eto dos dois !r?ximos ca!+tulos relacionam-se 0em de !erto com o conteHdo deste.
16
%ap&tulo /; 0 Buscas em textos % a!licação de com!utadores P recu!eração de inormaçes, 'ue teve in+cio na d=cada de 194, !ossi0ilitou a realização de 0uscas em textos em ormato eletrQnico, sem 'ue 8ouvesse a necessidade de a!licar 'ual'uer modalidade de indexação a este texto o !rograma utilizado na recu!eração !rocura determinadas !alavras, ou com0inaçes de !alavras, no !r?!rio texto, onde as !alavras escol8idas !or 'uem az a 0usca são indicativas da'uilo 'ue o texto est" examinando. %s 0uscas eitas em textos !elo com!utador !odem ser denominadas R0uscas em textosO ou R0uscas em linguagem naturalO. M texto onde são eitas as 0uscas !ode ser o conteHdo com!leto de uma !u0licação Bartigo, relat?rio, ou at= um livroC ou !arte dela o resumo, extrato ou a!enas o t+tulo. %s 0uscas eitas num texto integral são Ps vezes denominadasO 0uscas em texto com!letoO. % via0ilidade de 0uscas em textos cresceu notavelmente ao longo dos anos, na medida em 'ue aumentou o !otencial dos com!utadores, os custos de !rocessamento e armazenamento diminu+ram, e um volume cada vez maior de textos tornou-se dis!on+vel em ormato eletrQnico, em grande !arte como su0!roduto de v"rias ormas de !u0licação. M desenvolvimento da 7ede, 'ue torna acess+vel enorme 'uantidade de textos a um imenso nHmero de usu"rios, tornou rotineira, ao inv=s de exce!cional, a 0usca em textos. Dor causa disso, o interesse !or m=todos de 0uscas em textos aumentou notavelmente na Hltima d=cada, tanto na comunidade de !es'uisa 'uanto em setores governamentais e comerciais. :ssa "rea de 0uscas em textos vem avançando desde 1991, graças ao !rograma /IDS/:7 e a v"rias outras atividades com ele relacionadas. M /IDS/:7 oi uma iniciativa da eense %dvanced 7esearc8 Dro;ects %gencA BM%7D%C, em cola0oração com o 2ational lnstitute o Standards and /ec8nologA, outros ?rgãos governamentais e v"rias em!resas comerciais. M !rograma teve v"rios com!onentes, dos 'uais o mais !ertinente ao conteHdo deste ca!+tulo oram as coner>ncias anuais intituladas /ext 7etrieval Eonerences B/7:ESC, de 'ue oram realizadas 11 at= )). %s atividades das /7:Es im!ulsionam o estado de desenvolvimento da "rea, ao !ermitir 'ue dierentes gru!os de !es'uisas testem e com!arem seus !rogramas de recu!eração em condiçes controladas B0ases de dados, consultas e avaliaçes de relevncia mantidas constantesC. Mutros com!onentes do /IDS/:7 serão ocalizados no ca!+tulo seguinte. 2a realidade, este ca!+tulo e o !r?ximo se inter-relacionam tão de !erto 'ue deverão, de ato, ser lidos como uma unidade. hs vezes, oi uma decisão um tanto ar0itr"ria decidir 'uanto ao 'ue incluir neste ca!+tulo e ao 'ue !assar !ara o seguinte. Ms !rocedimentos modernos de !rocessamento de textos alegam 'ue a!licam t=cnicas oriundas de !es'uisas em intelig>ncia articial, e a ex!ressão R!rocessamento inteligente de textosO = Ps vezes em!regada !ara designar esse ti!o de !rocesso Bver, !or exem!lo, Taco0s, 199)cC. :ste ca!+tulo !assar" em revista os m=ritos relativos das a0ordagens da recu!eração da inormação 0aseadas em textos Blinguagem naturalC e em voca0ul"rios controlados, ar" um levantamento do desenvolvimento das 0uscas em textos desde a d=cada de 194 e terminar" com consideraçes so0re os atuais recursos nesta "rea. Eonsidera-se a ex!ressão linguagem natural como sinQnimo de Rdiscurso comumO, isto =, a linguagem utilizada 8a0itualmente na escrita e na ala, e 'ue = o contr"rio de Rvoca0ul"rio controladoO. 2o contexto da recu!eração da inormação, a ex!ressão normalmente se reere Ps !alavras 'ue ocorrem em textos im!ressos e, !or isso, considera-se como seu sinQnimo a ex!ressão Rtexto livreO.
Ms m=todos RmodernosO 'ue visam ao uso da linguagem natural na recu!eração da inormação remontam ao sistema
ser re!resentado ade'uadamente !or meio de !alavras sim!les BunitermosC extra+das do texto dos documentos !or indexadores com um n+vel de es!ecialização relativamente 0aixo. :scritos P mão ou datilograados, os nHmeros dos documentos eram RlançadosO em c8as !ro;etadas !ara esse m, cada uma re!resentando um Hnico termo, e as 0uscas eram eitas com!arandose os nHmeros em duas ou mais c8as Bde modo muito !arecido com um moderno sistema em lin8a 'ue com!ara listas de nHmeros associados a termosC. /au0e teve consider"vel inNu>ncia so0re o desenvolvimento de sistemas de recu!eração da inormação na d=cada de 194. Inelizmente, todavia, o sistema ncia de controle do voca0ul"rio. /odavia, 'uando os com!utadores oram inicialmente a!licados P recu!eração da inormação, em escala im!ortante, em ns da d=cada de 194 e in+cio da d=cada de 195, recon8eceu-se 'ue as 0uscas em textos, e mesmo 0uscas em textos integrais, 8aviam se tornado uma !ossi0ilidade sedutora. %o se estudar a 8ist?ria dos sistemas inormatizados de recu!eração da inormação, recon8ecem-se duas lin8as !rinci!ais de desenvolvimento.
!o!ular, !eri?dicos cient+cos, enciclo!=dias e outras ontes encontram-se agora acess+veis em ormato de texto com!leto. Ms s+tios da 7ede da i nternet consistem ma;oritariamente em texto, de modo 'ue uma verdade indu0it"vel = 'ue as 0uscas em textos su!eram 8o;e grandemente as 0uscas 'ue envolvem voca0ul"rios controlados. %s 0uscas em textos são realizadas de dois modos. 2o !rimeiro m=todo, !alavras 'ue não se;am comuns são inclu+das em ar'uivos RinvertidosO, 'ue mostram, !ara cada !alavra, 'ual o documento em 'ue ela a!arece Be re'entemente sua !osição exata nesse documentoC. % 0usca = realizada nesses +ndices Bos 'uais, no tra0al8o originalmente desenvolvido em Ditts0urg8, eram denominadosO concordnciasOC ao inv=s de ser realizada no !r?!rio texto. % outra alternativa = eetuar uma 0usca se'encial no texto, !alavra !or !alavra, sem utilizar 'ual'uer +ndice. :sta era a t=cnica comumente em!regada !ara !restar serviços de isseminação Seletiva de Inormaçes BSIC a !artir de 0ases de dados, antes de estarem am!lamente diundidos os sistemas em lin8a. Kuer dizer, os !ers de interesses de usu"rios, 'ue se ac8avam armazenados, eram com!arados com atualizaçes !eri?dicas da 0ase de dados B!alavras nos t+tulos ou resumosC. :ste m=todo RcaudalosoO de 0uscas em textos era mais atraente no caso de a!licaçes de SI do 'ue em 0uscas retros!ectivas devido a 'ue o volume de texto a ser examinado em 'ual'uer momento = muito menor na SI. ais tarde, contudo, oram desenvolvidos com!utadores es!ecializados 'ue !odiam azer 0uscas em textos de modo tão r"!ido 'ue se tornaram 0astante vi"veis as 0uscas RcaudalosasO at= mesmo em 0ases de dados muito grandes. Dor exem!lo, o Fast ata Finder Bqu et al., 196C alegava 'ue realizava 0uscas em textos P velocidade de 1),4 mil8es de caracteres !or segundo, o 'ue e'uivale a cerca de 1),4 romances de 4 !"ginas a cada segundo. :m0ora o m=todo RcaudalosoO não se;a conceitualmente dierente do m=todo de +ndice invertido, !ossui, de ato, algumas caracter+sticas mel8oradas. Dor exem!lo, = muito mais "cil realizar 0uscas com RragmentosO de !alavras, !rinci!almente se'>ncias de caracteres 'ue ocorram no meio ou no m de um voc"0ulo. Ms mecanismos de 0usca 'ue oram desenvolvidos na internet uncionam !or interm=dio da com!ilação de R+ndicesO de textos !resentes nos v"rios s+tios e não !assam de ar'uivos invertidos convencionais. 5ecursos auxiliares de busca
esmo nos !rim?rdios das 0uscas em textos, v"rios recursos auxiliares ;" 8aviam sido desenvolvidos !ara a;udar 'uem realizava as 0uscas. M mais !rimitivo deles = a a!resentação Bou sa+da im!ressaC em ordem ala0=tica das !alavras RsignicativasO 'ue ocorrem na 0ase de dados, com uma indicação da re'>ncia com 'ue cada uma delas ocorre. /am0=m era comum algum ti!o de indicador de distncia entre as !alavras Bo!erador m=tricoC. % ca!acidade de es!ecicar a !roximidade entre duas !alavras = !articularmente Htil em 0uscas em 0ases de dados de textos com!letos onde !alavras 'ue ocorrem em !ar"graos dierentes !odem não estar de modo algum relacionadas diretamente entre si. /alvez o recurso auxiliar mais !oderoso das 0uscas em linguagem natural se;a a ca!acidade de realiz"-las em !artes de !alavras - 'uer dizer, azer seu truncamento ou eetuar 0uscas com ragmentos de !alavras. % utilidade das 0uscas com ragmentos de !alavras oi analisada !or Williams B196)C. Ms !rogramas de com!utador mais Nex+veis !ermitem 'ue se açam 0uscas com 'ual'uer ragmento truncamento P direita B!or exem!lo, todas as !alavras iniciadas com RcondensOC, truncamento P es'uerda Btodas as !alavras 'ue terminam com RmicinaOC, truncamento com RinxosO Bes!ecicam-se o começo e o m mas não o meio da !alavraC, ou 'ual'uer com0inação !oss+vel desses recursos B!or exem!lo, todas as !alavras 'ue incluam a cadeia de caracteres RmagnetO, inde!endentemente de onde a!areçaC. :m0ora se;am !otencialmente Hteis em todos os cam!os do con8ecimento, as 0uscas com ragmentos de !alavras !arecem ter mais utilidade em ci>ncia e tecnologia, onde a linguagem costuma ser mais !revis+vel. :m certo sentido, esse recurso !ermite 'ue se com!ense a aus>ncia de um voca0ul"rio controlado mediante a ormação de classes Hteis de !alavras numa estrat=gia. %ssim, as 0uscas com o radical RcondensO !rovavelmente !ossi0ilitarão a recu!eração de um gru!o de documentos 'ue terão algo a ver com condensadores e condensação$ 0uscas com o suxo RmicinaO resultarão em documentos 'ue tratam de anti0i?ticos$ e 0uscas com Rtri...co0altatoO Binxo não es!ecicadoC recu!erarão uma am+lia de com!ostos 'u+micos ans. %s 0uscas com ragmentos de !alavras oerecem alguns recursos do tesauro convencional, mas o azem 'uando da sa+da, ao inv=s do controle eito na eta!a de entrada. Dor exem!lo, a !ossi0ilidade de 0uscas com os suxos R0i?ticos ou ilina ou micina ou ciclina ou.mixinaO 'uase e'uivale a uma entrada Ranti0i?ticosO num tesauro convencional 'ue leva a uma lista de termos es!ec+cos relativos a anti0i?ticos. M tesauro convencional = um 19
voca0ul"rio !r=-controlado, en'uanto a ormação de classes de !alavras ou ragmentos de !alavras numa estrat=gia de 0usca = uma es!=cie de !rocesso de R!?s-controleO. -inuaem natural #ersus #ocabulário controlado: alumas consideraç$es erais
%lguns atores im!ortantes 'ue inNuem no desem!en8o dos sistemas de recu!eração da inormação !odem ser exem!licados re!ortando-nos mais uma vez P gura 3. 2ela, P es'uerda, se encontram tr>s re!resentaçes em texto livre de um documento Bum t+tulo e dois resumos de extensão vari"velC, en'uanto P direita a!arecem dois con;untos de termos de indexação Bco0ertura seletiva e exaustiva do conteHdo tem"ticoC. Ms termos oram extra+dos do 7B$IS thesaurus B2açes mais !ontos de acesso do 'ue o resumo sucinto, o 'ual, !or sua vez, !rov> mais do 'ue o t+tulo. o mesmo modo, a indexação exaustiva !rov> um nHmero de !ontos de acesso 'uase tr>s vezes maior do 'ue o !rovido !ela indexação seletiva. ncias de !az, en'uanto o resumo ex!andido acrescenta outros !ontos de acesso, tais como esorços !ela !az e l+deres do Mriente =dio. :videntemente, isso tam0=m ocorre na com!aração entre indexação seletiva e indexação exaustiva. % indexação seletiva reNete a!enas o t+tulo do item e não !rov> !ontos de acesso adicionais ao t+tulo, e a indexação exaustiva e'uivale mais ou menos em am!litude ao resumo ex!andido. %o se considerar a recu!era0ilidade do item a!resentado, = a extensão do registro 'ue tem maior im!ortncia, e não o ti!o de voca0ul"rio. % indexação seletiva, 'uanto a isso, e'uivale ao t+tulo, en'uanto a indexação exaustiva se situa em algum !onto entre os dois resumos na medida em 'ue a0range o conteHdo tem"tico do item. Eomo o resumo sucinto !rov> mais !ontos de acesso do 'ue o t+tulo ou a indexação seletiva, o item 'ue re!resenta ser" mais recu!er"vel. o mesmo modo, a indexação exaustiva torna esse item mais recu!er"vel do 'ue o seria numa 0usca no resumo sucinto, !or=m menos recu!er"vel do 'ue o seria numa 0usca no resumo ex!andido.
191
Kuanto mais !ontos de acesso orem !rovidos !ara a recu!eração, mais alta ser" a revocação !oss+vel, !or=m, !rovavelmente, menor ser" a !recisão. m, essencialmente, relação entre si no documento B:2/7:*IS/%S /:L:F2IE%S não se relaciona diretamente com LJ:7:S nem :S/%MS <2IMS se relaciona diretamente com LJ:7:S DMLJ/IEMSC. m relação direta entre si, mas a relação = am0+gua. Kuanto mais extenso o registro, maior a c8ance de 'ue ven8am a ocorrer relaçes es!Hrias. :stas, evidentemente, causam menor !recisão. Mutras liçes so0re dierenças entre voca0ul"rio controlado e linguagem natural !odem ser tiradas da gura 13. 2este caso, o <2&IS t8esaurus alcança um resultado med+ocre na indexação do item. M resumo = 0em mais es!ec+co do 'ue os termos controlados o tesauro não !ossui termo !ara Ralunos monitoresO \!eer tutoring] ou mesmo RmonitoriaO \tutoring]. :sse exem!lo tam0=m ilustra o ato de a linguagem natural tender a ser mais redundante do 'ue os termos controlados de indexação. Dor exem!lo, o resumo cont=m o termo !rogrammed learning \ensino !rogramado] e !rogrammed instruction \instrução !rogramada], de modo 'ue esse item seria recu!erado !or 'ual'uer um desses termos 'ue a !essoa 'uisesse eventualmente usar. !rov"vel 'ue o texto integral de um documento !ro!orcione not"vel redundncia, aumentando as c8ances de vir a incluir uma ex!ressão em!regada !or 'uem az a 0usca, assim mel8orando a revocação. % indexação eita !or seres 8umanos =, naturalmente, um !rocesso intelectual su0;etivo, e os indexadores nem sem!re incluem um assunto 'ue deveria ser inclu+do, re!resentam um assunto com o mel8or termo !oss+vel ou ex!licitam alguma relação de interesse !otencial !ara certos usu"rios. % com!leteza e redundncia do texto com!leto evita esse ti!o de !ro0lema. YortA B195)C, o verdadeiro !ioneiro das 0uscas em texto com!leto, recon8eceu isso 8" mais de ) anos Kuando o texto com!leto dos documentos = utilizado como 0ase de um sistema de recu!eração, as consultas não cam amarradas P maneira como os documentos oram indexados. Kuase inevitavelmente o indexador descon8ece certos assuntos aos 'uais a cl"usula ;ur+dica = a!lic"vel ou seria a!lic"vel no uturo. /odavia a !es'uisa, !or sua !r?!ria natureza, determina 'ue o !es'uisador !rocure relaçes in=ditas entre v"rios assuntos$ relaçes 'ue !odem não ter sido anteci!adas !elo indexador. %o dis!ensar !or com!leto o +ndice e recorrer ao texto original em cada 0usca, essas novas relaçes !odem ser encontradas B!. 49C.
Dor outro lado, naturalmente, esta !r?!ria redundncia cria grandes !ro0lemas 'uando os textos de muitos documentos são com0inados !ara ormar uma grande 0ase de dados - 8" muitas ormas !elas 'uais um assunto !ode ser ex!resso num texto com!leto e, em alguns casos, o assunto = re!resentado im!l+cita e não ex!licitamente BMOEonnor, 1954C, dicultando uma revocação alta.
en'uanto a linguagem natural conta com a !reer>ncia do usu"rio es!ecialista num assunto. esc8telets B195C = um autor 'ue c8amou atenção !ara a im!ortncia de se azer com 'ue a linguagem controlada se a!roxime tanto 'uanto !oss+vel da linguagem natural da res!ectiva "rea.
Figura 13 ( Eom!aração entre resumo e indexação com voca0ul"rio controlado M resumo oi re!roduzido de %.I.. 7esearc8 evelo!ment %0stratcs com !ermissão do Eenter or evelo!ment Inormation and :valuation,
%t= agora identicamos diversas caracter+sticas do texto livre e da indexação com termos controlados eita !or seres 8umanos, tendo relacionado am0os com seus !rov"veis eeitos so0re a revocação e a !recisão. :ssas relaçes são resumidas na gura 1. Isso deixa evidente 'ue a situação = com!lexa, uma vezO 'ue alguns atores avorecem os termos controlados e outros avorecem o texto livre. % es!ecicidade das !alavras do texto costuma mel8orar a !recisão, mas dicultar a o0tenção de revocação alta, !elo menos durante 0uscas RconceituaisO gen=ricas, en'uanto a extensão do texto costuma mel8orar a revocação, !or=m diminuir a !recisão. % !reer>ncia !or um ou !or outro numa situação determinada ser" 0astante inNuenciada !elo ti!o de 0usca a ser eita uma 0usca conceitual gen=rica recomendar" os termos controlados, uma 0usca altamente es!ec+ca B!rinci!almente uma 'ue envolva nomes de !essoas, organizaçes, etc.C recomendar" o texto livre, uma 0usca realmente exaustiva so0re um assunto B!or exem!lo, toda reer>ncia !oss+vel a algum medicamentoC recomendar" o texto com!leto, en'uanto uma 0usca altamente seletiva Bsomente os itens mais im!ortantesC !rovavelmente recomendar" a indexação com termos controlados. :m geral, outros autores c8egaram a concluses semel8antes. Dor exem!lo, Fugmann B194C salienta 'ue as 0uscas em linguagem natural !roduzem 0ons resultados no caso de Rconceitos !articularesO, mas não de Rconceitos gen=ricosO$ u0ois B196C arma 'ue uma [das vantagens do texto livre = 'ue Rnão ocorre demora na incor!oração de novos termosO$ e Derez B19)C arma 'ue [um voca0ul"rio controlado !ode resultar em !erda de !recisão^ en'uanto o texto livre [não !erde a es!ecicidade^. Zna!! B19)C menciona Rassuntos es!ec+cosO, Rassuntos 'uentesO e Rnova terminologiaO como exem!los de casos em 'ue a linguagem natural !rovavelmente ser" mais Htil. Ms as!ectos relativos aos custos devem, naturalmente, ser tam0=m levados em conta numa com!aração entre linguagem natural e voca0ul"rio controlado. M custo do !rocessamento intelectual !or seres 8umanos continua a su0ir ra!idamente em relação ao custo do !rocessamento !or com!utador, e a indexação 'ue utiliza voca0ul"rio controlado exige mão-de-o0ra intensiva e cara. % construção e manutenção de um voca0ul"rio controlado !odem tam0=m custar caro. 2a medida em 'ue aumenta a dis!oni0ilidade de textos, a 0aixo custo, em ormato eletrQnico, como su0!roduto de atividades editoriais ou de disseminação de inormaçes, = natural 'ue os administradores de serviços de inormação analisem 193
cautelosamente a situação, a m de decidir se as vantagens da indexação com voca0ul"rio controlado realmente ;usticam os custos adicionais. o !onto de vista da relação custo-ec"cia !ode-se ver essa com!aração como uma negociação entre entrada e sa+da. %o a0andonar a indexação eita !or seres 8umanos e os voca0ul"rios controlados, = 0em !rov"vel 'ue 8a;a uma redução dos custos na entrada. 2o entanto, alcança-se essa redução Ps ex!ensas de custos mais elevados na sa+da, !ois se lança uma so0recarga intelectual maior so0re os om0ros do usu"rio da 0ase de dados. :ntre os atores 'ue inNuem na decisão em torno dessa negociação entre entrada e sa+da estão a 'uantidade de documentos e 0uscas envolvidas, os custos do indexador e da !essoa 'ue az as 0uscas, 0em como o grau de im!ortncia atri0u+vel aos resultados de uma 0usca.
Figura 1 ( Ms !r?s e contras do texto livre versus voca0ul"rio controlado
5e#isão de estudos ans: antes de /GJ
Ms !rimeiros tra0al8os escritos so0re a ex!eri>ncia com 0uscas em textos com!letos, no cam!o ;ur+dico, estavam im!regnados de um grande entusiasmo em ace desse novo recurso. Seus autores, no entanto, não realizaram ex!eri>ncia alguma visando a com!arar as 0uscas em texto com!leto com a indexação com voca0ul"rio controlado. SVanson B195C ormou uma !e'uena coleção de teste, contendo 1 artigos so0re +sica nuclear, e determinou 'uais deles eram relevantes !ara cada uma de um total de 4 'uestes. % coleção oi tam0=m indexada com ca0eçal8os de assuntos Rcriados es!ecialmente !ara o cam!o da +sica nuclearO. %s 0uscas em textos com!letos, 'ue contaram com a a;uda de uma Rcoleção de gru!os de !alavras e ex!resses, a modo de tesauroO, a!resentaram, segundo SVanson, resultados su!eriores P'ueles logrados !elas 0uscas em ca0eçal8os de assuntos. % !es'uisa REraneldO so0re as caracter+sticas e o desem!en8o de linguagens de indexação !arece ter tido !rounda inNu>ncia no convencimento de muitos !rossionais da 19
inormação 'uanto Ps vantagens da linguagem natural na recu!eração da inormação. Segundo oi relatado !or Eleverdon et al. B1955C, tratava-se de um estudo ex!erimental controlado. s ormas dierentes 1C os conceitos estudados eram anotados B!or exem!lo, R!erdas em cascataOC, )C os conceitos eram decom!ostos nas !alavras 'ue os constitu+am, no singular BRcascataO, R!erdaOC, e 3C os conceitos ans eram reunidos !ara ormar RligaçesO ou RtemasO B!or exem!lo, com!ressor de Nuxo axial#!erda em cascataC. Ms itens oram indexados exaustivamente não era raro 8aver de 3 a 4 RconceitosO !or item. Eom!ilou-se um gru!o de ))1 'uestes de teste. :ssas 'uestes oram ela0oradas !or es!ecialistas e se 0aseavam em tra0al8os de !es'uisa reais dos 'uais eles mesmos eram autores. % coleção de teste oi examinada minuciosamente !or estudantes de !?s-graduação do Eollege o %eronautics Bem Eraneld, InglaterraC, e os itens 'ue a!resentassem 'ual'uer RrelevnciaO imagin"vel eram enviados P !essoa 'ue !ro!usera a 'uestão, a m de 'ue ossem avaliados de acordo com uma escala de cinco !ontos Bdos 'uais uma categoria corres!ondia a Ra0solutamente não-relevantesOC. Eomo resultado, cava-se sa0endo 'uais os itens da coleção 'ue eram relevantes !ara cada 'uestão do teste B!elo menos aos ol8os do autor da 'uestãoC e 'uais não eram. /odo o estudo oi realizado como uma es!=cie de simulação. Foram RmontadosO dierentes ti!os de voca0ul"rios, variando do mais elementar B!alavras sim!les sem 'uais'uer controles, usão de singular#!lural, controle da orma das !alavras \0usca em radicais de !alavras], controle sim!les de sinQnimosC ao mais com!lexo Bagru!amento dos termos em 8ierar'uias como a!areceriam numa verdadeira classicação 8ier"r'uicaC. Eada 'uestão oi !ro!osta 33 vezes P coleção de teste, cada uma delas corres!ondendo ao teste de um voca0ul"rio dierente B33 ao todoC, !ossi0ilitando uma com!aração dos resultados alcançados !elos v"rios voca0ul"rios. %o serem com0inadas as medidas de revocação e !recisão numa Hnica medida de desem!en8o Bdenominada Rrevocação normalizadaOC, os voca0ul"rios constitu+dos de termos de uma Hnica !alavra da linguagem natural Bcom controle das ormas dos voc"0ulos, com controle de sinQnimos ou sem 'ual'uer controleC su!eraram em desem!en8o todos os outros. M estudo Eraneld gerou muita !ol>mica e suscitou muitas cr+ticas ao longo dos anos. @rande !arte dessas cr+ticas, no entanto, teve origem numa alta de com!reensão da'uilo 'ue o estudo realmente realizou. Dor exem!lo, Soergel B194C sugeriu 'ue tanto a indexação 'uanto a linguagem de indexação eram de 'ualidade duvidosa. Eomo eu ui um dos indexadores, !osso testemun8ar os grandes cuidados 'ue cercaram a indexação - cuidados muito maiores do 'ue os 'ue !rovavelmente ocorrem num am0iente de !rodução 8a0itual ( e 'ue os indexadores !ossu+am ex!eri>ncia anterior 0astante res!eit"vel. esmo 8o;e em dia ainda surgem cr+ticas. %lguns autores !rocuraram desacreditar os resultados de Eraneld com o argumento de 'ue, como as 'uestes se 0aseavam em documentos reais, isso criaria um vi=s avor"vel P linguagem natural. di+cil entender essa cr+tica, uma vez 'ue os itens considerados relevantes !elos autores das 'uestes não eram os itens nos 'uais 8aviam 0aseado as 'uestes. e 'ual'uer modo, não = min8a intenção deender a'ui os estudos Eraneld, mas meramente salientar 'ue, deeituosos ou não, levaram muitas !essoas a acreditar 'ue, !elo menos em certas circunstncias, os sistemas 0aseados em linguagem natural teriam um desem!en8o tão 0om ou mel8or do 'ue os 0aseados em voca0ul"rios controlados. :m alguns dos tra0al8os 'ue escreveu de!ois da realização dos testes de Eraneld, Eleverdon sugeriu 'ue um sistema com 0ase na linguagem natural, se im!lementado de orma a!ro!riada, sem!re teria desem!en8o su!erior ao de um sistema 0aseado em controle de voca0ul"rio. Douco mais tarde, Zling0iel B196C valeu-se dos resultados de Eraneld, aliados P sua !r?!ria ex!eri>ncia no eense ocumentation Eenter, !ara armar 'ue [voca0ul"rios controlados altamente estruturados são o0soletos !ara a indexação e a recu!eração^ e 'ue [a linguagem natural da !rosa cient+ca = totalmente ade'uada P indexação e P recu!eração^. Douco de!ois, &8attac8arAAa B196C diria Ms resultados de v"rios ex!erimentos visando a testar e avaliar as linguagens de indexação, realizados durante a Hltima d=cada, demonstraram, re!etidas vezes, a orça da linguagem natural, com o m+nimo ou sem nen8um controle, como a mel8or linguagem de indexação Bisto =, levando em conta tanto a ec"cia 'uanto a eci>ncia de recu!eraçãoC B!. )34C.
%!?s os estudos em Eraneld, e inNuenciados !or eles, diversos !es'uisadores c8egaram a concluses semel8antes 'uanto aos m=ritos da linguagem natural na recu!eração da inormação. Dor exem!lo, %itc8ison et al. B1959-196C em!reenderam alguns testes visando a o0ter elementos 'ue a;udassem nas decises acerca da indexação da 0ase de dados I2SD:E. 194
Eom!araram-se os resultados de 0uscas eitas em 1C t+tulo, )C t+tulos mais resumos, 3C termos de indexação utilizados na !u0licação im!ressa Science %0stracts, C indexação eita !or seres 8umanos com Rlinguagem livreO, e 4C termos controlados extra+dos de um rascun8o de tesauro com!ilado !elo !essoal do I2SD:E. M am0iente do teste consistia em 4) artigos no cam!o da eletrQnica e 96 'uestes ormuladas !or !es'uisadores. Fizeram-se avaliaçes no sentido de determinar 'uais artigos eram relevantes !ara 'uais 'uestes. /omou-se o cuidado de esta0elecer algum n+vel de Re'uival>nciaO entre as estrat=gias adotadas nas v"rias modalidades de 0usca. *ericou-se 'ue a recu!eração 0aseada no rascun8o de tesauro !ro!orcionou resultados mel8ores do 'ue 'ual'uer uma das outras modalidades de 0usca. /odavia, recomendava-se 'ue a atri0uição !elos indexadores de termos da linguagem livre, 'ue 8aviam cado em segundo lugar 'uanto ao desem!en8o, deveria ser o m=todo adotado. % 0ase de dados I2SD:E incor!orou !osteriormente tanto termos de tesauro 'uanto termos de texto livre. :m im!ortante estudo, Zeen e igger B196)C com!araram o desem!en8o de v"rios ti!os de voca0ul"rios no cam!o da ci>ncia da inormação. %s !rinci!ais caracter+sticas desse teste !odem ser assim resumidas 1. Foram utilizadas cinco linguagens de indexação dierentes ncia da inormação oi indexada !elos dois !es'uisadores, 'ue utilizaram cada um dos cinco voca0ul"rios. 3. Ms +ndices criados eram inteiramente manuais, sendo 'ue o +ndice !?s-coordenado oi montado com c8as de coincid>ncia ?!tica. . Sessenta e tr>s !edidos de 0uscas, o0tidos ;unto a 0i0liotec"rios e outros es!ecialistas em inormação, oram !rocessados nesses +ndices. 4. %s 0uscas oram realizadas !or 19 estudantes de 0i0lioteconomia e ci>ncia da inormação, 'ue em!regaram um !lano ex!erimental de 'uadrado latino. 5. *inte auxiliares de ensino da "rea ela0oraram ;ulgamentos de relevncia dos !edidos do teste em relação a cada documento da coleção. 6. Ms testes oram realizados com dierentes RversesO dos cinco +ndices. :ssas verses reNetiam mudanças introduzi das na linguagem de indexação ou na !ol+tica de indexação. %s !rinci!ais vari"veis assim examinadas oram o eeito da exaustividade da indexação Bisto =, o nHmero de termos atri0u+dos !or documentoC, a es!ecicidade do voca0ul"rio, dierentes m=todos de coordenação dos termos no momento da 0usca, o grau em 'ue os termos são interligados B!or remissivas ou estrutura 8ier"r'uicaC num voca0ul"rio$ união de termos ans no momento da indexação Bisto =, Rcom!artimentagem RC, o em!rego dos o!eradores relacionais e a !rovisão de RcontextoO no ar'uivo de 0uscas B'uem realiza a 0usca num +ndice de coincid>ncia ?!tica = remetido, !elo nHmero do documento, a um Rar'uivo de contextosO onde uma entrada de +ndice ala0=tico em cadeia re!resenta o conteHdo tem"tico es!ec+co estudado no documento, o 'ue e'uivale a!roximadamente ao contexto !rovido num +ndice !r=-coordenadoC. %s dierentes linguagens oram em!regadas em dierentes com!araçes B'uer dizer, nem todas as com!araçes são relevantes !ara todas as linguagensC, e se utilizou em algumas dessas com!araçes um su0con;unto de )1 documentos e 5 !edidos de 0uscas. Ms resultados das diversas com!araçes são a!resentados, em sua maioria, so0 a orma de coecientes de revocação e nHmeros a0solutos de itens não-relevantes recu!erados. /alvez de maneira não muito im!revis+vel, essa !es'uisa !roduziu resultados 'ue tendem a corro0orar os resultados de estudos anteriores %s linguagens não-controladas testadas tiveram, em geral, um desem!en8o tão 0om 'uanto o das linguagens controladas, ao !ro!orcionar uma ec"cia de recu!eração coerentemente 0oa e um desem!en8o de eci>ncia 'ue ;amais c8egou a ser tão ruim 'uanto o da !ior
195
linguagem controlada, nem tão 0om 'uanto as mel8ores, e em nen8um caso as dierenças oram estatisticamente im!ortantes Bvolume 1, !. 155-156C.
Ms !es'uisadores, al=m disso, armam 'ue M 'ue se !rescreve !ara a mel8or linguagem de indexação =, evidentemente, 'ue a!resente a mais alta es!ecicidade !oss+vel sem ter de em!regar dis!ositivos de !recisão 'ue se;am mais com!lexos do 'ue a sim!les coordenação Be com !ouca ou nen8uma !r=-coordenação de termosC. :, realmente, !arece 'ue as !alavras sim!les da linguagem natural inglesa se a!roximam da !rovisão desse n+vel ?timo de es!ecicidade Bvolume 1, !. 159C.
Zeen e igger c8egaram a sugerir 'ue agora estava 0em com!rovado o argumento contra os voca0ul"rios controlados, ao !onto de armarem 'ue [esta deve ser a Hltima vez em 'ue as tradicionais linguagens controladas de indexação são 8umil8adas, !or ter cado demonstrado 'ue não oerecem vantagem alguma^ Bvolume 1, !. 16C. Lancaster et al. B196)C realizaram um estudo so0re 0uscas em lin8a eitas !or !es'uisadores da "rea 0iom=dica no :!ile!sA %0stracts 7etrieval SAstem B:%7SC. Seu o0;etivo era determinar a eci>ncia com 'ue esses !es'uisadores !odiam azer 0uscas no texto de resumos no cam!o da e!ile!sia, tendo sido eetuadas algumas com!araçes entre texto livre e termos controlados. Eonstatou-se 'ue, em 6 0uscas, o em!rego dos termos de indexação atri0u+dos !ela :xcer!ta edica !ro!orcionou cerca de metade da revocação 'ue ora o0tida com as 0uscas eitas em resumos. M0serve-se, contudo, 'ue os resumos geralmente oereciam muito mais !ontos de acesso, de modo 'ue a com!aração oi mais a res!eito da extensão do registro do 'ue uma verdadeira com!aração entre 0uscas em texto livre versus 0uscas com termos controlados. Ms !es'uisadores conclu+ram 'ue a 0usca em texto resultou em mel8or revocação devido a aC nHmero de !ontos de acesso, 0C maior redundncia, cC maior coincid>ncia entre os termos em!regados !elos usu"rios e as !alavras do texto, dC erros e incoer>ncias na indexação eita !or seres 8umanos, e eC termos de indexação coincidentes entre si. Levantou-se a 8i!?tese de 'ue o desem!en8o mel8oraria grandemente se algum ti!o de Rtesauro de 0uscaO osse acrescentado ao sistema. ncia de !adresO, em 'ue os textos dos resumos são cote;ados com os textos dos !edidos eitos em linguagem natural, e o usu"rio rece0e um con;unto de o!çes de 0usca com variados n+veis de com!lexidade. 2os estudos de Salton, o S%7/ !arecia su!erar o desem!en8o do :L%7S somente 'uando se a!licava uma retroalimentação !ro!orcionada !elo usu"rio. Mu se;a, os usu"rios avaliavam os resultados !reliminares da 0usca e esta era re!etida com 0ase na retroalimentação ornecida !elo usu"rio a res!eito da relevncia. Isso suscita a 'uestão de sa0er 'ual seria o desem!en8o do :L%7S se adotasse a retroalimentação de relevncia. M S%7/ voltar" a ser examinado no !r?ximo ca!+tulo. Im!ortante estudo realizado nesse !er+odo = re'entemente es'uecido. Eleverdon B1966C com!arou 0uscas em linguagem natural e com termos controlados num su0con;unto da 0ase de dados da 2%S% ormado !or itens. Foram realizadas 0uscas em lin8a em 'uatro centros em cada um dos 'uais se aziam dez 0uscas. Eada 0usca era eita de um modo !or uma !essoa e de um modo dierente !or uma segunda !essoa. %s duas !essoas 'ue realizavam a 0usca so0re o mesmo assunto, cada uma de um modo dierente, !rimeiramente analisavam a solicitação, a m de c8egar a um acordo so0re a'uilo 'ue o consulente dese;ava. :ssas modalidades de 0usca eram aC somente em termos controlados, 0C linguagem natural dos t+tulos e resumos, cC termos controlados com0inados com linguagem natural, e dC linguagem natural com o aux+lio de uma lista de Rconceitos associadosO. Eonstatou-se 'ue as 0uscas em linguagem natural resultaram numa revocação acentuadamente mais alta e !ouco dieriam, 'uanto P !recisão, das 0uscas com termos controlados. % conclusão de Eleverdon, corretamente, oi 'ue a extensão do resumo ora a !rinci!al causa disso. Inelizmente, o estudo de Eleverdon = !re;udicado !elas deci>ncias ormais com 'ue oi descrito. Dor exem!lo, as 0uscas em 'ue tanto os termos controlados 'uanto a linguagem natural oram utilizados tiveram um desem!en8o 0em inerior, tanto 'uanto P revocação 'uanto P !recisão, do 'ue as 0uscas 'ue envolviam a!enas linguagem natural. Isso = exatamente o o!osto do 'ue seria natural, sendo di+cil de ex!licar, !rinci!almente !or'ue 196
essas 0uscas de Rmodo con;untoO recu!eraram duas vezes mais itens do 'ue as 0uscas em linguagem natural. Eleverdon não a!resenta ex!licação !ara essa anomalia. Mutra anomalia = 'ue as 0uscas em linguagem natural 'ue contaram com a a;uda do Rar'uivo de conceitos associadosO tam0=m tiveram desem!en8o 0em inerior ao das 0uscas realizadas com o em!rego somente da linguagem natural. Isso tam0=m não = ex!licado com clareza, cando di+cil !ara os leitores do relat?rio de Eleverdon c8egar a suas !r?!rias concluses, uma vez 'ue o !r?!rio Rar'uivo de conceitos associadosO não = descrito com!letamente. /udo 'ue se !ode con;eturar a !artir da descrição de Eleverdon = 'ue esse ar'uivo resultou da coocorr>ncia de termos nos t+tulos de documentos da coleção. /ra0al8o !osterior de artin B19C oerece alguns esclarecimentos, mas, !or sua conta, aumenta ainda mais o mist=rio. :le esclarece 'ue o com!onente de linguagem natural da 0ase de dados consistia em !alavras sim!les extra+das !or com!utador dos t+tulos e resumos e !osteriormente revistas !or seres 8umanos a m de eliminar R!alavras !roi0idasO e normalizar o voca0ul"rio com a exclusão de graas e ormas lexicais variantes. M ar'uivo de conceitos associados era um ar'uivo das !alavras-c8ave extra+das a!enas dos t+tulos e 'ue mostrava, !ara cada um deles, as !alavras-c8ave 'ue ocorriam com maior re'>ncia nos t+tulos. artin resume os resultados assim /ermos controlados Linguagem natural Linguagem natural mais termos controlados
7evocação BfC 45 6 61
Drecisão BfC 6 53 4
:, então, acrescenta 'ue [!ara cada documento relevante recu!erado !ela linguagem controlada, a linguagem natural sozin8a recu!erou 1,, a linguagem natural mais a linguagem controlada 1,5 \...]^, o 'ue = totalmente incom!at+vel com os valores de revocação#!recisão a!resentados. artin tam0=m esclarece 'ue as 0uscas em Rlinguagem natural mais termo controladoO incluem algumas 'ue envolviam somente termos controlados Bonde a !essoa 'ue azia a 0usca não viu necessidade de adicionar a linguagem naturalC e, !ortanto, [elas não re!resentavam todo o !otencial de LE \linguagem controlada] mais L2 \linguagem natural]^. %s incoer>ncias nos resultados e nas armaçes so0re eles, 0em como !reocu!açes acerca das instruçes !assadas Ps !essoas 'ue aziam as 0uscas, lançam alguma dHvida so0re a validade dessa com!aração. Somente um estudo realizado durante esse !er+odo arma ter encontrado resultados su!eriores !ara a indexação eita !or seres 8umanos com o em!rego de um voca0ul"rio controlado. YerseA et al. B1961C utilizaram um su0con;unto da 0ase de dados do Smit8sonian Science Inormation :xc8ange BSI:, ormada !or 544 descriçes de !ro;etos, na com!aração 'ue zeram entre texto livre e Rindexação !or cientistasO. % indexação envolveu o em!rego de c?digos de assuntos, atri0u+dos !or es!ecialistas, e extra+dos de um es'uema de classicação desenvolvido es!ecialmente !ara esse m. Dara )6 0uscas realizadas no !r?!rio SI:, oram alcançados os seguintes resultados /exto de descriçes de !ro;etos Indexação de assuntos
7evocação BfC 55 94
Drecisão BfC 1 94
ais uma vez as deci>ncias do relato dicultam !ara o leitor a com!reensão exata do 'ue oi eito. %s 'uestes utilizadas oram umas 'ue 8aviam sido Ranteriormente ormuladasO, mas não se esclarece se os resultados concernentes P indexação de assuntos oram o0tidos 'uando as 0uscas oram originalmente eitas !ara os usu"rios, ou se oram o0tidos mais tarde, no momento da realização das 0uscas em texto livre. Ms seguintes !ontos tam0=m são o0scuros de 'ue modo oram eitas as avaliaçes de relevncia Ba!arentemente oram eitas !elo !essoal do SI: e não !elos solicitantes originaisC, de 'ue orma o !edido oi entregue a 'uem azia a 0usca em texto livre, e se oram ou não im!ostos controles Ps !essoas 'ue aziam as 0uscas, a m de se conseguir certo n+vel de e'uival>ncia de m=todo entre 0usca em texto e 0usca em termos de indexação. Eada um desses atores teria grande inNu>ncia nos resultados do estudo. Dor exem!lo, se o !edido usado como 0ase !ara a 0usca em texto livre não estivesse nas !alavras originais do solicitante, mas 8ouvesse sido RnegociadoO mediante interação com o !essoal do SI:, os resultados da com!aração !oderiam muito 0em a!resentar um vi=s !ara os c?digos de assuntos. M ato de os resultados desse estudo relativos P revocação#!recisão terem sido 0em mais altos do 'ue os de outras !es'uisas, e muito mais altos do 'ue os o0tidos durante o uncionamento rotineiro de sistemas de recu!eração BLancaster, 195aC, aliado a um relato 19
muito im!reciso, suscita s=rias dHvidas 'uanto P validade dessa com!aração. Ms valores de !recisão exce!cionalmente altos ex!licam-se, !or=m, !arcialmente, !elo ato de 'ue o ar'uivo de teste de descriçes de !ro;etos era realmente uma usão de 'uatro ar'uivos de teste se!arados so0re "reas tem"ticas com!letamente dierentes.
:m geral, as com!araçes entre 0uscas em texto livre e com voca0ul"rio controlado realizadas nas d=cadas de 195 e 196 mostravam 'ue o texto livre uncionava tão 0em 'uanto os termos controlados, senão mel8or. /ais estudos, !or=m, oram realizados em ar'uivos muito !e'uenos, e Ps vezes insignicantemente !e'uenos. :m sua maioria, tratavase de estudos ex!erimentais, ao inv=s de envolver serviços de inormação reais uncionando em condiçes de tra0al8o concretas. % !a11ir de 19 alguns estudos oram realizados com 0ases de dados de maior !orte e#ou envolvendo serviços verdadeiramente o!eracionais. arXeA et al. B19C em!reenderam uma an"lise de enunciados de 0usca com voca0ul"rio controlado e texto livre em 0uscas em lin8a na 0ase de dados :7IE. /am0=m realizaram Rtestes de 0uscas em lin8aO, com!arando voca0ul"rio livre e controlado, mas usando somente seis assuntos. Eonclu+ram 'ue o texto livre resultou em revocação mais alta e os termos controlados resultaram em mais alta !recisão. Igual a muitos outros estudos, o relato do teste = lamentavelmente inade'uado. 2ão 8" inormaçes so0re como oram eitas as avaliaçes de relevncia nem so0re como as 0uscas oram realizadas, de modo 'ue o leitor não sa0e se oi eito algum esorço !ara RcontrolarO as estrat=gias de 0usca, a m de evitar o avorecimento de uma das modalidades de 0usca. Ms escores insolitamente elevados B93f de revocação e 61 f de !recisão !ara texto livre, e 65f de revocação e 94f de !recisão !ara termos controladosC lançam dHvida so0re a validade desse estudo. iversos estudos oram realizados no cam!o do direito. Eoco B19C utilizou uma 0ase de dados so0re casos em tri0unais itinerantes B195-1959C e 4 R!ro0lemas de !es'uisaO verdadeiros extra+dos de um estudo de 1966 do Federal Tudicial Eenter, a m de com!arar a recu!eração nos sistemas W:S/L%W e L:IS. M L:IS inclui somente o texto dos !areceres vinculados a esses casos, en'uanto o W:S/L%W acrescenta Rcom!onentes editoriaisO ao texto dos !areceres, inclusive v"rias ormas de sino!ses. M o0;etivo declarado desse estudo era com!arar os resultados de 0uscas 0aseadas somente no texto com os alcançados com o texto mais acr=scimos editoriais. Eomo as 0uscas no W:S/L%W oram executadas com e sem os acr=scimos editoriais, a com!aração com o L:IS tornou-se totalmente desnecess"ria e s? serviu !ara conundir o leitor. e 'ual'uer modo, a com!aração entre L:IS e W:S/L% W não !oderia ser considerada inteiramente v"lida !or'ue as 0ases de dados não eram exatamente com!ar"veis. Eomo diz Eoco, [os sistemas contin8am a!roximadamente \grio meu] o mesmo nHmero de casos !ara esse !er+odo^. %l=m disso, não 8ouve 'ual'uer esorço sistem"tico !ara determinar se os casos recu!erados eram ou não de alguma orma relevantes !ara os !ro0lemas de !es'uisa. Se o Hnico exem!lo a!resentado !or Eoco or re!resentativo de todos os itens da 0ase de dados, o texto am!liado do W:S/L%W = 'uase duas vezes o taman8o do texto do !arecer sozin8o. 2ão = de estran8ar, !ortanto, 'ue ten8a recu!erado mais casos B913 contra 6), em0ora não se sai0a 'uantos mais eram RrelevantesOC. e ato, seria razo"vel su!or 'ue o 199
do0ro da extensão de texto causaria um aumento su!erior a )f do nHmero de casos recu!erados. M ato de isso não ter ocorrido deve ser em !arte atri0u+vel P coincid>ncia de termos entre o texto e os acr=scimos editoriais. Ms resultados do estudo eram totalmente !revis+veis desde o in+cio, e seria dis!ens"vel esse ti!o de !es'uisa !ara nos dizer 'ue do0rando o taman8o do texto crescer" o nHmero de itens recu!erados. &lair e aron B194C realizaram um estudo 0astante extenso so0re uma 0ase de dados ;ur+dicos, 'ue utilizava o sistema S/%I7S Bcerca de 34 !"ginas de texto, ou documentos, e !edidos de inormaçãoC. %uxiliares advocat+cios realizaram 0uscas exaustivas, iterativas, em lin8a, e s? as interrom!eram 'uando os advogados !ara 'uem tra0al8avam se consideraram satiseitos, !ois !elo menos 64f das reer>ncias relevantes 8aviam sido recu!eradas. Dor amostragem, no entanto, os !es'uisadores calcularam 'ue se alcançara não mais de )f de revocação. Eoncluem 'ue os resultados de seu estudo lançam s=ria dHvida so0re a ec"cia das 0uscas em texto com!leto e, com 0ase em algumas an"lises de custos muito duvidosas, 'ue as 0uscas em texto com!leto são muito mais caras do 'ue os m=todos alternativos. :s'uecem !or com!leto o ato de 'ue grandes sistemas 'ue em!regam voca0ul"rio controlado talvez não alcancem um desem!en8o mel8or. Dor exem!lo, um estudo de 434 0uscas no :LI2:, realizadas !or 191 !essoas dierentes, mostrou 'ue elas a!resentaram uma revocação m=dia de a!enas )3f e uma !recisão de 56f BWanger et al., 19C. a0neA B195aC, em0ora tomando !or 0ase em grande !arte os resultados de &lair e aron, oerece um excelente estudo dos !ro0lemas da recu!eração em texto com!leto no cam!o ;ur+dico. 7es!ostas de cermott B195C e de 7unde e Lind0erg B195C a a0neA, 0em como um coment"rio com aditamentos de a0neA B1950C, tam0=m merecem ser examinados. Salton B195C !roduziu uma minuciosa revisão do estudo de &lair e aron. :le discorda enaticamente da conclusão deles segundo a 'ual 0ases de dados indexadas !or seres 8umanos !rovavelmente terão mel8or desem!en8o do 'ue as 0uscas em textos.
2Hmero de documentos recu!erados Bm=diaC ocumentos relevantes recu!erados Bm=diaC 7evocação Brelativa P usão de todos os m=todosC Drecisão Eusto !or 0usca Bem
/exto com!leto 16,
7esumos ),
/ermos controlados 3,1
3,4 63,9
1, 19,3
1,) ),
1, ),46 6,5
34,5 ,94 3,9
3, 4,3) 3,4
%s ciras de /eno!ir relativas a custos não !odem ser levadas muito a s=rio, !ois ela incluiu os custos da a'uisição de c?!ias com!letas dos documentos !ara a realização dos ;ulgamentos de relevncia, en'uanto na vida real isso raramente aconteceria Bisto =, os usu"rios ariam seus ;ulgamentos com 0ase nos t+tulos e# ou resumos mostrados em lin8aC. /alvez o resultado mais im!ortante da !es'uisa de /eno!ir se;a ter vericado 'ue as 0uscas em termos controlados recu!eraram alguns itens 'ue não oram recu!erados com texto com!leto, e vice-versa, demonstrando a necessidade de am0os os m=todos. Dosteriormente, 7o B19C realizou estudo dando seguimento P !es'uisa so0re a 0ase de dados da Yarvard &usiness 7evieV, o 'ual !roduziu resultados semel8antes aos alcançadosO !or /eno!ir. Sievert et al. B199)C desco0riu, o 'ue não oi sur!resa, 'ue 0uscas numa 0ase de dados 'ue contin8a o texto integral de artigos de revistas m=dicas o0tin8am mel8or revocação do 'ue 0uscas na 0ase :LI2:, em0ora as 0uscas em texto com!leto resultassem em muito menor !recisão. :m artigo anterior, contudo, c8amaram a atenção !ara os !ro0lemas das 0uscas em texto com!leto ao analisar os motivos de não-recu!eração, na 0ase de dados de textos com!letos, de itens relevantes recu!erados no :LI2: BSievert e cZinin, 199C Ms mel8oramentos 'ue a utilização de termos do texto, al=m dos termos controlados, introduz na revocação oram demonstrados !or diversos !es'uisadores, inclusive cEain et al. B196C, 'ue com!araram os resultados de 0uscas em cinco 0ases de dados so0re] ] t?!icos das ci>ncias m=dicas com!ortamentais. )
*"rios outros estudos relataram os resultados de 0uscas em texto com!leto ou !arcial, mas sem azer com!araçes com 0uscas com termos controlados. %lguns desses estudos envolveram sistemas Bsemel8antes de algum modo ao S%7/C 'ue adotam m=todos !ro0a0il+sticos e#ou ling+sticos de ordenação dos documentos, ou !ar"graos deles, com 0ase em sua similaridade com enunciados de !edidos ou estrat=gias de 0usca. Dor exem!lo, &ernstein e Williamson B19C avaliam esses m=todos a!licados P Ye!atitis ZnoVledge &ase \&ase de Eon8ecimentos so0re Ye!atite], e /ong et al. B194C avaliam t=cnicas de intelig>ncia articial a!licadas P recu!eração em texto com!leto numa 0ase de dados de not+cias. Fidel B199)C sugere 'uais os atores 'ue avorecerão as 0uscas com voca0ul"rio controlado e os 'ue avorecerão as 0uscas em textos. 2um estudo de )1 0uscas reais eetuadas !or 6 es!ecialistas treinados, ela identicou v"rios atores 'ue aetam a escol8a de termos controlados versus !alavras do texto eita !or 'uem az a 0usca. :la constatou 'ue existe mais conança no texto em algumas "reas tem"ticas do 'ue em outras Bem0ora isso !ossa estar menos relacionado Ps caracter+sticas do assunto ou sua linguagem do 'ue P 'ualidade dos voca0ul"rios controlados usados em v"rias 0ases de dados - es!ecialmente sua es!ecicidade - e P 'ualidade da indexação com voca0ul"rio controladoC. Eom a nalidade de mel8orar os resultados das 0uscas, alguns !es'uisadores estudaram os eeitos da segmentação de um texto em unidades menores, numa tentativa de mel8orar a !recisão das 0uscas sem s=rios !re;u+zos !ara a revocação. Williams B199C distingue entre segmentação do discurso B0aseado em rases, !ar"graos, seçesC e segmentação em ;anelas Bdivisão do texto em !edaços de taman8o ar0itr"rioC. Williams testou a recu!eração Bcoecientes de revocação e !recisãoC !ara !ar"graos, !"ginas, tr>s dierentes ;anelas B)4, 4 e 1 !alavrasC e tr>s ;anelas su!er!ostas de )4,4 e 1 !alavras. % su!er!osição ar0itr"ria oi !lane;ada !ara evitar a se!aração de textos ans 'ue, do contr"rio, ocorreria com a segmentação ar0itr"ria. Williams constatou 'ue a ;anela su!er!osta de 4 !alavras !arecia oerecer o mel8or resultado glo0al 'uando medido !ela revocação e !recisão. :le conclui 'ue esse ti!o de segmentação !ode mel8orar su0stancialmente a !recisão com uma 'ueda moderada da revocação. Williams reere-se a essa a0ordagem como Rindexação de !assagem de n+velO. 2ão ca claro como essa a0ordagem re!resenta mel8oria em com!aração com as 0uscas !or !roximidade de !alavras, 'ue era em!regada em 0uscas em textos anos antes. % revisão da literatura a'ui inclu+da concentrou-se em estudos 'ue com!aram o desem!en8o de 0ases de dados de texto livre com o de 0ases de dados em 'ue se adota a indexação !or meio de voca0ul"rios controlados e 'uando as 0uscas são eitas com o em!rego de com0inaçes 0ooleanas de termos. :m0ora outros ti!os de estudo ten8am sido mencionados, não se !rocurou azer uma revisão de toda a literatura so0re 0uscas em texto e 'ue em!regam m=todos não-0ooleanos. :sta revisão deixa evidente 'ue o imoderado entusiasmo inicial !elas 0uscas em linguagem natural soreu um a0randamento com o !assar dos anos P medida 'ue se identicavam com maior clareza os !ro0lemas 'ue im!licava. %lguns dos !rimeiros estudos 0aseavam-se em 0ases de dados de cun8o ex!erimental 'ue eram insignicantemente diminutas. Eonsiderando 'ue se !ode tolerar uma !recisão muito 0aixa 'uando se recu!era a!enas um !un8ado de itens, = !oss+vel conseguir um n+vel aceit"vel de revocação. :sta situação se altera su0stancialmente 'uando se !assa !ara 0ases de dados 'ue cont>m centenas de mil8ares de itens. :ntão, !or causa do nHmero de itens recu!erados BRso0recarga de sa+daOC, ;" não são mais aceit"veis 0aixos n+veis de !recisão, sendo analogamente di+cil o0ter alta revocação com n+vel aceit"vel de !recisão. Y", !or=m, ind+cios BWanger et al., 19C de 'ue isso = tam0=m verdadeiro no caso de grandes sistemas 0aseados em voca0ul"rios controlados, não sendo uma !eculiaridade exclusiva das 0uscas em texto livre. im!ortante recon8ecer a dierença entre as ex!resses texto livre e texto com!leto. %s concluses alcançadas como resultados de estudos so0re 0ases de dados de texto com!leto não se transerem automaticamente !ara 0ases de dados 'ue conten8am algo menor do 'ue o texto com!leto B!or exem!lo, resumosC. 2as 0ases de texto com!leto o !ro0lema de escala = agravado. Kuer dizer, com uma 0ase de texto com!leto muito grande ser" ainda mais di+cil alcançar revocação aceit"vel com !recisão toler"vel. M texto com!leto !ro!orcionar" maior revocação, !or=m menor !recisão do 'ue uma 0ase de dados 'ue conten8a algo menor do 'ue o texto com!leto. Isto oi claramente demonstrado !or /eno! ir B19C. lament"vel 'ue a maioria dos estudos 'ue se !ro!em a com!arar o desem!en8o na recu!eração entre texto livre e um con;unto de termos de indexação selecionados de um voca0ul"rio controlado não cum!ra isso. %o contr"rio, eles com!aram o desem!en8o na recu!eração de registros de extensão vari"vel.
!oss+vel, !ara termos controlados e'uivalentesC, 0em como a estrat=gia de 0usca Bisto =, uma estrat=gia RconceitualO teria de ser criada e em seguida traduzi da exatamente !ara a] ex!resses do texto, e 0] termos selecionados do voca0ul"rio controladoC. Isso !arece 'ue nunca oi eito desde os estudos em Eraneld. /eno!ir controlou suas estrat=gias de 0usca, mas, como estava utilizando uma 0ase de dados ;" existente, não !Qde controlar a extensão do registro. Eonse'entemente, suas concluses dizem res!eito muito mais P extensão do registro do 'ue P controv=rsia so0re linguagem natural#voca0ul"rio controlado. /am0=m = lament"vel o ato de a 0i0liograa ainda trazer armativas dis!aratadas, 0aseadas em ind+cios casu+sticos, de deensores de am0os os cam!os, 'ue se recusam a aceitar o ato de 'ue a linguagem natural e os voca0ul"rios controlados t>m am0os suas res!ectivas vantagens. Dara um 0om exem!lo ver Fugmann B196C. ncia na re!resentação do conteHdo tem"tico dos documentos, dis!e dos termos RconceituaisO gen=ricos 'ue amiHde não se encontram no texto, e, !or meio de uma estrutura 8ier"r'uica e remissivas, oerece ao usu"rio uma a;uda !ositiva na identicação de termos de 0usca 'ue se;am a!ro!riados. Sistemas h&bridos
Draticamente todos os autores 'ue escreveram a res!eito de 0uscas em texto livre, inclusive Yenzler B196C, Derez B19)C e uddamalle B199C, 0em como a maioria dos autores ;" citados, c8egaram P conclusão, ;" es!erada, de 'ue o sistema de recu!eração ideal incluir" uma !arte de termos controlados, 0em como uma !arte de texto livre. São ?0vias as vantagens desses sistemas 8+0ridos, descritos e exem!licados 8" muitos anos !or Yolst B1955C, <8lmann B1956 e Lancaster B196)CC. % utilidade do m=todo 8+0rido = a!oiada !elo ato de 'ue, na maioria dos estudos realizados, as 0uscas em texto livre recu!eraram alguns itens relevantes 'ue não oram identicados !or 0uscas com voca0ul"rio controlado, e vice-versa. M termo 8+0rido = em!regado !ara designar 'ual'uer sistema 'ue uncione com uma com0inação de termos controlados e linguagem natural, inclusive a'ueles em 'ue am0os os con;untos de termos são atri0u+dos !or indexadores 8umanos e a'ueles em 'ue uma 0ase de dados !ode ser consultada mediante uma com0inação de termos controlados atri0u+dos !or seres 8umanos e !alavras 'ue ocorram nos t+tulos, resumos ou texto com!leto. *e;amos, !or exem!lo, um sistema 0aseado em tr>s com!onentes voca0ulares inde!endentes 1. um !e'ueno voca0ul"rio de c?digos de assuntos gen=ricos, com um total talvez de 3 c?digos$ ). uma lista de c?digos 'ue re!resentem "reas geogr"cas$ e 3. !alavras-c8ave ou ex!resses 'ue ocorram nos t+tulos ou textos dos documentos. % indexação com esses elementos voca0ulares re!resentaria uma economia im!ortante em relação P indexação 'ue em!regue um grande voca0ul"rio meticulosamente controlado, !or dois motivos 1. Ms c?digos de assuntos seriam sucientemente gen=ricos !ara serem atri0u+dos sem muita diculdade !or um indexador 'ue não dis!usesse de um alto n+vel de ormação educacional ou es!ecialização num assunto. ). M nHmero de c?digos Btem"ticos e geogr"cosC = sucientemente reduzido !ara 'ue o indexador reten8a a maioria deles na mem?ria e dis!ense a consulta constante a uma lista de um voca0ul"rio. :m0ora 'ual'uer um dos elementos do voca0ul"rio, isoladamente, se;a relativamente im!ereito, o em!rego con;unto de uma !alavra-c8ave B!ara o0ter es!ecicidadeC e um c?digo tem"tico ou geogr"co B!ara o0ter o contextoC constitui dis!ositivo extremamente !oderoso. Dor exem!lo, a !alavra-c8ave !lantas !ode signicar algo inteiramente dierente ao ser com0inada com um c?digo tem"tico relativo P agricultura ou ao ser com0inada com um c?digo semntico relativo P ar'uitetura. Igualmente, a !alavra-c8ave assalto, associada ao c?digo geogr"co relativo ao Ira'ue, indica uma o!eração de guerra$ !or outro lado, 'uando ))
coordenada com o c?digo geogr"co relativo a uma metr?!ole onde a criminalidade Se;a alta, = mais !rov"vel 'ue signi'ue rou0o. %l=m disso, o em!rego con;unto de c?digos de assuntos gen=ricos, c?digos geogr"cos e !alavras-c8ave = extremamente ecaz !ara esclarecer relaçes, mesmo 'uando essas relaçes não se ac8am es!ecicadas ex!licitamente. uitas das 0ases de dados atualmente acess+veis em lin8a !odem ser consultadas com o em!rego de com0inaçes de termos controlados e !alavras-c8ave ou ex!resses 'ue ocorrem nos t+tulos ou nos resumos, sendo 'ue os Hltimos !ermitem maior es!ecicidade. O #ocabulário pLs2controlado
iversos autores salientaram 'ue as 0uscas em linguagem natural mel8oram consideravelmente mediante a ela0oração e utilização de v"rias ormas de instrumentos auxiliares de 0usca. DiternicX B19C descreveu alguns desses instrumentos auxiliares. eles, o mais evidente seria um Rtesauro de 0uscasO ou Rvoca0ul"rio !?s-controladoO imaginado !or Lancaster B196)C, Lancaster et al. B196)C, e, mais detidamente, !or Lancaster B195C. M !rimeiro sistema desenvolvido !ara azer 0uscas em grandes coleçes de textos ;ur+dicos Bem Ditts0urg8C utilizava uma es!=cie de tesauro !ara a;udar no !rocesso de 0uscas. /ratava-se, sim!lesmente, de uma com!ilação de !alavras com signicados semel8antes, !arecendo-se mais com o 7ogetOs t8esaurus do 'ue com a estrutura de tesauro comumente usado na recu!eração da inormação. esmo sem contar com uma RestruturaO 'ue se revestisse de alguma im!ortncia, esse tesauro era um instrumento auxiliar extremamente Htil durante as 0uscas$ como !alavras de signicado similar são !otencialmente su0stitu+veis durante uma 0usca, esse instrumento !ou!a a 'uem az as 0uscas o esorço de imaginar todas as !alavras ca!azes de ex!ressar determinada id=ia. M investimento na ela0oração de um instrumento auxiliar como esse resulta em im!ortante economia num sistema onde 8a;a um grande nHmero de 0uscas. :sse ti!o sim!licado de tesauro = uma es!=cie de voca0ul"rio controlado, em 'ue o controle = eito na sa+da e não na entrada do sistema. um voca0ul"rio !?s-controlado.
ncias sociais e com!ortamentais. 2a gura 14 est" um exem!lo de uma dessas ta0elas.
Figura 14 ( :xem!lo de entrada da 0ase de dados /:71
M t+tulo B/IC da ta0ela = DM*:7/q %7:%S \"reas de !o0reza]. :ste termo = utilizado !ara recu!erar itens so0re este t?!ico no :7IE B:7C, nas 0ases de dados indexadas com o edical su0;ect 8eadings B:C, e na 0ase de dados DSqEI2FM B!sC, na 'ual um termo am = @Y://MS \guetos]. 2o Sociological %0stracts BsoC, !oss+veis termos são SL< \avela], @Y://M e %DD%L%EYI% en'uanto um termo :7IE B:2C mais es!ec+co = SL<S. Finalmente, a!resenta-se uma lista detal8ada de termos ans em texto livre BF/C, Hteis !ara uma 0usca so0re este assunto elu'ual'uer 0ase de dados em l+ngua inglesa. :ra !oss+vel desenvolver uma estrat=gia na 0ase /:7, a 'ual seria salva e executada nas 0ases de dados 0i0liogr"cos !osteriormente. :sta 0ase de dados, inelizmente, não existe mais. 2o entanto, seu desenvolvedor !u0licou uma versão im!ressa exaustiva das ex!resses em texto livre Bnão os termos controladosC. :la !ode ser vista como um tesauro destinado a 0uscas em textos BZna!!, 1993C.
% d=cada de 195 assistiu ao começo de uma 'uantidade incr+vel de !ro;etos de !es'uisa so0re a utilização de com!utadores no tratamento de textos. Yavia v"rias razes !ara essa 1
7egião montan8osa !o0re dos :<%, 'ue tem como centro o estado da *irg+nia Mcidental. B2./.C
)
ex!losão de atividades as instituiçes de !es'uisa Be os !es'uisadoresC tin8am em mãos recursos instalados de com!utação 'ue eram caros e !ara eles 0uscavam utilidade, 8avia dis!oni0ilidade de nanciamento generoso das !es'uisas, !rocedente de muitas ontes governamentais, e o !rocessamento de textos era am!lamente considerado como uma tarea 0astante sim!les !ara com!utadores vistos como R!oderososO Bnormalmente, o 'ue era tido como maior o0st"culo era a o0tenção de uma 'uantidade signicativa de texto em ormato eletrQnicoC. :m0ora a tradução mecnica osse o !rinci!al o0;etivo de grande !arte dessas !es'uisas, tam0=m estavam sendo investigadas v"rias a0ordagens !ara a recu!eração da inormação. Ms !ro;etos mais am0iciosos no cam!o da recu!eração da inormação !rocuravam desenvolver sistemas de R!erguntas e res!ostasO ou Rrecu!eração de atosO - isto =, sistemas ca!azes de res!onder diretamente uma consulta do usu"rio ao inv=s de recu!erar um texto 'ue !oderia ou não conter a res!osta, ou, mais comum ente, uma reer>ncia desse texto. 2aturalmente, os !ro0lemas resultaram muito maiores do 'ue ora anteci!ado, !articularmente na "rea da tradução mecnica, e logo o interesse !elo !rocessamento de textos começou a minguar na comunidade de !es'uisa, 0em como nas ag>ncias de nanciamento, em0ora alguns !ro;etos mel8ores 8a;am resistido e, com os anos, revelado not"vel avanço e oerecido resultados !romissores. % am!litude das !es'uisas so0re !rocessamento de textos 8o;e em dia lem0ra as atividades da d=cada de 195 Bver Taco0s B199)aC e Dereira e @rosz B199C onde se encontram 0oas s+nteses dos tra0al8os desenvolvidos na d=cada de 199C. :ste aumento de interesse e atividade tem origem no ato de 'ue agora se encontram enormes 'uantidades de texto dis!on+veis em ormato eletrQnico, de 'ue a ca!acidade de !rocessamento = muito maior e custa muito menos, e de 'ue 8o;e existem necessidades sentidas de a!licaçes vi"veis de !rocessamento de textos nos setores !H0lico e !rivado B!or exem!lo, disseminação eciente de inormaçes na 7ede e as exig>ncias de multilingismo com!uls?rio da Eomunidade :uro!=iaC. %s !es'uisas atuais !rocuram desenvolver Rsistemas inteligentes 0aseados em textosO. Daradoxalmente, a mera 'uantidade de textos dis!on+veis !ara !rocessamento 8o;e em dia coloca desaos not"veis, mas tam0=m oerece soluçes !otenciais 'ue não estavam dis!on+veis 8" 3 anos !ara os !es'uisadores. Dor exem!lo, l=xicos de radicais ou de signicados de !alavras !odem conter muitos mil8ares de entradas ao inv=s de umas !oucas centenas BTaco0s e 7au, 199C e = !oss+vel utilizar associaçes Bco-ocorr>nciasC de !alavras em signicativos cor!os de textos com a nalidade de recon8ecer ex!resses im!ortantes ou desam0iguar !alavras, !reliminarmente ao !rocessamento ling+stico mais com!lexo de an"lise sint"tica BWilXs et al., 199)$ Yaas, 1995C. % re'>ncia de !alavras !ode tam0=m ser usada !ara atri0uir texto a v"rias categorias BTaco0s, 199)0C. %demais, !ode-se em!regar a Rltragem estat+sticaO, 0aseada na co-ocorr>ncia de determinadas !alavras ou radicais, !ara selecionar a'uelas rases 'ue !areçam mais !rov"veis de ser RrelevantesO !ara determinada exig>ncia e, assim, a mel8or candidata !ara uma an"lise mais renada BWilXs et al., 199)C. E8arniaX B1994C c8amou atenção !ara a !ossi0ilidade de o0ter 9f de exatidão ao atri0uir uma Reti'uetaO morol?gica \!art-o-s!eec8 RtagO] a uma !alavra sim!lesmente com 0ase no caso mais !rov"vel B'ue ocorra com maior re'>nciaC e essa exatidão aumentar em at= 94-95f mediante sim!les vericaçes de contexto Bisto =, !rocura em !alavras ad;acentesC. :xem!lo do m=todo da desam0iguação 0aseada no EM#^Dncia articial BI%CC com as de anos anteriores, como se segue % I% da orma como oi ormulada no !assado est" agQnica, se = 'ue ainda não morreu$ uma nova I% est" tomando seu lugar. % antiga I% 0aseava-se em regras e l?gica. % nova I% 0aseiase na estat+stica, !or=m, não a estat+stica como era ormulada no !assado. % !r"tica da !r?!ria estat+stica !assa !or su0stancial transormação B!. )14C
: Taco0s B199)aC salienta 'ue as a0ordagens de 8o;e em dia extraem [mais orça da enorme 'uantidade de textos armazenados do 'ue de regras artesanais^. %s a0ordagens atuais do !rocessamento de texto !odem ser consideradas RinteligentesO na medida em 'ue os com!utadores !ossam vir a Rcom!reenderO o texto.1 REom!reenderO :m0ora a !alavra RinteligenteO !ossa ser tam0=m atri0u+da ao !rocesso, se ele realizar uma tarea !ara cu;a execução os seres 8umanos !recisariam de intelig>ncia. 1
)4
signica a'ui ser ca!az de inter!retar o signicado de uma rase, sem am0igidade. 2ormalmente, isso re'uer alguma orma de an"lise sint"tica. % an"lise sint"tica !rocura identicar o !a!el de uma !alavra numa rase B!or exem!lo, su0stantivo ou ver0oC, recon8ecer os dierentes elementos estruturais Boração su0stantiva, oração ver0al, oração !re!ositiva, e assim !or dianteC, e assim determinar as diversas unçes dentro de uma rase B!or exem!lo, su;eito, !redicativo do su;eito, o0;eto, !redicativo do o0;etoC. M !rocessamento inteligente de textos vem sendo utilizado, ex!erimental ou o!eracionalmente, em v"rias a!licaçes, inclusive categorização de textos, extração de textos, sumarização e am!liação \augmentation], geração de textos, e recu!eração otimizada da inormação \en8anced inormation retrieval], 0em como tradução mecnica.1 M !ro!?sito de a!licar m=todos mais com!lexos de !rocessamento da linguagem natural \DL2] Ps 0uscas em texto com!leto oi ex!licado !or StrzalXoVsXi et al. B1999C da seguinte orma a !rinci!al motivação deste !ro;eto oi demonstrar 'ue um DL2 ro0usto, ainda 'ue relativamente su!ercial, !ode a;udar a extrair uma mel8or re!resentação de documentos textuais !ara ns de indexação e 0usca do 'ue 'uais'uer m=todos 0aseados em !alavras sim!les ou se'>ncias de !alavras comumente adotados em recu!eração estat+stica em texto com!leto. Isso se 0aseou na !remissa de 'ue o !rocessamento ling+stico !ode desco0rir certos as!ectos semnticos do conteHdo dos documentos, algo 'ue a mera contagem de !alavras não !ode azer, levando assim a uma re!resentação mais !recisa B!. 113-11C.
Im!ortante a0ordagem !ara lidar com a recu!eração de textos, utilizada !or v"rios gru!os de !es'uisas 'ue atuam no m0ito do /7:E, = a extração de sintagmas \!8rase extraction] - isto =, reduzir o texto com!leto a um con;unto de sintagmas 'ue ten8am signicado. ncia !ara 'ue se;am consideradas signicativas BStrzalXoVsXi et al., 1999C. Foram adotados muitos m=todos de extração de sintagmas.
:m0ora as revistas !rossionais !o!ulares continuem a azer armativas 0astante entusi"sticas, os autores s=rios são muito mais realistas acerca do 'ue ;" oi con'uistado em mat=ria de !rocessamento autom"tico de textos. Znig8t B1999C, !or exem!lo, nos diz 'ue %s a!licaçes de linguagem natural, como a tradução mecnica, recon8ecimento da ala, recu!eração da inormação e sumarização, alcançam 8o;e uma aixa maior de usu"rios. Kuem;" usou esses !rodutos sa0e 'uão im!ereitos eles são. %!esar disso, as !essoas os utilizam !or'ue estão ansiosas em 0usca de soluçes !ara organizar e !es'uisar a enorme 'uantidade de inormaçes colocadas P sua dis!osição em lin8a, em ormato textual B!. 4C. :m algumas a!licaçes de !rocessamento de textos = necess"rio 'ue o com!utador !ossa distinguir entre com!onentes l?gicos do documento B!or exem!lo, t+tulo, resumo, texto !rinci!al, notas de roda!=, ta0elas, gurasC e identicar relaçes entre eles Bcomo a ordem de leituraC. Isso oi denominado, de orma um tanto em!olada, Rcom!reensão do documentoO Bver, !or exem!lo. Semeraro et al., 199, e Droceedings o t8e /8ird Inlernalional Eonerence, 1994C. 1
)5
*oor8ees B1999C, 'ue !artici!ou dos tra0al8os das /7:Es durante v"rios anos, armou 'ue as a0ordagens mais com!lexas da recu!eração da inormação a !artir de textos !roduziram resultados desa!ontadores %tualmente, os m=todos de recu!eração de uso geral mais 0em-sucedidos são os m=todos estat+sticos 'ue tratam o texto como se não !assasse de um saco de !alavras \...] as tentativas !ara mel8orar o desem!en8o da recu!eração !or meio de !rocessamento ling+stico mais com!lexo oram em grande !arte mal-sucedidos. 2a realidade, a menos 'ue se;a eito com cuidado, esse !rocessamento !ode re0aixar a ec"cia da recu!eração B!. 3)C.
2o entanto, ela de ato sugere 'ue os n+veis mais ela0orados de !rocessamento de textos !odem ser Hteis em atividades de !erguntas e res!ostas e sumarização de documentos. StrzalXoVsXi et al. B1999C salientam 'ue at= o em!rego das mais r"!idas erramentas de an"lise sint"tica est" orçando gravemente os limites da !ratica0ilidade de um sistema de recu!eração da inormação !or causa do aumento da demanda !or !ot>ncia e armazenamento B!. 116-11C.
Segundo eles, não !assa de modesta a !ers!ectiva de >xito de m=todos mais com!lexos de !rocessamento de texto % !rinci!al o0servação a azer = 'ue at= agora não se com!rovou 'ue o !rocessamento de linguagem natural osse tão ecaz 'uanto se es!erava \...] !ara conseguir mel8or indexação e mel8ores re!resentaçes com termos das consultas. M em!rego de termos ling+sticos, como ex!resses, !ares de nHcleo-modicador, nomes ou mesmo conceitos sim!les, a;uda de ato a mel8orar a !recisão da recu!eração, mas os gan8os !ermanecem muito modestos B!. 13C.
Dosteriormente, Ear0allo e StrzalXoVsXi B)C admitiam 'ue %s t=cnicas de !rocessamento de linguagem natural BDL2C !odem conter um tremendo !otencial !ara su!erar as im!ro!riedades dos m=todos exclusivamente 'uantitativos de recu!eração de inormação textual$ no entanto, a !rova em!+rica 'ue sustente essas !revises oi at= agora inade'uada, e t>m demorado a surgir avaliaçes em escala 'ue se;am a!ro!riadas B!. 144C.
&lair B))C sustenta 'ue as alegaçes de 'ue 8ouve grande mel8oria nos resultados das /7:Es ao longo dos anos talvez se;am muito exageradas. :m !articular, ele critica os m=todos /7:E !ara o c"lculo da revocação Buma a0ordagem 'ue adota uma revocação relativaC M segundo eeito de estimativas de revocação 'ue não são con"veis diz res!eito ao avanço do cam!o da 7ecu!eração da Inormação como disci!lina cient+ca. Isto =, !ara 'ue avancem as !es'uisas so0re recu!eração de documentos, temos de con8ecer, com total !recisão, onde nos encontramos agora. Kual'uer incerteza im!ortante na com!aração de t=cnicas de recu!eração sola!a nossa !erce!ção do 'ue realmente unciona e do 'ue não unciona, o 'ue, !or sua vez, nos deixa sem 'ual'uer motivo l?gico !ara escol8er uma t=cnica e não outra. %tualmente, a maior !arte das t=cnicas de recu!eração automatizada usadas !elos !es'uisadores associados Ps /7:Es unciona exatamente no mesmo n+vel modesto de revocação e !recisão.
Saracevic et al. B)3C e S!arcX Tones B)3C reutaram algumas cr+ticas de &lair, armando B!or exem!loC M 'ue a avaliação eita so0 condiçes cuidadosamente controladas, 0aseada em coleçes de teste, = essencial !ara azer avançar a com!reensão dos enQmenos ligados P recu!eração$ 'ue os resultados desses ex!erimentos !odem ser trans!ostos !ara serviços de recu!eração reais$ 'ue não = !reciso uma medida de revocação a0soluta !ara com!araçes controladas do desem!en8o de dierentes !rocessos de 0usca$ e 'ue, no am0iente controlado das !es'uisas /7:E, = !oss+vel documentar mel8orias im!o11antes no desem!en8o da recu!eração P medida 'ue se a!ereiçoam os !rocessos de 0usca. %l8ures, S!arcX Tones armou coerentemente 'ue os m=todos mais com!lexos de !rocessamento ling+stico são di+ceis de ;usticar em a!licaçes voltadas !ara a recu!eração. e!ois de !assar em revista o estado atual do !rocessamento ling+stico de textos com a nalidade de recu!erar inormação Bela c8ama isso de Rindexação lingisticamente motivadaOC, conclui BS!arcX Tones, 1999C 'ue não est" !rovada sua su!erioridade em com!aração com a a0ordagem muito mais sim!les de com0inar !alavras do texto numa estrat=gia de 0usca )6
Darece 'ue o eeito de coordenação, otimizado !ela redundncia da indexação com termos sim!les, !ode 0astar !ara a desam0iguação de sentido, !elo menos no caso de 0ases de dados monol+nges, em0ora continue em a0erto a 'uestão da necessidade de desam0iguação ex!l+cita em 0uscas em v"rias l+nguas em 0ases de dados multil+nges. esmo 'uando a discriminação de sentido acrescenta algo ao desem!en8o \...] isso !ode ser o0tido mais com m=todos estat+sticos do 'ue ling+sticos B!. )1C.
%o azer uma revisão das atividades dos gru!os /7:E at= a /7:E-5 B1996C, ela BS!arcX Tones, )C conclui 'ue [m=todos 0aseados na estat+stica t>m desem!en8o tão 0om 'uanto 'uais'uer outros, e 'ue a natureza e o tratamento dado ao !edido do usu"rio são, de longe, o ator dominante no desem!en8o^. Ms m=todos estat+sticos incluem !onderação de termos, ex!resses sim!les 0em como !alavras sim!les, ex!ansão da consulta e retroalimentação de relevncia. Smeaton B1999C sugere 'ue o !rocessamento ling+stico, em0ora necess"rio !ara a!licaçes 'ue se;am [exatas e !recisas, como a tradução mecnica^, constitui erramenta demasiadamente sutil !ara a recu!eração da inormação 'ue ele considera [não uma a!licação exata, e a a!roximação = inerente a seu uncionamento devido aos inHmeros graus de incerteza !resente nos !rocessos envolvidos^. %l=m disso, n+veis com!lexos de !rocessamento da linguagem ainda são caros. :m geral, o !rocessamento autom"tico de texto re'uer a !re!aração 0astante extensa de um !rograma de com!utador. Isto =, o !rograma !rocessa o texto !ara azer o 'ue l8e = solicitado, e a sa+da = vista e corrigida !or !essoas, o 'ue leva a alteraçes do !rograma. :sse !rocesso iterativo de ensaio e erro continua at= o !rograma o0ter resultadosO satisat?riosO. Znig8t B1999C c8amou atenção !ara o volume de !rocessamento exigido !ara !re!arar um !rograma 'ue execute uma tarea 'ue seres 8umanos inteligentes executam acilmente. Dor exem!lo, retirados de um texto os artigos denidos e indenidos, seria !oss+vel escrever um !rograma ca!az de su0stitu+-los. 2o entanto, Znig8t arma 'ue !ara conseguir um desem!en8o a!enas Rrazoavelmente 0omO seria !reciso o !rocessamento de ) mil8es de !alavras de texto em ingl>s. : acrescenta % an"lise sint"tica de um texto sem limitaçes = tarea excessivamente di+cil, devido Ps am0igidades em !artes da ala Bsu0stantivo, ver0o, etc.C e da estrutura \...] as, a!esar de 8aver algoritmos de a!rendizagem !romissores, ningu=m conseguiu ainda extrair de 0ases de textos sem tratamento elementos \!arses] sint"ticos 'ue tivessem alguma exatidão B!. 49-51C.
:m0ora o !rocessamento mais com!lexo da linguagem !ossa não ser necess"rio na recu!eração de textos, !ode s>-lo em a!licaçes mais exigentes, como a de !erguntas e res!ostas. eruntas e respostas
:m setores muito limitados seria !oss+vel desenvolver sistemas 'ue realmente res!ondam !erguntas eitas !elo usu"rio ao inv=s de sim!lesmente a!ontar ontes !otenciais onde seriam encontradas as res!ostas. Sistemas desse ti!o seriam !articularmente ade'uados !ara 0ases de con8ecimento 'ue ossem est"ticas ou 'ue mudassem muito lentamente. Dor exem!lo, seria !oss+vel desenvolver uma 0ase de dados de ?!eras, a m de res!onder !erguntas so0re enredos, cen"rios, !ersonagens, com!ositores, estr=ias, etc. :m0ora os estudos so0re desenvolvimento de sistemas de !erguntas e res!ostas em cam!os muito restritos remontem a muito tem!o B!or exem!lo, @reen et al., 1953C, as tecnologias modernas tornam-nos muito mais vi"veis. Dor exem!lo, StocX B1993C descreve um sistema de 8i!erm+dia, o %LF7:SEM, com imagens de arescos italianos do s=culo I*, ca!az de res!onder am!la variedade de !erguntas, inclusive a identicação de !ersonagens ou o0;etos !resentes em certas !inturas. Mutro exem!lo = encontrado no tra0al8o de Zu!iec B1999C. % a0ordagem ali descrita !ode montar Rtexto de res!ostaO a !artir de v"rios documentos dierentes. ElarXe et al. B)1C descrevem !rocessos de res!osta autom"tica de !erguntas do ti!o atual !or meio da 7ede. M m=todo envolve a localização e extração de textos 'ue !rovavelmente cont>m a res!osta, 0em como a seleção da res!osta 'ue ocorra com mais re'>ncia em todos os trec8os extra+dos.
"escoberta de conhecimento
Im!ortante cam!o de !es'uisa surgido nos Hltimos anos reere-se a m=todos de extração, das 0ases de dados, de con8ecimentos im!revistos. % terminologia da "rea = estran8amente conusa e incoerente. ncia em su!ermercados. :m0ora a mineração !ossa ser eita !ara testar uma 8i!?tese, = mais Htil desenvolver algoritmos de mineração 'ue essencialmente sugerem as 8i!?teses. 2asuXaVa e 2agano B)1C denem a mineração de texto como o [encontro, no texto, de !adres e regras Hteis 'ue indicam tend>ncias e caracter+sticas signicativas so0re assuntos es!ec+cos^. escrevem um !rot?ti!o de sistema !ara mineração de 0ases de dados textuais em centros de a;uda comerciais \8el! centers] Bcentros de su!orte a clientesC, 'ue, segundo armam, !ode detectar automaticamente deeitos nos !rodutos$ identicar casos 'ue levaram ao r"!ido aumento do nHmero de c8amadas e as razes !or tr"s disso$ e analisar a !rodutividade do centro de a;uda e mudanças no com!ortamento dos clientes 'ue envolvam determinado !roduto, sem ler nen8um dos textos B!. 596C.
% mineração de texto = tam0=m tratada !or Znig8t B1999C. :m0ora :tzioni B1995C armasse 'ue a 7ede não = Htil em a!licaçes de mineração Bem sua o!inião ela = demasiadamente Rdinmica e ca?ticaOC, outros discordam. Delo menos dois livros so0re mineração na 7ede BE8ang et al., )1$ E8aXra0arti, )3C oram !u0licados. M Hltimo = mais te?rico do 'ue !r"tico e !arece 'ue E8aXra0arti est" interessado a!enas em utilizar a 7ede !ara an"lise de redes sociais. 2ão est" claro 'ue isso se;a RmineraçãoO no sentido com 'ue este voc"0ulo = comumente em!regado. :m virtude de o desco0rimento de con8ecimento im!licar a extração de inormaçes, 8" uma relação !r?xima entre ele e os !rocessos de extração de textos 'ue serão examinados no ca!+tulo seguinte. %onclus$es
Sistemas 'ue dis!ensam o controle convencional de voca0ul"rio e a indexação eita !or seres 8umanos !odem uncionar, e isso oi com!rovado ao longo de um !er+odo de mais de anos. /odavia, a!resentam, de ato, !ro0lemas 'uando da realização de 0uscas RconceituaisO gen=ricas. :m0ora a linguagem natural a!resente vantagens ex!l+citas, = claro 'ue a!ereiçoamentos a!ro!riados Buso limitado da indexação e#ou desenvolvimento de recursos auxiliares de 0uscaC !rovavelmente mel8orarão a ec"cia dos sistemas de linguagem natural. %demais, uma vez 'ue a internet ez crescer, em muitas ordens de magnitude, a 'uantidade de textos acess+veis !ara !es'uisa, tornou-se cada vez mais necess"rio im!lementar sistemas 'ue classicarão os itens recu!erados segundo uma ordem de Rrelevncia !rov"velO ao inv=s de sim!lesmente dividir os Rrecu!eradosO !elos Rnão-recu!eradosO Baron, 19C. 2ão est" claro 'ue n+veis com!lexos de !rocessamento de texto B!or exem!lo, 'ue envolvam an"lise sint"ticaC se;am necess"rios !ara a!licaçes de recu!eração da inormação, ainda 'ue o se;am em serviços verdadeiramente de !erguntas e res!ostas e algumas das a!licaçes examinadas no ca!+tulo seguinte. 1
Freitas B))C v> a mineração como um com!onente da desco0erta de con8ecimento. :sta jltima denominação inclui o !r=-!rocessamento de dados !ara acilitar a mineração e o !?s-!rocessamento do Rcon8ecimento desco0ertoO, a m de valid"-lo e ren"-to.
)9
)1
%ap&tulo /> 0 Indexação automática1 redação automática de resumos e processos ans < ma imagem muito sim!licada do !ro0lema da recu!eração da inormação oi a!resentada na gura 1. %gora, na gura 15, tem-se uma versão mais com!lexa. :m ess>ncia, o !ro0lema consiste em cote;ar necessidades de inormação com mensagens. Isso s? !ode ser eito de modo muito indireto. % maioria das mensagens Ba'uilo 'ue os autores dese;am transmitirC a!arece como textos Balguns se a!resentam em ormato de imagem, de som ou outro ormato não-textualC, en'uanto as necessidades de inormação se a!resentam como !edidos ormulados a um serviço de inormação. :ste cria re!resentaçes dos textos, armazena-os numa 0ase de dados e oerece um dis!ositivo 'ue !ossi0ilita 'ue se;am eitas 0uscas nessas re!resentaçes. % 0ase de dados !ode ser armazenada em !a!el, microimagem ou ormato eletrQnico, e o Rdis!ositivoO 'ue !ossi0ilita 'ue se açam as 0uscas !ode ser tão sim!les 'uanto o arran;o de entradas num cat"logo em c8as ou +ndice im!resso, ou tão com!lexo 'uanto um com!utador e um con;unto de res!ectivos !rogramas. M serviço de inormação tam0=m cria re!resentaçes dos !edidos Benunciados de 0uscas de algum ti!oC e os !rocessa em cote;o com a 0ase de dados, !ara recu!erar as re!resentaçes de textos 'ue coincidam ou mais se a!roximem das re!resentaçes dos !edidos. %s re!resentaçes de textos consistirão no !r?!rio texto com!leto, !artes dele ou outra orma de re!resentação constru+da !or meios 8umanos ou autom"ticos. %s re!resentaçes de !edidos serão termos, termos a!resentados em relaçes l?gicas, enunciados textuais ou RitensO B!or exem!lo, um sistema !ermite ao usu"rio inserir inormaçes de um item cu;a relevncia se;a con8ecida, e, em seguida, !rocurar outros 'ue de algum modo l8e se;am assemel8adosC. /emos P nossa dis!osição v"rios recursos de a;uda intelectual Elue assistem na construção das re!resentaçes Bde textos ou !edidosC. M mais ?0vio deles = o voca0ul"rio controlado convencional, mas tam0=m se usam outros instrumentos auxiliares, como o voca0ul"rio !?s-controlado mencionado no ca!+tulo 1. evidente 'ue são !oss+veis muitas variaçes so0re o tema undamental da gura 15. Dor exem!lo, em muitas situaçes o serviço de inormação 'ue cria as re!resentaçes dos textos Bisto =, a ormação da 0ase de dadosC ser" dierente dos serviços 'ue realizarão as 0uscas em tal 0ase. %demais, 'uem !rocura inormaçes !oder" não delegar a realização da 0usca a um es!ecialista em inormação, mas, sim, assumi-la !essoalmente. Eom o surgimento da internet, a maior !arte das atividades de recu!eração da inormação envolve 0uscas em textos de s+tios da 7ede, e as !essoas 'ue !recisam de inormaçes azem elas !r?!rias as 0uscas ao inv=s de deleg"-las a outrem. :ste diagrama evidencia os !ro0lemas da recu!eração da inormação. Ms textos !odem não ser re!resentaçes !ereitas das mensagens Bem0ora este se;a, denitivamente, um !ro0lema de comunicação, normalmente não = visto como um !ro0lema de recu!eração da inormaçãoC e, conorme vimos desde os ca!+tulos iniciais, as re!resentaçes dos textos tam0=m !odem ser im!ereitas. :, !or sinal, os !edidos raramente são re!resentaçes !ereitas das necessidades de inormação e os enunciados de 0usca !odem não ser re!resentaçes !ereitas dos !edidos. %l=m disso, o reerencial BRes'uemasOC de um solicitante !ode não coincidir com o reerencial de um es!ecialista em inormação ou, na realidade, o reerencial dos autores. Eonsidera-se, então, 'ue o !ro0lema da recu!eração da inormação consiste essencialmente em !rocurar cote;ar a!roximaçes de necessidades de inormação com a!roximaçes de mensagens. 2ão = de admirar 'ue os resultados nem sem!re se;am com!letamente satisat?rios. Eomo salientou &ates B195C, o !ro0lema da recu!eração da inormação = mais com!lexo do 'ue a!arenta ser$ ela o trata como RindeterminadoO e R!ro0a0il+sticoO. Darece estar em voga concentrar-se mais no lado da sa+da da atividade Bnecessidade de inormação-!edidore!resentaçãoC do 'ue no lado da entrada Bmensagem-texto-re!resentaçãoC, e a 8i!?tese a+ im!l+cita seria 'ue o lado da sa+da = mais Rcom!lexoO. e ato, &elXin e &elXin et al. B19, 19)C reerem-se ao cote;o do Restado anQmalo de con8ecimentoO de um consulente com o estado mais RcoerenteO de con8ecimento dos autores. Eomo oi a!ontado ainda no ca!+tulo ), a unção do indexador - !rever os ti!os de consultas !ara as 'uais determinado documento !rovavelmente ser" uma res!osta Htil - não = necessariamente mais sim!les do 'ue a de 'uem atua como intermedi"rio com!reender 'uais os ti!os de documentos 'ue satisazem a um solicitante em dado momento. Se;a como or, a gura 15 = a!resentada neste !onto !reci!uamente !ara exem!licar o ato de 'ue !odem ser usados !rocessos algor+tmicos em diversas atividades de recu!eração da inormação, em su0stituição ao !rocessamento intelectual !or seres 8umanos. Ms com!utadores !odem ser a!licados P indexação autom"tica e P ela0oração autom"tica de )11
resumos, 0em como a outras o!eraçes 'ue envolvam a ormação de classes de documentos e de termos, ao desenvolvimento de estrat=gias de 0uscas e esta0elecimento de redes de associaçes entre termos. Eomo o diagrama im!lica, o com!utador !odem, em certa medida, su0stituir os seres 8umanos em !raticamente todas as atividades exem!licadas. %tualmente, eles não geram, de modo inde!endente, mensagens ou necessidades de inormação, a menos 'ue se;am es!ecicamente !rogramados !ara esse m !or seres 8umanos, mas talvez c8egue o dia em 'ue tam0=m arão isso.
Figura 15 ( Ms !ro0lemas undamentais da recu!eração da inormação
Indexação por extração automática
2o começo deste livro ez-se uma distinção entre indexação !or atri0uição e indexação !or extração. % maior !arte da indexação eita !or seres 8umanos = !or atri0uição, !ois envolve a re!resentação do conteHdo tem"tico !or meio de termos selecionados de algum ti!o de voca0ul"rio controlado. 2a indexação !or extração, !alavras ou ex!resses 'ue a!arecem no texto são extra+das e utilizadas !ara re!resentar o conteHdo do texto como um todo. Ms indexadores 8umanos !rocurarão selecionar ex!resses do texto 'ue !areçam ser 0ons indicadores da'uilo de 'ue trata um documento. Drovavelmente serão inNuenciados !ela re'>ncia com 'ue um termo a!arece no documento e talvez onde a!arece - no t+tulo, resumo do autor, legendas das ilustraçes, etc. - e !or seu contexto. %dmitindo 'ue o texto exista em ormato eletrQnico, = ?0vio 'ue o com!utador !ode ser !rogramado !ara realizar a indexação !or extração, adotando esses mesmos crit=rios de re'>ncia, !osição e contexto. % indexação autom"tica 0aseada na re'>ncia de !alavras tem origem na d=cada de 194 e no tra0al8o de Lu8n B1946C e &axendale B194C. !oss+vel escrever !rogramas sim!les !ara contar as !alavras num texto, desde 'ue este ten8a sido cote;ado com uma lista de !alavras !roi0idas, a m de eliminar !alavras não-signicativas Bartigos, !re!osiçes, con;unçes e assemel8adosC, e, em seguida, ordenar essas !alavras segundo a re'>ncia de sua ocorr>ncia. %s !alavras do to!o da lista serão evidentemente, escol8idas !ara serem os Rtermos de indexaçãoO do documento. % denição do !onto de corte Bou se;a, o !onto em 'ue a lista ser" interrom!idaC o0edecer" a alguns de v"rios crit=rios !oss+veis um nHmero a0soluto de !alavras, um nHmero relacionado com a extensão do texto ou !alavras 'ue ocorram com re'>ncia acima de determinado limiar. ncia im!ortante no texto. %ssim, um documento !oder" ser re!resentado com uma com0inação de !alavras e ex!resses, e o crit=rio de re'>ncia !ara a seleção das ex!resses ser" menos rigoroso do 'ue o crit=rio !elo 'ual se selecionam as !alavras im!ortantes. %o inv=s de selecionar !alavras e ex!resses, os !rogramas !odem ser escritos !ara selecionar radicais. %ssim, o radical calor seria escol8ido e armazenado em vez das variantes calor, caloria e calorimetria. :m!regam-se !rogramas !ara derivação autom"tica, a m de eliminar a!enas terminaçes selecionadas de !alavras B!or exem!lo, RadoO, RadaO, RandoOC. :videntemente, = !oss+vel atri0uir !esos a todas as !alavras, ex!resses ou radicais, 'ue )1)
reNitam a re'>ncia com 'ue ocorrem no documento. Dor exem!lo, o radical calor !ode rece0er um !eso num=rico relativo ao ato de a!arecer no texto, digamos, 1) vezes. Ms crit=rios de re'>ncia !odem ser com!lementados com outros crit=rios. Dor exem!lo, &axendale B194C !ro!Qs 'ue somente a !rimeira e a Hltima rase de cada !ar"grao ossem !rocessadas, !ois um de seus estudos demonstrara 'ue a !rimeira era o Rt?!ico rasalO em 4f das vezes e a Hltima o era em outros 6f dos casos. Eonsiderava-se Rt?!ico rasalO a'uele 'ue !rovia o m"ximo de inormaçes relativas ao conteHdo. 2os !rim?rdios da indexação autom"tica oram !ro!ostos ou testados v"rios outros m=todos !ara identicar os segmentos do texto Rricos em inormaçãoO$ !rogramas de com!utador !rocurariam certos elementos, como locuçes !re!ositivas, textos 'ue viessem a!?s R!alavras sugestivasO, como concluses e resumo do autor, e !artes do texto 'ue inclu+ssem as ocorr>ncias !rimeiras de su0stantivos. ncia de !alavras sim!les ou ex!resses !ara a seleção de termos est" em 'ue, mesmo de!ois de usar uma lista de !alavras !roi0idas, algumas das !alavras 'ue ocorrem re'entemente num documento !odem não ser 0ons discriminantes - 'ue sirvam !ara dierençar este documento de outros na 0ase de dados - !or'ue tam0=m ocorrem com re'>ncia na 0ase de dados como um todo. /omando-se um exem!lo ?0vio, as !alavras 0i0lioteca e inormação não seriam muito 0ons discriminantes de itens numa coleção de 0i0lioteconomia e ci>ncia da inormação. %ssim, num documento a !alavra 0i0lioteca ocorre 1) vezes, en'uanto a !alavra amianto s? ocorre 'uatro vezes. 2o entanto, o Hltimo termo = muito mel8or discriminante, uma vez 'ue se trata de um termo 'ue raramente ocorre na literatura de 0i0lioteconomia. Seria um termo altamente im!ortante numa coleção deste assunto, mesmo 'ue s? ocorresse uma Hnica vez num documento. % re'>ncia com 'ue uma !alavra ocorre num documento não = a Hnica re'>ncia !ara a 'ual se deve atentar no !rocessamento de textos !or com!utador. % re'>ncia com 'ue uma !alavra ocorre na 0ase de dados como um todo = ainda mais im!ortante. Kuer dizer, as !alavras 'ue são os mel8ores discriminantes são a'uelas 'ue são im!revis+veis e raras numa coleção ( !or exem!lo, amianto em 0i0lioteconomia, 0i0lioteca na 0ase de dados de uma "0rica de cimento-amianto. 2a realidade, não = !reciso calcular a re'>ncia com 'ue uma !alavra ocorre em toda uma 0ase de dados ormada !or textos, mas a!enas a re'>ncia com 'ue ela ocorre no ar'uivo invertido utilizado !ara executar a 0usca nos textos Bisto =, o nHmero de ocorr>ncias de uma !alavra em relação ao nHmero de ocorr>ncias de todas as !alavras no ar'uivoC. :m!rega-se, então, ao inv=s da re'>ncia a0soluta com 'ue uma !alavra ocorre num documento, um m=todo de re'>ncia relativa !ara a seleção de termos BMsVald et al., 1949C. Eom este m=todo, selecionam-se !alavras ou ex!resses 'ue ocorram num documento com mais re'>ncia do 'ue sua taxa de ocorr>ncia na 0ase de dados como um todo. Isso = um !ouco mais com!licado do 'ue o m=todo de re'>ncia a0soluta, !ois exige 'ue se manten8a uma contagem da re'>ncia com 'ue cada !alavra ocorre na 0ase de dados Brelativa ao nHmero total de ocorr>ncias de !alavras na 0ase de dadosC, 0em como uma com!aração dessa taxa de ocorr>ncia com a de uma !alavra em determinado documento. ncia relativa ser" dierente de uma lista criada com 0ase na re'>ncia a0soluta, mas não de orma radical. uitos dos termos !ermanecerão os mesmos. Ms !oucos termos novos serão os 'ue ocorrem raramente no documento, talvez a!enas uma vez, mas ainda mais raramente na 0ase de dados como um todo - uma Hnica ocorr>ncia entre as 4 !alavras de um artigo de !eri?dico = altamente signicativa se essa !alavra tiver ocorrido at= então somente cinco vezes numa 0ase de dados de 1 mil8es de !alavras` Ms termos 'ue desa!arecerão, evidentemente, serão os 'ue, em0ora ocorram re'entemente num documento, ocorrem re'entemente na 0ase de dados como um todo. :videntemente, os termos selecionados com 0ase na re'>ncia relativa não devem ser radicalmente dierentes dos selecionados com 0ase na re'>ncia a0soluta. Dara uma recu!eração da inormação ecaz !recisa-se de termos 'ue se;am 0ons discriminantes de documentos, e tam0=m de termos 'ue ormem classes ecazes de documentos$ Se or Htil mirar exatamente no item raro - o Hnico documento na 0ase de dados 'ue talvez examine os riscos !ara a saHde do amianto em!regado em orros de 0i0liotecas -, algu=m tam0=m !ode 'uerer recu!erar gru!os de documentos ans. Dalavras como riscos ou !erigos talvez não se;am tão raras numa 0ase de dados de 0i0lioteconomia 'uanto amianto, mas serão Hteis !ara recu!erar uma certa classe de documentos 'ue !oderão interessar a alguns usu"rios. Dara uma recu!eração ecaz da inormação, re'uerem-se, comumente, classes 'ue consistam em mais de um Hnico item.
)13
Ms crit=rios !ara extrair termos dos documentos incluem, !ortanto, re'>ncia a0soluta e re'>ncia relativa, ou uma com0inação de am0as, al=m de crit=rios !osicionais ou sint"ticos. 1 Se se adotar um m=todo relativo !ara a seleção de !alavras, as listas de !alavras !roi0idas, = claro, não serão necess"rias !re!osiçes, con;unçes e artigos ocorrerão com re'>ncia nos itens es!ec+cos, mas tam0=m em toda a 0ase de dados, e serão assim re;eitadas, ;unto com !alavras signicativas mas de ocorr>ncia comum Bcomo 0i0lioteca em 0i0lioteconomiaC. Ms termos tam0=m !odem ser extra+dos do texto 'uando coincidem com algum ti!o de dicion"rio armazenado de termos Raceit"veisO. :ssa oi a 0ase do im!ortante tra0al8o so0re indexação com aux+lio de com!utador realizado na d=cada de 196 !elo eense ocumentation Eenter Bver, !or exem!lo, Zling0iel, 1961C. :ssencialmente, as cadeias de !alavras 'ue ocorriam nos t+tulos e resumos eram cote;adas com uma 0ase de dados em linguagem natural \2atural Language ata &ase B2L&C]. %s cadeias de !alavras 'ue coincidiam tornavam-se candidatas a termos de indexação. Zling0iel e 7inXer B1965C com!araram os resultados da indexação com aux+lio de com!utador com os resultados da indexação eita !or seres 8umanos. Eomo resultado de tr>s estudos de casos, conclu+ram 'ue a indexação com aux+lio de com!utador e sem revisão !osterior alcança n+veis de revocação com!ar"veis aos alcançados !ela indexação eita !or seres 8umanos, e 'ue a !recisão alcançada !ela indexação com aux+lio de com!utador = !elo menos tão 0oa 'uanto a alcançada !ela indexação eita !or seres 8umanos. % indexação !or com!utador com revisão !osterior logrou resultados de revocação com!ar"veis e mel8or !recisão do 'ue a indexação eita !or seres 8umanos. :sta a0ordagem da indexação = atualmente adotada no Eenter or %ero S!ace Inormation da 2%S% BSilvester et al., 1993, 199C. Indexação por atribuição automática
% extração de !alavras e#ou ex!resses dos documentos = tarea 'ue os com!utadores executam de modo 0astante satisat?rio. % extração autom"tica a!resenta n+tida vantagem em relação P extração eita !or seres 8umanos = totalmente coerente. 2o entanto, a maior !arte da indexação eita !or seres 8umanos não constitui indexação !or extração, mas indexação !or atri0uição, e a realização desse tra0al8o !or com!utador =, em geral, mais di+cil. % maneira ?0via de executar a indexação !or atri0uição com o em!rego de com!utador = desenvolver, !ara cada termo a ser atri0u+do, um R!erlO de !alavras ou ex!resses 'ue costumam ocorrer re'entemente nos documentos aos 'uais um indexador 8umano atri0uiria esse termo. :sse ti!o de !erl, !or exem!lo, !ara o termo c8uva "cida incluiria ex!resses como c8uva "cida, !reci!itação "cida, !oluição atmos=rica, di?xido de enxore, etc. Se a cada termo de um voca0ul"rio controlado corres!ondesse um !erl desses, seria !oss+vel utilizar !rogramas de com!utador !ara cote;ar as ex!resses im!ortantes num documento Bessencialmente a'uelas 'ue ossem extra+das segundo os crit=rios de re'>ncia antes mencionadosC com essa coleção de !ers, atri0uindo um termo ao documento sem!re 'ue o !erl do documento coincidisse com o !erl de termos acima de determinado limiar. Isso !arece relativamente "cil. 2a !r"tica, !or=m, = dierente. :m !rimeiro lugar, os crit=rios de coincid>ncia teriam de ser um tanto com!lexos. Se c8uva "cida ocorrer dez vezes num artigo de !eri?dico, 'uase certamente o termo de indexação EY<*% EI% ter" de ser atri0u+do. Su!on8amos, !or outro lado, 'ue c8uva "cida ocorra a!enas duas vezes no documento, !or=m atmosera, di?xido de enxore e "cido sulHrico ocorram com 0astante re'>ncia. %tri0ui-se o termo EY<*% EI% evidente 'ue muitas com0inaçes dierentes de !alavras ou ex!resses sinalizam o ato de 'ue determinado termo de indexação ser" candidato P atri0uição. %l=m do mais, a im!ortncia de cada com0inação, como !reditor de 'ue determinado termo ser" atri0u+do, im!licaria o em!rego de dierentes valores de coocorr>ncia. Dor exem!lo, se as !alavras calor, lago e !oluição ocorressem !oucas vezes num documento, isso seria o suciente !ara levar P atri0uição dos termos DMLncia num documento 'ue trate do assunto, de modo 'ue a atri0uição correta do termo de indexação EY<*% EI% talvez não se;a tão di+cil 'uanto estariam a sugerir as consideraçes anteriores. M termo DMLncias re'entes dessa ex!ressão. Mutros termos 'ue um indexador 8umano atri0uiria com grande acilidade 'uase 'ue resistem P atri0uição Dara um exame com!leto dos v"rios crit=rios adotados !ara a seleção de termos com 0ase na re'>ncia de ocorr>ncia, ver Salton e c@ill B193C. 1
)1
!or com!utador. MOEonnor B1954C analisou alguns !ro0lemas concernentes a isso. xito, mesmo 'uando estavam envolvidos voca0ul"rios muito !e'uenos de termos de indexação B!or exem!lo, &orXo e &ernicX, 1953C. 2os Hltimos anos, !or=m, desenvolveramse !rocessos mel8ores, e agora = !oss+vel executar, com maior c8ance de >xito, a indexação !or atri0uição. % indexação autom"tica e !rocessos ans t>m, !ortanto, uma longa 8ist?ria. 2o resto do ca!+tulo serão vistos em !rimeiro lugar outros !rinc+!ios e a0ordagens anteriores. Ms eno'ues mais atuais serão analisadas mais ao nal do ca!+tulo. 4studos anteriores sobre indexação
*an der eulen e Tanssen B1966C relatam uma com!aração entre indexação !or atri0uição autom"tica e indexação manual. 2este caso, com!arou-se a indexação 8umana adotada !elo I2SD:E com um es'uema de indexação autom"tica 'ue su0stitui ex!resses, 'ue ocorrem nos resumos, !or RnHmeros conceituaisO extra+dos de um RtesauroO armazenado no com!utador. :m0ora os autores digam 'ue a indexação autom"tica deu resultados tão 0ons 'uanto os o0tidos !ela indexação 8umana, tal conclusão 0aseou-se nos resultados de a!enas duas 0uscas. s n+veis !rim"rio, secund"rio e terci"rioC, cerca de 64f das atri0uiçes !oderiam ser eitas automaticamente. 2a realidade, !or=m, os !rogramas não alcançaram um n+vel de desem!en8o tão elevado. %lcançaram de a 9f de >xito em atri0uiçes !rim"rias e secund"rias Bisto =, atri0u+am de a 9f dos 64f 'ue, teoricamente, seriam atri0u+dos com 0ase nos t+tulosC, e 'uase esse n+vel de >xito em todas as atri0uiçes Bou se;a, !or volta de f, ou um !ouco mais, dos 51f de atri0uiçes 'ue ocorreriam com 0ase a!enas nos t+tulosC. :m outras !alavras, ocorria su0atri0uição$ 'uer dizer, os !rogramas deixavam de atri0uir termos 'ue deveriam ser e seriam atri0u+dos !or seres 8umanos. %o mesmo tem!o, tam0=m se vericava su!eratri0uição atri0u+am-se termos 'ue não deveriam ser atri0u+dos. Isso estava na mesma aixa da su0atri0uição entre e 9f das atri0uiçes de termos !elo com!utador eram corretas, no sentido de 'ue indexadores 8umanos tam0=m as teriam eito. ncia de um termo num t+tulo ou resumo !ara azer com 'ue osse atri0u+do um termo controlado, os !rocessos de indexação autom"tica tendiam a atri0uir mais termos a um item do 'ue o aria a indexação 8umana Bm=dia de 15 !or item em contraste com -1)C. /am0=m similares ao tra0al8o realizado no &IMSIS são os !rocessos de indexação com aux+lio de com!utador im!lementados !elo %merican Detroleum Institute B&renner et al., 19C. Sua nalidade era desenvolver m=todos 'ue !ermitissem ao com!utador atri0uir os termos controlados do tesauro do %DI com 0ase nos textos dos resumos. &renner et al. relatam 'ue uma versão anterior do sistema atri0u+a somente cerca de f dos termos 'ue os indexadores 8umanos atri0uiriam, al=m de atri0uir muitos termos su!=rNuos. Eom os ensinamentos ad'uiridos nessa ex!eri>ncia, os autores, contudo, sentiam-se otimistas 'uanto P !ossi0ilidade de os !rocessos inormatizados atri0u+rem cerca de f dos termos 'ue deveriam ser atri0u+dos, e 'ue a isso se seguiria uma redução signicativa das atri0uiçes su!=rNuas. e )14
ato, desde os !rimeiros testes, ocorreram mel8oramentos not"veis. artinez et al. B196C analisam esses mel8oramentos e tam0=m descrevem os !ro0lemas encontrados ao azer a ligação entre ex!resses dos textos e os termos do tesauro. Dosteriormente, Ylava B199)C analisou !rogressos na a0ordagem do %DI no 'ue concerne P ligação de termos de indexação em uma l+ngua com termos de indexação em outra B!or exem!lo, do ingl>s com o alemão e vice-versaC. ncias !osteriores B!or exem!lo, Fu8r, 199$ &ie0ric8er et al., 1996C. M m=todo de armstadt, 'ue adota a t=cnica da !onderação, calcula a !ro0a0ilidade 'ue um descritor tem de vir a ser atri0u+do a um item, su!ondo-se 'ue determinada ex!ressão textual ocorra no t+tulo ou no resumo. Eomo oi dito antes neste ca!+tulo, uma das mais 0em-sucedidas a!licaçes da indexação !or atri0uição com aux+lio de com!utador encontra-se atualmente em uso no Eenter or %ero S!ace Inormation BSilvester et al., 1993, 199C, com 0ase no tra0al8o de Zling0iel. %!esar de a indexação !or atri0uição autom"tica ter mel8orado consideravelmente nos Hltimos anos Bver a seção nal deste ca!+tuloC, ainda não c8egamos ao !onto onde termos de um voca0ul"rio extenso Bdigamos, 1 descritores de um tesauroC !ossam ser atri0u+dos de modo com!letamente autom"tico sem intervenção 8umana. ncia de 'ual'uer uma dessas ex!resses numa !"gina de texto aria com 'ue osse selecionada uma das entradas de +ndice !ara a'uela !"gina. %rtandi armava 'ue um +ndice assim !roduzido com!arava-se em 'ualidade a um +ndice eito !or seres 8umanos, mas custava 0em mais caro. @rande !arcela do custo corres!ondia, !or=m, P transcrição do texto !ara ormato eletrQnico. Eomo 8o;e !raticamente toda im!ressão de textos = eita a !artir de registros eletrQnicos, os atores de custo não mais avoreceriam o esorço intelectual 8umano. %!esar disso, os !ro0lemas inerentes P !rodução autom"tica de +ndices de livros são mais di+ceis do 'ue sugere o tra0al8o de %rtandi. esmo num cam!o limitado seria !reciso um voca0ul"rio muito grande de termos de ex!ressão e, !ara cada um deles, tam0=m seria muito grande o nHmero de termos de detecção !oss+veis. %demais, am0os os voca0ul"rios !recisariam ser mantidos atualizados !ara a0rigar os novos desenvolvimentos e as mudanças terminol?gicas nesse cam!o. :videntemente, %rtandi !rocurava azer a indexação !or atri0uição.
com!utadorO. :m geral, identicam-se dois m=todos !rinci!ais de indexação com aux+lio de com!utador 1.
Eomo vimos no ca!+tulo ), a indexação = uma orma de classicação a atri0uição de um termo a um item coloca-o numa classe ;unto com outros aos 'uais o mesmo tendo oi atri0u+do. São !oss+veis outros ti!os de classicação 'uando 8" v"rios dados so0re itens 0i0liogr"cos em ormato eletrQnico. !oss+vel usar !rocessos autom"ticos !ara criar classes de documentos ou classes de termos. :m sistemas RconvencionaisO de recu!eração, a realização de uma 0usca = auxiliada !elas associaçes entre termos esta0eleci das !ela mente 8umana, com a a;uda Ps vezes de relaçes constantes de um tesauro ou outro voca0ul"rio controlado. 2um m=todo mais autom"tico de recu!eração - 0aseado, !or exem!lo, no cote;o de consultas em linguagem natural com o texto com!leto de itens, resumos, ou re!resentaçes de documentos criadas !or com!utador - tam0=m conv=m incor!orar !rocessos autom"ticos !ara desenvolvimento de relaçes entre termos, a m de mel8orar a ec"cia das 0uscas. Eo-ocorr>ncia = a relação ?0via a ser ex!lorada !elo com!utador. Kuanto mais re'entemente dois termos ocorrerem ;untos Bno texto de documentos ou em listas de termos atri0u+dos aos documentosC, mais !rov"vel ser" 'ue tratem de conteHdo tem"tico similar. Levando isso P sua conclusão l?gica, se o termo % nunca ocorre sem & e o termo & nunca ocorre sem % Bo 'ue seria uma situação muito raraC, os dois termos são totalmente interde!endentes e seriam com!letamente intercam0i"veis nas 0uscas. %l=m da associação direta Bx e tendem a ocorrer ;untosC, as associaçes indiretas entre termos !odem tam0=m ser derivadas com 0ase nos dados de co-ocorr>ncia. Su!on8amos 'ue o termo 'uase nunca ocorra sem W numa 0ase de dados e 'ue tam0=m tenda a não ocorrer sem V, em0ora e / ;amais co-ocorram nos documentos. Eonclui-se 'ue 8" uma relação entre e / são relacionados entre si !elo ato de cada um co-ocorrer ortemente com V. uito !rovavelmente, e / são exatamente sinQnimos neste contexto sinQnimos costumam não ocorrer um com o outro, ainda 'ue os termos com os 'uais coocorram se;am muito similares. 2o exem!lo 8i!ot=tico, seria RdeltaO, / RvQo livreO e W RasaO. 2a realidade, não se calcula o grau de associação entre dois termos com 0ase na re'>ncia sim!les de co-ocorr>ncia, mas na de co-ocorr>ncia relativa P re'>ncia de ocorr>ncia de cada termo. Dor exem!lo, se os termos % e & co-ocorrerem ) vezes na 0ase de dados, en'uanto % ocorrer 1 vezes, e & 4 vezes, o Rator de associaçãoO entre % e & ser" raco. Dor outro lado, su!ondo 'ue % ocorra 4 vezes, & ocorra )4 vezes, e am0os coocorram ) vezes, o ator de associação ser" grande, !ois = muito im!rov"vel 'ue & ocorra sem % e 'uase a metade das ocorr>ncias de % coincida com as ocorr>ncias de &. Dortanto, a relacionalidade B7C de dois termos = comumente denida !ela e'uação sim!les.
Kuando 7 excede algum limiar !reesta0elecido, os dois termos são aceitos como se ossem relacionados. Ms dados de co-ocorr>ncia são usados de duas ormas 1C desenvolve-se e armazena-se uma rede de associaçes entre termos, ou )C identicam-se e armazenam-se classes se!aradas de termos com 0ase em associaçes extra+das da rede. 2o !rimeiro caso, os termos introduzidos !or 'uem realiza as 0uscas, em orma de lista ou dentro de um enunciado em orma de ex!ressão ou rase, !odem ser !rocessados automaticamente !ara !roduzir uma lista ex!andida de termos de 0usca. 2o m=todo desenvolvido !or Stiles BStiles, 1951$ Salis0urA Stiles, 1959C, os termos acrescentados a uma estrat=gia de 0usca são os relacionados de !erto )16
com todos os termos da 0usca original com 0ase na re'>ncia de co-ocorr>ncia. Dor exem!lo, %, S e E ocorrem na estrat=gia original e e q são acrescentados !or'ue tendem a co-ocorrer com todos os tr>s termos iniciais. M !rocesso !oderia continuar de modo a introduzir, digamos, o termo D !or'ue est" associado a %, S, E, e q. MS itens da 0ase de dados !odem rece0er um !eso num=rico, 'ue reNita o nHmero de termos 'ue coincidem entre item e estrat=gia de 0usca e as orças de associação 'ue existem entre esses termos Bcom 0ase na co-ocorr>nciaC, e os itens recu!erados !odem ser ordenados !or !eso. !oss+vel, assim, 'ue alguns itens 'ue a!arecem no alto da ordenação \ranXing] não conten8am nen8um dos termos com os 'uais se iniciou a 0usca. 2a segunda a!licação, 'ual'uer !alavra 'ue ocorra num enunciado de 0usca !ode ser su0stitu+da !ela classe de !alavras a 'ue !ertence. Isso = autom"tico ou !ode ser eito so0 controle de 'uem az a 0usca. Ms ti!os de classes de !alavras 'ue !odem ser derivadas dos dados de co-ocorr>ncia oram claramente identicados !or Salton e [email protected]3C. 2um deles, c8amado acção, todas as !alavras do gru!o são associadas com todas as outras !alavras do gru!o acima de um limiar escol8ido. 2um gru!o de ligação Hnica, !or outro lado, cada !alavra !recisa estar ligada a!enas a uma outra !alavra do gru!o acima do limiar esta0elecido. %s classes ormadas mediante !rocessos estat+sticos serão muito menos !uras do 'ue as de um tesauro convencional. nero#es!=cie, !arte#todo e outras, como no seguinte exem!lo %S% %:7MFLIM :L/% E%<% *I&7%kM
%:7MI2•IE% FL<M
% !ureza da classe não = a 'uestão !rinci!al. M 'ue im!orta = se a classe = !otencialmente Htil na recu!eração. Dor exem!lo, ser" !rov"vel 'ue a classe 8i!ot=tica de !alavras identicadas acima, se se su0stitu+sse automaticamente cada um de seus mem0ros, mel8oraria os resultados da 0usca e!endendo da 0usca, !arece !rov"vel 'ue esse ti!o de su0stituição mel8oraria a revocação. %o mesmo tem!o, causaria um grave decl+nio da !recisão, !rinci!almente se a classe Bcomo no exem!loC osse um con;unto muito 8eterog>neo de termos. Salton e c@ill B193C a!resentam exem!los de entradas de tesauro extra+das automaticamente de uma coleção de documentos de engen8aria Bgura 16C. Eom esse ti!o de tesauro, a consulta R!ro!riedades criog>nicas de xO seria ex!andida !ara Rx em relação ao conceito 14O. M resultado seriam itens recu!erados so0re su!ercondutividade Bisto =, 'ue cont>m o radical Rsu!ercondutOC de x. :stas consideraçes giraram at= agora a!enas em torno de m=todos com os 'uais se ormam classes de termos com 0ase nos documentos onde ocorrem. Ms dados 'ue !ermitem tal classicação são extra+dos de uma matriz 'ue mostra 'uais os termos 'ue ocorrem em 'uais documentos Bmatriz termo#documentoC. claro 'ue, com esses dados, = tam0=m !oss+vel azer a o!eração inversa. Mu se;a, ormar classes de documentos com 0ase nos termos 'ue cont>m. Salton B1964C e Saltonoe c@ilI B193C identicaram v"rios ti!os dessas classes 1. % acção na 'ual todos os itens %-: t>m uma orte ligação entre si.
). % estrela na 'ual uma classe %K7S/ = denida !elo ato de K, 7, Se / estarem todos, de alguma orma, ligados de !erto a %.
)1
3. % leira na 'ual & est" ligado de !erto a %, E a &, e assim !or diante at= :, o 'ual não est" ligado de !erto a 'ual'uer outro item exceto . % UGGG & UGGG E UGGG UGGG :
. M conglomerado 'ue !ode ser ormado com 0ase em v"rios crit=rios. :m geral, no entanto, cada mem0ro se associa aos outros mem0ros do gru!o ao alcançar um valor acima de determinado limiar.
:strelas, leiras e conglomerados são exem!los dos gru!os de ligação Hnica denidos acima. s ten8am um conteHdo tem"tico em comum. Isso, evidentemente, = a 0ase da indexação de citaçes. %o entrar num +ndice de citaçes em %, 'uem realiza a 0usca encontrar" e q, itens estes 'ue citam %. Se % or um item altamente relevante !ara os interesses !resentes de 'uem az a 0usca, e q tam0=m serão relevantes. Se assim or, 'uem realiza a 0usca ter" logrado >xito sem ter em!regado a indexação de assuntos convencional. Identicam-se outras classes nas relaçes sim!les mostradas na gura 1. Dor exem!lo, considere-se 'ue e q ormam uma classe !or'ue am0os citam % e &. :ste = o !rinc+!io do aco!lamento 0i0liogr"co BZessler, 195)-1954C. Kuanto mais reer>ncias dois Bou maisC itens tiverem em comum, mais orte ser" seu aco!lamento. e q estão ortemente aco!lados !or'ue am0os citam %, & e E. _ est" menos ortemente aco!lado a e q !or'ue tem somente duas reer>ncias em comum com estes itens. Mutra maneira de dizer isso = 'ue e q ormam uma classe orte Bde orça 3C, en'uanto e _ e qe _ são classes racas Bde orça )C. evidente 'ue 'uanto mais !arecidas orem as listas de reer>ncias inclu+das em duas !u0licaçes mais !rov"vel ser" 'ue tratem do mesmo assunto. %ssim, se K cita F, @, Y e I a!enas, e o. artigo 7 tam0=m cita somente estes 'uatro itens, K e 7 'uase com certeza tratam do mesmo assunto. Se os dois artigos tiverem essas 'uatro reer>ncias em comum, !or=m se cada um incluir, digamos, dez reer>ncias 'ue o outro não inclui, 8aver" menos c8ance de K e 7 tratarem do mesmo assunto, em0ora a relação entre K e 7 ainda se;a considerada muito !r?xima. m uma relação raca entre si, !ois a!enas dois itens os citam ;untos. Kuanto mais itens os co-citarem, su!e-se 'ue mais ortemente relacionados eles estarão. %s classes ormadas com 0ase nas ligaçes de citaçes a!resentam algumas vantagens so0re as classes ormadas !or meio da indexação, de assuntos convencional. M 'ue = mais evidente em tudo isso = 'ue serão inde!endentes de l+ngua e de mudanças terminol?gicas. M nome de uma doença !ode mudar mais de uma vez no decorrer do tem!o, !or=m isto não im!edir" 'ue se realize uma 0usca so0re essa doença num +ndice de citaçes, !rinci!almente se o documento inicial 'ue a identica or do con8ecimento de 'uem az a 0usca e se ainda or citado com re'>ncia. M !rinc+!io do aco!lamento 0i0liogr"co !ode, naturalmente, ser utilizado !ara ligar documentos escritos em l+nguas com!letamente dierentes$ !or exem!lo, identicar tra0al8os em russo e c8in>s 'ue este;am ortemente aco!lados a um tra0al8o em l+ngua inglesa. Igualmente, uma classe de documentos co-citados incluiria itens em v"rios idiomas. M 'ue = mais im!ortante, evidentemente, = 'ue as classes ormadas !or co-citação sorem mudanças com o !assar do tem!o, !ois novas inter-relaçes entre os resultados de )19
!es'uisas são vericadas !or !es'uisadores !osteriores. *oltando P gura 1, os autores de e q v>em alguma relação entre os itens %, & e E, mas esta relação !oderia ter !assado des!erce0ida durante muitos anos. %, & e E ormam uma classe de itens !ela !rimeira vez em, digamos, 199, !or'ue oi em 199 'ue tanto 'uanto q oram !u0licados, !or=m % talvez tivesse sido !u0licado na d=cada de 193, E na d=cada de 194 e & na d=cada de 196.
ISLME%/IM2 T<2E/IM2 I2M7I/q-E%77I:7 2-D-2 D-2-D DMI2/-EM2/%E/ 7:EM&I2: /7%2SI/IM2 <2IT<2E/IM2
9
&L%S/-EMML: Y:%/-FLMW Y:%/-/7%2SF:7
1
%22:%L S/7%I2
1 1
EM:7EI*: :%@2:/I_: FL<-L:%Z%@: YqS/:7:SIS I2
1 )
LM2@I/<I2%L /7%2S*:7S:
13
E%D%EI/%2E: ID:%2E:-%/EYI2@ ID:%2E: I2
1
%2/:22% ZLqS/7M2 D
Figura 16 ( :xem!lo de entradas de tesauro extra+das !or m=todos autom"ticos
7e!rodução de Salton e c@ill, Introduction to modern inormation retrieval , 193, com !ermissão de c@raV-Yill Du0lis8ing Eom!anA
Figura 1 ( Ligaçes de citaçes#reer>ncias
Ms estudos 'ue com!araram as classes ormadas !ela indexação convencional de assuntos com as ormadas com 0ase em ligaçes de citaçes remontam a cerca de anos BZessler, 1954C. Eom!araçes !osteriores incluem Dao B19C, Dao e Wort8en B199C e S8aV B1990C. ncias#citaçes !oderem ser utilizadas na recu!eração de inormação !ara ormar uma Rcoleção am!liadaO de itens recu!erados. Kuer dizer, 'uando se a!lica uma estrat=gia de 0usca a uma 0ase de dados da ))
orma normal, em!regando !alavras do texto ou termos controlados, o con;unto de itens assim recu!erados ser" am!liado com os itens a eles ligados !or meio de citaçes 0i0liogr"cas. :le sugere 'ue o con;unto de termos associados aos itens originalmente recu!erados se;a am!liado com o acr=scimo de termos extra+dos dos itens 'ue eles citam. :stes novos termos !odem ser termos de indexação atri0u+dos aos itens citados, ou ex!resses do texto extra+das dos resumos ou dos t+tulos. :le sugere 'ue a am!liação mediante a extração de termos dos t+tulos dos itens citados = mais !ratic"vel. Salton e _8ang B195C testaram a utilidade de am!liar o con;unto de termos associados aos itens recu!erados mediante o acr=scimo de !alavras do t+tulo extra+das de itens R0i0liogracamente relacionadosO. %s !alavras do t+tulo oram extra+das de aC itens citados !elos itens recu!erados, 0C itens 'ue citavam os itens recu!erados, e cC itens co-citados. % conclusão deles = 'ue, em0ora muitas !alavras de conteHdo RHtilO se;am extra+das dessa orma, tam0=m serão extra+dos muitos termos de utilidade duvidosa, e 'ue o !rocesso não = sucientemente con"vel !ara ;usticar sua inclusão em sistemas de recu!eração o!eracionais. ?0vio 'ue as ligaçes ex!l+citas ou im!l+citas entre os itens numa rede de 8i!ertexto ou 8i!erm+dia são muito similares Ps ligaçes de citaçes a'ui examinadas. %s im!licaçes !ara a indexação das ligaçes de 8i!ertexto#8i!erm+dia são mencionadas no ca!+tulo 15.
Se os com!utadores !odem ser !rogramados !ara selecionar termos dos documentos segundo crit=rios de re'>ncia, tam0=m !odem ser !rogramados !ara selecionar rases dos documentos. :sta = a 0ase do 'ue se denomina comumente Rredação autom"tica de resumosO, em0ora osse mais exato c8amar isso Rela0oração autom"tica de extratosO. Lu8n B194C, criador desse m=todo, adotou os seguintes !rocedimentos 1. ncias de todas as !alavras restantes, 'ue são ordenadas segundo sua re'>ncia de ocorr>ncia Bem vez de !alavras, !odem ser usadas ra+zes BradicaisCC. 3. /odas as !alavras 'ue ocorram mais de x vezes são denidas como !alavras de Ralta re'>nciaO ou RsignicativasO. . Localizam-se as rases 'ue conten8am concentraçes dessas !alavras de alta re'>ncia. Eonsideram-se duas !alavras relacionadas dentro de uma rase se não 8ouver mais de 'uatro !alavras intermedi"rias. 4. Ealcula-se um Rator de signicnciaO !ara cada rase, da seguinte maneira aC determina-se o nHmero de RaglomeradosO na rase Baglomerado = o gru!o de !alavras mais extenso, demarcado !or !alavras signicativas, no 'ual as !alavras signicativas não se ac8am se!aradas !or mais de 'uatro !alavras intermedi"riasC$ 0C determina-se o nHmero de !alavras signicativas no aglomerado e se divide o 'uadrado desse nHmero !elo nHmero total de !alavras dentro do aglomerado$ cC dene-se o ator de signicncia da rase como o valor do aglomerado mais alto ou como a soma dos valores de todos os aglomerados na rase. Isso soa mais com!licado do 'ue realmente = na !r"tica, e sua ex!licação ca mais "cil !or meio de um exem!lo. *e;amos a rase + B % "M 4 *M NM I PM Q - F = O A 5 Mnde cada letra re!resenta uma !alavra, e as !alavras seguidas de asterisco são as consideradasO signicativasO. M aglomerado ormado !elas !alavras - T cont=m 'uatro !alavras signicativas, de modo 'ue o ator de signicncia do aglomerado = )#6 ou ),3. :ste = tam0=m o ator de signicncia da rase, uma vez 'ue ela cont=m somente um aglomerado. e acordo com os !rocedimentos de Lu8n, as rases 'ue conten8am os atores de signicncia mais altos são selecionadas e im!ressas, na se'>ncia em 'ue ocorrem no texto, a m de ormar o RresumoO. !oss+vel esta0elecer um !onto de corte, !ara controlar a 'uantidade de rases selecionadas. Isso !ode 0asear-se num nHmero xo de rases ou no nHmero de rases necess"rias !ara atingir certo !ercentual do texto total do documento. % gura 19 = um exem!lo de um Rauto-resumoO !roduzido de acordo com o m=todo de Lu8n. %o lidar com documentos muito longos talvez se;a conveniente azer com 'ue os !rogramas selecionem e im!rimam rases signicativas !ara cada seção da !u0licação.
!ara a 'ual o resumo = !re!arado, !ode-se incluir uma !onderação adicional numa certa categoria ou lista de !alavras, de modo a garantir 'ue as rases 'ue conten8am uma ou mais ocorr>ncias dessas !alavras se;am selecionadas !ara inclusão no resumo. claro 'ue um resumo montado dessa orma não ser" muito !arecido com um resumo !re!arado !or um ser 8umano. ncia l?gica B7us8 et al., 1961, at8is et al., 1963C. :n'uanto Lu8n B1949C e MsVald et al. B1949C utilizaram a re'>ncia de !alavras ou ex!resses !ara a seleção de rases, outros !es'uisadores !ro!useram ou em!regaram crit=rios alternativos. :dmundson B1959C identicou 'uatro m=todos !oss+veis 1. =todo da c8ave. Similar ao crit=rio de re'>ncia de !alavras adotado !or Lu8n. %tri0ui-se Ps rases um !eso corres!ondente P soma dos !esos das !alavras 'ue as com!em. ). =todo da deixa. % !resença de certas !alavras numa rase sinaliza o ato de 'ue = !rov"vel 'ue ela se;a um 0om indicador de conteHdo. m. . =todo da localização. 2este m=todo atri0uem-se !esos Ps rases, tomando !or 0ase a !osição onde a!arecem num documento. %s rases 'ue a!arecem em certas seçes B!rimeira e Hltima rase dos !ar"graos, !rimeiro e Hltimo !ar"grao, texto antecedido !or entre t+tulos, como Introdução ou EonclusesC são aceitas como mais indicadoras de conteHdo do 'ue outras.
Figura 19 ( :xem!lo de um auto-resumo de Lu8n BLu8n 194C
Eo!Arig8t | 194 0A International &usiness ac8ines incor!orated$ re!roduzido com !ermissão
esco0riu-se 'ue os m=todos de deixa, t+tulo e localização a!resentavam maior !ro0a0ilidade de concordncia 'uanto Ps rases a serem selecionadas do 'ue 'ual'uer com0inação de m=todos 'ue envolvessem o !rocesso de c8ave, o 'ue levou :dmundson a concluir 'ue este !rocesso, 0aseado somente nos crit=rios de re'>ncia, era inerior aos outros m=todos. 7us8 et al. B1961C argumentam 'ue 'ual'uer m=todo Htil de extração deve incluir crit=rios tanto !ara re;eição como !ara seleção de rases. M m=todo deles !ara avaliação de rases leva em conta a RinNu>ncia contextualO - uma !alavra ou se'>ncia de !alavras, e seu contexto circun;acente, oerecem deixas !ara a aceitação ou re;eição da rase. M m=todo de )))
extração 'ue descrevem 0aseia-se no cote;o do texto com uma Lista de Eontrole de Dalavras \Word Eontrol List BWELC], 'ue inclui uma lista de ex!resses 'ue, se estivessem !resentes numa rase, causariam sua re;eição, e uma lista muito menor de ex!resses 'ue. a levariam a ser selecionada. %s ex!resses de re;eição incluem indicadores de 'ue a rase trata Rde material relativo a antecedentes e não aos o0;etivos, m=todos e resultados do tra0al8o. %s ex!resses de seleção são as Bdo ti!o Reste artigoO, Reste estudoO ou o R!resente tra0al8oOC 'ue 'uase sem!re signicam 'ue a rase trata do tema !rinci!al do artigo. São tam0=m selecionadas rases 'ue !ossuam !alavras signicativas do t+tulo do documento. Ms crit=rios de re'>ncia não são !ostos de lado, mas usados a!enas !ara modicar os !esos associados Ps deixas negativas e !ositivas no WEL. Ms m=todos de extração desenvolvidos !or 7us8 et al. oereciam v"rias vantagens em relação a !rocessos anteriores, inclusive a ca!acidade de modicar rases extratadas B!or exem!lo, !ela eliminação de ex!resses !arent=ticasC. Mutra caracter+stica era a Rremissão interrasalO 'uando uma rase era selecionada !ara inclusão num extrato era testada, a m de determinar se seu signicado de!endia das rases imediatamente !recedentes B!or exem!lo, !or incluir ex!resses do ti!o R!ortantoO ou R!or este motivoOC. Se o signicado osse assim de!endente, as rases !recedentes, at= um m"ximo de tr>s, eram inclu+das no resumo, mesmo 'ue não atendessem a outros crit=rios de aceitação. :sse m=todo de extração tem, !ortanto, o !otencial de criar extratos 'ue !ossuam mel8or se'>ncia l?gica do 'ue os o0tidos mediante !rocessos menos com!lexos. 2a gura 11 temse o exem!lo de um extrato !roduzido segundo os !rocedimentos de 7us8 et al. Bo sistema de ela0oração autom"tica de resumos %%C. at8is et al. B1963C introduziram a!ereiçoamentos nos m=todos de extração descritos !or 7us8 et al. /ais a!ereiçoamentos reerem-se undamentalmente Ps caracter+sticas de modicação rasal e remissão interrasal dos !rocessos anteriores, e se destinam a !roduzir re!resentaçes 'ue se;am mais Rleg+veisO. :arl B196C realizou ex!eri>ncias a m de determinar se rases signicativas !oderiam ou não ser identicadas !or meio de an"lise sint"tica. % 8i!?tese era 'ue as rases 'ue contivessem certas estruturas sint"ticas seriam mais indicativas de conteHdo do 'ue outras. Ms resultados não oram !romissores, devido !rinci!almente ao grande nHmero de ti!os de rases 'ue oram identicados. ncia 'ue cont>m. Daice B191C descreveu !rocessos de ela0oração autom"tica de extratos 0aseados na identicação de rases com !ro0a0ilidade de serem 0ons indicadores da'uilo de 'ue trata um documento B!or exem!lo, 'ue contivessem ex!resses como Ro !rinci!al o0;etivoO ou Rdescreve-se um m=todoOC. Fum et al. B19)C descreveram um m=todo de ela0oração autom"tica de resumos no 'ual, segundo armam, !rocessos de an"lise sint"tica \!arsing] e !onderação identicam as inormaçes mais im!ortantes transmitidas num texto, eliminam elementos não-essenciais e reestruturam o restante num resumo condensado e ex!ressivo. :les a!resentam como exem!lo a rase % necessidade de gerar enorme 'uantidade adicional de energia el=trica e ao mesmo tem!o !roteger o meio am0iente = um dos !rinci!ais !ro0lemas sociais e tecnol?gicos 'ue nossa sociedade ter" de resolver em uturo !r?ximo \sic]
'ue se reduz a % sociedade deve resolver no uturo o !ro0lema da necessidade de gerar energia ao mesmo tem!o 'ue !rotege o meio am0iente.
))3
Figura 11 ( :xem!lo de extrato !roduzido !elo sistema %% de redação autom"tica de resumos 7e!roduzido de at8is B196)C com !ermissão do e!anment o Eom!uter and Inormation Science, M8io State
:m0ora isso se;a es!l>ndido como rase, eles não logram demonstrar 'ue os !rocessos 'ue descrevem !roduzirão uma condensação ex!ressiva e Htil de um artigo inteiro. Ya8n e 7eimer B19C descrevem tra0al8o voltado !ara o desenvolvimento de um m=todo, ins!irado no conceito de Rsistema es!ecialistaO, !ara condensação de textos, em 'ue oi adotada uma 0ase de con8ecimento de 'uadros \rame XnoVledge 0ase] a!licada P an"lise sint"tica \!arsing] de textos. :les !reerem o termo condensação de textos a redação de resumos !or'ue os m=todos !odem, em !rinc+!io, ser utilizados !ara criar condensaçes com v"rios n+veis de extensão e !ormenores. :videntemente, 'uanto mais ormais e coerentes orem os textos dos documentos, mais 0em-sucedidos !rovavelmente serão os !rocessos de ela0oração de extratos. Dor exem!lo, &orXoVsXi e artin B1964C alegam ter alcançado mais de 9f de >xito na extração autom"tica de ementas e !rescriçes exaradas em !rocessos, !artindo do texto de decises ;udiciais. %s a0ordagens atuais de extração autom"tica, 8o;e em dia re'entemente c8amada de Rsumarização de textosO, são mencionadas mais adiante neste ca!+tulo. :m0ora os !rocedimentos correntes se;am ca!azes de azer coisas mais com!lexas, como a com0inação 0em-sucedida de rases,1 = !oss+vel 'ue os crit=rios relativamente sim!les introduzidos !or Lu8n e &axendale se;am tão 0ons ou mel8ores do 'ue 'uais'uer outros !ara a seleção !r"tica de rases com !ro0a0ilidade de serem indicativas do conteHdo do documento. Dor exem!lo, Yui e @o8 B1995C com!araram 'uatro crit=rios dierentes na !re!aração de resumos de not+cias m=todo de localização, !rocesso indicativo, re'>ncia de !alavras-c8ave e !alavra-c8ave do t+tulo. M em!rego de ex!resses indicativas B!or exem!lo, Rem conclusãoO, Ro o0;etivo eraOC !ara identicar rases signicativas deu os !iores resultados. M crit=rio sim!les de re'>ncia de !alavras-c8ave oi mel8or, mas os mel8ores resultados oram o0tidos com m=todos 'ue atri0u+am !eso maior P localização B!or exem!lo, !rimeiras rases do !ar"graoC ou P seleção de rases 'ue contin8am maior concentração de !alavras 'ue tam0=m ocorriam em t+tulos, entre t+tulos, legendas ou 0i0liograas. Operaç$es Rautomáticas de recuperação
))
linguagem natural osse cote;ado com os textos dos documentos texto com!leto, texto !arcial ou alguma orma de re!resentação. Eonsidera-se isso como uma es!=cie de coincid>ncia de !adres atri0ui-se aos textos da 0ase de dados um ti!o de escore, 'ue reNita o grau com 'ue coincidem com o texto de um !edido, o 'ue !ermite 'ue se;am a!resentados, a 'uem az a 0usca, na orma de uma sa+da ordenada !or !rov"vel relevncia. São !oss+veis v"rios ti!os e n+veis de coincid>ncia. :xaminemos, !or exem!lo, o !edido Datologia, siologia, radiograa e tratamento de !neumonia causada !or irradiação ou 0rose !ulmonar causada !or irradiação.
: su!on8amos 'ue a 0ase de dados consista em textos de resumos. M m=todo mais sim!les de !ontuar uma coincid>ncia seria a'uele 'ue sim!lesmente levasse em conta 'uantas !alavras do !edido ocorrem num resumo. %ssim, um resumo rece0eria um escore elevado se contivesse as !alavras R!atologiaO, RsiologiaO, RradiograaO, RirradiaçãoO e RtratamentoO Bisto =, cinco das oito ocorr>ncias de !alavras signicativas do !edidoC, em0ora, evidentemente, se;a im!rov"vel 'ue !ossa ser relevante, uma vez 'ue não cont=m nen8uma das !alavras do !edido 'ue são mais discriminantes. São !oss+veis muitos renamentos desse n+vel rudimentar de esta0elecimento de coincid>ncia. ncias de uma !alavra num !edido e num resumo tam0=m !ode ser levado em conta na classicação dos documentos. Segundo este crit=rio, um resumo 'ue conten8a diversas vezes a !alavra irradiação tem a !ro0a0ilidade de rece0er um escore elevado !or'ue esta !alavra = a Hnica 'ue ocorre mais de uma vez no !edido. 2o caso de uma 0ase de dados 'ue conten8a o texto integral dos documentos, = !reciso ter em conta a extensão destes. o contr"rio, documentos muito extensos sem!re terão uma !ro0a0ilidade !ro!orcionalmente maior de serem recu!erados. % coincid>ncia !ode 0asear-se em radicais de !alavras ao inv=s de !alavras com!letas. Dor este crit=rio, um resumo 'ue inclua as !alavras irradiante e irradia, 0em como irradiação, o0teria um escore elevado em relação ao !edido do exem!lo. Se 8ouvesse no sistema um tesauro criado !or com!utador, seria !oss+vel su0stituir uma ou mais de uma das !alavras do !edido !elo gru!o existente no tesauro Bver gura 16C e ao 'ual !ertencesse essa !alavra. Se ocorresse a su0stituição das !alavras irradiação e !ulmonar do !edido, os !esos dos resumos 'ue contivessem as !alavras !ulmes e raios aumentariam notavelmente !or'ue !ulmes e !ulmonar !ertenceriam ao mesmo gru!o do tesauro B;unto, talvez, com o radical !neumC, do mesmo modo 'ue radiograa, irradiação e raios. :videntemente, a coincid>ncia ser" mais !recisa se se 0asear em ex!resses e não em !alavras sim!les, !elo 'ue 'ual'uer sistema 'ue cote;e o texto de um !edido com os textos dos documentos !recisa, denitivamente, ter a !ossi0ilidade de realizar 0uscas em ex!resses. Ms resumos 'ue conten8am a ex!ressão R!neumonia !or irradiaçãoO rece0erão um escore alto em relação ao !edido 8i!ot=tico, do mesmo modo 'ue a'ueles 'ue conten8am R0rose !ulmonar !or irradiaçãoO. Ms resumos onde 8ouvesse a ex!ressão R0rose !ulmonarO tam0=m rece0eriam um escore alto, em0ora com menos !ro0a0ilidade de ser relevantes, a menos 'ue o as!ectoO irradiaçãoO tam0=m estivesse !resente. :m !osição intermedi"ria entre !alavras sim!les e ex!resses est" o em!rego da !roximidade de !alavras - neste caso a ca!acidade de atri0uir !esos maiores a !alavras 'ue a!areçam !erto uma da outra no texto, em0ora não necessariamente ad;acentes. Fica evidente, com esta ex!osição, 'ue !odem ser usados dierentes crit=rios na atri0uição de um escore ao texto, a m de reNetir o grau em 'ue ele coincide com o texto de um !edido, e 'ue o escore atri0u+do !ode 0asear-se em mais de um dos crit=rios examinados B!or exem!lo, teria em conta o nHmero de coincid>ncias de !alavras ou ex!resses, 0em como o +ndice de ocorr>ncia dessas !alavras ou ex!resses na 0ase de dados como um todoC. /eoricamente, !ortanto, um sistema Rautom"ticoO deve incor!orar diversos crit=rios !oss+veis !ara o esta0elecimento de coincid>ncia, e !ermitir ao usu"rio escol8er um deles. M sistema mais ela0orado desse ti!o geral = o S%7/ de Salton, desenvolvido e a!ereiçoado ao longo de um !er+odo de mais de 3 anos. :xiste uma vasta 0i0liograa acerca do. S%7/, e se encontra uma 0oa s+ntese em Salton e c@ill B193C. :m0ora os !rocessos 8a;am sido a!rimorados desde 'ue esse livro oi !u0licado, ainda !arece ser a mel8or descrição dos !rinc+!ios 0"sicos. M S%7/ oi !ro;etado de modo a atri0uir !esos num=ricos ))4
aos itens, a reNetir a extensão com 'ue coincidem com os enunciados de !edidos, e a a!resentar esses itens ao usu"rio de acordo com uma ordenação !or !rov"vel relevncia, onde a!arecem em !rimeiro lugar a'ueles com !esos maiores. M S%7/ incor!ora dierentes crit=rios !ara o esta0elecimento de coincid>ncia, inclusive a !onderação de termos, 'ue visa a reNetir seu +ndice de ocorr>ncia numa 0ase de dados, coincid>ncia de ex!resses, e coincid>ncia 0aseada em ra+zes de !alavras. /am0=m !ossi0ilita a incor!oração de um tesauro, o 'ue = o0tido mediante uma com0inação de !rocessamento !or com!utador e !or seres 8umanos. Mutro elemento essencial do S%7/ = a Rretroalimentação de relevnciaO. Se, numa sa+da !reliminar, o usu"rio !uder indicar 'uais os itens 'ue são relevantes e 'uais os irrelevantes, o sistema recalcular" o !eso dos itens da 0ase de dados. Eonsegue-se isso com a redução dos !esos relativos Ps caracter+sticas dos itens não relevantes e o aumento dos !esos das caracter+sticas relativas aos itens relevantes. Saiton B199C descreveu como a an"lise sint"tica dos textos de ca!+tulos de livros, acom!an8ada de !rocessos de geração de ex!resses, !ode ser a!licada P !rodução de +ndices de nal de livros. Ms m=todos desenvolvidos !or Salton determinam essencialmente a similaridade entre dois textos e ex!ressam essa !roximidade como um escore num=rico, uma Rmedida de similaridadeO. 2as o!eraçes convencionais de recu!eração, mede-se a similaridade entre o texto de uma consulta e textos de documentos numa 0ase de dados, e o escore num=rico de similaridade ser" usado !ara ordenar a sa+da. Mutras utilizaçes !oderão, !or=m, ser dadas a essa medida de similaridade dos textos. Dor exem!lo, = !oss+vel medir a !roximidade de textos de documentos, o 'ue !ermitir" a ormação de classes de textos similares. *er, !or exem!lo, o Rma!a de relaçes textuaisO da gura 111, 0aseado em Salton et al. B1996C. :m0ora os seis textos re!resentados !ossam ser considerados semanticamente relacionados, alguns são intimamente relacionados B!or exem!lo, 161) e 1615 são ortemente relacionados com um valor de ,46C, en'uanto as ligaçes entre outros !ares são racas Bum valor de ,9 entre 19199 e ))36 e uma ligação com!letamente não-signicante entre ))36 e 96C. Salton et al. !ro!em 'ue esses !rocessos de medição de similaridade se;am usados !ara esta0elecer v+nculos de 8i!ertexto numa rede de inormação. Eomo ser" examinado mais adiante neste ca!+tulo, !odem tam0=m ser utilizados !ara medir a similaridade entre !ar"graos no mesmo texto BRsimilaridade intradocumentalOC e isso !oder" então ser usado como 0ase !ara a sumarização do texto.
Figura 111 ( a!a de relaçes textuais 0aseado em Salton et al. B1996C
7e!roduzido com !ermissão de :lsevier Science Inc. Ms v alores num=ricos ex!ressam o grau de similaridade entre cada !ar nos seis textos
SavoA B1994C lida com o esta0elecimento de v+nculos de 8i!ertexto mediante a!licação de m=todos !ro0a0il+sticos. /am0=m sugere 'ue os v+nculos de 8i!ertexto se;am usados !ara a o0tenção autom"tica de novos termos de 0usca. Dor exem!lo, se o item % or altamente relevante !ara uma consulta e % tiver ortes v+nculos de 8i!ertexto com &, então & !oder" tam0=m ser relevante. %l=m disso, os termos ortemente associados com & !oderão ser Hteis !ara ex!andir mais a 0usca. Mutros sistemas tam0=m oram desenvolvidos !ara !ermitir ao usu"rio dar entrada a um !edido na orma de enunciado textual. ncia Eom!utadorizada de Inormaçes em Ingl>s]C tem sido em!regado como interace em linguagem natural com as 0ases de dados ))5
:LI2: e E%/LI2: da 2ational Li0rarA o edicine. M EI/: unciona numa 0ase de dados de registros 'ue !ossuam termos de indexação Bcomo o :LI2:C ou numa 'ue envolva texto livre B!or exem!lo, resumosC. M sistema !ode remover automaticamente os suxos das !alavras Bisto =, reduzir as !alavras a seus radicaisC, atri0uir automaticamente !esos aos termos da consulta Bos !esos reNetem a raridade do termo termos 'ue ocorram raramente na 0ase de dados o0t>m !eso maiorC e a!resentar termos !oss+veis !ara 'ue o usu"rio os a!rove ou re;eite. Eomo no S%7/, os itens da 0ase de dados rece0em um escore num=rico 'ue reNete o grau com 'ue coincidem com o enunciado do !edido. 2o EI/:, os termos relacionados com a'ueles em!regados na consulta são identicados somente 'uando a consulta 8ouver sido !rocessada na 0ase de dados. % mat=ria-!rima tra0al8ada = o con;unto de !alavras BtermosC relativas aos documentos recu!erados. %ssim, nos itens recu!erados so0re os termos %, & e E, os termos 7 e / tam0=m !odem ocorrer re'entemente e ser Hteis na ex!ansão da 0usca. Ms termos 7 e / não são considerados signicativos, contudo, a menos 'ue ocorram no con;unto recu!erado com maior re'>ncia do 'ue o es!erado. %ssim, tam0=m se leva em conta a re'>ncia de ocorr>ncia de um termo na 0ase de dados como um todo. Dor exem!lo, uma 0ase de dados de 0i0lioteconomia a!resenta 4 resumos em res!osta a uma consulta sim!les, como Ravaliação de coleçesO B'ue = inter!retada como RavaliaçãoO e RcoleçesOC. % !alavra R0i0liotecaO ocorre em 49 desses resumos, mas não = considerada signicativa, !ois sua taxa de ocorr>ncia no con;unto recu!erado B49#4C não excede a taxa de ocorr>ncia na 0ase de dados como um todo. Dor outro lado, a !alavra Rdistri0uiçãoO seria considerada associada signicativamente com RcoleçesO e RavaliaçãoO ainda 'ue s? ocorra em dos 4 resumos, sua taxa de ocorr>ncia B#4C excede em muito sua taxa de ocorr>ncia na 0ase de dados como um todo.
Eomo oi acima sugerido, a internet !rovocou tremendo aumento do interesse !elas t=cnicas de recu!eração em geral e !elos m=todos autom"ticos em !articular. %lguns sistemas e !rocessos considerados como meramente ex!erimentais 8" alguns anos são 8o;e em dia a!licados comercialmente. encionou-se no ca!+tulo anterior 'ue o !ro;eto /IDS/:7 em muito contri0uiu !ara o !rogresso alcançado na Hltima d=cada em v"rias atividades de !rocessamento autom"tico de texto. :ste !rograma, 0em como esorços correlatos, inclu+ram v"rias coner>ncias so0re recu!eração de textos \/ext 7etrieval Eonerences B/7:ESC] - a und=cima delas realizada em )) - 0em como coner>ncias so0re com!reensão de mensagens \essage ncias so0re com!reensão de documentos \ocument
um com!onente do /I:S B!rograma /ranslingual Inormation etection, :xtraction, and Summarization da %7D%. /am0=m 8ouve uma im!ortante coner>ncia so0re avaliação de m=todos de sumarização Bani et al., 199C. :m0ora o !atroc+nio ormal do governo ao /IDS/:7 8a;a ex!irado em outu0ro de 199 B@ee, 1999C, !ermanece a coo!eração nessas "reas, inclusive com a continuação das atividades /7:E. M tra0al8o do /ISD/:7 e as contri0uiçes das /7:Es em es!ecial oram totalmente estudados na literatura Bver, !or exem!lo, Yarman, 1996, S!arcX Tones, 1994, e *oor8ees e Yarman, 1999,)C. % vertente do /7%EZ 'ue trata de recu!eração interativa oi revista !or Mver B)1C. Eontri0u+ram tam0=m de orma im!ortante !ara as !es'uisas nessa "rea as coner>ncias so0re !rocessamento de linguagem natural a!licada \Eonerences on %!!lied 2atural Language Drocessing] e as coner>ncias internacionais so0re an"lise e recon8ecimento de documentos \International Eonerences on ocument %nalAsis and 7ecognition]. %s atividades de !rocessamento autom"tico de textos relativas ao assunto deste livro incluem indexação com aux+lio de com!utador, indexação com!letamente autom"tica, encamin8amento de mensagens Bcategorização de textosC, sumarização e extração de textos, e am!liação e geração de textos. %s !es'uisas so0re indexação com aux+lio de com!utador, em lin8a, a!licada a livros, artigos e outras !u0licaçes remontam a mais de 3 anos Bver, !or exem!lo, &ennett, 1959 e &ennett et al., 196)C. M aux+lio em lin8a assume v"rias ormas sugestão de termos aos indexadores B!or exem!lo, com 0ase no t+tulo, resumo ou outro texto tra0al8ado !elo com!utador a !artir de termos ;" inseridos !elo indexadorC, advert>ncia !ara certos erros do indexador B!or exem!lo, termos 'ue ainda não se ac8am no voca0ul"rio do sistema ou com0inaçes indevidas de termosC, su0stituição de termos inaceit"veis !or termos aceit"veis, e interace com a 0ase de dados !ara !ermitir ao indexador vericar como certos termos oram usados anteriormente ou como certos itens oram antes indexados. Ms sistemas de indexação em lin8a em am0ientes o!eracionais atuais oerecem v"rios graus de a;uda e com!lexidade. Dor exem!lo, o sistema em uso na 2ational Li0rarA o edicine, o ES Bata Ereation and aintenance SAstemC, mostra v"rias mensagens ao indexador, como oi mencionado no ca!+tulo 3. Sistemas de indexação com aux+lio de com!utador mais com!lexos su!eram esses recursos e c8egam ao !onto, !or exem!lo, de indexar !arcialmente um item ou, !elo menos, sugerir termos ao indexador. ncia dessas ex!resses em texto de entrada Bnormalmente t+tulos e resumosC leva o sistema a !roduzir uma lista de descdtores candidatos 'ue serão revistos !elo indexador. 2o E%SI, tra0al8os relacionados com esse desenvolveram !rocedimentos !ara ligação com os termos do tesauro da 2%S% dos termos atri0u+dos a registros !or outras ag>ncias e com o em!rego de outros voca0ul"rios BSilvester et al., 1993C. %inda !erdura um grande interesse !ela indexação autom"tica destinada a !e'uenas a!licaçes es!ecializadas, !articularmente no cam!o 0iom=dico. :m um exem!lo B&orst et al., 199)C, o texto de resumos de alta de !acientes = analisado, a m de atri0uir automaticamente os descritores cl+nicos relevantes. e certa orma !arecido com esse sistema = o descrito !or Mliver e %ltman B199C, 'ue analisar" !rontu"rios m=dicos e a eles atri0uir" termos da S2M: BSAstematized 2omenclature o Yuman and *eterinarA edicineC. :m0ora se reivindi'ue um n+vel razo"vel de desem!en8o !ara esse ti!o de indexação !or atri0uição em "reas es!ecializadas, esses !rocessos autom"ticos geralmente não conseguem alcançar o n+vel de desem!en8o o0tido !or indexadores 8umanos Bver, !or exem!lo, E8ute e qang, 1993C. 2ão o0stante, esse ti!o de indexação autom"tica !oder" reduzir a carga de ))
tra0al8o dos indexadores 8umanos ao azer uma atri0uição !reliminar. 7indNesc8 e %ronson B199C analisam alguns dos !ro0lemas de am0igidade !resentes na ligação do texto com voca0ul"rios m=dicos Bneste caso, o -los. M sistema !ode instar o indexador a atri0uir determinado termo e tam0=m corrigi1 'uando o termo or em!regado de modo ina!ro!riado. Dor exem!lo, o indexador 'ue atri0uir um termo em 'ue a!areça a !alavra neo!lasia BcncerC com indicação da localização da doença B!or exem!lo, neo!lasia ?sseaC !ode ser lem0rado a atri0uir um termo associado 'ue re!resenta o ti!o 8istol?gico da neo!lasia B!or exem!lo, adenocarcinomaC. Mu o indexador 'ue atri0uir uma com0inação im!r?!ria, como >mur e neo!lasias ?sseas, !oder" ser inormado do termo correto, neste caso neo!lasiasemorais. M edlnd:x oi a0andonado em avor de !es'uisas so0re m=todos mais totalmente autom"ticos. Mutros sistemas es!ecialistas oram desenvolvidos !ara auxiliar no treinamento de indexadores ao inv=s de a;udar no !rocesso de indexação de orma rotineira$ um sistema desse ti!o - E%I/ BEom!uter- %ssisted Indexing /utorC oi desenvolvido na 2ational %gricultural Li0rarA BIrving, 1996C. Kual'uer sistema inormatizado 'ue auxilie no tra0al8o de indexação tem"tica !ode ser visto como um sistema es!ecialista, !elo menos no sentido mais lato do termo, !rinci!almente se a;udar uma !essoa menos ex!eriente a se a!roximar do tra0al8o de um indexador es!ecializado. : sistemas 'ue sugerem termos aos indexadores ou corrigem certos erros deles !odem ser vistos como sistemas 'ue t>m !elo menos um tantin8o de Rintelig>nciaO. %lguns sistemas ou !rogramas descritos na literatura são citados como Rarticialmente inteligentesO. :ncontram-se exem!los em riscoll et al. B1991C e Tones e &ell B199)C. Ms dois Hltimos autores descrevem um sistema !ro;etado !ara extrair !alavras ou ex!resses de textos, a m de ormar entradas de +ndices. Seu uncionamento, em grande !arte, 0aseia-se em listas armazenadas de !alavras a serem ignoradas, !alavras#ex!resses#nomes de recon8ecido interesse, e listas auxiliares !ara desam0iguação de 8om?graos, !ara undir ormas do singular#!lural e !ara !ermitir uma an"lise sim!les Blista de terminaçes de voc"0ulosC. %s listas são com0inadas !ara ormar um dicion"rio, 'ue tam0=m inclui inormaçes 'ue !ermitem outros recursos, como, de modo limitado, indexação tanto com os termos es!ec+cos 'uanto com os mais gen=ricos \generic !osting]. M sistema descrito !or riscoll et al. tam0=m se destina a encontrar no texto termos de indexação Hteis. M texto = !rocessado em cote;o com uma lista de mais de 3 ex!resses. % ocorr>ncia de uma delas no texto aciona o uso de regras de inserção e eliminação. %s regras de eliminação sim!lesmente evitam novo !rocessamento de !alavras ou ex!resses 'ue se;am am0+guas, en'uanto as regras de inserção !odem gerar, !or im!licação, um con;unto limitado de termos !rocurados B!ara com!letar um R!adrãoOC. Dor exem!lo, as !alavras RtimeO, RoverO e RtargetO \tem!o, so0re, alvo] gerarão %I7 W%7F%7: \guerra a=rea], se a!arecerem P distncia de x !alavras uma da outra. alone et al. B1991C a!resentam um modelo estat+stico !ara !revisão do desem!en8o deste sistema. Sistemas como os do ti!o descrito !or riscoll et al. e !or Tones e &ell são engen8osos. São ca!azes de realizar indexação !or extração, ou extração com atri0uição limitada, em n+vel com!ar"vel ao alcançado !or indexadores 8umanos e !or um custo menor. 2o m+nimo, são Hteis !ara a!resentar termos candidatos 'ue serão revistos !or seres 8umanos. /odavia, não se !ode realmente concordar 'ue a!resentem intelig>ncia verdadeira. M mesmo se !ode dizer dos !rogramas 'ue desenvolvell1 RtesaurosO e outros recursos auxiliares de 0usca com 0ase na coocorr>ncia de termos B!or exem!lo, E8en et al. 1994C. Eontinuam a a!arecer na literatura !es'uisas destinadas a identicar mel8ores crit=rios de associação estat+stica !ara a atri0uição de termos de voca0ul"rios controlados, com 0ase nas ocorr>ncias de !alavras no texto. Dlaunt e 2orgard B199C, !or exem!lo, descrevem ex!eri>ncias com a atri0uição de termos do tesauro I2SD:E com 0ase numa t=cnica de Rcolocação lexicalO. ))9
% 2ational Li0rarA o edicine B2LC investe atualmente ex!ressivos recursos no desenvolvimento de !rocessos !ara atri0uir automaticamente a artigos de !eri?dicos os ca0eçal8os do edical Su0;ect Yeadings BeSYC. Isso est" se tornando uma necessidade cr+tica, devido ao volume de !rocessamento cerca de artigos !or ano de cerca de 3 !eri?dicos 0iom=dicos, com mais de 19 termos nos voca0ul"rios eSY. M !ro0lema = a0ordado !ela 2L Indexing Initiative. %ron-son et al. B)C assim a ;ustica h medida 'ue um nHmero cada vez maior de documentos torna-se dis!on+vel em ormato eletrQnico e mais organizaçes desenvolvem R0i0liotecas digitaisO !ara seus acervos, !assam a ser necess"rias t=cnicas automatizadas !ara acessar as inormaçes. 2ão = !oss+vel indexar manualmente cada documento, e novos m=todos devem ser desenvolvidos. :ssas consideraçes levaram a !romover na 0i0lioteca a Indexing Initiative. =todos automatizados desenvolvidos e im!lementados nesse !ro;eto terão um im!acto im!ortante na ca!acidade de a 2L continuar oerecendo serviços de alta 'ualidade a seu !H0lico B!. 16C.
/r>s m=todos !rinci!ais de indexação autom"tica estão sendo !es'uisados na 2L. Eada um deles !ode gerar uma lista de candidatos a ca0eçal8os de assuntos ordenada !or relevncia !rov"vel$ alternativamente, a ordenação !ode ser o0tida !ela com0inação de dois m=todos ou, eetivamente, todos tr>s. ois desses m=todos envolvem a ligação com os termos do eSY de ex!resses !resentes nos t+tulos dos artigos e nos resumos. M ncias de !alavras de t+tulos de artigos e ocorr>ncias de !alavras em resumos B= !reciso 'ue uma !alavra-c8ave ocorra !elo menos tr>s vezes !ara ser considerada im!ortanteC. e!ois de 8aver !rocessado 1 registros, a atri0uição autom"tica de descritores oi com!arada com descritores atri0u+dos !or seres 8umanos. Ms m=todos autom"ticos omitiram muitos descritores 'ue as !essoas atri0u+ram corretamente e acrescentaram muitos 'ue não deviam ter sido atri0u+dos, em0ora tam0=m 8a;am acrescentado uma m=dia levemente su!erior a um descritor !or registro 'ue os seres 8umanos deveriam ter atri0u+do mas não o zeram. os 4,4 descritores !or registro atri0u+dos automaticamente, a!enas 3,4 oram ;ulgados corretos. %s condiçes em 'ue tra0al8aram eram muito sim!les em com!aração com as do :LI2: B!or exem!lo, um voca0ul"rio muito menor e muito menos termos atri0u+dos !or itemC o 'ue serve !ara dar uma id=ia dos grandes !ro0lemas envolvidos na tentativa de automatizar totalmente a indexação !or atri0uição no am0iente de uma 0ase de dados real. &rads8aV e Yammond B1999C descrevem um sistema em 'ue as citaçes 'ue uma !u0licação az de outra !odem levar P extração de texto 'ue seria uma descrição Htil !ara recu!eração. Isto =, se a !u0licação % cita a !u0licação &, % talvez inclua texto 'ue indica do 'ue trata & ou, !elo menos, do 'ue ac8a 'ue & trata. Dor exem!lo, um tra0al8o de Yar!ring B))C cita um livro de DanosXA e arma DanosXA identicou tr>s n+veis !rinci!ais de signicado na arte descrição !r=-iconogr"ca, identicação iconogr"ca, e inter!retação iconogr"ca ou RiconologiaO.
claro 'ue este texto oerece alguns Rtermos de indexaçãoO Hteis !ara DanosXA signicado, arte, iconograa, iconologia e assim !or diante. M m=todo = curioso, mas = di+cil !erce0er nele alguma a!licação !r"tica, exceto, talvez, !ara uma 0ase de dados de textos em "rea tem"tica altamente es!ecializada. Ms exem!los de 0uscas 0em-sucedidas usados !or &rads8aV e Yammond Bem consultas so0re RTavaO e Rcommon Lis!OC são 0astante comuns, )3
!rinci!almente !or'ue resultados iguais teriam sido o0tidos com 0uscas de !alavras-c8ave nos t+tulos. Woodrup e Dlaunt B199C descrevem um sistema singular !ara indexação geogr"ca autom"tica. estina-se a \...] extrair de documentos nomes de lugares e tam0=m indicadores geogr"cos mais gen=ricos, e utilizar a interseção desses reerentes !ara gerar estimativas da "rea P 'ual se reere um documento B!. 5C.
2omes de lugares identicados no texto !odem ser cote;ados com uma 0ase de dados 'ue ornecer" coordenadas de latitude#longitude e tam0=m Rcaracter+sticasO correlatas, como RNorestaO, RreservaO, R!ortoO e R!ntanoO. Darece !rov"vel 'ue, !elo menos na maior !arte das a!licaçes, sem!re 8aver" itens 'ue não !odem ser indexados automaticamente. 7i0eiro-2eto et al. B)1C, !or exem!lo, descrevem !rocessos !ara atri0uição autom"tica de categorias da Elassicação Internacional de oenças BEIC a !rontu"rios m=dicos. M texto dos !rontu"rios = cote;ado com termos relativos a cada uma das categorias e su0categorias da EI Bextra+das de seu +ndice, ;unto com dicion"rios de sinQnimos e siglasC. Eom 0ase na indexação de mais de ) !rontu"rios, os autores armam 'ue o0tiveram resultados RexcelentesO. :m0ora muito !oucos dos c?digos atri0u+dos ossem ;ulgados RerradosO, mais de 3 registros não rece0eram o c?digo RidealO. esses, 91 não rece0eram c?digo algum Bisto =, o algoritmo não conseguiu index"-losC, 'ue, na grande maioria, asseveram os autores, [re!resentam casos R'ue somente !odem ser inteiramente categorizados com aux+lio 8umano B!or'ue, !or exem!lo, exigem o con8ecimento es!ec+co de determinada !atologiaC^. Eontinuam as !es'uisas na "rea de Rindexação semntica latenteO. %nderson e D=rezEar0allo B)1C descrevem o m=todo da seguinte orma % indexação semntica latente BISLC = um dos mais ela0orados esorços atuais visando a uma indexação autom"tica de alta 'ualidade. Fundamenta-se em agru!amentos de termos 0aseados em co-ocorr>ncia e identicação de documentos relativos a tais agru!amentos. %o se a!oiar em dados de co-ocorr>ncia a ISL tam0=m consegue lidar com o !ro0lema da variedade de termos 'ue ex!ressam id=ias semel8antes. \...] Eomo exem!lo da ca!acidade de a ISL lidar com terminologia divergente, imaginemos documentos so0re conserto e manutenção de autom?veis. ocumentos dierentes usarão v"rios termos dierentes como Rautom?velO, RcarroO, Rve+culo automotorO, RsedãO, al=m dos nomes de marcas e modelos - R&uicXO, RDlAmout8O, RE8eroXeeO. M !rograma ISL, mui !rovavelmente, relacionar" esses termos entre si devido ao alto n+vel de co-ocorr>ncia com termos comoO ?leoO, RgasolinaO, Rcom0ust+velO, Rcar0uradorO, R!neusO, Rar-condicionadoO, etc. M !rograma cria agru!amentos de termos altamente relacionados B!or meio da co-ocorr>nciaC, de modo 'ue, 'uando um nHmero suciente deles ocorre num documento, este !ode ser ligado ao agru!amento res!ectivo. %ssim, = !oss+vel azer 0uscas so0re cuidado e manutenção de car0uradores de autom?veis a gasolina sem nos !reocu!armos com as !alavras es!ec+cas usadas !ara autom?vel. /odas as !alavras 'ue signicam mais ou menos o mesmo 'ue autom?vel serão ligadas ao mesmo agru!amento, P medida 'ue um nHmero suciente de outros termos co-ocorrentes coincidir com os termos do agru!amento B!. )55C.
2a realidade, a indexação semntica latente não = de ato um m=todo de indexação, mas uma maneira de desenvolver automaticamente uma estrat=gia de 0usca !ara !roduzir termos semanticamente relacionados. Dor exem!lo, o termo % estar" um tanto relacionado com o termo q se am0os ocorrerem re'entemente com o termo K. Eom esse m=todo, !oder-se-" recu!erar documentos !ossivelmente relevantes cu;os termos de indexação dierem dos termos da consulta mas estão estatisticamente relacionados a ele. Segundo @ordon e umais B199C 2a !r"tica, isso signica 'ue dois documentos 'ue usam voca0ul"rios com alto grau de du!licidade !odem ser am0os recu!erados mesmo 'ue a consulta somente em!regue os termos 'ue indexam um deles. Igualmente, termos serão considerados R!r?ximosO uns dos outros se ocorrerem em con;untos de documentos coincidentes B!. 566C.
%nalisam o em!rego desse m=todo como uma maneira de identicar literaturas RdesconexasO Bver, !or exem!lo, SVanson, 199C a literatura % estar" relacionada com a literatura q se os termos de indexação de % orem similares aos de K e os de q orem tam0=m semel8antes aos de K, em0ora os termos conectivos em cada caso se;am dierentes. 2otem-se as semel8anças entre a indexação semntica latente e a recu!eração associativa descrita muito antes !or Stiles B1951C. )31
s dierentes m=todos estat+sticos !ara a seleção de ex!resses !ortadoras de conteHdo no texto, com!arou-as e avaliou seu em!rego con;unto na extração de ex!resses. @ood0A B)1C com!arou a extração de ex!resses !or meio de !rocessos ling+sticos Ban"lise sint"tica !ara identicar sintagmas nominais com extração 0aseada em estat+stica de re'>ncia, e c8egou P conclusão de 'ue o m=todo mais sim!les de re'>ncia a!resenta resultados tão 0ons 'uanto os do m=todo de an"lise sint"ticaC. M m=todo estat+stico !ode identicar !ares de !alavras 'ue ocorrem re'entemente num cor!us, sua re'>ncia num documento e sua ocorr>ncia no documento em ex!resses mais longas B@ood0A e 7eig8art, )1C. Ms !rocessos de indexação autom"tica relacionam-se muito de !erto com os !rocessos de categorização de textos Bou mel8or, classicação de textosC.1 :m ess>ncia, v"rias caracter+sticas de um texto, es!ecialmente a ocorr>ncia de diversas !alavras ou ex!resses, são em!regadas !elo com!utador !ara colocar esse texto numa ou v"rias categorias !reesta0elecidas. % origem conceitual disso est" nos !rogramas 'ue oram desenvolvidos !ara a disseminação seletiva de inormaçes BSIC. 2esta, as caracter+sticas de itens !u0licados recentemente são cote;adas com os R!ers de interesseO de !essoas ou gru!os. %o ocorrer uma coincid>ncia de determinado valor, o item selecionado ser" levado ao con8ecimento da !essoa ou gru!o. :sse ti!o de serviço de noticação corrente remonta, de ato, a 1949. :sse cote;o de documentos rece0idos com os !ers de interesses armazenados no sistema = designado Rltragem e encamin8amentoO no am0iente /7:E. 7o0ertson B))C az uma revisão desse com!onente das !es'uisas /7:E. ncia de not+cias com o em!rego de um es'uema de at= 56 categorias BYaAes e Weinstein, 1991$ YaAes, 199)aC. E8en et al. B199C descrevem !rocessos !ara identicação de conceitos 'ue ocorrem no texto de reunies eletrQnicas$ neste caso, os conceitos são identicados !elos !rocedimentos ao inv=s de serem !reesta0elecidos. qang B1999C com!arou o desem!en8o de v"rios m=todos de categorização de texto, valendo-se de dierentes crit=rios de avaliação, em diversas coleçes de telegramas de not+cias da 7euters. % categorização autom"tica de texto est" incor!orada a muitos sistemas o!eracionais de !u0licação. :ncontra-se um 0om exem!lo no tra0al8o de %l-Zoa8i et al. B)1C. % a!licação inclui a atri0uição de ementas de casos ;ur+dicos a um es'uema de classicação 0aseado em mais de 13 conceitos legais. % cada semana são !roduzidas cerca de 1) ementas. % categorização 0aseia-se undamentalmente nos su0stantivos e !ares de su0stantivosu0stantivo, su0stantivo-ver0o e su0stantivo-ad;etivo 'ue ocorrem no texto da ementa, cote;ados com os su0stantivos#!ares de su0stantivos relativos a cada categoria. % atri0uição não = com!letamente autom"tica - os !rocessos resultam em sugestes de categorização 'ue são examinadas !or uma e'ui!e editorial. %rma-se 'ue os !rocessos autom"ticos se com!aram avoravelmente com os !rocedimentos manuais, 'ue su0stituem, em termos da 'uantidade de ementas !rocessadas !or semana. Dara um ingresso semanal de 1) ementas a categorização autom"tica az cerca de 1 5 sugestes, 9 das 'uais são aceitas, 16 recusadas e 43 não são adotadas !or razes editoriais Ba !recisão = estimada em 9f 13#15C. Y" atualmente !rogramas de com!utador 'ue realizam algum n+vel de classicação autom"tica de recursos da 7ede B/ri!!e, )1$ 7eamA, ))C. 7eamA, 'ue trata o !rocesso como RautocategorizaçãoO, resume algumas das a0ordagens % !rimeira e mel8or coisa 'ue um !rograma de autocategorização !ode azer = examinar com muita ra!idez cada !alavra do documento e analisar as re'>ncias de !adres de !alavras e, com 0ase numa com!aração com a taxonomia existente, atri0uir o documento a determinada categoria dessa taxonomia. Mutras coisas 'ue estão sendo eitas com esse !rograma são Ragru!amentoO ou Rconstrução de taxonomiaO em 'ue o !rograma = sim!lesmente a!ontado !ara uma coleção de documentos, !or exem!lo de 1 a 1 , e ele !es'uisa em todas as com0inaçes de !alavras em 0usca de aglomerados ou agru!amentos de documentos 'ue !areçam ser da mesma classe B!. 1C. 1
*er @ut8rie et al. B1999C !ara uma an"lise dos crit=rios de re'>ncia na categorização de textos.
)3)
/ri!!e menciona diversos !rodutos desse ti!o, inclusive um da em!resa :!rise 'ue = assim descrito e acordo com YanX &arnes, vice-!residente de estrat=gia da :!rise, Rncia, esse m=todo de ornecimento de conteHdos 'ue se 0aseia em classicação = muito mais ecaz do 'ue 0uscas em texto com!leto ou de utilidade geralO B!. 5C.
ZVon e Lee B)3C tam0=m tratam da classicação de s+tios da 7ede, en'uanto LaVrence et al. B1999C descrevem !rocedimentos !ara citação autom"tica de literatura cient+ca na 7ede. Ms !rocessos de categorização de textos at= agora descritos re!resentam ormas de classicação autom"tica, isto =, a atri0uição de itens a classes ou categorias !reesta0elecidas. %o longo dos anos, oram eitos estudos so0re a automação do ti!o de classicação com o 'ual os 0i0liotec"rios estão mais amiliarizados, a sa0er, a atri0uição de nHmeros de classicação a livros, mas disso não resultaram sistemas totalmente o!eracionais. IAer e @iguere B1994C zeram estudo so0re o desenvolvimento de um sistema es!ecialista 'ue esta0elecesse ligação entre um sistema de classicação e outro, no caso es!ec+co do es'uema de matem"tica da %merican at8ematical SocietA !ara a classe de matem"tica da Elassicação ecimal de eVeA. %rmam 'ue [ncias com a classicação autom"tica de !"ginas da 7ede com o em!rego da Elassicação ecimal de eVeA B/8om!son et al., 1996C. % atri0uição 0aseava-se no cote;o de texto da 7ede com as deniçes textuais dos nHmeros de classicação da E, mediante o uso de algoritmos desenvolvidos !ara utilização no sistema S%7/ de Salton. %ntes, Larson B199)C testou, em !e'uena escala, a atri0uição autom"tica de nHmeros de classicação da Li0rarA o Eongresso Seu o0;etivo era dierente a atri0uição autom"tica de um Hnico nHmero a um livro com 0ase nos t+tulos e ca0eçal8os de assuntos !resentes nos registros %7E. %ssim como no estudo eito !elo @ELE, seu algoritmo ordenava os nHmeros de classicação em ordem de !ro0a0ilidade de RcorreçãoO. Larson concluiu 'ue talvez não osse !oss+vel uma classicação totalmente autom"tica, mas uma classicação semi-autom"tica. Isto =, o !rograma !roduziria uma lista de nHmeros candidatos Bos de mais alta !ontuaçãoC da 'ual o classicador selecionaria o 'ue osse mais a!ro!riado. Des'uisas so0re classicação autom"tica tam0=m são eitas em cam!os com!letamente diversos. Dor exem!lo, &ailin et al. B1993C examinaram tra0al8os so0re classicação de com!onentes de !rogramas de com!utador B!ara um re!osit?rio de !rogramas reutiliz"veisC$ armam 'ue 8ouve caracter+sticas de a!rendizado, de m"'uina. Savi= B1994C lida com as !ossi0ilidades de classicação autom"tica de corres!ond>ncia administrativa. :m v"rios centros de !es'uisa, ora do cam!o da 0i0lioteconomia, ci>ncia da inormação, t>m !rosseguimento tra0al8os so0re a construção autom"tica de tesauros. %s erramentas assim constru+das, em0ora, de ato, !ossivelmente revelem relaçes Hteis entre termos, são
)33
muito menos estruturadas do 'ue os tesauros criados !or seres 8umanos. :ncontram-se exem!los em @ao et al. B1994C, E8en et al. B1994C e Lu et al. B1994C. :m0ora a indexação assistida !or com!utador !ossua uma longa 8ist?ria, a redação de resumos assistida !or com!utador Bao contr"rio dos m=todos totalmente autom"ticosC tem rece0ido muito !ouca atenção. Eraven B), )1C, no entanto, descreveu um sistema 'ue gerar" automaticamente !alavras-c8ave ou ex!resses a !artir de texto com!leto e as exi0ir" em ;anelas !ara a;udar 'uem estiver !re!arando um resumo !ara esse texto. %s ex!resses são escol8idas com 0ase num escore num=rico 'ue reNete o nHmero de !alavras-c8ave Rre'entesO na ex!ressão, o taman8o da ex!ressão e o nHmero de vezes em 'ue ela ocorre. Ms su;eitos de sua ex!eri>ncia ;ulgaram 'ue as ex!resses extra+das não eram mais Hteis do 'ue as !alavras-c8ave na redação dos resumos. % denominação Rredação autom"tica de resumosO cedeu lugar P denominação Rsumarização de textosO. 2a realidade, nen8um gru!o de !es'uisa conseguiu !roduzir automaticamente o ti!o de resumo 'ue uma !essoa consegue redigir. % sumarização autom"tica ainda = uma 'uestão de seleção de rases e o o0;etivo das !es'uisas nesta "rea consiste em otimizar essa seleção Bno sentido de escol8er as rases 'ue mel8or re!resentem o conteHdo do texto !resenteC e organizar as rases selecionadas. B!ossivelmente modicando-as mediante alguma orma de usãoC !ara mel8orar a clareza e utilidade do extrato.. % sumarização !ode envolver v"rias transormaçes do texto !ara condens"1 ainda mais. Dor exem!lo, = !oss+vel agregar enunciados !or meio de an"lise sint"tica e semntica. ani B)1C a!resenta o exem!lo muito sim!les de RToão e aria ;antaram ;untosO e R:ntão Toão l8e !ro!Qs casamentoO 'ue se agregam !ara ormarO Toão !ro!Qs casamento a aria de!ois do ;antarO. %s limitaçes dos m=todos atuais de sumarização oram 0em ex!licadas !or Ya8n e ani B)C \...] sua a!licação limita-se P extração - selecionar !assagens originais do documento-onte e concaten"-las de modo 'ue !roduzam um texto menor. % redação de resumos, em com!ensação, !araraseia em termos mais gerais a'uilo de 'ue trata o texto. M m=todo de concatenação !ara azer a extração em !ouco contri0ui !ara garantir a coer>ncia do resumo, o 'ue !ode dicultar a leitura do texto. %l=m do 'ue, nem sem!re a onte !ossui texto - !or exem!lo, um evento es!ortivo em videotei!e ou ta0elas 'ue mostram dados econQmicos - e as erramentas atuais não !odem resumir m+dia não-textual. Finalmente, essas erramentas atualmente não tra0al8am com ontes mHlti!las. Dor exem!lo, se 8ouvesse muitas not+cias na 7ede so0re um evento, seria Htil se o resumidor !udesse ca!turar inormaçes comuns e novas B!. )9C.
%s duas Hltimas limitaçes mencionadas realmente não são mais v"lidas !or'ue agora existem diversos m=todos !ara resumir material em v+deo Bver ca!+tulo 13C e multidocumentos. Ya8n e ani B)C salientam 'ue os m=todos atuais de extração utilizam um modelo de !onderação linear com v"rios com!onentes, tais como localização no texto, nHmero de ocorr>ncias na 0ase de dados como um todo e o a!arecimento de ex!resses-deixa \cue !8rases]. %ssim, uma unidade de texto Bgeralmente uma aseC seria selecionada com 0ase num modelo do seguinte ti!o Deso da rase { !eso da localização !eso da ex!ressão-deixa !eso da ocorr>ncia no texto !eso da ocorr>ncia na 0ase de dados
2aturalmente, o Hltimo com!onente = um !eso negativo !alavras ou ex!resses o0t>m escores mais elevados 'uanto menos re'entem ente ocorrerem al8ures na 0ase de dados. Ya8n e ani tam0=m sugerem o em!rego de um !eso adicional !ara !alavras#ex!resses 0aseado na ocorr>ncia al8ures no texto B!or exem!lo, !eso maior se tam0=m ocorrer no t+tuloC ou mesmo ocorr>ncia numa lista de termos 'ue re!resentam interesses atuais. Salton et al. B1996C descreveram um m=todo de !rodução autom"tica de resumos de textos com!letos. Ms m=todos em!regados !ara medir a semel8ança entre !ares de documentos Bver gura 111C !odem ser tam0=m em!regados !ara medir a semel8ança entre !ares de !ar"graos no mesmo documento. %ssim, !odem ser ormados agru!amentos de textos, em 'ue um agru!amento consiste em !ar"graos, !ossivelmente extra+dos de !artes com!letamente dierentes do texto, 'ue !arecem tratar do mesmo tema. %rmam 'ue isso !ermite a ormação de resumos de textos, intelig+veis, !or meio da extração de !ar"graos. M0serve-se 'ue o tra0al8o deles = um tanto dierente da maioria dos tra0al8os 'ue tratam de redação autom"tica de resumos, 'ue se 0aseiam na rase como unidade, e não no !ar"grao. )3
Ms !rocedimentos em!regados !or Salton et al. !roduzem resumos de textos mais longos do 'ue as a0ordagens mais convencionais. 7esumos de textos !roduzidos !or essa extração de !ar"graos oram com!arados com resumos !roduzidos !ela extração eita !or seres 8umanos de !ar"graos Rim!ortantesO. Ms !es'uisadores consideram aceit"veis os !rocessos autom"ticos !or'ue o resumo da+ resultante tem tanta !ro0a0ilidade de coincidir com um resumo extratado !or uma !essoa 'uanto dois resumos extratados !or !essoas t>m de estar de acordo um com o outro, em0ora os !rocessos autom"ticos saiam muito mais 0aratos. cZeoVn et al. B1994C e aA0urA B1994C descrevem atividades altamente es!ecializadas de sumarização. Ms !rimeiros geram resumos narrativos de dados armazenados Be não de texto narrativoC relativos a ;ogos de 0as'uete0ol e atividade de !lane;amento de redes teleQnicas, en'uanto o sistema de aA0urA gera resumos textuais de mensagens militares altamente condensadas e estruturadas Bdados de 0atal8aC. 2omoto e atsumoto B)1C descrevem um m=todo de criação de resumos em 'ue a RdiversidadeO = levada em conta na ormação do extrato. Isto =, são identicados os v"rios t?!icos a0rangidos !elo texto e = selecionada a rase mais re!resentativa !ara cada t?!ico. Saggion e La!alme B)C descrevem um m=todo de sumarização 0aseado em Ran"lise seletivaO. M m=todo !ossui duas eta!as. 2a !rimeira, um resumo indicativo = a!resentado ao usu"rio Bna realidade, a!enas uma lista de termos-c8ave extra+dosC$ se o usu"rio 'uiser mais, serão recu!eradas e a!resentadas a ele !assagens im!ortantes , do texto. M m=todo usado !or Le8mam B1999C 0aseia-se na seleção de rases 'ue conten8am a maior concentração de !alavrasO indicadoras de conteHdoO ou ex!resses como Rnesta !es'uisaO, Ro m=todoO e R= examinadoO. %inda existe um orte interesse !ela !re!aração autom"tica de extratos. Dor exem!lo, oens e umortier B)C descrevem !rocedimentos !ara !rodução de extratos de artigos de revistas de interesse geral. % nalidade desses Rresumos em realceO \8ig8-lig8t a0stracts] = des!ertar suciente interesse dos leitores 'ue, navegando em lin8a nos resumos, sentiriam vontade de ler o artigo inteiro. :les descrevem as caracter+sticas alme;adas da seguinte orma M resumo em realce = indicativo do conteHdo do texto original. Sugere os !rinci!ais t?!icos do artigo sem entrar em muitos detal8es, o 'ue tornaria su!=rNua a leitura do texto com!leto. M resumo em realce !ossui uma dimensão adicional. eve não a!enas ser actual e sugerir de 'ue trata o artigo, mas tam0=m estimular a a'uisição do artigo com!leto. M resumo consiste em recortes de texto, isto =, rases e enunciados extra+dos do texto. e !reer>ncia cont=m rases curtas e acilmente intelig+veis, 'ue não de!endam do contexto do artigo circundante !ara !ermitir uma inter!retação correta. im!ortante incluir linguagem conversacional no resumo B!or exem!lo, rases em discurso direto, !erguntasC, !or'ue isso o torna interessante B!. 4)1C.
Seu !rocesso de sumarização utiliza os !adres de discurso caracter+sticos dos relatos de not+cias, a m de desenvolver uma Rgram"tica do textoO 'ue = em!regada na an"lise sint"tica do texto. % Rsinalização de deixas ling+sticasO identica rases relevantes !ara inclusão no resumo. oens et al. B1999C sustentaO 'ue o con8ecimento da estrutura do discurso de v"rios ti!os de textos = Htil no !ro;eto de sistemas !ara geração de texto 'ue extração de texto. :sses autores tra0al8am es!ecialmente com textos ;ur+dicos. Yo;e em dia, são comuns os !rogramas !ara extração autom"tica de rasesc8ave de textos. *"rios !rodutos encontram-se dis!on+veis !ara !re!aração desses extratos !ara textos acess+veis na 7ede. iversos !rodutos, gratuitos ou de 0aixo !reço, oram examinados !or Tacs? B))C. %llan et al. B)1C descrevem m=todos !ara !rodução de Rresumos tem!oraisO de not+cias. % situação = a de uma corrente de not+cias so0re determinado t?!ico em 'ue as not+cias mudam ra!idamente e seria di+cil acom!an8ar as mudanças !or meio da leitura de todos os itens. Ms !rocedimentos visam a !roduzir um resumo revisto a intervalos regulares B!or exem!lo, de 8ora em 8ora ou no in+cio de cada diaC. Eada resumo visa a mostrar a!enas o 'ue mudou desde o resumo !recedente. Eom a sumarização tem!oral, a RnovidadeO torna-se um crit=rio Htil na seleção de rases. Isto =, uma rase nova, 'ue se;a 0em dierente das rases 'ue ocorreram no !assado, = um candidato !romissor !ara seleção. % seleção de rases 'ue a!arecerão nos resumos 0aseia-se numa com0inação de novidade e RutilidadeO B!ro0a0ilidade de relevncia !ara o assuntoC. :sse ti!o de rastreamento autom"tico do desenvolvimento de uma not+cia ao longo do tem!o oi denominado Rrastreamento de eventosO. *er, !or exem!lo, qang et al. B)C.
)34
@ong e Liu B)1C reerem-se a resumos 'ue se relacionam com determinado assunto como Rrelevantes !ara a consultaO. ani B)1C az uma revisão de tra0al8os so0re v"rias ormas de sumarização a!licada a a!resentaçes de multim+dia, 'ue inclui tanto sumarização de "udio 'uanto de v+deo. /am0=m = !oss+vel usar a sumarização autom"tica ;unto com outros !rocessos autom"ticos, como o em!rego dos resumos !roduzidos como entrada !ara categorização de texto Bver, !or exem!lo, Zo1cz et al., )1C. h medida 'ue os m=todos de sumarização oram se tomando cada vez mais a!rimorados, surgiam a!licaçes mais es!ecializadas. :las incluem sumarização de multidocumentos e miniaturização de textos. % sumarização de textos não !recisa restringir-se a um Hnico texto. 2a sumarização autom"tica de multidocumentos Bani, )1C, rases de muitas ontes inde!endentes !odem ser undidas !ara ormar um resumo. Dor exem!lo, todas as reer>ncias a determinada !essoa ou evento !odem ser localizadas numa 0ase de dados de textos, e essas reer>ncias com!aradas !ara eliminar redundncia e undir o 'ue restar em algumas rases !roeminentes. Sc8ipman et al. B)1C descrevem um sistema !ara criar um dossi> 0iogr"co de uma !essoa mencionada com desta'ue nos notici"rios mediante a extração de aluses !resentes numa variedade de textos. [Selecionar" e undir" descriçes de !essoas, extra+das de uma coleção de documentos, eliminando descriçes redundantes.^ :etua-se um alto n+vel de usão e sumarização. :is um exem!lo Bo texto su0lin8ado oi extra+do diretamente das ontes$ os conectivos, não su0lin8ados, são ornecidos !elo sistemaC YenrA YAde is a 7e!u0lican c8airman o Youse TudiciarA Eommittee and a !rosecutor in Senate im!eac8ment trial. Ye Vill lead t8e TudiciarA EommitteeOs im!eac8ment revieV. YAde urged 8is colleagues to 8eed t8eir consciences, [t8e voice t8at V8isoers in our ear, RdutAO, dutA, dutAO.^ 1
:ste resumo oi criado a !artir de uma coleção de 1 3 itens de uma ag>ncia de not+cias B66 !alavrasC 'ue contin8am 43 rases 'ue mencionavam YAde. Mutra a!licação da sumarização a multidocumentos, descrita !or :l8adad e cZeoVn B)1C, reere-se a !rontu"rios m=dicos. Ms !rocedimentos 'ue descrevem destinam-se a examinar as seçes de resultados !u0licadas em artigos de !eri?dicos recu!erados numa 0usca, localizar o texto dos artigos 'ue !areçam estar diretamente relacionados com as inormaçes constantes do !rontu"rio de um !aciente e !roduzir um resumo relacionado a esse !aciente. M !ro0lema da sumarização de multidocumentos, 0em como v"rias !oss+veis a0ordagens, = examinado !or @oldstein et al. B)C e !or ani B)1C. %tualmente muita atenção vem sendo dedicada P sumarização de textos B!or exem!lo, de mensagens de correio eletrQnicoC destinados a telas muito !e'uenas, como as de teleones celulares ou assistentes !essoais digitais. Eorston-Mliver B)1C descreve um desses m=todos ao 'ual denomina com!actação de texto. %s t=cnicas de com!actação incluem seleção de rases, eliminação de caracteres e !ontuação, e a su0stituição !or a0reviaturas de !alavras !or extenso ou ex!resses. %ssim, uma rase como esta /8e !ro0lem o automatic summarization !oses a varietA o toug8 c8allenges in 0ot8 2L understanding and generation.
ser" com!actada assim Dr0lmM%utmtcSmmezinDss*rtAM/g8E8llngsIn&t82L
&uAuXXoXten et al. B)1C descrevem m=todos !ara sumarização de !"ginas da 7ede !ara navegação com dis!ositivos !ort"teis de mão. Ms !rocedimentos 'ue desenvolveram incluem !arcelamento de !"ginas da 7ede em Runidades textuais semnticasO, 'ue !odem ser visualizadas com!leta ou !arcialmente B!or exem!lo, somente a !rimeira ou as tr>s !rimeiras lin8asC. M !rograma desenvolvido !ode, alternativamente, identicar e exi0ir aC as !alavrasc8ave mais im!ortantes extra+das da unidade, 0C a rase mais signicativa, ou cC tanto as !alavras-c8ave 'uanto a rase signicativa. % seleção de !alavra-c8ave 0aseiase em nHmero de ocorr>ncias na unidade de texto e estimativas de ocorr>ncia na 7ede como um todo Bcom 0ase na amostragem de ) mil8es de !"ginasC. % seleção de rases usa versão modicada do m=todo de Lu8n !ara recon8ecimento de rases signicativas, ;" descrito neste ca!+tulo. M 1
YenrA YAde = !residente re!u0licano da Eomissão de Tustiça da Emara dos e!utados e !romotor no !rocesso de im!eac8ment no Senado. :le dirigir" a revisão do im!eac8ment na Eomissão de Tustiça. YAde conclamou seus colegas a ouvir suas consci>ncias, [a voz 'ue sussurra em seu ouvido, Rdever, dever, deverO.^ B2./.C
)35
desem!en8o relativo dos v"rios resumos oi avaliado com a !artici!ação de su;eitos 8umanos em tareas de 0usca de inormação. % com0inação de !alavra-c8ave e rase-c8ave oi a mais ecaz na conclusão da tarea. &oguraev et al. B)1C tam0=m trataram da sumarização miniaturizada de not+cias !ara dis!ositivos !ort"teis de mão. M recente incremento de atividades em torno da sumarização de textos tam0=m acarretou um interesse renovado !elos m=todos de avaliação Bver tam0=m o ca!+tulo 9C. ani B)1C divide a avaliação de resumos !re!arados automaticamente em m=todos intr+nsecos e extr+nsecos. Ms m=todos intr+nsecos incluem a. utilizar um gru!o de "r0itros !ara decidir 'uais as rases 'ue merecem ser selecionadas e as 'ue não merecem BconcordnciaC 0. avaliar a legi0ilidade do resumo em termos de certos crit=rios, como extensão da !alavra e da rase e 'ualidade gramatical$ !ara esse m !odem ser usados "r0itros 8umanos ou corretores gramaticais e de estilo B'ualidadeC c. com!arar um resumo !re!arado automaticamente com um resumoO idealO !re!arado !or seres 8umanos BinormatividadeC d. avaliar um resumo em termos de se = ca!az de res!onder um determinado con;unto de 'uestes$ o resumo !ode ser com!arado com o texto com!leto !ara esta avaliação Bm=todo 0aseado em conteHdoC e. avaliar 'uanto da inormação no texto com!leto = !reservado no resumo Bdelidade P onteC. Ms m=todos extr+nsecos recon8ecidos !or ani incluem 1C avaliar o resumo em termos de sua ca!acidade de !rever corretamente a relevncia do texto com!leto, )C avaliar sua ca!acidade de !ermitir a um analista 8umano classicar corretamente o texto com!leto, e 3C avaliação da com!reensão da leitura. ani tam0=m recon8ece o Rsistema avançado de avaliaçãoO, 'ue envolve a avaliação de resumos no contexto de um sistema totalmente o!eracional B!or exem!lo, em termos de satisação do usu"rioC. % sumarização de textos im!lica normalmente a extração de rases, em0ora se;am !oss+veis outros ti!os de extração, como a de determinados termos ou ti!os de termos, e talvez a colocação de termos extra+dos em algum ti!o de ga0arito. /omando um exem!lo totalmente 8i!ot=tico, um sistema !oderia monitorar o movimento de executivos de em!resas !or meio da an"lise de not+cias, e a rase TPoão *. %ru8ado1 6ice2residente de 6endas da +5% durante os Hltimos cinco anos1 foi nomeado 6ice2residente 4xecuti#o da UVWX seria redu8ida C seuinte estrutura: 4xecuti#o: Poão *. %ru8ado %aro anterior: 6ice2residente de 6endas 4mpreador anterior: +5% =o#o caro: 6ice2residente 4xecuti#o =o#o empreador: UVW "ata: > de no#embro de /@ (data da not&cia)
EoVie e Le8riert B1995C traçam um Htil !anorama so0re a extração de texto, e @ris8man B199C examina os !ro0lemas envolvidos na avaliação de resultados de tra0al8os de extração. S8uld0erg et al. B1993C oerecem a descrição minuciosa de uma a0ordagem. MnAs8XevAc8 B199C e Yo00s e Israel B199C, entre outros, tecem consideraçes so0re o !ro;eto de ga0arito. LaVson et al. B1995C consideram este ti!o de extração de dados#!reenc8imento de ga0arito como uma orma de Rmineração de dadosO. :sta denominação, no entanto, = a!licada com mais re'>ncia a !rocedimentos e !rogramas 'ue !rocuram desco0rir nos dados B!or exem!lo, registros de vendas ou !rontu"rios m=dicosC !adres e correlaçes signicativas, sem instruçes so0re o 'ue !rocurar Bver ca!+tulo anteriorC. Y" muitas a!licaçes !otenciais !ara esse ti!o de extração de texto e !reenc8imento de ga0arito B'uadroC, das 'uais a mais ?0via talvez se;a a !rodução de resumos de not+cias atuais. Yaug e &eesleA B199)C examinam outra a!licação em 'ue os dados de !rontu"rios de !acientes !odem ser recon8ecidos automaticamente, extra+dos e colocados so0 um nHmero limitado de ca0eçal8os B!or exem!lo, R'ueixas deO, R!aciente negaOC !ara a;udar os radiologistas na inter!retação de radiograas. Daice e Tones B1993C examinam o em!rego de uma a0ordagem de !reenc8imento de 'uadros na construção de resumos autom"ticos. Mutra a!licação es!ecializada do m=todo de ga0arito = a extração de citaçes 0i0liogr"cas do texto )36
de !atentes BLaVson et al., 1995C. Yum!8reAs et al. B)C descrevem o modo como !rocessos de !reenc8imento de ga0arito !odem ser a!licados P extração de determinados dados de !eri?dicos cient+cos. Ms !rocessos modernos de extração !odem identicar textos candidatos Bisto =, a'ueles cu;as !alavras-c8ave indicam alta !ro0a0ilidade de 'ue o texto conter" o ti!o de dado a ser extra+doC e !orçes do texto 'ue se;am 0ons candidatos !ara os !rocessos de extração, 0aseados numa com0inação de an"lise sint"tica e semntica. Taco0s e 7au B199C descrevem um desses sistemas a!licado P extração de inormação so0re uses de em!resas. % extração de inormação em geral = o0;eto de um livro organizado !or Dazienza B1999C. :m algumas situaçes de recu!eração, um con;unto limitado de caracter+sticas do texto !ode ser da maior im!ortncia. Dor exem!lo, datas e nomes Bde lugares, !essoas, organizaçesC são es!ecialmente Hteis em 0uscas de not+cias. Watters e Wang B)C descrevem um sistema ca!az de extrair das not+cias ex!resses su0stantivas !r?!rias \Rname !8rasesO] e categoriz"-las Bcomo local do evento, data do evento, nome !essoal, nome de instituiçãoC. M uso de iniciais maiHsculas = a deixa !ara identicação das ex!resses su0stantivas !r?!rias. M sistema destina-se P recu!eração interativa, em tem!o real, 0aseada num algoritmo de com!aração o usu"rio com acesso em lin8a 'ue encontra uma not+cia de interesse !ode !edir ao sistema 'ue localize outras not+cias 'ue se;am semel8antes a essa. M sistema ex!erimental !retende ser a!licado na 7ede [usando como interace os navegadores comuns da 7ede^. *"rios !rocessos oram desenvolvidos na 2ational Li0rarA o edicine B2LC !ara identicação#extração em textos m=dicos. &odenreider e _Veigen0aum B)C lidamO com a identicação de nomes !r?!rios, Wil0ur et al. B1999C com nomes 'u+micos, 7indNesc8 et. al. B1999C com terminologia de ligação molecular, 7indNesc8 et al. B)aC com terminologia de medicamentos e genes, e Sneiderman et al. B199C com termos anatQmicos. :m muitos casos, os termos identicados ou extra+dos são ainda !rocessados B!or exem!lo, !ara azer a ligação com o ncia rocX e ;azz]. Tones e DaAnter B))C descrevem !rocessos !ara extração autom"tica de !alavras-c8ave ou ex!resses-c8ave do texto dos documentos, com o o0;etivo de !roduzir sucedneos 'ue !ossam ser usados !ara !es'uisar em extensas tareas de recu!eração de texto na 7ede. % extração de Rex!resses-c8aveO = eita !or meio de !rocessos de a!rendizado de m"'uina. M algoritmo de extração a!rende com um con;unto de textos de treinamento nos 'uais as ex!resses c8ave ;" oram atri0u+das B!or exem!lo, !or seus autoresC. Eom 0ase em avaliação eita !or seres 8umanos, Tones e DaAnter concluem 'ue as ex!resses extra+das segundo seus !rocedimentos [não eram !iores, estatisticamente, do 'ue as a!resentadas !elos autores^. %nteriormente, Yui e @o8 B1995C zeram ex!eri>ncias com a geração autom"tica de resumos de artigos de ;ornais como !arte de uma interace de recu!eração e ltragem da 7ede. Yo;e em dia encontram-se dis!on+veis comercialmente !rogramas !ara extração de v"rias ormas de dados de s+tios da 7ede. Dor exem!lo, M;ala B))C reere-se a um !roduto 'ue !oder" azer 0uscas de mudanças na direção de em!resas, com!ra e venda de em!resas, resultados de reestruturação de em!resas e outros ind+cios de mudança nessas organizaçes Bentre outras a!licaçesC. %s a!licaçes correlatas ao !rocessamento de texto incluem vinculação de texto, aumento de texto e geração de texto. % vinculação de texto em!rega an"lises estat+sticas e#ou sint"ticas !ara identicar semel8anças entre dierentes !assagens do texto, em geral de documentos com!letamente dierentes, e assim vincul"-los BSalton e &ucXleA, 199)$ aareX, 199)$ Salton et al., 1996C. :m ess>ncia, o m=todo !ode ser adotado !ara !roduzir automaticamente v+nculos de 8i!ertexto.1 Dozzi e Eelentano B1993C analisam uma a!licação !r"tica de vinculação, 'ue inclui corres!ond>ncia e outros documentos administrativos. 1
)3
% am!liação de texto !ode ser considerada uma extensão da vinculação de texto. Ms sistemas !ro;etados !ara tal m tentam integrar !artes de textos de diversas ontes numa narrativa coerente - !or exem!lo, acom!an8ando not+cias so0re um evento, como uma usão de em!resas ou um desastre natural, em ;ornais Be assim a!lic"vel a tareas de !reenc8imento de ga0arito ou sumarização de multidocumentosC. *ariação disso = a !es'uisa !ara desenvolver erramentas 'ue integrem entradas de textos e imagens - !or exem!lo, relacionar uma !assagem descritiva num manual com elementos num diagrama e extrair texto 'ue elucide o !r?!rio diagrama B7a;ago!alan, 199C. E8en B1993C descreve um com!utador RmodeloO !ara integração de textos ans oriundos de dierentes ontes. @eração de texto reere-se a erramentas de geração autom"tica de ti!os limitados de texto e a sistemas es!ecialistas 'ue a;udam as !essoas a redigir v"rios ti!os de relat?rios. Y" sistemas deste ti!o, !or exem!lo, 'ue auxiliam na geração de documentação de !rodutos industriais, oerecendo acesso em lin8a a textos e elementos gr"cos a!lic"veis, de modo re!etitivo, na criação de v"rios ti!os de relat?rios Bver Smit8, 1991, !or exem!loC. :xem!lo de sistemas mais ela0orados = a R0ancada do editorO , descrita !or &ateman e /eic8 B1994C, 'ue !oder" extrair texto e estrutur"-lo em res!osta a necessidades editoriais. R%ssistentes inteligentes de redaçãoO modernos serão mais do 'ue corretores ortogr"cos orientarão na escol8a de !alavras, correção gramatical e uso do idioma BMaXman, 199C. StocX B1993C e StocX et al. B1996C descrevem um interessante sistema de 8i!erm+dia B%LF7:SEMC !ara recu!eração de imagens de arescos italianos do s=culo I* e inormaçes a eles !ertinentes. :ntre outras caracter+sticas, o sistema incor!ora uma interace de 0usca de linguagem natural e a ca!acidade de gerar res!ostas coerentes a !artir de Rtextos enlatadosO relativos a dierentes imagens de arescos armazenadas numa rede de 8i!erm+dia. StocX oerece um exem!lo da !ergunta R*oc> !oderia me mostrar e descrever um aresco de %m0rogio Lorenzetti em SienaO 'ue geraria a seguinte res!osta Ms :eitos do &om @overno = um aresco de %m0rogio Lorenzetti no Dalazzo Du0lico. Ms :eitos do &om @overno oi !intado em 133.
Ms v"rios com!onentes desta res!osta oram extra+dos de textos enlatados 'ue a!arecem em dierentes !artes da rede de 8i!erm+dia. emasco e cEoA B199)C descreveram uma a!licação es!ecializada de geração de texto. Seu tra0al8o visa a desenvolver uma interace 'ue a;ude !essoas 'ue !adeçam de graves deci>ncias motoras a com!or textos. s ormas, segundo as necessidades do usu"rio. %s tecnologias de recu!eração da inormação estão se diundindo numa am!la variedade de a!licaçes, onde antes eram !ouco usadas, es!ecialmente no mundo dos neg?cios. Eom eeito, alguns dos m=todos mais com!lexos de recu!eração da inormação oram mais 0em aceitos !or em!resas comerciais do 'ue !ela indHstria de serviços de inormação.
Dalavra ormada a !artir dos voc"0ulos com!ression e ex!ansion. B2./.C
)39
no 'uantitativo de !essoal necess"rio !ara lidar com !erguntas dos consumidores e reduzem a 'ualicação do !essoal designado !ara o serviço. /ornaram-se !articularmente Hteis !or'ue muitos dos !ro0lemas ocorrem de modo re!etitivo. ncia e )C !erguntas a serem eitas ao cliente, a m de concentrar a 0usca e assim recu!erar o caso e a solução correta. %s res!ostas Ps 'uestes aunilam o alcance da 0usca em0ora o consulente !ossa !es'uisar inormaçes so0re os casos armazenados Bver gura 113C !ara com!lementar as !erguntas. Eomo resultado desse !rocesso interativo, aos casos na 0ase de dados são atri0u+dos escores num=ricos 'ue !ermitem 'ue se;am ordenados !or relevncia !rov"vel.
Figura 11) ( &usca inicial numa 0ase de dados de um serviço de atendimento a clientes
)
%!ud /. L. %corn e S.Y. Walden. In Scott, %.E.$ Zla8r, D., ed. Innovative applications o artifcial intelligence , !. 3-1. Eam0ridge, %, I/ Dress, 199).
%lguns serviços de atendimento a clientes incor!oram m=todos com!lexos de !rocessamento de linguagem natural. Dor exem!lo, %nicX B1993C descreve um desses sistemas, 'ue tam0=m inclui uma orma de tesauro !ara a;udar os usu"rios a identicar termos de 0usca alternativos, e m !rocurando desenvolver serviços 'ue os !r?!rios clientes !ossam usar !ara si, es!ecialmente serviços 'ue se;am im!lementados na 7ede undial. Yo;e em dia ;" existem !rogramas, dis!on+veis comercialmente, 'ue a;udam na im!lementação de serviços, 0aseados na 7ede, de atendimento a clientes B*arneA, 1995$ 7a!oza, 1995C, 'ue, inclusive, !ermitem aos clientes re!ortar !ro0lemas a um serviço de atendimento a !artir de navegadores em suas estaçes de tra0al8o BWals8, 1995C.
Figura 113 ( Des'uisa !or mais inormação em 0ase de dados de serviço de atendimento a clientes
%!ud /. L. %corn e S.Y. Walden. In Scott, %.E.$ Zla8r, D., ed. Innovative applications o artifcial intelligence , !. 3-1. Eam0ridge, %, I/ Dress, 199).
:m livro de oens B)C encontra-se uma descrição 0em com!leta dos !rocessos examinados neste ca!+tulo Be, em menor extensão, no anteriorC. %onclus$es
% recu!eração da inormação est" im!l+cita em todas as atividades de !rocessamento de texto ;" mencionadas. :m termos de com!lexidade, a recu!eração de rases ou !ar"graos situa-se a meio camin8o entre a recu!eração de reer>ncias 0i0liogr"cas Bt+!ica da maioria das 0uscas em lin8a eitas em 0i0liotecasC e a recu!eração de res!ostas reais a !erguntas reais. Erot e /urtle B199)C asseguram 'ue mel8oramentos im!ortantes na recu!eração )1
exigirão t=cnicas 'ue Rcom!reendamO o conteHdo de documentos e consultas e !ossam assim inerir se um item ser" Htil.1
Figura 11 ( Easos com ordenação mais alta selecionados com 0ase em consulta cr+tica e res!ostas dos clientes Ps !erguntas
%!ud /. L. %corn e S.Y. Walden. In Scott, %.E.$ Zla8r, D., ed. Innovative applications o artifcial intelligence , !. 3-1. Eam0ridge, %, I/ Dress, 199).
Figura 114 ( 7esumo de caso com a ação recomendada ao cliente
%!ud /. L. %corn e S.Y. Walden. In Scott, %.E.$ Zla8r, D., ed. Innovative applications o artifcial intelligence , !. 3-1. Eam0ridge, %, I/ Dress, 199).
:m algumas a!licaçes de !rocessamento de texto o com!utador deve distinguir entre com!onentes l?gicos do documento B!or exem!lo, t+tulo, resumo, texto !rinci!al, notas de roda!=, ta0elas, gurasC e identicar relaçes entre eles Bcomo, !or exem!lo, a ordem de leituraC. Isso oi designado, um tanto !om!osamente, Rcom!reensão do documentoO Bver, !or exem!lo, Semeraro et al., 199, e Droceedings ot8e /8ird International Eonerence, 1994C. 1
))
Ms m=todos 8o;e em!regados em grande !arte do !rocessamento de texto não são !articularmente novos. % maioria oi usada, talvez de modo mais rudimentar, 8" 3 anos, ou mais, !or Lu8n, &axendale, :dmundson, &orXo, aron, Simmons, Salton e muitos outros !es'uisadores Bver o ca!+tulo 9 de Lancaster B1950C !ara uma visão geral dessa "rea na d=cada de 195C. Eomo oi sugerido, atualmente = !oss+vel alcançar mel8ores resultados !or'ue 8" muito maior dis!oni0ilidade de con;untos de textos eletrQnicos e a !ot>ncia dos com!utadores !ossi0ilita o !rocessamento desses textos com razo"vel eci>ncia. 2ão o0stante, mesmo os m=todos atuais mais com!lexos estão longe do ideal em termos de resultados alcançados, tem!o e custos de !rocessamento. %demais, ainda são relativamente !oucos os sistemas verdadeiramente Ro!eracionaisO no sentido de 'ue ornecem um serviço real de orma rotineira. Taco0s B199)aC assim encara a situação :m0ora 8a;am ocorrido alguns !rogressos vis+veis na direção dos sistemas inteligentes 0aseados em textos, não c8egamos muito !erto de um estado aceit"vel de desenvolvimento da tecnologia B!. 4C.
Yo00s et al. B199)C armam 'ue o o0;etivo nal = desenvolver um sistema 'ue \...] recu!erar" todas as inormaçes 'ue este;am, im!l+cita ou ex!licitamente, !resentes no texto, e concretizar" isso sem cometer erros. :ste modelo ainda est" muito al=m do estado atual da tecnologia. /rata-se de uma meta incrivelmente alta !ara seres 8umanos, 'uanto mais !ara m"'uinas B!. 13-1C.
conald B199)C ressalta 'ue, em geral, os mel8ores analisadores \!arsers] modernos somente lidam com rases relativamente curtas e sim!les. Eom rases mais longas e com!lexas, o m"ximo 'ue conseguem = identicar ragmentos com!onentes B!or exem!lo, um sintagma nominalC$ estão longe de !roduzir uma an"lise com!leta e sem am0igidade. 2o caso de uma rase de mat=ria ;ornal+stica, de taman8o comum, com ) a )4 !alavras, os analisadores atuais !rovavelmente c8egariam a centenas de an"lises !oss+veis. Segundo conald, [nen8um analisador c8ega !erto de com!reender tudo num texto real, como uma re!ortagem^. esmo com cor!ora relativamente !e'uenos Bcerca de 1 4 mensagensC de textos curtos Bnormalmente !or volta de 1 rasesC, o mel8or dos m=todos atuais est" longe de !roduzir resultados !ereitos - !or exem!lo, num exerc+cio de extração de texto, nem todas as rases relevantes são selecionadas e nem todas as rases selecionadas são relevantes. :m condiçes controladas de avaliação, muitos sistemas modernos uncionam somente !erto da marca de 4#4 BTaco0s e 7au, 199$ Sund8eim, 1994C - !or exem!lo, !roduzem cerca de metade dos ga0aritos Bre!resentaçes estruturadas 0aseadas em texto extra+do das mensagensC 'ue deveriam !roduzir e cerca de metade dos !roduzidos são es!erados Bisto =, coincidem com o modelo !reesta0elecidoC. 1 :m0ora alguns sistemas de !rocessamento de texto re!ortem resultados muito mel8ores, isso ocorre com tareas muito mais sim!les. Dor exem!lo, YaAes B199)aC relata 9f de revocação e f de !recisão !ara o EM2S/7<:, mas a tarea executada - colocar not+cias em at= ) categorias - = mais sim!les do 'ue os tra0al8os de extração de texto e !reenc8imento de ga0arito. qang B1999C arma 'ue o EM2S/7<: consegue alcançar tão 0ons resultados graças ao em!rego de [regras, desenvolvidas manualmente, es!ec+cas de uma "rea ou es!ec+cas de uma a!licação^ e 'ue essa a0ordagem = muito cara !ara a maioria das a!licaçes. :m condiçes controladas, = !oss+vel o0ter escores muito mel8ores em tareas de extração mais sim!les B!or exem!lo, encontrar entidades nomeadas no textoC ou tareas mais sim!les de !reenc8imento de ga0arito - envolvendo extração de texto relativo a entidades nomeadas BSund8eim, 1994C. M n+vel de desem!en8o de 4#4 na extração de rase#conclusão de ga0arito tam0=m !recisa ser contextualizado. São resultados o0tidos em "reas muito limitadas B!or exem!lo, atividade terrorista na %m=rica LatinaC. Dara azer a seleção de rases = !reciso criar um dicion"rio es!ec+co da "rea. esmo numa "rea muito limitada, isso !ode ser um tra0al8o 'ue re'uer mão-de-o0ra intensiva B1 4 !essoas#8ora oram mencionadas !ara um casoC, em0ora 8a;am sido desenvolvidas erramentas !ara construção desses dicion"rios automaticamente ou semi-automaticamente Bver 7ilope Le8nert, 1993, !ara um exem!loC.) 1
*ale a !ena o0servar 'ue os !es'uisadores modernos da "rea de !rocessamento de texto em!regam as mesmas medidas - revocação e !recisão - 'ue oram descritas !ela !rimeira vez na literatura de recu!eração da inormação na d=cada de 194.
)3
% tarea de encamin8amento na /7:E-5 B1996C conseguiu, 'uando muito, a!enas )f de !recisão B*oor8ees e Yarman, )C com somente 6 assuntos. :m geral, mesmo os mais com!lexos dos atuais !rocessos de indexação autom"tica saem !erdendo na com!aração com a indexação eita !or seres 8umanos 'ualicados. Dor exem!lo, E8ute e qang B1993C, tra0al8ando com relatos de casos cirHrgicos, constataram 'ue os c?digos de !rocedimento atri0u+dos !or seres 8umanos !roduziam mel8ores resultados do 'ue v"rios !rocessos autom"ticos, inclusive a indexação semntica latente. %nteriormente, Yers8 e YicXam B1991C relataram 'ue 0uscas em !alavras do texto Bsomente t+tulos e resumosC davam mel8ores resultados do 'ue 0uscas em registros indexados !or !essoas B:LI2:C ou !rocessados automaticamente em am0iente m=dico. ais tarde BYers8 e YicXam, 1994aC relataram Rnen8uma dierença signicativaO em 0uscas num manual m=dico com dois m=todos de !rocessamento autom"tico Bum 0aseado em !alavras e outro R0aseado em conceitosOC e uma a0ordagem 0ooleana de 0uscas em texto. Yers8 e YicXam B19940C azem um a!an8ado dos estudos de avaliação 'ue realizaram durante um !er+odo de 'uatro anos. oens e umortier B)C descrevem um m=todo de atri0uição de categorias a artigos de revistas de interesse geral. M +ndice de >xito relatado = muito modesto. Eom a!enas 1 categorias gen=ricas !ara atri0uir, o m"ximo 'ue seus !rocedimentos conseguem alcançar não !assa de 6f de revocação e 5f de !recisão. Isto =, esse m=todo atri0u+a 6f das categorias 'ue deviam ser atri0u+das en'uanto 5f das atri0uiçes realmente eitas oram consideradas corretas. Dara Fidel B199C a indexação autom"tica se orienta !ara os documentos ao inv=s de centrar-se nos usu"rios. :m0ora isso se;a, em geral, verdadeiro, = !oss+vel azer m=todos mais centrados nos usu"rios, como, !or exem!lo, o uso de listas de termos a serem !rocurados es!ecicamente num texto. Eomo a !r?!ria Fidel tam0=m realça, um sistema totalmente automatizado !ode ser mais centrado nos usu"rios no lado da sa+da, ao !ermitir consultas em linguagem natural, retroalimentação de relevncia e sa+da em ordem de !rov"vel relevncia. %demais, muitos dos sistemas autom"ticos utilizam uma orma de !onderação !ara !roduzir uma sa+da em ordem de !rov"vel relevncia. :m0ora alguns estudos B!or exem!lo, Salton, 196)C 8a;am reivindicado >xito na ordenação !or relevncia !rov"vel, outros não o zeram. 2um estudo de recu!eração de inormação, arc8ionini et al. B199C o0tiveram resultados muito ineriores na ordenação !or relevncia !rov"vel. Isso tam0=m aconteceu em a!licaçes com!letamente dierentes. Dor exem!lo, sistemas de diagn?stico autom"tico em medicina raramente colocam o diagn?stico RcorretoO no alto da ordenação e com re'>ncia ele a!arece 0em l" em0aixo B&erner et al., 199$ Zassirer, 199C. %0ordagens mais modernas !ara !roduzir resumos RinteligentesO Bresumos autom"ticosC de documentos não c8egam a im!ressionar. M sistema desenvolvido e avaliado !or &randoV et al. B1994C !roduziu resumos 'ue oram ;ulgados signicativamente menos aceit"veis do 'ue o Rlide do textoO. M 'ue isso signica = 'ue analistas 8umanos, em m=dia, ;ulgam as !rimeiras )4 !alavras Bsu!on8amosC de um texto como um indicador de conteHdo mel8or do 'ue um resumo de )4 !alavras ormado com rases selecionadas do texto automaticamente. oens B)C, 'ue tra0al8ou durante algum tem!o na "rea de sumarização autom"tica, concorda 'ue um resumo gerado automaticamente = a!enas [uma a!roximação de um resumo ideal^. @aizausXas e WilXs B199C, de!ois de uma excelente revisão do cam!o da extração de texto Breerem-se a ela como extração de inormação B:ICC, concluem ser im!rov"vel 'ue os n+veis de desem!en8o caracter+sticos dos sistemas de recu!eração de inormação se !restem P maioria dos !ro!?sitos Ms escores com0inados de !recisão e revocação !ara os sistemas de recu!eração da inormação \7I] mantiveram-se na aixa intermedi"ria dos 4f durante muitos anos, e = nessa aixa 'ue 8o;e se encontram os sistemas de :I. :m0ora os usu"rios de sistemas de 7I ten8am se ada!tado a esses n+veis de desem!en8o, não est" claro 'ue se;am aceit"veis !ara as a!licaçes de :I. claro 'ue o toler"vel variar" de uma a!licação !ara outra. as 'uando as a!licaçes de :I envolvem a construção de 0ases de dados 'ue co0rem longos !er+odos de tem!o, 'ue su0se'entemente ormam a entrada !ara an"lise ulterior, o ru+do nos dados com!rometer" seriamente sua utilidade B!. 96C.
M interesse grandemente renovado !or !rocessos autom"ticos a!licados a v"rios as!ectos da recu!eração da inormação atraiu muitos gru!os de !es'uisa !ara este cam!o !ela !rimeira vez. Earentes de !ers!ectiva 8ist?rica, = !rov"vel 'ue du!li'uem tra0al8os eitos )
)
no !assado ou, no m+nimo, deixem de se undamentar em !es'uisas anteriores. S? um exem!lo FoVler et al. B1995C e _izi B1995C descrevem tra0al8o so0re visualização gr"ca de conceitos em lin8a 'ue = muito !arecido com o tra0al8o de oAle B1951C realizado anos antes. 2o ca!+tulo anterior, oi mostrado 'ue muitas !es'uisas 'ue com!aram a recu!eração de texto com a recu!eração de 0ases de dados indexadas !adecem de s=rias al8as. Inelizmente, o mesmo se !ode dizer so0re com!araçes entre !rocessos de indexação autom"tica e indexação !or seres 8umanos. Y" um exem!lo em Ymeidi et al. B1996C. Eom 0ase em resultados de recu!eração numa !e'uena 0ase de resumos em "ra0e no cam!o da ci>ncia da com!utação, os autores concluem 'ue a [indexação autom"tica = !elo menos tão ecaz 'uanto a indexação manual e mais ecaz em alguns casos^. 2a realidade, não 8ouve indexação manual a com!aração oi entre um !rocesso de indexação autom"tica 0aseado no tra0al8o de Salton e 0usca em texto a!licada aos resumos. nciaC, = natural 'ue ten8am alcançado mel8ores resultados do 'ue se nada zessem com o texto al=m talvez de reduzi-lo P orma de tema#raiz. %!esar de os custos de com!utação continuarem caindo, o !rocessamento atual de textos não = necessariamente uma !ro!osta 0arata. YaAes B199)aC coloca isso em !ers!ectiva, com o exem!lo do EM2S/7<:. :m 199), o sistema !rocessava texto P velocidade de cerca de 1 !alavras !or minuto Buma mensagem m=dia da 7euters, com 141 !alavras, em menos de cinco segundosC. % essa velocidade, ele alerta, [um giga0Ate de texto tomaria 'uase dois meses de tem!o de cru !ara categorizar^. Isso se reere P mera colocação de not+cias em cerca de ) categorias. claro 'ue a extração e mani!ulação de texto, 'ue são mais com!lexas, tomariam mais tem!o de !rocessamento. YaAes, em tom dram"tico, salienta 'ue o EM2S/7<: ocu!aria ) anos ou mais de tem!o de cru !ara !rocessar uma 0ase de dados de 1 giga0Ates do taman8o de 2:IS. :m0ora v"lido, 8" um e'u+voco nisso. ncias, deve-se tam0=m recon8ecer 'ue os cor!ora usados nas tareas mais com!lexas são 0astante !e'uenos em com!aração com o taman8o das 0ases de dados 0i0liogr"cos, mesmo as de 3 anos atr"s. 1 M ato = 'ue os m=todos 0ooleanos de 0usca, relativamente toscos, mais comumente usados !ara !es'uisar em grandes 0ases de dados 0i0liogr"cos 8o;e em dia, a!esar de seus inHmeros cr+ticos, a!resentam resultados notavelmente 0ons, considerando o taman8o dos cor!ora com 'ue lidam, um !onto levantado de modo muito convincente !or Stanll e Waltz B199)C M 'ue sur!reende Bdo !onto de vista da I%C = 'ue a a0ordagem estat+stica, 'ue não utiliza a0solutamente 'ual'uer con8ecimento es!ec+co de uma "rea, unciona. : unciona com 'uantidades de inormação Bgiga0AtesC 'ue são incrivelmente grandes !elos !adres da I% B!. )16C.
2ote-se 'ue estavam se reerindo aos sim!les m=todos 0ooleanos de 0usca usados em 0ases de dados indexadas B!or exem!lo, :LI2:C ou de texto com!leto B!or exem!lo, 2:ISC e não Ps a0ordagens mais com!lexas de sa+das ordenadas !or relevncia !rov"vel. Taco0s B199)aC identicou v"rios desaos 'ue se colocam 8o;e !ara os !es'uisadores na "rea de !rocessamento de texto tornar os sistemas mais ro0ustos Bmaior exatidão, mais r"!idos, mais 0aratos na an"lise ling+sticaC, recursos de renamento B!or exem!lo, !assar de 1
:m exerc+cios mais convencionais de recu!eração, os m=todos modernos de 0uscas em texto nem mesmo alcançam o n+vel 4#4 de desem!en8o 'uando estão envolvidas 0ases de dados muito maiores Bcentenas de mil8ares de itensC BYarman, 1996$ S!arcX Tones, 1994C.
)4
recu!eração de documento !ara recu!eração de trec8os !ara recu!eração de res!ostaC, e azer sa+das com mel8or relação custo-ec"cia ou atraentes !ara o usu"rio Bmediante realçamento, extração de texto ou sumarizaçãoC. :m0ora algum !rogresso 8a;a certamente ocorrido na a!licação do com!utador a v"rias tareas relativas P recu!eração de inormação, existem reduzidos ind+cios de 'ue os !rocessos autom"ticos !ossam ainda vir a su!erar os seres 8umanos em tareas tão intelectuais como indexação, redação de resumos, construção de tesauros e criação de estrat=gias de 0usca. Zu8len B19C sugere 'ue ainda não con8ecemos o suciente so0re os !rocessos intelectuais envolvidos na redação de resumos Be, !or analogia, na indexação e !rocedimentos ansC !ara desenvolver !rogramas com os 'uais essas atividades seriam simuladas !elo com!utador 7esumir \...] = uma arte intelectual e, como tal, não transer+vel diretamente !ara !rocessos autom"ticos. % !sicologia cognitiva e a intelig>ncia articial ainda não nos !ro!iciaram con8ecimento suciente so0re os !rocessos 'ue se !assam de ato nas mentes dos resumidores 'uando com!reendem textos e os condensam. %ssim, a imitação direta de um !rocesso intelectual, como o ato de resumir, !arece inalcanç"vel B!. 9C. 1
%!esar da !es'uisa e desenvolvimento vericados mais ou menos na Hltima d=cada, as !alavras de Zu8len !arecem at= 8o;e !ertinentes.
1
%lguns autores cometem o erro de armar 'ue os ti!os de !rocessamento autom"tico de texto analisados neste ca!+tulo B!or exem!lo, atividades de extraçãoC constituem Rcom!reensão autom"ticaO de texto Bver, !or exem!lo, oens et al. B1999C. 2ada estaria tão longe da verdade.
)5
%ap&tulo /@ 0 + indexação e a internet % 7ede undial tornou-se tão imensa, desa;eitada e com!lexa n.os Hltimos anos 'ue se distanciaria muito do o0;etivo deste livro tentar ex!licar a m+riade de com!onentes 'ue ormam seu a!arato navegadores, mecanismos de 0usca, mecanismos de meta0usca, agentes de 0usca, craVlers, etc. M !anorama descrito !or Sc8Varz B199C ainda = conceitualmente Htil, em0ora muitas de suas inormaçes este;am desatualizadas. :ncontra-se em %rasu et al. B)1C uma excelente descrição t=cnica so0re como realmente uncionam os craVlers e mecanismos de 0usca da 7ede. :m LiddA B))C encontra-se uma a0ordagem mais leg+vel Bisto =, mais sim!lesC. %s mudanças ocorrem agora tão ra!idamente 'ue 'ual'uer relato, mal = !u0licado ;" est", !elo menos em !arte, o0soleto. Dara se manter a !ar das mudanças, = !reciso usar um serviço como U8tt!##extremesearc8er.com#neVs.8tm e U8tt!##searc8engineVatc8.com
:ncontrados na !r?!ria 7ede. :ste ca!+tulo limitar-se-" a 'uestes da 7ede 'ue se;am mais !ertinentes aos temas da indexação e redação de resumos. a !ers!ectiva da recu!eração, os recursos inormacionais acess+veis na 7ede são muit+ssimo dierentes dos registros 0i0liogr"cos do sistema RconvencionalO da gura 1 no começo do livro. :ntretanto, 8" certas semel8anças. Ms s+tios da 7ede t>m dierentes elementos !es'uis"veis <7L, nome do s+tio, 'uais'uer metadados inclu+dos no s+tio, !"ginas de conteHdo Bonde os termos 'ue ali ocorrem !odem ser considerados um tanto an"logos aos termos de indexação de registros 0i0liogr"cos convencionaisC e todo o texto encontrado no s+tio. :sses elementos !es'uis"veis a!resentam de ato algumas semel8anças com os dierentes elementos !es'uis"veis em registros !resentes numa 0ase de dados 0i0liogr"cos t+tulo, nHmeros de classicação BPs vezesC, termos de indexação, texto de resumo Bem0ora a 'uantidade de texto no s+tio da 7ede !ossa ser consideravelmente maiorC. Ms s+tios da 7ede dierem da maioria dos registros 0i0liogr"cos !elo ato de 'ue !odem tam0=m conter a!ontadores Bv+nculos de 8i!ertextoC !ara outros s+tios, onde os termos dos v+nculos são tam0=m !es'uis"veis. 2este sentido, um s+tio não = uma unidade inde!endente Bcomo um registro 0i0liogr"co comumC, mas um n? de uma rede. LAnc8 B)1C c8amou atenção !ara uma dierença im!ortante entre uma 0ase de dados 0i0liogr"cos, como o :LI2:, e o con;unto de s+tios 'ue ormam a 7ede undial. %s organizaçes !rodutoras de 0ases de dados 0i0liogr"cos são RneutrasO em ace dos registros 'ue !rocessam. Ms sucedneos 'ue desenvolvem - resumos e termos de indexação - destinamse a re!resentar de modo exato e im!arcial os documentos. Dor outro lado, muitos s+tios oram criados !or em!resas 'ue alme;am 'ue sua !"gina se;a recu!erada e não a !roduzida !elo concorrente. Y" dois modos de azer isso o R index spammingO \saturação de +ndice] e o R page &ac-ingO \se'estro de !"gina] Bver adianteC. Ser#iços de busca na 5ede
YocX B)1C nos d" uma clara visão glo0al da 7ede como um sistema de recu!eração de inormação Dara o 'ue nos interessa, um mecanismo de 0usca = um serviço oerecido !or interm=dio da 7ede undial 'ue !ermite ao usu"rio dar entrada a uma consulta e azer 0uscas numa 0ase de dados 'ue a0range uma !orção 0astante su0stancial do conteHdo da 7ede. Dara ser um !ouco mais es!ec+co, um mecanismo de 0usca !ermite ao usu"rio ingressar com um ou mais termos, e 'ualicadores o!cionais, a m de localizar !"ginas de interesse na 7ede. M termo = 'uase intercam0i"vel com Rserviços de 0usca na 7edeO, 'ue \...] normalmente se reere mais ao s+tio como um todo, e 'ue !or sua vez !ode ornecer o mecanismo de 0usca como uma de mHlti!las o!çes. M mecanismo de 0usca !ode at= ser a!enas uma oerta num con;unto de oertas 'ue ;untas visam a oerecer ao usu"rio um lugar geral de !artida ou um R!ortalO da 7ede B!. xxiiC. Dode-se visualizar o !r?!rio mecanismo de 0usca como se osse com!osto de cinco !artes !rinci!ais uncionais 1C os R cra8lersO do mecanismo, 'ue saem em 0usca de s+tios e !"ginas da 7ede$ )C a 0ase de dados de inormaçes reunidas so0re essas e outras !"ginas 'ue 8a;am sido reunidas a !artir de outras ontes$ 3C o !rograma de indexação, 'ue indexa o conteHdo da 0ase de dados$ C o Rmecanismo de recu!eraçãoO, o algoritmo e !rogramação res!ectiva, dis!ositivos, etc., 'ue, a !edido, recu!erem material do +ndice#0ase de dados$ 4C
)6
a interace gr"ca BY/LC, 'ue reHne dados da consulta do usu"rio !ara alimentar o mecanismo de recu!eração B!. 5C. "ra8lers ou spiders são !rogramas 'ue !ercorrem a 7ede !ara 1C identicar novos s+tios 'ue serão acrescentados ao mecanismo de 0usca e )C identicar s+tios ;" co0ertos, mas 'ue ten8am sorido mudanças. Ms cra8lers coletam inormaçes so0re o conteHdo das !"ginas de s+tios e alimentam a 0ase de dados do mecanismo de 0usca com essas inormaçes B!. 5C.
M con;unto total de inormaçes armazenadas so0re todas as !"ginas da 7ede constitui a 0ase de dados do mecanismo de 0usca. :sse con;unto inclui !"ginas identicadas !or cra8lers, mas, cada vez mais, inclui tam0=m !"ginas identicadas !or outras ontes ou t=cnicas. -las, caso se 'ueira, !edindo ao navegador !ara mostrar a R!"gina-onteO. \...] %lguns mecanismos, !or=m, !ro!ositalmente, n0o indexam algumas metaeti'uetas !or'ue eles são a !arte da !"gina 'ue = mais suscet+vel de violação !elos spammers. :sta cautela = adotada em detrimento da indexação de inormaçes extremamente Hteis B!. -9C
Sc8Varz B199C a0ordou a varia0ilidade da indexação nos v"rios serviços %lguns serviços indexam todas as !alavras de uma !"gina \...] Inormaçes !osicionais e inormaçes de eti'uetas de marcação !odem ser armazenadas com texto indexado !ara mel8orar a recu!eração e a ec"cia da ordenação. Mutros somente indexam !alavras 'ue ocorram re'entemente, ou a!enas !alavras 'ue ocorram dentro de certas eti'uetas de marcação, ou s? as !rimeiras n !alavras ou lin8as \...] Doderão ou não ser adotadas listas de !alavras !roi0idas, e, se orem adotadas, !oderão incluir !alavras 'ue ocorrem com re'>ncia muito alta \...] B!. 964C.
M estudo de Yert et al. B)C = um dos !oucos 'ue analisam um s+tio da 7ede de uma !ers!ectiva de indexação. Ms !es'uisadores desenvolveram tr>s a0ordagens alternativas !ara a indexação realmente utilizada num s+tio existente e as com!araram !or meio de 0uscas eitas !or ) estudantes universit"rios. %s com!araçes oram eitas com 0ase tanto na ec"cia da recu!eração 'uanto das !reer>ncias dos usu"rios. :m0ora v"rios mecanismos de 0usca aleguem !ossuir atualmente 0ases de dados com mais de ) mil8es de registros, nen8um desses mecanismos consegue a0arcar todos os s+tios da 7ede. LaVrence e @iles B1999C estimaram 'ue a co0ertura não !assava de 15f no caso do mecanismo mais exaustivo, e muitos co0riam a!enas 1f ou menos. %l=m disso, relataram 'ue a co0ertura !arecia estar diminuindo com o !assar dos anos. Kuer dizer, a 7ede estava crescendo numa velocidade mais r"!ida do 'ue os mecanismos de 0usca !odiam su!ortar. 5ecursos de recuperação
:m0ora o usu"rio comum da internet !rovavelmente aça suas 0uscas inserindo uma se'>ncia sim!les de termos B'ue dierentes mecanismos de 0usca tratarão de modo dierenteC - alguns colocando os termos numa relação M<, outros numa relação :C, esses mecanismos !odem na realidade oerecer v"rias o!çes mais avançadas - como o em!rego de 1. L?gica 0ooleana, inclusive recursos de encaixamento \nesting ] ). /runcamento 3. &uscas com ex!resses . Droximidade de !alavras 4. &uscas em cam!os Bisto =, !oder limitar a 0usca a um cam!o es!ecicado no registro, como t+tulo ou <7LC )
5. *+nculos de 8i!ertexto Bisto =, 0uscar !"ginas vinculadas a determinado <7LC 6. &usca de imagens Bca!acidade de !rocurar a!enas !"ginas 'ue conten8am imagensC . Eonsulta !or exem!lo Bca!acidade de encontrar registros semel8antes a um registro ;" con8ecido como interessanteC. 2aturalmente, nem todos os mecanismos de 0usca !ossuem todos esses recursos. Ms registros recu!erados numa 0usca na 7ede são ordenados com 0ase num escore num=rico e a!resentados ao usu"rio nessa ordem. *"rios atores !odem ser levados em conta nessa !ontuação, inclusive 1. Fre'>ncia de ocorr>ncia de termos de 0usca no registro. Dode ser usada a re'>ncia relativa Bo nHmero de ocorr>ncias = relacionado com a extensão do registro, de modo 'ue, !or exem!lo, um termo de 0usca 'ue ocorra cinco vezes num registro de 1 !alavras ter" !eso maior do 'ue outro termo 'ue ocorra cinco vezes num registro de 1 !alavrasC. !rov"vel 8aver um limite !ara o nHmero de ocorr>ncias levadas em consideração na !ontuação devido ao index spamming. ). 2Hmero de coincid>ncias de termos. 7egistros 'ue coincidem com todos os tr>s termos numa consulta B!or exem!loC alcançam !ontuação maior do 'ue os 'ue coincidem com a!enas dois. 3. Localização do termo. /ermos 'ue ocorrem no t+tulo !odem o0ter mais !eso do 'ue a'ueles 'ue ocorrem em outros lugares. . 7aridade. /ermos muito incomuns - os 'ue ocorrem muito !oucas vezes na 0ase de dados - t>m !ro0a0ilidade de alcançar escore mais elevado. 4. Droximidade. Se os termos de 0usca ocorrerem muito !r?ximos no texto, isso !ode valer mais do 'ue se estivessem muito distantes um do outro. 5. Mrdem dos termos. m !eso maior. . Do!ularidade da onte 0aseada ou no nHmero de vezes 'ue oi acessada ou no nHmero de outras ontes a ela vinculadas. %lguns mecanismos de 0usca tam0=m !ermitem ormatos de sa+da alternativos essencialmente o!çes de visualização sucintas versus extensas. :astman B))C desco0riu 'ue itens 'ue a!areciam no to!o da classicação no curso de 0uscas relativamente sim!les Buma se'>ncia de termos de 0uscaC !ossu+am maior relevncia B!recisãoC do 'ue a'ueles 'ue a!areciam no to!o da classicação 'uando se em!regavam 0uscas 0ooleanas mais com!lexas !ara os mesmos assuntos. :la conclui 'ue os !rocessos de classicação do mecanismo de 0usca devem uncionar muito 0em. YocX B)1C, no entanto, assegura 'ue as 0uscas na 7ede ainda são muito rudimentares se com!aradas com o uso de uma 0ase de dados cuidadosamente indexada, como o :LI2:, !or !arte de um consulente ex!eriente. 7econ8ece, !or=m, 'ue os recursos de 0usca na 7ede v>m mel8orando com o tem!o M 8iato entre as ex!ectativas da recu!eração tradicional e as ex!ectativas das 0uscas na 7ede diminui ainda mais 'uando se levam em conta dois outros atores. M recon8ecimento de am0os os atores = im!ortante !ara o consulente 'ue 'ueira tirar o m"ximo de !roveito de 'ual'uer um desses ti!os de serviço de 0usca. Drimeiro, os mecanismos de 0usca na 7ede lidam com dados muito desestruturados, ou !elo menos dados com uma estrutura muito !ouco coerente. e ato, existe uma estrutura denida !ara a Y/L !or tr"s das !"ginas da 7ede, mas, no 'ue diz res!eito ao real conteHdo intelectual, a 'uase Hnica estruturaO intelectualO encontra-se nos t+tulos e metaeti'uetas. M cor!o das !"ginas tem !ouca estrutura coerente 'ue o serviço de 0usca na 7ede !ossa usar em 0uscas estruturadas \...] Segundo, o sim!les vol.ume de dados atualmente na 7ede - associado ao volume 'ue aumenta todos os dias - acrescenta um grau de res!eito ao 'ue os mecanismos de 0usca na 7ede conseguiram realizar em !er+odo de tem!o muito curto. M ato de existir !elo menos um n+vel elementar de acesso Ps centenas de mil8es de !"ginas de material = um eito 'ue deve ins!irar mais admiração do 'ue rustração B!. )-)1C.
Mutros autores são mais cr+ticos acerca dos recursos de 0usca na 7ede. W8eatleA e %rmstrong B1996C, !or exem!lo, ex!em assim a situação 2o cor!o de uma !"gina da 7ede, não 8" a !ossi0ilidade de dados em cam!os denidos, e !or isso = im!oss+vel \...] limitar as 0uscas a \...] !artes da !"gina. Dortanto, uma 0usca desco0rir" oBsC termoBsC de 0usca com igual acilidade no Hltimo !ar"grao, em nota de
)9
roda!= ex!licativa ou em material existente !erto do alto da !"gina. Eom o advento dos metadados, torna-se \...] \!oss+vel] uma a0ordagem levemente dierente \...] as, como os metadados não são exi0idos e em geral inexiste editora ou autoridade 'ue im!on8a limites, = "cil ocorrer a0uso de !alavras-c8ave e !ares de termos descritivos e rec8eados de termos destinados a dar-l8es alta relevncia a!arente ou localização re'ente \...] Inexiste, at= 8o;e, norma !ara atri0uição de r?tulos a recursos em rede, e, em0ora continuem os estudos so0re metadados, seu uso eetivo na "rea su!erior de !"ginas da 7ede ainda = raro e incoerente B!. )5C.
:ntretanto, desde 'ue isso a+ em cima oi escrito, em certa medida as coisas mel8oraram, tanto na 'uestão dos cam!os 'uanto dos metadados. 2aturalmente, dierentes mecanismos de 0uscas !roduzirão resultados dierentes !ara a mesma consulta !or causa de dierenças de co0ertura, de algoritmos de 0usca e crit=rios de ordenação. uitas com!araçes de desem!en8o surgiram na literatura nos Hltimos anos, remontando a 1994, mas são de valor limitado devido P situação de constante mudança da !r?!ria 7ede. Eom!araçes avaliat?rias cote;am resultados de 0uscas somente com 0ase na du!licação#unicidade ou tentam esta0elecer a relevncia dos itens recu!erados. Leig8ton e Srivastava B)C e Su e E8en B1999C são exem!los do Hltimo caso. Tansen e Dooc8 B)1C azem uma revisão de estudos anteriores. Mutras avaliaçes oram eitas com o0;etivos es!eciais. /8elVall B)1C com!ara os mecanismos de 0usca em relação a seu em!rego !otencial em a!licaçes de mineração de dados, 'ue ele !arece denir como [a agregação de inormaçes oriundas de grande nHmero de !"ginas da 7ede, !ara criar con8ecimento novo^. M!!en8eim et al. B)C azem excelente revisão de avaliaçes de mecanismos de 0usca eitas anteriormente. 7ecomendam o desenvolvimento de um con;unto normalizado de !rocedimentos !ara essas avaliaçes, de modo 'ue [se;am eitas com!araçes de mecanismos de 0usca de modo mais ecaz, e 'ue se;am rastreadas as variaçes de desem!en8o de 'ual'uer mecanismo de 0usca ao longo do tem!o^. :m certa medida, = !oss+vel com!ensar os recursos entre os mecanismos de 0usca !or meio do em!rego de mecanismos de meta0usca, serviços 'ue azem 0uscas em v"rios mecanismos de 0usca, e em seguida agru!am os resultados. Segundo YocX B)1C, existem 8o;e mais de 1 mecanismos de meta0usca em uso. YocX = claro 'uanto Ps suas limitaçes :m !articular, se 8ouver mais de um !un8ado de s+tios relevantes !ara encontrar nos mecanismos de 0usca, os mecanismos de meta0usca re'entemente não encontrarão a maioria deles. Isso = causado !or v"rios atores, inclusive os limites im!ostos !elo serviço ao nHmero de registros recu!erados em cada mecanismo, limites de tem!o 'uando o serviço de meta0usca sim!lesmente interrom!e a 0usca num mecanismo se demorar muito, inca!acidade de traduzir ade'uadamente a consulta !ara a sintaxe es!ec+ca exigida !elo mecanismo-alvo, e outros atores. Felizmente, alguns mecanismos de meta0usca realmente conseguem ca!tar todos os registros 'ue ali existam Bmas t>m outros inconvenientesC. Ms tr>s !rinci!ais !ontos racos dos mecanismos de meta0usca são 1C muitas vezes limitam estritamente o nHmero de registros 'ue recu!erarão de cada mecanismo BPs vezes não mais de dezC$ )C muitas vezes não re!assam aos mecanismos consultas 'ue ten8am um m+nimo de com!lexidade$ e 3C na maioria dos casos, s? azem 0uscas em dois ou tr>s dos maiores mecanismos de 0usca \...] 2a maioria, os mecanismos de meta0usca dierem entre si nos seguintes as!ectos •
•
•
•
•
Ms mecanismos de 0usca es!ec+cos 'ue a0rangem M nHmero de mecanismos de 0usca 'ue !odem ser !es'uisados !or vez % ca!acidade de re!assar consultas mais com!lexas - como as 'ue incluem ex!resses, enunciados 0ooleanos, etc. - !ara os mecanismos de 0usca RalvosO Limites 'uanto ao nHmero de registros 'ue !odem recu!erar de cada mecanismo B'ue !ode c8egar a ser no m"ximo 1C M tem!o 'ue estão dis!ostos a gastar na 0usca em cada mecanismo Bantes de interrom!er a sessão !or decurso de tem!oC Eomo a sa+da = a!resentada, inclusive se eliminaram ou não registros certos encontrados em du!licata nos v"rios mecanismos B!. 15-16C.
YocX salienta 'ue os mecanismos de meta0usca são mais Hteis 'uando se !rocura algo o0scuro, isto =, assuntos so0re os 'uais !rovavelmente 8" muito !oucos s+tios 'ue ten8am algo a oerecer. 2o in+cio do ca!+tulo, ez-se uma distinção entre os recursos da 7ede e as 0ases de dados 0i0liogr"cos tradicionais. 2aturalmente, muitas dessas 0ases de dados estão dis!on+veis na )4
7ede. :m0ora uma 0ase de dados como o :LI2: !ossa ser localizada e nela serem eitas 0uscas, seu conteHdo não = inclu+do nos resultados a!resentados !or nen8um dos mecanismos de 0usca, as!ecto 'ue oi ex!licitado !or _ic8 B199C % 0usca de inormaçes na 7ede !adece de duas deci>ncias de0ilitantes - o !rocesso de 0uscas = su!ercial e limitado. su!ercial !or'ue os mecanismos de 0usca c8egam somente at= ao 'ue c8amo de documentos de !rimeiro n+vel, isto =, documentos 'ue residem em servidores em Y/L. Y" um mundo de inormaçes adicionais al=m desse !onto. 7ero-me a inormaçes em cat"logos de 0i0liotecas e outros ar'uivos de dados a 'ue a 7ede oerece acesso. M cat"logo da Li0rarA o Eongress, !or exem!lo, nunca = !es'uisado !or nen8um dos mecanismos de 0uscas. il8es de inormaçes, meticulosamente organizadas e rigorosamente autenticadas, 'ue ali ;azem e estão dis!on+veis continuam inex!lorados !or esses mecanismos. %s descriçes dos materiais em ormato digital do !rograma %merican emorA, da Li0rarA o Eongress, e os !r?!rios materiais digitalizadoscentenas de mil8ares de otograas, sons e documentos textuais 0aseados em imagem - não a!arecem nos resultados das 0uscas eitas !or tais mecanismos, e tam!ouco materiais e ar'uivos semel8antes de uma m+riade de outras instituiçes. Ms atuais mecanismos de 0uscas arran8am a su!er+cie do conteHdo da 7ede B!. 16C.
:sse !onto tam0=m oi suscitado !or Yan e E8ang B))C :m ;ul8o de ), os analistas estimavam 'ue c8egava a !elo menos 1 o nHmero de 0ases de dados !es'uis"veis na 7ede. :ssas 0ases de dados oerecem inormaçes de alta 'ualidade, com 0oa manutenção, mas não são acilmente acess+veis. Eomo os atuais cra8lers da 7ede não !odem consultar essas 0ases, os dados 'ue cont>m !ermanecem invis+veis !ara os mecanismos de 0usca tradicionais B!. 5C.
Fetadados
M termo RmetadadosO !ossui v"rias deniçes !oss+veis. Eleveland e Eleveland B)1C lidam assim com essa 'uestão 7e!etidamente, denem-se metadados como dados so%re dados . %inda 'ue necess"ria, não = uma denição suciente. etadados 'uer dizer dados so0re dados 'ue são estruturados !ara descrever um o0;eto ou recurso de inormação. Earacterizam dados de ontes e descrevem suas relaçes. %utores de recursos, editoras, 0i0liotec"rios e outros !rossionais da inormação !odem criar metadados. Dodem estar incor!orados ao recurso ou mantidos em re!osit?rios se!arados de metadados B!. ))3C.
YocX B)1C !reere o termo Rmetaeti'uetasO 'ue dene como % !orção Bcam!oC da codicação Y/L de uma !"gina da 7ede 'ue !ermite a 'uem a cria inserir texto 'ue descreva o conteHdo da !"gina. M conteHdo das metaeti'uetas não a!arece na !"gina 'uando esta = visualizada na ;anela de um navegador B!. ))C.
M c8amado 5u%lin "ore = um con;unto de itens de metadados Bmetaeti'uetasC !ara descrever recursos dis!on+veis em rede. /ornou-se uma norma de acto !ara descrição de recursos da 7ede. Eleveland e Eleveland B)1C ressaltam 'ue o u0lin Eore \...] !ro!orciona inormaçes de indexação !ara ontes documentais, inclusive indicadores !ara t+tulo, criador, assunto, descrição, editora, cola0oradores, data, ti!o, ormato, identicador de recurso, l+ngua, relação com recursos ans e gerenciamento de direitos autorais. \...] M conceito de core \nHcleo] reere-se a um consenso alcançado !or !rossionais da inormação e es!ecialistas de assuntos so0re 'uais os elementos 'ue são essenciais ou undamentais !ara manter re!resentaçes de inormação, !rinci!almente em ormatos eletrQnicos. \...] mesmoO, mediante o !reenc8imento de es!aços em 0ranco. Ms consulentes !oderiam us"-la !ara navegar nas disci!linas e atrav=s delas, em am0iente internacional, na 7ede B!. ))C.
Yearst B1999C distingue entre Rmetadados externosO e Rmetadados de conteHdoO. enem-se os !rimeiros como os dados Rrelativos P !rodução e utilização do documentoO, como autor, lugar de !u0licação e data de !u0licação. Retadados de conteHdoO, naturalmente, são )41
os dados relativos ao conteHdo BassuntoC do documento. claro 'ue este livro diz mais res!eito aos metadados de conteHdo. Mutra distinção oi eita !or MO2eill et al. B)1C. Ms ti!os de metadados 'ue estes autores recon8ecem são [a'uilo 'ue = ex!licitamente ornecido !elo autor do documento da 7ede, e a'uilo 'ue = !ro!orcionado automaticamente !elo editor de Y/L com 'ue o documento = criado^. Eom 0ase numa amostra de registros da 7ede, col8ida em ;un8o de 199, concluem Ms resultados \...] sugerem 'ue a utilização de metadados = 0astante comum em documentos da 7ede. 2o entanto, v"rias ressalvas devem ser eitas a essa conclusão. Drimeiro, = evidente 'ue grande !arte do uso atual dos metadados !ode ser atri0u+do P geração autom"tica de metaeti'uetas !elos editores de Y/L. 2ão est" claro 'ue essa es!=cie de metadado se;a !articularmente Htil !ara acilitar a desco0erta e a descrição de recursos. Segundo, com re'>ncia os metadados são usados !ara descrever a!enas o !r?!rio s+tio, ou, no m"ximo, um !e'ueno su0con;unto dos documentos do s+tio. Ms atuais !adres de uso dos metadados estão muito distantes da descrição exaustiva do documento em n+vel de !"gina. Finalmente, a maior !arte da utilização dos metadados ainda = casu+stica$ com !oucas exceçes, a maior !arte dos s+tios não o0edece a um con;unto 0emdenido de elementos de metadados B!. 36C.
Eonstatou-se 'ue cerca de 16f da amostra dos s+tios contin8am R!alavras-c8aveO. Dor=m, não eram necessariamente termos muito Hteis !ara recu!eração % caracter+stica mais not"vel oi 'ue as !alavras-c8ave, em0ora normalmente !ertinentes, de algum modo, ao conteHdo do s+tio, eram, não o0stante, muitas vezes extremamente gen=ricas. Dor exem!lo, o s+tio de uma universidade na 7ede teria ReducaçãoO como !alavrac8ave, ou um !rovedor da internet usaria R7edeO como !alavra-c8ave. % utilização de !alavras-c8ave dessa maneira sugere 'ue a nalidade dos metadados = aumentar ao m"ximo as !ossi0ilidades de a relevncia do s+tio ser !erce0ida nas consultas eitas !elos mecanismos de 0uscas, ao inv=s de a;udar no desco0rimento do s+tio !or si mesmo ou como mem0ro de um con;unto relativamente !e'ueno de resultados de consultas de 0usca. 2aturalmente, a generalidade de algumas dessas !alavras-c8ave !ode ser atenuada !ela com0inação de duas ou mais de duas numa consulta de 0usca. %l=m disso, não = necessariamente o caso de terem sido escol8idas !alavras-c8ave não-es!ec+cas !ara aumentar a !ro0a0ilidade de recu!eração no s+tio. !rov"vel 'ue, em alguns casos, o uso de termos extremamente gerais se;a sim!lesmente o resultado de uma !r"tica de indexação ruim B!. 355C.
em!seA e YeerA B199C c8amaram atenção !ara a crescente im!ortncia dos metadados Ms metadados diundir-se-ão nos am0ientes vi"veis de inormação digital a tal !onto 'ue \...] ser" di+cil alar genericamente so0re eles. %s an"lises sensatas cingir-se-ão ao uso dos metadados !ara ns es!ec+cos ou em comunidades es!ec+cas B!. 15C.
% im!ortncia dos metadados !ara ar'uivos digitais de v+deo oi analisada !or Wactlar e E8ristel B))C. rott B))C estudou a extensão com 'ue os s+tios de grandes em!resas na 7ede incluem Rrecursos auxiliares de indexaçãoO Bisto =, aux+lios no texto !ara orientar os ro0Qs so0re o 'ue !rocurar !ara ns de indexaçãoC. :le examinou tanto os aux+lios !ositivos Bmetaeti'uetas incor!oradas 'ue identicam R!alavras-c8aveO ou RdescriçãoO no textoC e negativos Buso de um ar'uivo ro0ots.txt 'ue !ode im!edir 'ue um ro0Q indexe uma !arte de um s+tio da 7edeC. :ntre ) e )) ele detectou um aumento no em!rego de metaeti'uetas. %lguns autores t>m c8amado atenção !ara o ato de 'ue os metadados tanto !odem ter desvantagens 'uanto vantagens. e7uiter B))C = um deles Dara orientar mecanismos de 0usca sem conundir as !essoas, certas inormaçes oram colocadas em metaeti'uetas 'ue não são imediatamente vis+veis na a!resentação de uma tela na 7ede. Eom!rovou-se 'ue isso era uma vantagem discut+vel. Dor um lado, um mecanismo de 0usca !ode encontrar a inormação com eci>ncia, mas, !or outro lado, muitas vezes não ca claro !ara os usu"rios !or 'ue uma !"gina a!areceu na 0usca B!. )4C.
Eraven B)1aC examinou a esta0ilidade dos metadados na 7ede. :le asssim resumiu os resultados 'ue o0teve Kuatro con;untos de !"ginas da 7ede anteriormente visitadas no verão de ) oram revisitadas um ano de!ois. e 66 !"ginas 'ue, no ano de ), contin8am descriçes de metaeti'uetas, 45 !ermaneciam com essas descriçes em )1, e, de 1 )3 !"ginas 'ue careciam de descriçes em ), 11 !ossu+am descriçes em )1. 2as !"ginas de
)4)
a0ertura \home pages] !arecia 'ue tanto 8avia !erdas 'uanto mudanças das descriçes, mais do 'ue nas outras !"ginas, com cerca de 19f das descriçes modicadas nos dois con;untos em 'ue as !"ginas de a0ertura !redominavam versus cerca de 1)f nos outros dois con;untos B!. 1C.
:m estudo relacionado a esse BEraven, )1 0C, ele examinou a a!ar>ncia das RdescriçesO Bessencialmente um ti!o de resumoC em metadados da 7ede. assim 'ue ele descreve os resultados alcançados %mostras aleat?rias de 16) !"ginas da 7ede registradas no qa8oo` e 153 !"ginas localiz"veis a !artir de !"ginas registradas no qa8oo` oram analisadas 'uanto ao uso de metaeti'uetas, es!ecialmente as 'ue contin8am descriçes. Setecentas e vinte e sete B3,fC das !"ginas registradas no qa8oo` e ) B)6,fC das outras !"ginas inclu+am descriçes em metaeti'uetas. %lgumas das descriçes excediam grandemente as diretrizes usuais relativas P extensão de 14 ou ) caracteres.
ncias entre ex!resses-c8ave no texto e o texto associado aos nHmeros da E. %s atri0uiçes eitas !elo Scor!ion !odem ser consideradas sugestes a serem su0metidas P revisão de !essoas. :m0ora re'entemente se;am RcorretasO Bisto =, este;am de acordo com a classicação eita !or !essoasC, nem sem!re serão. @ood0A e 7eig8art B)1aC descrevem sua !es'uisa so0re a!licação de indexação autom"tica Bo sistema Vordsmit8C a registros EM7E. M Vordsmit8 !ode selecionar ex!resses candidatas em documentos da 7ede !ara 'ue sirvam como !oss+veis termos de indexação, a!resentando-os como sugestes ao catalogador 'ue estiver criando um registro EM7E. %t= outu0ro de )), umas 4 instituiçes 8aviam contri0u+do com cerca de 6 registros. Mutra iniciativa relacionada a ltros de 'ualidade na 7ede = o M!en irectorA Dro;ect BUhttp:KKdmo8.orC, 'ue !retende ser um cadastro de recursos da 7ede, selecionados !or serem de 0oa 'ualidade, numa am!la variedade de "reas tem"ticas. mantido graças aos esorços de volunt"rios 'ue se dedicam a selecionar s+tios em suas "reas de con8ecimento. :m 1 de ;aneiro de )3 o !ro;eto declarava incluir mais de 3, mil8es de s+tios selecionados !or mais de 4 cola0oradores e organizado em mais de 5 categorias. 2aturalmente, 8" muito 'ue a !rossão de 0i0liotec"rio lida com metadados - na orma de entradas descritivas em cat"logos em c8as, im!ressos e em lin8a. 2ão o0stante, os metadados exigidos !or recursos da 7ede são, de algum modo, dierentes dos metadados tradicionalmente utilizados !ara descrever livros e outros materiais im!ressos, inclusive !or'ue t>m de descrever coleçes inteiras de registros ao inv=s de itens individuais BYill et al., 1999C e 'ue !odem reerir-se a o0;etos B!or exem!lo, !eças de museusC ao contr"rio de texto Bver, !or exem!lo, _eng, 1999C. %demais, talvez se;am necess"rios dierentes n+veis de metadados !ara os mesmos materiais, a m de atender Ps necessidades de dierentes !H0licos 'ue !odem at= incluir crianças Bver, !or exem!lo, Sutton, 1999C. :ncontra-se em @uent8er e cEallum B)3C uma an"lise de desenvolvimentos recentes so0re os metadados, inclusive o MS Betadata M0;ect and escri!tion Sc8emaC e :/S Betadata :ncoding and /ransmission StandardC. 5esumos na 5ede
Ms metadados inclu+dos num s+tio da 7ede !odem conter texto 'ue = um tanto a!arentado com um resumo - !elo menos uma anotação ou nota de conteHdo. Se não 8ouver )43
nada dessa es!=cie, alguns mecanismos de 0usca usarão as !rimeiras lin8as do !r?!rio texto como uma es!=cie de resumo. %lguns dos serviços de 0usca constroem !rimeiroO resumosO !ara os recursos 'ue encontram e, em seguida, tornam !es'uis"veis as !alavras do resumo ou extraem !alavras do resumo e não do texto com!leto. 2o entanto, as em!resas nisso envolvidas costumam não ser muito inormativas so0re como realmente uncionam seus !rocessos autom"ticos de ela0oração de resumos. W8eatleA e %rmstrong B1996C salientaram 'ue os recursos acess+veis na 7ede !odem exigir uma a0ordagem algo dierente da ela0oração de resumos, em es!ecial !or'ue !rovavelmente se reram a coleçes de textos Bou, com eeito, imagensC e não itens individuais
:les com!aram resumos ou extratos extra+dos da internet com resumos de 0ases de dados 0i0liogr"cos convencionais e resumos ou descriçes de gateVaAs da internet. Foram eitas com!araçes so0re legi0ilidade, conteHdo e estilo. %lguns itens da 7ede incluem !alavras-c8ave ou ex!resses atri0u+das !elos autores, as 'uais !odem uncionar como sucedneos !ara o o0;etivo de azer 0uscas. 2o entanto, a grande maioria não o az, o 'ue estimulou a realização de !es'uisas visando a extrair automaticamente tais ex!resses de textos da 7ede, conorme oi visto no ca!+tulo anterior Bver, !or exem!lo, Tones e DaAnter, ))C. Dara uma an"lise das caracter+sticas de RdescriçesO Bum ti!o de resumoC de !"ginas da 7ede, ver Eraven B)10C. :le vericou, !or exem!lo, 'ue muitas tendem a em!regar sintagmas nominais ao inv=s de rases com!letas. Spamming de &ndice e outras trapaças
ncia na internet. :le o0serva 'ue Ms documentos digitais em am0iente distri0u+do talvez não se com!ortem de modo coerente$ como são mostrados tanto !ara !essoas 'ue dese;am v>-los 'uanto !ara sistemas de sot8are 'ue dese;am index"-los !or meio de !rogramas de com!utador, eles !odem ser alterados, talvez de orma radical, !ara cada a!resentação, 'ue !ode ser moldada !ara um rece!tor es!ec+co. %demais, a inormação 'ue uma !essoa retira da a!resentação de um documento !or meio de !rogramas, como um navegador da 7ede, !ode ser muito dierente da 'ue um !rograma de indexação extrai at= do mesmo documento-onte, a não ser 'ue o !rograma de indexação se;a !ro;etado !ara levar em conta o im!acto do documento na !erce!ção dos seres 8umanos. \...] Ms s+tios interessados em mani!ular os resultados do !rocesso de indexação começaram ra!idamente a ex!lorar a dierença entre o documento como = visto !elo usu"rio e o documento como = analisado !elo cra8ler de indexação !or meio de um con;unto de t=cnicas genericamente denominadasO spamming de +ndiceO. Dor exem!lo, um documento !ode ser a0arrotado com mil8ares de !alavras 'ue o usu"rio não veria, !or'ue se conundem com o undo da !"gina, numa onte de ti!os diminutos, !or=m 'ue seriam encontradas !elo cra8ler de indexação. M resultado disso tem sido uma corrida armamentista entre indexadores e desenvolvedores de s+tios da 7ede, com os serviços de indexação acrescentando maior com!lexidade P extração de !alavras, an"lise estat+stica, !rocessamento da linguagem natural e outras tecnologias. Ms serviços de indexação tam0=m com!lementam a indexação direta do conteHdo com inormaçes contextuais, como, !or exem!lo, 'uantos outros s+tios se vinculam com uma !"gina, como uma orma de tentar identicar !"ginas im!ortantes. im!ortante com!reender 'ue, 'uando um cra8ler re'uisita uma !"gina !ara indexar, não se trata sim!lesmente de ler um ar'uivo em alguma es!=cie de sistema de ar'uivo de rede$ ele est" re'uisitando uma !"gina !ara um servidor da 7ede !or meio do !rotocolo 8tt!. % re'uisição inclui identicação da onte do !edido Bem v"rios n+veis - o !rograma 'ue est"
)4
!edindo e a m"'uina !ara a 'ual a re'uisição = enviadaC, e o servidor da 7ede !ode ser !rogramado !ara res!onder de modo dierente a solicitaçes id>nticas de dierentes origens. Ms motivos !ara isso !odem ser 0astante generosos$ !or exem!lo, alguns servidores oerecem !"ginas 'ue são a;ustadas, !ara indexar ecientemente, com os algoritmos de indexação usados !or dierentes craVlers. Mutros motivos !ara reaçes sens+veis P onte são mais ativamente maldosos, como a !r"tica do se'estro de !"gina \ page &ac-ing]. leva uma c?!ia da !"gina !ara q e ornece isso ao serviço de indexação da 7ede, mas 'uando um usu"rio Bao contr"rio do serviço de indexação, clica no <7L, voc> envia a !"gina de seu !roduto ao inv=s da !"gina co!iada !ara q. % concorr>ncia não = o Hnico motivo$ !or exem!lo, talvez voc> 'uisesse garantir 'ue as !"ginas de uma organização de 'ue voc> não gosta ossem devolvidas em res!osta a !edidos de material de sexo ex!l+cito. M se'estro de !"ginas = denido, geralmente, como o ornecimento ar0itr"rio de documentos com entradas de +ndice ar0itr"rias e inde!endentes. claro 'ue constitui um !ro0lema enorme a construção de sistemas de recu!eração .de inormação ca!azes de azer ace a esse am0iente, e os craVlers da 7ede estão começando a integrar uma grande variedade de controles de validade Bcomo examinar redes de v+nculos entre !"ginas e s+tiosC na tentativa de identicar e ltrar tentativas !rov"veis de se'estro de !"ginas B!. 13-1C.
rott B))C tam0=m se de0ruçou so0re o !ro0lema do spamming Im!ortante com!an8ia de seguros imaginou a artiman8a de re!etir v"rias vezes a mesma !alavra. Isto =, sua entrada de R!alavras-c8aveO re!etia cada !alavra seis vezes B!or exem!lo, !r>mios !r>mios !r>mios !r>mios !r>mios !r>miosC. :sta es!=cie de tentativa de garantir mel8or !osição na indexação = com re'>ncia encontrada no texto de s+tios !ornogr"cos onde as !alavras são ocultadas com o estratagema de usar uma mesma cor no texto e no undo da !"gina. 7essalva se;a eita, a seu avor, 'ue a com!an8ia de seguros não im!lantou esse 'uestion"vel dis!ositivo. % maioria dos serviços de 0usca desconta as re!etiçes de modo 'ue a re!etição de !alavra-c8ave = inHtil. :, indo ao 'ue interessa, = di+cil imaginar uma razão comercial leg+tima !ara uma com!an8ia de re!utação 'uerer envolver-se em tal !r"tica B!. )1-)14C.
Introna e 2issem0aum B)C asseguram 'ue, em termos de acesso, a 7ede avorece os ricos, os inescru!ulosos e os tecnologicamente !rocientes. Ms dois Hltimos !odem !romover o acesso a s+tios da 7ede !or meio de spamming e outras vigarices. Ms ricos !odem !agar aos mecanismos de 0uscas !ara alcançar R!roemin>nciaO no ran-ing dos resultados. oVs8oVitz e ZaVaguc8i B))C alertaram !ara a exist>ncia de vi=s na 7ede. Isto =, os mecanismos de 0usca !odem criar vi=s na seleção de s+tios a 'ue !ro!orcionam acesso. :xem!licam esse vi=s com 0uscas so0re !rodutos Buma 0usca so0re rerigeradores mostra vi=s !ara certos a0ricantes em alguns mecanismos de 0uscasC e so0re eutan"sia. :m0ora não !rocurem ex!licar !or 'ue ocorre o vi=s, a ele se reerem como [um !ro0lema socialmente im!ortante^. Floridi B1995C talvez 8a;a sido o !rimeiro a a!ontar os !erigos da internet como onte de desinormação. esde então o tema oi tratado com detal8es em livro organizado !or intz B))C, 'ue a ele se reere como mal inormação \ misinormation ], 'ue = denida como inormação [intencionalmente errada ou e'uivocada^. :xem!los incluem inormaçes m=dicas e comerciais 'ue carecem de credi0ilidade, scams !ara arrecadação de din8eiro !ara ns !seudocaritativos, tra!aças !or correio eletrQnico, e orientação ;ur+dica !erigosa. :m0ora os !ro0lemas a0ordados nesta seção não se;am, de !er si, 'uestes de indexação, ilustram com clareza a necessidade de ltros de 'ualidade e o ato de um !edaço su0stancial da 7ede não merecer o m+nimo de atenção em mat=ria de indexação. 6inculação de hipertextoKhiperm&dia
?0vio 'ue, na estrutura da 7ede, ac8a-se im!l+cita uma orma de indexação. M ato de duas ontes, A e $, estarem vinculadas na 7ede im!lica 'ue am0as !ertencem, em algum sentido, P mesma classe, e 'ue os termos relativos a A tam0=m !odem ser Hteis na recu!eração de $, e vice-versa BSavoA, 1994C. natural, !ortanto, 'ue os !ro0lemas de indexação relativos a ontes em 8i!ertexto e 8i!erm+dia 8a;am rece0ido grande atenção. %lguns tra0al8os B!or exem!lo, Salton e &ucXleA, 199)$ SavoA, 1994$ Salton et al., 1996C analisam !rocessos !ara esta0elecimento autom"tico de v+nculos de 8i!ertexto. Isso tam0=m = tema de livro organizado !or %gosti e Smeaton B1995C. %gosti et al. B1994C descrevem m=todos !ara esta0elecimento autom"tico de v+nculos )44
de 8i!erm+dia, com o uso de crit=rios de associação estat+stica, em tem!o real, !es'uisando interação com a 7ede. 7eerem-se a isso como Rautoria autom"ticaO de 8i!erm+dia. :m0ora não !ro!on8am ex!licitamente isso, os v+nculos de 8i!ertexto esta0elecidos !elo consulente, se orem registrados, serão Hteis !ara consulentes !osteriores. % id=ia = conceitualmente similar P de um Rtesauro em crescimentoO . %rents e &ogaerts B1995C azem revisão da literatura so0re recu!eração de 8i!erm+dia. :m0ora mencionem amiHde a RindexaçãoO, muitos dos m=todos Bna maioria ex!erimentaisC 'ue estudam envolvem !es'uisas ou RnavegaçãoO em 8i!erredes, seguindo v+nculos !reesta0elecidos ou ormados no !r?!rio !rocesso de 0usca. Ms RnavegadoresO gr"cos ou Rma!asO destinados a ornecer ao usu"rio um !anorama visual dos v+nculos na rede Bver _izi, 1995, !or exem!loC lem0ram os Rma!as semnticosO !ro!ostos !or oAle B1951C 8" mais de anos. Eomo oi indicado neste livro, o 8i!ertexto e as redes de 8i!erm+dia criam ontes de inormação 'ue não !ossuem ronteiras claramente denidas. E8iaramella e Z8eir0eX B1995C tratam dessa 'uestão. Salientam 'ue [os documentos não são mais unidades atQmicas^ o 'ue az com 'ue mudem nossas conce!çes so0re o 'ue constitui não a!enas RdocumentoO mas Rcor!usO e tam0=m R+ndiceO. /essier B199)C, :llis et al. B199, 1995C e E8u B1996C são alguns autores 'ue a0ordaram as relaçes indexação#8i!ertexto. /essier examinou as semel8anças entre vinculação de 8i!ertexto e indexação convencional. :la sustenta 'ue os autores de 8i!ertexto vinculam o texto de orma muito !arecida com a orma como seriam vinculados na indexação convencional. :llis et al. constataram 'ue seres 8umanos, solicitados a inserir v+nculos de 8i!ertexto numa coleção de textos, como indexadores convencionais, não revelam grande coer>ncia nessa tarea. :m artigo !osterior B:llis et al., 1995C, testam o eeito dessa coer>ncia da vinculação na ec"cia da recu!eração. E8u B1996C tentou a!licar os !rinc+!ios da exaustividade e es!ecicidade a v+nculos de 8i!ertexto. :m0ora a medida do !rimeiro se;a !recisa BnHmero de v+nculos !or nHmero de !alavras n.um documentoC, a medida de es!ecicidade = muito mais di+cil de a!licar com >xito. Srinavasan et al. B1995C ocalizam os !ro0lemas da indexação e recu!eração de itens na 7ede. Seu tra0al8o sugere 'ue t=cnicas 'ue uncionam 0em em am0ientes mais est"veis B!or exem!lo, re'>ncia inversa de termos !ara a classicação dos itens recu!eradosC !odem ser menos ecazes em [contexto \tão] 8eterog>neo e dinmico^. %lguns !ro0lemas relativos ao uso de uma 0ase de dados de 8i!ertexto em atividades de recu!eração de inormação são examinados !or imitrop e Wolram B1993C. ais tarde, Wolram B1995C, usando tr>s modelos dierentes, !es'uisou os v+nculos entre registros de 8i!ertexto. &lair e Zim0aug8 B))C exaltam as virtudes de Rdocumentos exem!laresO no !ro;eto de sistemas de recu!eração. ocumentos exem!lares são a'ueles Bcomo artigos de revisão, manuais cl"ssicos e normas ;ur+dicasC 'ue mel8or [descrevem ou exi0em a estrutura intelectual de determinado cam!o^. Sugerem v"rios usos !oss+veis Bum = uma onte de terminologia re!resentativa !ara o cam!oC, inclusive sua utilidade !oss+vel !ara o usu"rio da 7ede. Se 'uem az a 0usca recu!era !rimeiro um documento exem!lar, os v+nculos de 8i!ertexto nele inseridos !odem ser usados !ara estender uma 0usca em v"rias direçes. elucci B1999C avaliou a ec"cia da recu!eração de v+nculos de 8i!ertexto constru+dos automaticamente, e &lustein e StaveleA B)1C oerecem uma revisão de tra0al8os so0re geração e avaliação de 8i!ertexto.
*"rios mecanismos de 0uscas incluem alguma modalidade de categorização dos recursos a 'ue !ro!orcionam acesso. :sses RcadastrosO \RdirectoriesO] em!regam alguma orma de classicação 8ier"r'uica. :m alguns casos, v"rios mecanismos de 0uscas com!artil8am o uso de um cadastro !roduzido al8ures. M qa8oo` considera-se 0asicamente um cadastro da 7ede, em0ora se;a, essencialmente, uma com0inação de cadastro#mecanismo de 0usca. %l=m disso, algumas instituiçes v>m tra0al8ando com vista P organização de recursos da internet !or meio de alguma modalidade de classicação. M MELE, !or exem!lo, conta com v"rias iniciativas relacionadas com isso.
desativadaC tam0=m usava a estrutura 8ier"r'uica da classicação de eVeA, a m de !ro!orcionar acesso a recursos selecionados da 7ede. _ins B))C examinou os ti!os de classicação usados em im!ortantes !ortais e cadastros classicados da 7ede. Identicou oito !rinc+!ios de classicação adotados nesses recursos, e considerou cinco deles Rrelativos a conteHdoO assuntos, o0;etos B!or exem!lo, !essoas e organizaçesC, a!licaçes B!or exem!lo, com!rasC, usu"rios B!ara 'uem se destina um recursoC e localizaçes BlugarC, e os outros tr>s !rinc+!ios relativos a ormato m+dia B!or exem!lo, imagensC, Rreer>nciaO B!or exem!lo, dicion"rios, ma!asC, e l+nguas. _ins sugere a necessidade de integrar esses !rinc+!ios numa classicação acetada !ara a!licação na internet. :m0ora tal integração se;a teoricamente atraente, _ins !arece su0estimar o ato de 'ue a classicação dos recursos da 7ede = essencialmente !ragm"tica e !r"tica, e 'ue os es'uemas unidimensionais 8o;e em!regados talvez se;am tudo de 'ue os usu"rios !recisam !ara utilização 0em-sucedida da 7ede. %lgumas 0i0liotecas começam a atri0uir nHmeros de classicação aos recursos da 7ede a 'ue !ro!orcionam acesso. :lrod B)C resumiu um de0ate em lin8a so0re essa 'uestão. tem em seu acervo, mas tam0=m a'ueles recursos da internet so0re o mesmo assunto ou assuntos !r?ximos.
:n'uanto os mecanismos de 0usca da 7ede !ro!orcionam acesso em n+vel de !"gina, os cadastros e !ortais geralmente ornecem acesso em n+vel de s+tio da 7ede. EaseA B1999C examinou a necessidade de um +ndice anal+tico da 7ede, ou se;a, 'ue em!regue alguma orma de classicação ou outro voca0ul"rio controlado !ara indexar recursos a0aixo do n+vel de s+tio. :la recon8ece [a im!ossi0ilidade de um +ndice anal+tico exaustivo da internet^, mas acredita 'ue a [criação de !e'uenos +ndices ocais !ode ser a mel8or solução !ara acessar ti!os es!ec+cos de inormação digital^. Isso = !recisamente o 'ue os !ortais examinados na seção seguinte o0;etivam azer. uitos autores enatizaram a necessidade de mais classicação dos recursos da 7ede. /ri!!e B)1C assim se ex!ressou Segundo alguns, o camin8o 'ue leva a uma mel8oria da recu!eração da inormação na 7ede est" em taxonomias a!licadas de orma inteligente. Segundo tal o!inião, = !reciso identicar com mais !recisão o conteHdo, mediante o uso de categorias, de modo 'ue os mecanismos de 0usca e outros aux+lios P navegação !ossam ser mais 0em sintonizados !ara a;udar o usu"rio. Eomo, cada vez mais, os conteHdos camin8am rumo P 7ede, essas ontes de dados !recisam 0eneciar-se das tecnologias e t=cnicas 'ue !ermitem Ps !essoas visualizar, navegar e !rocurar dados !or meio de categorias 'ue se;am am!lamente com!reendidas B!. C.
: !assa a descrever v"rios !rodutos comerciais 'ue se destinam a realizar automaticamente v"rias atividades de categorização em ontes da 7ede. ortais
:m0ora 0ases de dados 0i0liogr"cos, como as da 2ational Li0rarA o edicine, este;am acess+veis na internet, a grande maioria dos recursos da 7ede não est"O indexadaO no sentido com 'ue a !alavra = em!regada neste livro, isto =, !ela atri0uição de termos, eita !or seres 8umanos ou com!utador, talvez extra+dos de um voca0ul"rio controlado. 2ão o0stante, 0i0liotecas es!ecializadas e centros de inormação !odem oerecer um serviço i m!ortante com a identicação dos recursos da 7ede de maior relevncia e utilidade !ara seus usu"rios, indexando de alguma orma esses recursos, e desenvolvendo um gate8ay 'ue !ro!orcione acesso a eles !or meio dos elementos de metadados. *"rios desses gate8ays ou R!ortaisO são descritos e exem!licados em Wells et al. B1999C, 'ue a eles se reerem como R0i0liotecas virtuaisO.
\...] um gate8ay !ara s+tios da internet, de 'ualidade, so0re engen8aria \...] \'ue] tem !or o0;etivo !ermitir 'ue !roessores, !es'uisadores e estudantes de engen8aria no 7eino
% 0ase de dados cont=m descriçes !es'uis"veis e v+nculos com s+tios da internet 'ue ten8am interesse. Ms recursos são categorizados com um es'uema de classicação es!ecialmente desenvolvido !ara tal m. % sigla ::*L BUhttp:KK.ee#l.ac.uYKC originalmente signicava :din0urg8 :ngineering *irtual Li0rarA. Dosteriormente oi renomeada :n8anced and :valuated *irtual Li0rarA 'uando seu cam!o de ação oi am!liado !ara incluir matem"tica e inorm"tica. :m )1#9#)), a ::*L !ro!orcionava acesso a mais de 9 s+tios.
:m )1#9#)), anunciava 'ue !ro!orcionava acesso a mais de )3 recursos. Ms s+tios inclu+dos são comentados e rece0em ca0eçal8os de assuntos BLi0rarA o EongressC !ara mel8orar o acesso Bitc8ell e ooneA, 1999C. Mutros !ortais destinam-se a acilitar o acesso a recursos da 7ede 'ue se;am de interesse !otencial !ara usu"rios de 0i0liotecas !H0licas. M Li0rariansO Index to t8e Internet BUhttp:KKlii.orKC = assim descrito !or Yinman e Leita, 1999 um cadastro tem"tico, !es'uis"vel e comentado, de \...] recursos da internet, selecionados e avaliados 'uanto P sua utilidade !ara as necessidades de inormação do usu"rio de 0i0liotecas !H0licas.. Ms recursos são selecionados e indexados !or uma e'ui!e de 0i0liotec"rios treinados, volunt"rios, de 0i0liotecas da Eali?rnia B!. 1C.
São a0rangidos mais de 1 recursos da internet, organizados em categorias e su0categorias. São em!regados ca0eçal8os de assuntos da Li0rarA o Eongress, com modicaçes. M @ettA Inormation Institute = outra instituição atuante nesse ti!o de esorço. &usc8 B199C descreveu como os voca0ul"rios controlados do @ettA !odem ser usados !ara !ro!orcionar mel8or acesso a recursos em arte. Dortais desse ti!o são im!ortantes como ltros dos recursos em rede. M com!onente de Rvalor agregadoO ou Rltro de 'ualidadeO - de seleção, anotação, indexação - = de suma im!ortncia. :sse !onto = enatizado na ::*L %s 0uscas na ::*L recu!erarão recursos de alta 'ualidade, mas, em virtude de os recursos constantes da ::*L serem col8idos P mão, a'ui voc> não encontrar" tantos recursos 'uantos encontraria em alguns serviços, !or=m serão os mel8ores`
Ms !ortais mencionados neste ca!+tulos destinam-se a serem acessados !or uma grande variedade de usu"rios !otenciais. 2o entanto, são !oss+veis !ortais mais restritos e es!ecializados. %s 0i0liotecas !odem criar seus !r?!rios !ortais !ara recursos da 7ede. Yurt e Dotter B)1C dão um exem!lo 2o cam!us da @eorgia State ncia e desenvolvimento de coleçesC dedicam-se ativamente P identicação e criação de s+tios na 7ede, !articularmente em suas es!ecialidades, e desenvolvem s+tios so0re v"rios temas, 'ue incor!oram outros s+tios 0emconceituados. Mutro gru!o im!ortante de 0i0liotec"rios muito envolvidos com a 7ede são docentes 0i0liotec"rios de coleçes es!eciais e ar'uivos, muitos dos 'uais criam ar'uivos digitais !ara am!liar o conteHdo da 0i0lioteca virtual na 7ede B!. )3C.
)4
edeiros et al. B)1C descrevem a a0ordagem de uma 0i0lioteca universit"ria de medicina em relação a um !ortal, 'ue utiliza como 0ase o Eoo!erative Mnline 7esource Eatalog BEM7EC. %ssim se reerem Ps vantagens disso % 0i0lioteca !ode usar o EM7E !ara selecionar s+tios 'ue oereçam conteHdo de 'ualidade. M cliente da 0i0lioteca = atendido ao !oder dirigir-se, sem esorço, ao recurso exato de 'ue !recisa e evitar car vascul8ando os resultados dos mecanismos de 0uscas 'ue re'entemente consistem em !"ginas de v+nculos irrelevantes. %s caracter+sticas t+!icas do EM7E, como controle de autoridade !ara acesso a nomes, a;udam na localização dos recursos B!. 11)C.
:m0ora Eam!0ell não trate diretamente das 'uestes relativas P indexação, elas estão im!l+citas no recon8ecimento de 'ue o !ortal [tam0=m oereceria excelentes tesauros eletrQnicos 'ue orientariam, com !recisão, os !es'uisadores !ara "reas de interesse^. % %ssociation o 7esearc8 Li0raries vem atuando no desenvolvimento dessa id=ia !or interm=dio do Sc8olarOs Dortal Dro;ect BUhttp:KK.arl.orKaccess KscholarsportalKC. *er TacXson B))C !ara os avanços nessa "rea at= meados de )). :m % Vre e Wise B))C encontra-se uma 0reve revisão de desenvolvimentos recentes relativos a !ortais no 7eino ncias em mat=ria de inormação, de modo 'ue os gate8ays !ossam notic"-los so0re novos recursos 'ue sur;am no cat"logo B!. )3-)C.
M uturo da indexação e da redação de resumos = examinado, mais detidamente, no ca!+tulo seguinte, e Hltimo, deste livro.
)49
%ap&tulo /E 0 O futuro da indexação e redação de resumos :screvendo 8" 'uase 4 anos, Fairt8orne B194C armou 'ue [% indexação = o !ro0lema undamental 0em como o o0st"culo mais dis!endioso da recu!eração da inormação^. : a indexação continua sendo o !ro0lema !rinci!al do acesso P inormação, e a mente de Fairt8orne !or certo teria cado atQnita diante da imensidão dos !ro0lemas de acesso P inormação suscitados !ela 7ede undial. issing8am B1995C oerece uma clara ex!lanação desses !ro0lemas 2ão se !ode considerar a internet como se osse a!enas mais um !asso na 8ist?ria da indexação. :la suscita enormes desaos e exige uma a0ordagem muito dierente da indexação !ara alcançar uma recu!eração eciente da inormação. \...] % indexação da internet oerece muitos desaos ela cont=m mil8es de documentos ou ar'uivos$ a localização desses documentos#ar'uivos muda re'entemente$ não 8" nen8um controle de 'ualidade da inormação na internet, nen8uma coer>ncia no uso da terminologia, ou mesmo no em!rego de t+tulos$ = muito di+cil manter-se a !ar das novas ontes$ os +ndices são com!licados !or'ue muitos de!endem de inormaçes comunicadas !elos !r?!rios editores Balgo !arecido com o atual !rocesso de catalogação na !u0licaçãoC. \...] 2ão 8" normas 'ue exi;am 'ue se;am usados os autores ou os t+tulos, nem a exig>ncia de 'ue a inormação !rinci!al inclua o t+tulo ou o su0t+tulo. % indexação da internet =, !ortanto, muito dierente da indexação de um artigo de !eri?dico, onde essas inormaçes identicadoras normalmente são claras B!. 34C.
: ela acrescenta 'ue o maior de todos os !ro0lemas talvez se;a \...] a natureza vol"til da rede onde indexar um recurso = realmente como se se estivesse a enxugar gelo, !ois 8o;e ela !ode estar ali e aman8ã ;" ter desa!arecido ou mudado com!letamente. 2ão s? o nome, o conteHdo e a localização do recurso !odem alterar-se regularmente, mas tam0=m sua acessi0ilidade e ormato mudar acilmente B!. 35C.
M grande deeito da internet como onte de inormação, ora seu taman8o, est" no ato de 'ue ela carece de 'ual'uer orma de controle de 'ualidade. M ato de os serviços de inormação uncionar com razo"vel eci>ncia no mundo do !a!el im!resso deve-se a 'ue v"rias instituiçes existem !ara desem!en8ar a unção de ltro de 'ualidade. %s editoras de livros e !eri?dicos cient+cos adotam !rocessos de revisão#avaliação 'ue são, !elo menos em certa medida, ecazes !ara eliminar a maior !arte do 'ue = im!rest"vel. Ms serviços 'ue editam +ndices e resumos !ro!orcionam o n+vel seguinte de ltro de 'ualidade, !rinci!almente ao escol8er os !eri?dicos, s=ries de relat?rios ou outras !u0licaçes 'ue serão analisados regularmente. Dor m, as 0i0liotecas, !articularmente as 'ue servem Ps comunidades de ensino e !es'uisa, colocam os ltros mais !erto dos usu"rios reais 'uando com!ram materiais considerados de maior utilidade !ara esses usu"rios e 'uando organizam as coleçes segundo n+veis de acessi0ilidade, !ara 'ue 'uem mais !r?ximos Bsicamente e talvez tam0=m intelectualmenteC os materiais 'ue mais !rovavelmente os usu"rios ven8am a !recisar. claro 'ue a imensa vastidão de recursos mal-organizados 'ue estão acess+veis, !elo menos em sentido te?rico, na internet, az com 'ue a construção de ltros ecazes se;a uma !ro!osta intimidadora, tanto !ara !essoas 'uanto !ara instituiçes. %demais, dão-nos a certeza de 'ue a situação 8aver" de car muito !ior BWeld et al., 1994C. :m0ora muitos documentos da 7ede se;am de 0aixa utilidade, outros !odem sim!lesmente desa!arecer, conorme salientou issing8am. S!inellis B)3C constatou 'ue cerca de )f [dos <7Ls reerenciados em dois im!ortantes !eri?dicos de ci>ncia da com!utação, entre 1994 e 1999, não estavam mais acess+veis em ), nHmero esse 'ue aumentou !ara 1f em )). M +ndice de desa!arecimento de documentos da 7ede !ode, grosso modo, e'uivaler ao +ndice de o0solesc>ncia da literatura de ci>ncia da com!utação Bisto =, decl+nio de uso com a idadeC. 2ão o0stante, o ato de itens desa!arecerem ou talvez rea!arecerem em outro ormato sem reer>ncia ao original não estimula investimento numa indexação dis!endiosa. Yo;e em dia, não !arece !rov"vel 'ue a situação ca?tica causada !elo enQmeno do Rcada um ser" seu !r?!rio editorO se;a revers+vel. :m outras !alavras, = di+cil visualizar a !ossi0ilidade de 'ue algu=m !oderia im!or ou im!oria normas de 'ualidade total P !u0licação ou distri0uição atrav=s de redes. Dor conseguinte, a via0ilidade de uma vasta rede como recurso de inormação de!ender" da im!osição de ltros de 'ualidade similares aos do mundo da im!ressão em !a!el. 2ão 8" dHvida 'ue a unção de ltro = tão im!ortante no am0iente eletrQnico 'uanto o era num am0iente editorial dominado !ela im!ressão em !a!el. Eomo indexação e resumos, )5
numa ou noutra orma, são elementos essenciais na ltragem da inormação, conclui-se 'ue terão uturo. %s !erguntas 'ue !ermanecem sem res!osta, então, são as seguintes 1. Kual a orma 'ue terão essas atividades, e ). % 'uem ca0er" ou ca0eria realiz"-las interessante o0servar 'ue MdlAzXo, 'ue 8" alguns anos !reviu 'ue tanto as 0i0liotecas 'uanto os !eri?dicos cient+cos tornar-se-iam o0soletos, !elo menos em seu ormato tradicional Bver, !or exem!lo, MdlAzXo, 1994C, = 0astante !ositivo no 'ue tange ao uturo dos serviços de indexação e resumos. :le arma BMdlAzXo, 1999C 'ue esses serviços so0reviverão !or'ue sua contri0uição intelectual = su0stancial e !or'ue, !or isso, são com!arativamente 0aratos. Tacs? B))C discorda um !ouco em relação aos serviços, mas continua sendo um rme ade!to da necessidade de resumos na 7ede % crescente dis!oni0ilidade de 0ases de dados de texto com!leto ez diminuir a im!ortncia de 0ases de dados de resumos e +ndices nos Hltimos 1 a 14 anos, mas não a necessidade de resumos. %s 0ases de texto com!leto !recisam de resumos !ara 'ue seu uso se;a eciente. % razão ?0via disso est" em 'ue !assar os ol8os nas listas com os resultados de 0uscas 'ue conten8am 0reves resumos a;uda tremendamente a selecionar os documentos-onte mais !romissores, mesmo 'uando os resumos deixam muito a dese;ar.
: acrescenta % razão menos ?0via !ara a exist>ncia de resumos nessas 0ases de dados est" em 'ue se a 0usca se limitar ao cam!o do resumo numa 0ase de dados de textos com!letos 8aver" garantia de 'ue ela ser" mais !recisa do 'ue se or eita em centenas de mil8ares de documentos de texto com!leto B!. ))C.
claro 'ue Tacs? não est" se reerindo necessariamente a resumos !re!arados !or seres 8umanos, mas a resumos ou extratos !re!arados automaticamente. e ato, seu artigo !assa em revista !rogramas dis!on+veis comercialmente destinados P Rsumarização de documentosO. ani B)1C = outro autor 'ue acentuou a im!ortncia da sumarização % ex!losão da 7ede undial trouxe consigo um esto'ue imenso de inormaçes, em sua maior !arte relativamente não-estruturadas. Isso ez surgir a demanda !or novas maneiras de gerenciar esse cor!o 0astante so0recarregado de inormaçes dinamicamente cam0iantes. :m tal am0iente, !arece indis!ens"vel alguma orma de sumarização autom"tica. m exercendo !ressão crescente em !rol de avanços da tecnologia na 'uestão da sumarização. :m!resas comerciais !assam cada vez mais a oerecer recursos de sumarização de textos, muitas vezes integrados com erramentas de recu!eração da inormação B!. 4)9C.
%s !ro!ostas reerentes P indexação de recursos da 7ede a0rangem um le'ue extremamente variado, inclusive armativas de 'ue isso não = !oss+vel de modo algum. Dor exem!lo, Wellisc8 B199C sustentou 'ue [ im!rov"vel 'ue os !eri?dicos eletrQnicos se;am indexados, devido P insta0ilidade de seus textos^. /endo em vista 'ue a maioria das ontes na internet são muito menos est"veis do 'ue os !eri?dicos, ele !rovavelmente ac8a 'ue todo o esorço - ou se;a, a indexação de textos 'ue estão su;eitos a re'entes mudanças - se;a uma causa !erdida. evidente 'ue a indexação !rossional, eita !or seres 8umanos, de toda a 7ede = totalmente invi"vel. esmo 'ue o osse, grande !arte do 'ue a!arece na 7ede = de valor muito !assageiro ou de 'ualidade excessivamente 0aixa !ara c8egar a merecer tais cuidados com a indexação. T" uma indexação seletiva, !rossional, =, naturalmente, vi"vel. MVen B199C e Wein0erg B1995C são dois autores 'ue deenderam a indexação !rossional numa 0ase seletiva. Wein0erg recomendou es!ecicamente uma indexação no estilo dos +ndices de nal de livro, e essa es!=cie de indexação !oderia certamente ser a!licada a s+tios es!ec+cos da 7ede. 2a realidade, ;" oi a!licada dessa orma, e &roVne B)1C analisou e exem!licou os res!ectivos !rocessos. EaseA B1999C admite 'ue o son8o 'ue ela alimentava de um R+ndice anal+ticoO com!leto da 7ede Bisto =, 'ue indexasse a0aixo do n+vel de s+tioC era ut?!ico e 'ue [+ndices !e'uenos, ocais, talvez se;am a mel8or solução^. :llis et al. B199C sugerem 'ue um grande !ro0lema de 'ual'uer a0ordagem relacionada com a indexação da 7ede = o ato de 'ue o indexador sem!re estar" muito longe do usu"rio \...] na 7ede undial \...] não 8" !roximidade alguma entre !ro;etista ou criador B'ue !oderia ser 'ual'uer umC e usu"rio !otencial B'ue !oderia ser 'ual'uer um ou todosC. Isso =
)51
agravado !ela alta de uma noção clara !or !arte da maioria dos consulentes so0re o 'ue = 'ue os diversos mecanismos de 0uscas na realidade azem 'uando realizam uma 0usca. e modo 'ue a origem real dos !ro0lemas 'ue ocorrem nas 0uscas eitas em ontes distri0u+das em lin8a ou na internet não est" nos !ro0lemas t=cnicos de indexação, mas na acilidade de acesso !ro!orcionado !or serviços em lin8a e a 7ede undial a inormaçes selecionadas, estruturadas e indexadas !ara um gru!o de usu"rios B'ue !ossuem um con;unto de caracter+sticas e necessidades de inormaçãoC !or es!=cies de usu"rios totalmente dierentes com caracter+sticas e necessidades totalmente dierentes. natural 'ue isso ven8a a exacer0ar !ro0lemas existentes em relação P coincid>ncia de conceitos entre indexador e usu"rio, !ois os usu"rios encontram muitos ar'uivos ou s+tios dierentes, com caracter+sticas, !r"ticas de indexação e voca0ul"rios dierentes, nen8um dos 'uais, com certeza, !oder" satisazer a todas ou mesmo algumas das necessidades de um usu"rio ou gru!o de usu"rios !otenciais. :ssa = uma 'uestão im!ortante, !ois os usu"rios mais distantes são, no 'ue concerne a caracter+sticas e necessidades de inormação, dentre os ti!os de usu"rios imaginados e levados em conta !elos 'ue criam ou indexam uma 0ase de dados, os 'ue mais !rovavelmente terão !ro0lemas em acessar inormaçes relevantes dessa 0ase de dados. M !ro0lema = a indexação !ara o usu"rio descon8ecido B!. C.
Dode-se considerar os documentos da 7ede como RdinmicosO, e não est"ticos, no sentido de 'ue !odem ser modicados !elo seu criador, ou mesmo !or outros. &is8o! B1999C examinou como os !es'uisadores !odem mani!ular artigos de !eri?dicos eletrQnicos B!or exem!loC !ara criar novos documentos. :la se reere a isso como desagregação Bo desmem0ramento do artigoC e reagregação Breunir todos os !edaços do artigo, ou !arte deles, numa organização dierenteC. %demais, alguns documentos da 7ede são RvirtuaisO - documentos ['ue carecem de um estado de !erman>ncia^ Bsão criados a camin8o do usu"rioC BWatters, 1999C. @iordano B)C salienta 'ue \...] a !r?!ria estrutura do documento = !ro0lem"tica !or'ue, num am0iente 'ue se 0aseia na 7ede, um documento 'ue a!areça na estação de tra0al8o de um usu"rio como um Hnico o0;eto !oder" de ato ser uma montagem de documentos vinculados, mas inde!endentes, residentes em 0ases de dados distri0u+das B!. )3C.
:ssa situação Nuida gera conusão em !essoas 8a0ituadas ao am0iente 0astante s?lido e !ermanente da im!ressão em !a!el, !or=m nem sem!re a!resentar" !ro0lemas de indexação e redação de resumos. %s mudanças 'ue o autor zer num texto RautorizadoO exigirão, naturalmente, algumas alteraçes num resumo ou termos de indexação relativos a esse texto B!or exem!lo, em !ortais 'ue a!ontem !ara eleC. M documento RvirtualO Bdescrito !or WattersC somente estaria 'ualicado !ara ser indexado ou resumido se osse ca!turado e armazenado numa 0ase de dados como um item novo. o mesmo modo, o documento reagregado Bdescrito !or &is8o!C !rovavelmente seria um documento inormal, 'ue não mereceria os cuidados da indexação e resumo. % im!erman>ncia dos documentos eletrQnicos tem mais !ro0a0ilidade de constituir um !ro0lema nas intranets de em!resas, onde os documentos !odem desa!arecer !or com!leto, ser radicalmente alterados ou agregados#desagregados sem 'ual'uer controle. +bordaens prossionais
uas im!ortantes a0ordagens 'ue oerecem acesso intelectual aos recursos mais im!ortantes da 7ede ;" estão dis!on+veis e oram ocalizadas no ca!+tulo anterior a iniciativa EM7E BEoo!erative Mnline 7esource EatalogC Brenomeada REonnexionO em ))C e v"rios !ortais es!ecializados. :m0ora a maioria dos !ortais 8a;am sido desenvolvidos em "reas Racad>micasO, a im!ortncia deste ti!o de atividade !ara a 0i0lioteca !H0lica oi assim realçada !or Yolt B1994C \...] o !essoal de 0i0lioteca !H0lica !ode !ou!ar o tem!o de seus clientes ao organizar a massa de inormaçes eletrQnicas dis!on+veis em servidores locais, nacionais e internacionais \...] \e] !ode desenvolver guias eletrQnicos 'ue a;udem os consulentes em meio aos metadados e megaar'uivos, em lin8a, com 'ue lidarão B!. 444-445C.
:le menciona, es!ecicamente, a im!ortncia de !ro!orcionar anotaçes aos usu"rios, e encara a 0i0lioteca !H0lica como uma central de inormaçes !rovida de Ragentes de inormaçãoO. /odas essas atividades dizem res!eito P ltragem de recursos da 7ede e todas im!licam alguma orma de !rovisão de acesso !or assuntos !or meio de indexação ou classicação, e talvez alguma orma de resumo. /ri!!e B)1C ressalta a necessidade de mais classicação dos recursos da 7ede, e :lrod B)C resume um de0ate em lin8a so0re a conveni>ncia de as )5)
0i0liotecas atri0u+rem nHmeros de classicação aos recursos da 7ede aos 'uais elas !ro!orcionam acesso Balgumas ;" o azemC. *"rios autores Bver, !or exem!lo, acougall, ), e StudVell, )C insistem no uso de voca0ul"rios controlados na indexação de recursos da 7ede, !or=m se mant>m vagos 'uanto P a!licação ou !arecem su0estimar grandemente os !ro0lemas da a!licação. %nderson e Derez-Ear0allo B)1C argumentam 'ue o tremendo aumento na 'uantidade de texto index"vel, es!ecialmente na 7ede, torna essencial uma a0ordagem seletiva da indexação !or seres 8umanos M 'ue não !odemos nos !ermitir = continuar tratando todos os documentos 'ue ingressam em nossos acervos e 0ases de dados de recu!eração da inormação como se ossem igualmente im!ortantes e merecedores !or igual do nosso tra0al8o es!ecializado de an"lise e indexação. Sim!lesmente, eles não são, e a continuar assim estaremos des!erdiçando nossos !reciosos recursos B!. )6C.
: azem sugestes so0re como identicar esses itens de escol. +bordaens alternati#as
rott B))C !ro!e uma solução com!letamente dierente. :le c8amou atenção !ara o !ro0lema da indexação na 7ede da seguinte orma Localizar inormaçes so0re temas es!ec+cos na 7ede = di+cil e ca cada vez mais di+cil. Ms recentes avanços em 0uscas autom"ticas na 7ede e indexação algor+tmica oram grandemente su!erados !elo enorme crescimento da 'uantidade de material dis!on+vel. %s estimativas de co0ertura !elos mecanismos de 0uscas da 7ede, eitas !or LaVrence e @iles B1999C, sugerem a im!ossi0ilidade de em!regar ro0Qs !ara indexar toda a 7ede, e, evidentemente, 'uanto maior or o tem!o de an"lise 'ue um ro0Q dedicar P extração de termos de indexação !ara uma Hnica !"gina, menor ser" a 'uantidade do material dis!on+vel 'ue !oder" ser indexada. %l=m disso, em0ora grandes !rogressos este;am sendo eitos !ara mel8orar a exatidão da indexação autom"tica, ainda = verdade 'ue atri0uir termos de indexação a uma 0ase de dados tão diversa 'uanto a 7ede continua sendo um !ro0lema !ara o 'ual 8" !oucas soluçes !romissoras B!. )9-)1C.
: sugere, no entanto, 'ue em0ora o em!rego de indexadores !rossionais não se;a uma !ro!osta economicamente atraente, os res!ons"veis !ela criação de !"ginas na 7ede deveriam ter condiçes de eles mesmos azerem um tra0al8o aceit"vel de indexação Seria 0om estimular os criadores de s+tios na 7ede a atri0uir seus !r?!rios termos de indexação M atual modelo de indexação, como o 'ue se encontra nos !rinci!ais serviços de indexação de !eri?dicos, 0aseia-se no em!rego de indexadores ca!acitados e 'ue rece0eram extenso treinamento. :ncontra-se, contudo, uma !es'uisa encora;adora de Eoom0s B199C so0re a indexação de !"ginas do governo do estado de Was8ington na 7ede. Eoom0s valeuse, como indexadores, das !essoas 'ue criaram e tra0al8aram com os documentos. Ms resultados desse estudo mostraram 'ue, 'uando os indexadores leigos com!artil8am o mesmo entendimento 'uanto ao conteHdo e usos de seus documentos, as !alavras-c8ave 'ue !roduzem são um aux+lio razo"vel na localização !or assuntos B!. )1C.
:, nalmente 2osso modelo de indexação da 7ede 0em 'ue !oderia tornar-se um desses modelos de Rcaos glo0al, ordem localO em 'ue a indexação de cam!os es!ec+cos eita !elo autor = ade'uada dentro de cam!os limitados, mas ruim !ara integrar-se em 'ual'uer es'uema glo0al de con8ecimento. :ste conceito sugere um sistema de indexação de duas camadas em 'ue o !rocessamento distri0u+do de metaeti'uetas !or um grande nHmero. de com!utadores 'ue rodem !rogramas 0astante sim!les = su!ortado no n+vel seguinte !or ro0Qs de indexação mais com!lexa. :sses ro0Qs serão !ro;etados não !ara extrair de cada !"gina descriçes de conteHdo es!ec+cas, mas !ara se concentrar na colocação de gru!os de !"ginas ou s+tios inteiros em categorias de assuntos es!ec+cos e deixando as inormaçes de conteHdo !ara os criadores das eti'uetas B!. )1C.
Mutra !ossi0ilidade = !romover a indexação de recursos da 7ede !or seus usu"rios. &esser B1996C analisou a necessidade disso. :m0ora lidasse es!ecicamente com imagens na 7ede, o m=todo = a!lic"vel a 'uais'uer recursos Se !udermos desenvolver sistemas !ara terminologia atri0u+da !elo usu"rio, os gerentes de acervos !oderão a!oiar-se nos usu"rios !ara 'ue atri0uam termos ou !alavras-c8ave a cada imagem 2esse sistema, 'uando o usu"rio encontrasse uma imagem, o sistema l8e
)53
!erguntaria 'uais as !alavras 'ue teria usado !ara 0uscar essa imagem. :ssas !alavras seriam então inseridas no sistema de recu!eração, e usu"rios su0se'entes 'ue zessem 0uscas com essas !alavras encontrariam a imagem. h medida 'ue crescer a 'uantidade de !essoas 'ue usarem esse sistema, tam0=m crescer" a 'uantidade de !ontos de acesso !ara muitas imagens. essencial 'ue esses sistemas !ermitam a realização de 0uscas em termos atri0u+dos de orma ocial, tanto inde!endentemente dos termos contri0u+dos !elos usu"rios 'uanto ;unto com eles. Dodemos ter dois ti!os de 0uscas uma 'ue somente examina termos atri0u+dos !or catalogadores, e a outra 'ue examina tanto os termos atri0u+dos !elos catalogadores 'uanto os termos atri0u+dos !elos usu"rios. Sistemas desse ti!o tam0=m !oderão servir como aux+lio aos catalogadores. Dode-se imaginar um sistema em 'ue, de tem!os em tem!os, termos contri0u+dos !elos usu"rios se;am R!romovidosO P condição de termos ocialmente atri0u+dos !elo catalogador Be serão então recu!er"veis !or am0os os m=todosC. h medida 'ue sistemas como esse crescem, os usu"rios uturos !oderão 'uerer limitar suas 0uscas a termos atri0u+dos !or !essoas em 'uem conam Btalvez !or'ue !roven8am do mesmo cam!o ou !or'ue atri0uam termos de modo mais con"velC. Dortanto, !rovavelmente esses sistemas desenvolverão tanto uma caracter+stica !es'uis"vel de R!ro!riedadeO !ara cada termo atri0u+do e um Rn+vel de conançaO 'ue o usu"rio !ode denir e 'ue se a!lica a um gru!o de !ro!riet"rios. M !ro;eto de sistemas como este ter" tam0=m de ser sens+vel P !rivacidade de 'uem contri0ui com termos. Ms usu"rios 'ue denem n+veis de conança !ara os atri0uidores de termos !odem localizar essas !essoas !or meio de !ers 0"sicos de sua es!ecialidade e cargo Bmas sem identicaçãoC, ou !odem.localiz"-los ao encontrar correlaçes entre outros atri0uidores de termos e como o !r?!rio usu"rio atri0ui termos a outras imagens \...] B!. )-)4C.
% indexação de documentos da 7ede eita !elos usu"rios tam0=m oi deendida !or *illarroel et al. B))C. +bordaens automáticas
:ncontram-se dis!on+veis !rogramas 'ue azem automaticamente a indexação ou resumos de recursos da 7ede. Tacs? B))C avalia alguns !rogramas de sumarização dis!on+veis no com=rcio, e 7eamA B))C reere-se a !rogramas de RautocategorizaçãoO Bisto =, 'ue colocam automaticamente os recursos em categoriasC e !rev> im!ortantes avanços nessa "rea no uturo. % situação do desenvolvimento de m=todos autom"ticos oi examinada no ca!+tulo 14. %onclusão
e!ois de tudo isso, !ode-se concluir 'ue as atividades de indexação e resumos v>m aumentando ao inv=s de diminuir de im!ortncia, e 'ue os !rossionais dessas "reas !odem dar uma contri0uição su0stancial se;a no n+vel de um s+tio da 7ede ou em n+veis mais am!los, como o !ro;eto e im!lementação de um !ortal. Doderão tam0=m desem!en8ar im!ortantes !a!=is na o!eração de intranets de em!resas. e ato, 7eamA B))C, es!ecialista na "rea de gestão do con8ecimento, em0ora !reve;a o crescimento da RautocategorizaçãoO, oerece en"tica deesa da necessidade de !rossionais em atividades de acesso intelectual %s em!resas não 'uerem !agar aos 0i0liotec"rios !ara categorizar seu conteHdo !or'ue ac8am 'ue sai muito caro. :stão erradas, !elo menos 'uando se com!uta o tem!o 'ue os uncion"rios des!erdiçam ao tentar em vão encontrar a'uele documento de 'ue !recisam !ara res!onder a'uela !ergunta do cliente, sem o 'ue o cliente ir" em0ora em 0usca de um concorrente 'ue, ao contr"rio, tem a res!osta. %!esar disso, muitas em!resas ainda não !agarão !ara 'ue seres 8umanos categorizem seu conteHdo, e = mais !rov"vel 'ue este;am dis!ostas a !agar entre )4Z a 64Z !or um !rograma de com!utador 'ue amiHde executa um tra0al8o menos ecaz B!. 1C.
: acrescenta :m !rimeir+ssimo lugar, a autocategorização não !ode su0stituir !or com!leto um 0i0liotec"rio ou ar'uiteto de inormação, em0ora !ossa torn"-los mais !rodutivos, !ou!ar seu tem!o e !roduzir um mel8or !roduto nal. M !r?!rio !rograma, sem uma categorização 0aseada em regras eitas !or seres 8umanos, não !ode atualmente c8egar a mais de uns 9f de exatidão - o 'ue soa muito 0em at= se !erce0er 'ue um de cada dez documentos listados nos resultados de uma 0usca ou interace de !es'uisa estar" errado. :, o 'ue = mais
)5
im!ortante, estar" errado !or razes inex!lic"veis - razes 'ue levarão os usu"rios a !erder conança no sistema. :m0ora se;a muito mais r"!ida do 'ue um categorizador 8umano e não exi;a =rias nem !lano de saHde, a autocategorização sim!lesmente ainda não = tão 0oa 'uanto um categorizador 8umano. 2ão !ode com!reender as sutilezas de signicado nem sumarizar como um ser 8umano !or'ue não com!rende coisas como o signicado im!l+cito num documento e !or'ue não leva !ara a tarea de categorização os contextos signicativos 'ue as !essoas levam. = Htil. &em, est" certo, talvez 8a;a um !ouco de exagero nisso, mas o !rograma de autocategorização tem o !otencial de realçar o 'ue ;" devia estar claro - 'ue o !rossional da inormação est" em!en8ado numa atividade undamental de inra-estrutura. Ms !rossionais da inormação estão ou deveriam estar envolvidos na criação e manutenção da inraestrutura intelectual de sua instituição. :m0ora a tecnologia e as inra-estruturas organizacionais 8a;am merecido mais atenção e recursos, !arte do dese'uil+0rio !oderia ser corrigido com a utilização e integração inteligentes de novos !rogramas, novos m=todos de tra0al8o tanto com os !rovedores de conteHdo 'uanto com os consumidores de conteHdo, e novas ormas de a!resentar a inormação. Dortanto, como conclusão, ac8o ser !rov"vel 'ue a autocategorização, em Hltima an"lise, mel8orar" tanto o !oder 'uanto o !rest+gio do !rossional da inormação B!. ))C.
Darece claro 'ue o crescimento continuado dos recursos de inormação acess+veis em rede ar" com 'ue as atividades de an"lise tem"tica ven8am a ter uma im!ortncia maior do 'ue ;amais tiveram. %l=m disso, = !rov"vel 'ue mais e mais indiv+duos estarão envolvidos nessas unçes. Eom certeza, os m=todos !ara ela0oração autom"tica de +ndices e resumos continuarão a mel8orar. 2o entanto, como Lancaster e Warner B)1C salientam na revisão 'ue escreveram so0re esta "rea, !rovavelmente ainda decorrer" muito tem!o at= 'ue as m"'uinas se;am sucientemente inteligentes !ara su0stituir !or com!leto os seres 8umanos nessas im!ortantes atividades, se = 'ue de ato um dia o arão.
)54
arte 3 0 rática %ap&tulo /G 0 4xerc&cios de indexação Fazendo = 'ue se a!rende, se;a na indexação e redação de resumos se;a em outras atividades. Ms dois Hltimos ca!+tulos deste livro cont>m alguns exerc+cios de indexação e redação de resumos. :videntemente, os !oucos exerc+cios 'ue !odem ser inclu+dos num livro deste ti!o estão longe do 'ue seria suciente !ara ormar indexadores e resumidores consumados. %!esar disso, a!resentamo-los na es!erança de 'ue !elo menos !ro!orcionarão alguns exem!los concretos dos !rinci!ais !ontos mencionados nos ca!+tulos !recedentes. 2as !oucas !"ginas a seguir encontram-se v"rios resumos de relat?rios ou artigos de !eri?dicos. %lguns são resumos verdadeiros de !u0licaçes existentes. Mutros são de artigos R8i!ot=ticosO, em0ora se 0aseiem em !u0licaçes existentes. *oc> dever" indexar cada um desses itens em!regando termos do 7B$IS thesaurus B2eV qorX, !oder" !rimeiro escrever as !alavras ou ex!resses 'ue re!resentem sua an"lise conceitual de cada item e, em seguida, !rocurar traduzir cada um desses enunciados !ara um termo ou termos do tesauro. e 'ual'uer modo, se!are seus descritores em descritores principais e secundários , sendo os !rimeiros os termos 'ue voc> considera mais im!ortantes !ara re!resentar o conteHdo tem"tico. e!ois dos resumos voc> encontrar" nossas sugestes de indexação !ara cada item, o 'ue l8e !ermitir" com!arar sua indexação com a min8a. Lem0rese, contudo, 'ue a indexação = um !rocesso algo su0;etivo. :m0ora acredite na min8a indexação, não !osso garantir 'ue ela se;a RcorretaO em sentido a0soluto. Incluem-se ex!licaçes so0re !or 'ue a indexação oi eita de determinada orma. Ms itens 5-13 oram !u0licados originalmente no nHmero de ;aneiro de 1966 de A.I.5. :esearch and 5evelopment A%stracts e são a'ui re!roduzidos com !ermissão do Eenter or evelo!ment Inormation and :valuation,
1. M álcool com%ustível ho&e \%lco8ol uel todaA] B&aseado em artigo !u0licado em Smithsonian , arc8 191, !. -43C escreve as v"rias ontes das 'uais se !ode destilar etanol, a0rangendo diversos ti!os de !rodutos e res+duos agr+colas, al=m de res+duos ur0anos e lama industrial. Eom!ara os custos de !rodução do etanol com os da gasolina, e analisa os !ro0lemas inerentes P conversão da !rodução de etanol da ase de usina-!iloto P !rodução comercial em larga escala. :xamina as vantagens e desvantagens do gasool, urna mistura de gasolina e "lcool com0ust+vel, e estuda os !ro0lemas 'ue devem ser resolvidos !ara 'ue os carros a "lcool se tornem vi"veis. ). A eros0o e o agricultor. escreve como o vento, a c8uva e a neve derretida !odem erodir valiosas terras de cultivo, e avalia o volume das !erdas agr+colas devidas a essas causas na :uro!a setentrional. :xamina !oss+veis soluçes, a sa0er, a rotação da cultura de grãos com a de gram+neas !rotetoras do solo e o em!rego de "rvores e terraços como 'ue0ra-ventos. 3. A otografa a9rea e o 4ue ela pode aLer \%erial !8otogra!8A and V8at it cando] B&aseado em artigo !u0licado em Smithsonian , arc8 19, !. 14-144.C Faz uma revisão dos v"rios usos !oss+veis da otograa a=rea, 'ue a0rangem a otograa !or sat=lite, a vigilncia militar, o controle do desarmamento, o estudo de s+tios ar'ueol?gicos, a!licaçes em censos B!or exem!lo, contagem de domic+liosC, !revisão do tem!o e inundaçes, e cartograa BotogrametriaC. . # fm do %ordo sacarinoF \/8e end ot8e sugar ma!le] B&aseado em artigos !u0licados em $lair Netchum s "ountry Journal , arc8 195, !. 5-9 e American Gorests, 2ovem0er-ecem0er 196, !. )5-3.C s, = o /esauro SDI2:S B&ras+lia I&IE/$ Lis0oa T2IE/, 19C, onde se encontram mais de 6f dos descritores das res!ostas dadas !elo autor. B[./.C 1
)55
Ser" testado no Eanad" o !rot?ti!o de uma aeronave movida a eletricidade, 'ue não !recisa de 'ual'uer com0ust+vel convencional. % eletricidade = transmitida do solo so0 a orma de energia de microondas, sendo reconvertida em eletricidade !or meio de RretenasO instaladas no avião. /eoricamente, o avião !oderia !ermanecer no ar durante meses sem !iloto. :ntre suas a!licaçes incluem-se !es'uisa cient+ca, vigilncia Bmilitar, !olicial ou civilC, !revisão do tem!o e trans!orte de !assageiros. %s microondas tam0=m !odem acionar es!aço naves. Ms !oss+veis riscos das microondas !ara a saHde seriam um o0st"culo a sua am!la a!licação. 5. !duca10o nutricional em programas de alimenta10o inantil nos países em desenvolvimento . \2utrition education in c8ild eeding !rograms in t8e develo!ing countries] B%gencA or International evelo!ment 196, !.C :ste ol8eto, de texto sim!les, com!lementado com desen8os de inHmeros cartazes, destina-se a agentes comunit"rios e outras !essoas 'ue lidam com a alimentação de crianças nos !a+ses em desenvolvimento, a;udando-os a transmitir a mães e l8os ensinamentos so0re os alimentos de 'ue as crianças !recisam durante o crescimento e !ara manter a saHde, e como utilizar alimentos locais na mel8oria de sua dieta. Ms ca!+tulos a0rangem % du!la nalidade dos !rogramas de alimentação inantil$ M 'ue voc> deve sa0er so0re os alimentos$ Fixando metas 'ue se a;ustem a sua comunidade$ %lgumas regras gerais !ara o ensino$ /ra0al8ando com mães de !r=-escolares$ e :nsinando Ps crianças em !rogramas de alimentação escolar. Derce0e-se 'ue a educação nutricional ministrada !or !essoas da !r?!ria comunidade tem eeito mais duradouro e contri0ui !ara a !revenção da desnutrição tanto 'uanto os alimentos doados, !or mais im!ortantes 'ue estes se;am !ara a saHde das mães e crianças 'ue os rece0em. 6. Melhoramento da 4ualidade nutritiva e da produtividade da cevada para regi6es semi2 áridasO relatErio anual/ QRQRT . \Im!rovement ot8e nutritive 'ualitA and !roductivitA o 0arleA or semi-arid regions$ annual re!ort, 1964#1965] Bontana State nicos Eom!ana, glutinosos e normais$ devidas ao ti!o de amido ou de com!osição em amino"cidos da !rote+na. Ms resultados !reliminares indicam 'ue os !ovos 'ue consomem 0asicamente arroz dariam !reer>ncia e !rovavelmente consumiriam mais uma cevada de endos!erma glutinoso do 'ue a cevada de endos!erma normal. % variedade Yig8 %mAlose @lacier a!resentou um valor energ=tico levemente menor do 'ue a @lacier normal, mas a !rimeira cont=m uma !rote+na de mel8or 'ualidade, devido a um aumento na !rote+na de v"rios amino"cidos. Ms dados de desem!en8o animal BErescimento, :S e *&C conrmam as an"lises 'u+micas da com!osição em !rote+na e amino"cidos das cevadas YA!rolA e 2ormal YA!rolA. *ericou-se 'ue o conteHdo de lisina da !rote+na era inNuenciado !elo meio am0iente de modo dierencial, de!endendo do gene !resente, e se reNetia no desem!en8o animal. M desem!en8o animal tem alta correlação com o conteHdo de amino"cidos essenciais das cevadas. Eomumente a lisina res!onde !or mais de 4f da variação animal em crescimento e D:7, e 5f da variação em valor 0iol?gico. Identicou-se uma translocação du!la 'ue ser" ecaz na transer>ncia do gene Yi!rolA !ara uma !o!ulação, 0em como genes resistentes a doenças Bcoc8onil8a, errugem, nanismo da cevada amarelaC no cromossomo 3. Foram desenvolvidas lin8agens =rteis, c8eias e com alto teor de lisina, a !artir de 8+0ridos Yi!rolA, !ara servirem como matrizes em outros tra0al8os de desenvolvimento de variedade com esse gene. . Mulheres aricanas no desenvolvimento agrícola/ um estudo de caso em Serra eoa . \%rican Vomen in .agricultural develo!ment, a case studA in Sierra Leone] BS!encer, .S.E., 1965, 1!. e!artment o %gricultural :conomics, ic8igan State ncias na mão-de-o0ra, entre am+lias de agricultores, de um em!r=stimo !ara !ro;eto da %.I.. destinado ao desenvolvimento de terras alagadas no interior !ara !rodução de arroz. M estudo corres!ondia a uma !e'uena !arte de uma !es'uisa nacional so0re !ro0lemas de em!rego rural em Serra Leoa. s "reas o!eracionais do !ro;eto da %.I.., oi selecionada !ara o estudo intensivo do tra0al8o di"rio realizado !or 8omens, mul8eres e crianças, em )3 domic+lios selecionados. e maio de 196 a ;un8o de 1964, oram eitas entrevistas duas vezes !or semana em domic+lios selecionados, )56
a!licando-se um 'uestion"rio de insumo-!roduto !ara manter registros di"rios de 8oras tra0al8adas !or mem0ro da am+lia e !roduto não-agr+cola, vendas agr+colas e não-agr+colas, em!r=stimos concedidos e rece0idos, e !resentes dados e rece0idos. % !artir desses dados calcularam-se a receita domiciliar !or onte e sua distri0uição, utilização da mão-de-o0ra, rendimentos da mão-de-o0ra, e !ers sazonais de em!resas agr+colas e não-agr+colas. M autor conclui 'ue as mul8eres envolvidas no !ro;eto de desenvolvimento tra0al8aram com um !ouco mais de anco do 'ue as mul8eres 'ue dele não !artici!aram, mas 'ue o aumento da carga de tra0al8o oi muito menor do 'ue o aumento da carga de tra0al8o de 8omens adultos e crianças. %s mul8eres desem!en8am !a!el su0stancial no cultivo de um !roduto de RdesenvolvimentoO Barroz irrigadoC 'ue em!rega tecnologia a!ereiçoada. /odavia, os resultados do estudo negam a 8i!?tese de 'ue esses !ro;etos de desenvolvimento agr+cola im!em uma carga de tra0al8o desigual !ara as mul8eres em com!aração com os 8omens. 9. Política de ci3ncia e tecnologia/ administra10o e plane&amento da pes4uisa na :epH%lica Ura%e do !gito QRT, 13 !. \Science and tec8nologA !olicA, researc8 management and !lanning in t8e %ra0 7e!u0lic o :gA!t] B2ational %cademA o Sciences, 2ational 7esearc8 Eouncil, Was8ington, .e. )1.C 7elat?rio de sim!?sio so0re !lane;amento de !ol+tica cient+ca e ocina so0re administração e !lane;amento da !es'uisa. % coner>ncia girou em torno de !lane;amento e !ol+tica de ci>ncia e tecnologia, e administração da !es'uisa. :scol8eu-se o ormato de RocinaO como o mel8or m=todo !ara reunir um gru!o re!resentativo de cientistas da "rea das ci>ncias +sicas, naturais e sociais, economistas, engen8eiros e !lane;adores de desenvolvimento eg+!cios e norte-americanos. Eonstatou-se 'ue, em0ora o :gito careça de uma !ol+tica cient+ca nacional ormalmente enunciada, as diversas instituiçes voltadas !ara a ci>ncia ali criadas e os recursos nanceiros alocados !ara a !es'uisa e a educação em ci>ncia constituem uma im!ortante !ol+tica nacional im!l+cita. % administração desse grande e com!lexo con;unto de instituiçes = uma tarea ormid"vel, e devem ser encetados todos os esorços !ara garantir sua ec"cia e eci>ncia. % administração da !es'uisa nas universidades = um !ro0lema muito dierente da administração de institutos de !es'uisa a!licada, e deve ser resolvido tão ra!idamente 'uanto !oss+vel. %inda 'ue o !rograma de !es'uisa a!licada do :gito se;a um em!reendimento de vulto, sua execução !rovavelmente este;a a necessitar de uma am!la reestruturação e redirecionamento, !ara ser totalmente ecaz. % transer>ncia de tecnologia P indHstria eg+!cia !or outras naçes oi e continuar" sendo um elemento undamental no desenvolvimento industrial do :gito. *isando a assegurar uma transer>ncia ecaz de tecnologia e a reduzir seus custos, deveria 8aver revises a!ro!riadas da legislação e das !r"ticas nacionais. 1. 7tiliLa10o para o consumo humano de esp9cies marinhas su%utiliLadas . \
'ue at= 8o;e não oram utilizadas !elo 8omem serão utilizadas no uturo, e as c8amadas es!=cies sem valor serão aceitas como es!=cies comest+veis a!ro!riadas ao consumo 8umano direto. 11. A utiliLa10o de alunos monitores e instru10o programada pelo rádio alternativas viáveis na educa10o. \/8e use o !eer tutoring and !rogrammed radio instruction via0le alternatives in education] BYannum, W.Y.$ organ, 7.. 196, 3!. Florida State ncia. M r"dio, 'uando com0inado com alunos monitores, !ode ser um instrumento educacional ecaz em !a+ses em desenvolvimento. Ms conceitos de ensino !rogramado e a!rendizado com !roci>ncia !odem ser incor!orados ao !ro;eto de !rogramas educacionais !elo r"dio. :stes, acom!an8ados !or alunos monitores, a!ereiçoam o esorço educacional glo0al de modo com!at+vel com os recursos de muitos !a+ses em desenvolvimento. :ste ti!o de sistema educacional = uma alternativa vi"vel P educação ormal tradicional. everia ser testado em v"rios !a+ses em desenvolvimento visando P ex!loração de todo seu !otencial. 1). Gatores culturais e sociais 4ue inuem na participa10o de pe4uenos agricultores em program asorm ais de cr9dito \Eultural and social actors apecting small armer !artici!ation in ormal credit !rograms] B@illette, EAnt8ia$ s !ressu!ostos 0"sicos 'ue, com uma exceção, constituem seu tema !rinci!al. % exceção = a 'uestão da Rracionalidade econQmicaO, con8ecida de todos os 'ue se interessam !elo desenvolvimento do /erceiro undo, mas 'ue = vista como ;usticativa de uma 0reve an"lise na introdução. % !arte II trata do contexto cultural de !e'uenos agricultores como tomadores de em!r=stimo, isto =, diversos atores 'ue inNuem so0re a demanda de cr=dito. :m seguida, a !arte III trata do contexto cultural dos !rogramas credit+cios como em!restadores, isto =, atores 'ue condicionam o ornecimento de cr=dito dis!on+vel em termos uncionais aos !e'uenos agricultores. % !arte I* mostra v"rias im!licaçes das !artes II e III o 'ue acontece 'uando esses dois sistemas culturais interagem e 'uais os !rov"veis !ontos de diculdade. % !arte * conclui azendo uma com!aração das dierenças gerais entre ontes de cr=dito ormais e inormais. 13. 5esenvolvimento de co%erturas de casas de %aixo custo a partir de materiais locais em na16es em desenvolvimentoO relatErio anual/ QRVQR \evelo!ment o loV-cost roong rom indigenous materials in develo!ing nations$ annual re!ort, 196#1964] Bonsanto 7esearc8 Eor!oration, aAton, M8io, 1964,334 !.C :ste relat?rio examina a segunda ase Bmaio de 196 a setem0ro de 1964C de uma !es'uisa de tr>s ases, com tr>s anos e meio de duração, visando P o0tenção de mel8ores co0erturas de casas !ara !a+ses em desenvolvimento, mediante a com0inação de 0ras e enc8imentos locais com aglutinantes de 0aixo custo. % meta nal do !rograma = tornar dis!on+vel em !elo menos tr>s !a+ses, cada um deles na %m=rica Latina, sia e rica, um sistema de co0ertura de casas 'ue se;a econQmica e tecnicamente aceit"vel e 'ue de!enda menos de divisas estrangeiras do 'ue as alternativas ora existentes. M o0;etivo do !rograma ser" demonstrado, em cada um dos !a+ses !artici!antes, com a construção de !elo menos 'uatro !rot?ti!os de co0erturas e a transer>ncia da tecnologia necess"ria a instituiçes 'ualicadas. Ms !a+ses cola0oradores atuais são Tamaica, Fili!inas e @ana. % !rioridade do !ro;eto durante a ase III consistiu no desenvolvimento de materiais de co0ertura e esta0elecimento do mecanismo de transer>ncia de tecnologia. Ms o0;etivos !redominantes do desenvolvimento de materiais inclu+am o esta0elecimento de um con;unto generalizado de crit=rios !ara co0erturas$ denição dos com!onentes do material com!osto$ determinação dos con;untos mais !romissores de materiais, !rocessos e !rodutos$ e an"lises de custos e via0ilidade dos sistemas !ro!ostos. Foram denidos 'uatro sistemas !ro!ostos de material com!osto !ara co0erturas 'ue em!regam de 6 a 1f de materiais locais. :xce!cional como enc8imento = o 0agaço, 'ue = o res+duo da cana-de-açHcar. Ms !rinci!ais aglutinantes !ro!ostos incluem 0orrac8a natural, resinas en?licas e termo!l"sticas comerciais. % cura acelerada e ao ar livre demonstra a via0ilidade dos sistemas !ro!ostos. Ms o0;etivos dos as!ectos relativos P transer>ncia de tecnologia inclu+ram a denição de instituiçes cola0oradoras !otenciais e !essoas +sicas na Tamaica, Fili!inas e @ana$ a ormação de comisses de tra0al8o, assessoras e t=cnicas, em cada um desses !a+ses 'ue !artici!ariam do )59
!rograma de desenvolvimento de co0erturas de casas$ e a identicação de instituiçes 'ualicadas interessadas na utura !rodução comercial dessas co0erturas. :ssas instituiçes, comisses e gru!os de tra0al8o oram denidos nos tr>s !a+ses e estão uncionando, em v"rios graus, com a Tamaica P rente. Foram identicadas indHstrias do setor !rivado 'ue !oderão tornar-se uturos a0ricantes de co0erturas em cada um dos tr>s !a+ses. urante a ase III, de outu0ro de 1964 a dezem0ro de 1965, o !rograma ser" conclu+do com a otimização de materiais, !ro;eto, a0ricação, testes e avaliação dos !rot?ti!os de co0erturas$ e a0ricação em cam!o, instalação e avaliação das co0erturas em escala integral. Indexação e explicaç$es do autor
BMs descritores !rinci!ais são identicados com um asterisco C 1. # álcool com%ustivel ho&e %lco8ol uels \"lcoois com0ust+veis] @aso8ol \gasool] Droduction costs \custos de !rodução] @asoline \gasolina] Ero!s \!rodutos agr+colas] %gricultural Vastes \res+duos agr+colas] 7euse derived uels \com0ust+veis derivados do lixo] omestic Vastes \res+duos dom=sticos] Industrial Vastes \res+duos industriais] Dilot !ro;ects \!ro;etos-!iloto] Waste utilization \utilização de res+duos]
2ão se encontra no <2&IS o termo ethanol \etanol] do 'ual se az remissiva !ara alcohol uels \"lcoois com0ust+veis], 'ue !arece ser o termo mais !ertinente !ara este item. Se o termo ethanol existisse no tesauro, ele seria usado, e não alcohol uels, a!esar do t+tulo, !ois o resumo indica 'ue o artigo trata exclusivamente de etanol. 2ão cone em demasia nos t+tulos$ eles Ps vezes são enganosos. M resumo sugere 'ue o artigo d" 0astante atenção ao gasool, e !or isso este termo = tam0=m em!regado na indexação seletiva. M tesauro não contem!la a !ossi0ilidade de se ex!ressar a id=ia de Rcarros a "lcoolO. 2o entanto, isso se ac8a im!l+cito com muita nitidez em gasohol \gasool], de modo 'ue o em!rego do termo automo%iles \autom?veis], em0ora não se;a errado, !arece desnecess"rio. Se utiliz"ssemos o termo motor uels \com0ust+veis !ara motores] estar+amos cometendo um s=rio engano, !or'ue o artigo trata exclusivamente de gasool, 'ue = um ti!o de com0ust+vel !ara motores, e motor uels, no <2&IS, = um termo gen=rico B/@C de uma ordem su!erior a gasohol . 2a indexação mais exaustiva seria !reciso a0arcar as outras id=ias condensadas no resumo. %s ontes do etanol !odem ser satisatoriamente a0rangidas !or interm=dio do termo cro!s \!rodutos agr+colas] ;unto com diversos termos es!ec+cos de R 8asteO \res+duos].
/am0=m = im!oss+vel ex!rimir a id=ia de Rvantagens#desvantagensO ou R!ro0lemasO Brelativos a carros movidos a gasool ou "lcoolC. % maioria dos voca0ul"rios controlados não c8ega a contem!lar esse ti!o de id=ias mais ne0ulosas. ). A eros0o e o agricultor Soil erosion \erosão do solo] 7ain \ c8uva] Soil conservation \conservação do solo] SnoV \neve] Ero! rotation \rotação de culturas] Wind0reaXs \'ue0ra-ventos] Ero! Aields \!rodução agr+cola] :uro!e \:uro!a]
%'ui, o termo undamental = soil erosion \erosão do solo]. Soil conservation \conservação do solo] = o termo 'ue, isoladamente, mel8or a0range R!oss+veis soluçesO. eci>ncias do tesauro <2&IS dicultam a indexação exaustiva. :ain \c8uva], sno8 \neve] e 8ind \vento] são termos a!ro!riados e necess"rios, caso algu=m !recise azer uma 0usca de artigos es!ecicamente so0re erosão do solo !rovocada !or c8uva, neve ou vento. Kuanto Ps soluçes es!ec+cas analisadas, crop rotation \rotação de culturas] e 8ind%rea-s \'ue0ra-ventos] são a!ro!riados. 2o <2&IS não se !ode ex!ressar a id=ia de R!erdas agr+colasO, !or=m crop yields \!rodução agr+cola] = sucientemente a!roximado !ara merecer ser atri0u+do Bisto =, o eeito da erosão so0re a !roduçãoC. M termo Borthern !urope \:uro!a setentrional] não existe no <2&IS Bem0ora exista Southern !urope ` \:uro!a meridional]C, !or isso o termo :uro!e deve ser atri0u+do. Isso exem!lica um as!ecto im!ortante se o termo exato de 'ue se necessita não existe no tesauro, utiliza-se o termo mais es!ec+co 'ue o tesauro !ermite. 3. A otografa a9rea e o 4ue ela pode aLer %erial !8otogra!8A \otograa a=rea] %erial !8otogrammetrA \aerootogrametria] Image analAsis \an"lise de imagens] %erial surveAs \levantamentos a=reos] YAdrogra!8ic surveAs \levantamentos 8idrogr"cos] Flood control \controle de inundaçes] ilitarA reconnaissance \recon8ecimento militar] Satellite monitoring \monitoramento !or sat=lite] @eodetic satellites \sat=lites geod=sicos] %rc8aeologA \ ar'ueologia] Eensuses \censos] Weat8er !rediction \!revisão do tem!o] Weat8er ma!s \cartas meteoro l?gicas]
:ste artigo !arece tratar do em!rego de aeronaves e sat=lites na realização de diversos ti!os de levantamentos otogr"cos. Aerial photography \otograa a=rea] e aerial surveys \levantamentos a=reos] são termos im!ortantes. M termo satellite photography \otograa !or sat=lite] não existe no <2&IS. % id=ia !oderia ser ex!ressa, contudo, com0inando-se aerial !8otogra!8A com um termo de Rsat=liteO. M termo mais a!ro!riado !arece ser geodetic satellites \sat=lites geod=sicos], es!ecialmente !or'ue o <2&IS liga B!or meio de /7C o termo aerial photogrammetry \aerootogrametria] com geodetic satellites. Kuanto Ps a!licaçes, o <2&IS a0range satisatoriamente umas, e outras não tão satisatoriamente. Cerifcation \vericação] = um termo do tesauro a!arentemente a!ro!riado !ara este artigo at= se desco0rir 'ue satellite monitoring \monitoramento !or sat=lite] = um termo mais es!ec+co do 'ue verication. :m!rega-se satellite monitoring !or'ue o ti!o de vericação analisado no documento Bvericação de desarmamentoC s? !ode ser realizado !or meio de otograas tiradas !or sat=lite. Lem0re-se em!regue sem!re o termo mais es!ecico existente no tesauro, ainda 'ue um outro termo !ossa RsoarO mais a!ro!riado. Isso exem!lica outro as!ecto im!ortante o RcontextoO de um termo num tesauro revela o signicado desse termo, mesmo 'ue não se;a acom!an8ado de uma nota ex!licativa. M contexto de satellite )61
monitoring no <2&IS deixa claro 'ue o o0;etivo = o uso de sat=lites na vericação, e não o monitoramento de sat=lites.1 M estudo de s+tios ar'ueol?gicos !rovavelmente ca mais 0em a0rangido !or archaeology \ar'ueologia] do 'ue !or archaeological excavations \escavaçes ar'ueol?gicas]. Eomo Rcontagem de domic+liosO = usado sim!lesmente como exem!lo de uma a!licação em censos, o termo gen=rico censuses \censos] = mais seguro do 'ue housing censuses \ censos domiciliares]. %l=m disso, o Hltimo termo = um tanto am0+guo, !ois !ode reerir-se aos ocu!antes de !r=dios e não ao nHmero de resid>ncias. 2o <2&IS, o !rogn?stico so0re o tem!o se traduz como 8eather prediction \!revisão do tem!o]. Eomo isso im!lica a ela0oração de cartas meteoro l?gicas, este termo tam0=m seria a!licado, ainda 'ue se;a um tanto !eri=rico. 2ão 8" como a0ranger a !revisão de inundaçes como tal. M o0;etivo = a !revenção contra inundaçes, de modo 'ue se deve usar ood control \controle de inundaçes]. Eomo o movimento de "gua ou gelo se ac8a im!l+cito, hydrographic surveys \levantamentos 8idrogr"cos] tam0=m seria um 0om termo. % cartograa est" 0em a0rangida !or aerial !8otogrammetrA \aerootogrametria]. Finalmente, como todas as diversas a!licaçes envolvem extensamente a inter!retação de otograas, image analAsis \an"lise de imagens] !arece ser inteiramente ade'uado.
. # fm do %ordo sacarinoF Sugar groVing \culturas açucare iras] Sugar industrA \indHstria açucareira] /rees \"rvores] eo liation \desol8amento] %cid rain \c8uva "cida] Eanada \Eanad"]
M tesauro <2&IS s? recon8ece como !lantas !rodutoras de açHcar a cana-de-açHcar e a 0eterra0a sacarina, !or isso, = !reciso em!regar a'ui sugar crops \culturas açucare iras]. Eomo nesse tesauro 8" !oucos termos !ara ti!os es!ec+cos de "rvores, = !reciso em!regar o termo gen=rico trees \"rvores]. !rov"vel 'ue a !oluição se;a a causa do desol8amento, mas = desnecess"rio usar air pollution \!oluição atmos=rica] !or'ue acid rain \c8uva "cida] = mais exato. 4. Poderá um avi0o voar eternamenteF %ircrat \aeronave] :lectric ve8icles \ve+culos el=tricos] icroVaves \microondas] Scientic researc8 \!es'uisa cient+ca] DrototA!es \!rot?ti!os] S!acecrat \es!açonave] 7adiation sicXness \doença !rovocada !or radiação] ilitarA surveillance \vigilncia militar] Eanada \Eanad"]
% id=ia de uma aeronave movida a eletricidade, 'ue utilize microondas, ac8a-se 0em a0rangi da !elos tr>s termos com asterisco. M artigo concede mais atenção Ps !oss+veis a!licaçes cient+cas e militares, !elo 'ue se ez um esorço !ara englo0ar esses as!ectos. Lamentavelmente, a id=ia da vigilncia em geral est" ausente do <2&IS, mas existe military surveillance \vigilncia militar]. %s outras !oss+veis a!licaçes mencionadas no artigo, como, !or exem!lo, a !revisão do tem!o, o são de modo tão su!ercial 'ue !arecem não merecer :sta advert>ncia do autor ;ustica-se !or causa da am0igidade da ex!ressão em ingl>s, 'ue tanto !ode signicar Rmonitoramento de sat=liteO 'uanto Rmonitoramento !or sat=liteO. B2./.C 1
)6)
sua inclusão na indexação. Eomo o risco !ara a saHde mencionado = a radiação de microondas, o termo radiation sic-ness \doença !rovocada !or radiação] !arece a!ro!riado. 5. !duca10o nutricional em programas de alimenta10o inantil E8ild eeding \alimentação inantil] 2utrition education \educação nutricional] E8ild nutrition \nutrição inantil] evelo!ing countries \!a+ses em desenvolvimento] Inant nutrition \nutrição do lactente] Sc8ool meals \merendas escolares] M assunto desse relat?rio est" !ereitamente a0arcado !elos termos existentes no tesauro.
6. Melhoramento da 4ualidade nutritiva e da produtividade da cevada &arleA \cevada] %rid zones \zonas "ridas] 2 utrition \nutrição] Ero! Aields \!rodução agr+cola] evelo!ing countries \!a+ses em desenvolvimento] Dlant 0reeding \mel8oramento gen=tico de !lantas] Dlant genetics \gen=tica vegetal] Dlant diseases \doenças das !lantas] Dlant !rotection \!roteção das !lantas] Droteins \!rote+nas] Arid Lones \zonas "ridas] =, no <2&IS, o mais !r?ximo 'ue se !ode c8egar de Rregies semi"ridasO.
. Mulheres aricanas no desenvolvimento agrícola 7ice \arroz] Sierra Leone \Serra Leoa] Women in agriculture \mul8eres na agricultura] Women VorXers \mul8eres tra0al8adoras] Women in develo!ment \mul8eres no desenvolvimento] WomenOs rig8ts \direitos das mul8eres] Yours o VorX \8oras de tra0al8o] WorXing time arrangement \organização do tem!o de tr"0al8o] La0our !roductivitA \!rodutividade do tra0al8o] ivision o la0our \divisão do tra0al8o]
2ão se deixe enganar !elo t+tulo. :ste documento = so0re mul8eres em Serra Leoa, não so0re mul8eres aricanas em geral. M artigo estuda !rinci!almente as condiçes de em!rego das mul8eres, não a cultura do arroz. :m0ora rice \arroz] se;a um termo !ertinente, os mais im!ortantes são 8omen 8or-ers \mul8eres tra0al8adoras] e hours o 8or- \8oras de tra0al8o]. %rroz não = um termo !rinci!al, !ois 'uem estiver P !rocura de itens so0re a cultura do arroz !oder" não se interessar !or esse ti!o de estudo social. M termo division oa%our \divisão do tra0al8o] !rovavelmente = !ertinente, uma vez 'ue o documento analisa a relação 8omens#mul8eres no tra0al8o, no entanto, a nota ex!licativa no tesauro traz uma indicação muito inade'uada so0re como e 'uando usar este termo. 9. Politica de ci3ncia e tecnologia :gA!t \:gito]
)63
Science and tec8nologA !olicA \!ol+tica de ci>ncia e tecnologia] Science and tec8nologA !lanning \!lane;amento de ci>ncia e tecnologia] 7esearc8 and develo!ment \!es'uisa e desenvolvimento] /ec8nologA transer \transer>ncia de tecnologia] Scientic researc8 \!es'uisa cient+ca] Du0lic administration \administração !H0lica] anagement \administração] Science and tec8nologA nancing \nanciamento de ci>ncia e tecnologia]
São necess"rios v"rios termos !ara a0ranger esse relat?rio de modo ade'uado. 2ote-se 'ue research and development \!es'uisa e desenvolvimento] e management \administração] são am0os necess"rios !ara reNetir a id=ia de Radministração da !es'uisaO. !gypt \:gito] = considerado um termo !rinci!al !or'ue todo o relat?rio trata da situação eg+!cia. M 'ue = muito dierente do artigo so0re Rmul8eres aricanasO, no 'ual a localização BSerra LeoaC = 'uase acidental !ara a nalidade do estudo. 1.
7tiliLa10o para o consumo humano de esp9cies marinhas su%utiliLadas Food consum!tion \consumo de alimentos] Fis8 \!eixes] Fis8 !rocessing \!rocessamento de !eixes] Fis8erA !roducts \!rodutos da !esca] Fis8erA conservation \!reservação da !esca]
:ste = um exem!lo de um artigo 'ue não !ode ser indexado ade'uadamente !or'ue o tesauro não ex!ressa a id=ia de Res!=cies de !eixes su0a!roveitadasO. Ms termos a'ui em!regados não oerecem uma imagem satisat?ria da'uilo de 'ue trata o item, mas são os mel8ores existentes. 11.
A utiliLa10o de alunos monitores e instru10o programada pelo rádio :ducational radio \ensino !elo r"dio] Drogrammed instruction \instrução !rogramada] evelo!ing countries \!a+ses em desenvolvimento] 2onormal education \educação não-ormal] /eac8ing !ersonnel \!essoal de ensino]
ais uma vez um item 'ue não oi a0rangido satisatoriamente !or'ue o tesauro carece de termos 'ue ex!ressem a id=ia de Ralunos monitoresO ou mesmo de RmonitoriaO. 1). Gatores culturais e sociais 4ue inuem so%re a participa10o de pe4uenos agricultures em programas ormais de cr9dito Eredit !olicA \!ol+tica de cr=dito] Farmers \agricultores] Small arms \!e'uenas !ro!riedades agr+colas] evelo!ing countries \!a+ses em desenvolvimento] %gricultural credit \cr=dito agr+cola] Eultural values \valores culturais] Social values \valores sociais]
:ste = um excelente exem!lo de um relat?rio relativamente longo 'ue = satisatoriamente a0rangido com um !e'ueno nHmero de termos. Dara ex!rimir a id=ia de R!e'uenos agricultoresO = !reciso usar tanto armers \agricultores] 'uanto small arms )6
\!e'uenas !ro!riedades agr+colas]. %tri0ui-se developing countries \!a+ses em desenvolvimento] !or'ue = ?0vio 'ue este = o contexto no 'ual se analisa o cr=dito agr+cola. 13.
5esenvolvimento de co%erturas de casas de %aixo custo 7oos \co0erturas de casas] /raditional tec8nologA \tecnologia tradicional] &agasse \0agaço de cana] Fi0res \0ras] &uilding materials \materiais de construção] /ec8nologA transer \transer>ncia de tecnologia] 7u00er \0orrac8a] Dlastic !roducts \!rodutos !l"sticos] Tamaica @8ana \@ana] D8ili!!ines \Fili!inas] evelo!ing countries \!a+ses em desenvolvimento]
:sta indexação não = totalmente satisat?ria !or'ue o tesauro não nos !ermite ex!ressar Rindigenous materiaisO \Rmateriais locaisO]. 2o entanto, !odem-se considerar os materiais locais como relacionados de !erto com a tecnologia local, de modo 'ue o termo traditional technology \tecnologia tradicional] se ;ustica, ainda 'ue não se;a exatamente o ideal.
)64
%ap&tulo / 0 4xerc&cios de redação de resumos +5'4 /
Dara azer este exerc+cio =.!reciso !rimeiro reunir os artigos de !eri?dicos 'ue são mencionados na lista a0aixo. % maioria deles = acilmente encontrada em 0i0liotecas dos :stados escreveu com os resumos 'ue sugeri e com meus coment"rios. e 'ue modo esses resumos dierem dos seus Kuais os mel8ores Dor 'u> %rtigos a serem resumidos 1. Ean a !lane NA orever BBe8s8ee- , Se!tem0er ), 196, !. ), 6C. ). Dluto limits on its atmos!8ere, ice on its moon BScience Be8s, Se!tem0er )5, 196, !. )6C. 3. Dlastic s8ocXs and visi0le s!arXs BScienceBe8s, Se!tem0er 4, 196, !. 14)C. . oscoVOs c8emical candor BBe8s8ee- , Mcto0er 19, 196, !. 45C. 4. StereotA!es t8e %ra0Os image BWorld Press :evie8, Tune 195, !. 39C. 5. %ds re'uire sensitivitA to %ra0 culture, religion BMar-eting Be8s, %!ril )4, 195, !. 3C. 6. France, racism and t8e Let Bhe Bation, Se!tem0er ), 194, !. )69-)1C. . Eom!assion or animais BBational Gorum, Winter 195, !. )-3C. 2ota Dara o item 1, redi;a resumos indicativos. Dara os itens ), 4 e 6, redi;a resumos inormativos. Dara os de nHmero 3 e , redi;a resumos indicativos e inormativos. Dara os itens 5 e , aça da orma 'ue l8e !arecer mais ade'uada. 5esumos deste autor
1. %an a plane ?Z fore#erD \Doder" um avião voar eternamente] BBe8s8ee- , Se!tem0er ), 196, !. ), 6C. :esumo (indicativo, Ser" testado no Eanad" o !rot?ti!o de uma aeronave movida a eletricidade, 'ue não re'uer com0ust+vel convencional. % eletricidade = transmitida do solo so0 a orma de energia de microondas e reconvertida em eletricidade !or RretenasO no avião. /eoricamente, o avião !ode !ermanecer no ar durante meses sem !iloto. Suas a!licaçes incluem !es'uisa cient+ca, vigilncia Bmilitar, !olicial ou civilC, !revisão do tem!o e trans!orte de !assageiros. %s microondas !odem tam0=m acionar es!açonaves. Doss+veis riscos das microondas !ara a saHde !odem im!edir a!licação mais generalizada. "omentário % clareza tem !reced>ncia so0re a 0revidade. % ex!ressão R'ue não re'uer com0ust+vel convencionalO = necess"ria !ara esclarecer 'ue o a!arel8o = inteiramente movido a eletricidade. M resumo não deve extra!olar o 'ue o artigo arma. %ssim, Rser" testadoO est" 0em, mesmo 'ue o resumidor sai0a 'ue os testes ;"oram realizados. Drocure evitar o em!rego de !alavras irrelevantes. Dor exem!lo, R%s microondas !odem tam0=m acionar es!açonavesO = mais conciso do 'ueO %s microondas !odem tam0=m ser a!licadas com a nalidade de acionar es!açonavesO, sem 'ue com isso se !erca em clareza. Eomo não se a!resentam resultados concretos, seria di+cil escrever um resumo verdadeiramente inormativo desse item. ). luto: limits on its atmosphere1 ice on its moon \Dlutão limites de sua atmosera, gelo em sua lua] B Science Be8s, Se!tem0er )5, 196, !. )6C. :esumo (inormativo, E"lculos recentes indicam 'ue o dimetro de Dlutão talvez não su!ere ) )9 Xm, com sua lua, Earonte, cu;o dimetro não deve ser su!erior a 1 ) Xm. M es!ectro inravermel8o de Dlutão !arece ser radicalmente dierente do de Earonte. Dlutão !ossui uma su!er+cie rica em metano, mas Earonte, com relativamente !ouco metano, !arece ter uma !redominncia de gelo de "gua. % ret1etividade de Earonte corres!onde somente P metade da de Dlutão, sugerindo 'ue Dlutão !ossui uma tem!eratura su!ercial mais 0aixa talvez 4 Xelvin em Dlutão e 4 em Earonte. % !ressão de va!or em Dlutão !ode ser de a!enas 3,4 micro0ars com!arada com 49 em Earonte. Darece 'ue Dlutão !ossui calotas !olares não-est"ticas de gelo de metano cu;a co0ertura do !laneta varia com o tem!o. "omentário :ste = um resumo realmente inormativo, 'ue !rocura condensar todos os !rinci!ais dados descritos no artigo. Drocure evitar redundncia. Dor exem!lo, = exato, mas não necess"rio, dizer Redidas do es!ectro inravermel8o sugerem 'ue o es!ectro inravermel8o de )65
Dlutão !arece ser radicalmente dierente do de EaronteO !or'ue a reer>ncia a Res!ectro inravermel8oO !or si mesma indica 'ue oram tomadas medidas do es!ectro inravermel8o. 3. lastic shocYs and #isible sparYs \E8o'ues !l"sticos e a+scas vis+veis] B Science Be8s, Se!tem0er 4, 196, vol. 13), no. 1, !. 14)C. :esumo (indicativo, escreve as condiçes so0 as 'uais a eletricidade est"tica !ode causar inc>ndios ou ex!loses, ao se manusear !?s ou l+'uidos, e menciona dois instrumentos desenvolvidos recentemente 'ue !odem ser em!regados !ara monitorar o!eraçes de manuseio de materiais. :esumo (inormativo, %o enc8er ou esvaziar reci!ientes, a eletricidade est"tica !ode !roduzir a+scas 'ue causam inc>ndios ou ex!loses. *asil8ames !l"sticos 'ue conten8am l+'uidos inNam"veis !odem rece0er uma carga vinda de um saco !l"stico ou do 0olso de um casaco 'ue este;a !erto, !roduzindo uma a+sca 'uando o l+'uido = des!e;ado. %s cargas ocorrem tam0=m 'uando do trans!orte de !?s 'u+micos, 'uando tam0ores de metal revestidos de !l"stico são enc8idos com l+'uidos condutores ou rece0em tra!os em0e0idos com solventes condutores, ou 'uando revestimentos semicondutores 'ue ten8am solventes como 0ase são a!licados P su!er+cie de uma !el+cula não-condutora. M !r?!rio cor!o 8umano !ode !roduzir a+scas 'ue causam ignição de va!ores inNam"veis. 2ovos instrumentos !ermitem o monitoramento das o!eraçes de enc8er e esvaziar vasil8ames com !?s ou l+'uidos. :m!regando intensicação eletrQnica de imagens ou a medição da !olaridade de carga e sua magnitude, registram o aiscamento e identicam as condiçes mais !rov"veis de causar a ignição. Ms l+'uidos mais !erigosos !ossuem 0aixa condutividade, t>m carga negativa, são altamente inNam"veis e se eva!oram acilmente ormando uma mistura de va!or-ar 'ue sustenta a ignição. "omentário :is um 0om exem!lo da dierença entre resumo indicativo e inormativo. M !rimeiro sim!lesmente menciona de 'ue trata o artigo, en'uanto o segundo !rocura ser uma s+ntese verdadeira - 'uais os ti!os de o!eraçes, 'ual o ti!o de risco, 'ual o ti!o de instrumento e assim !or diante. uitas vezes consegue-se ser conciso, sem sacricar a clareza, ao se omitir artigos ou con;unçes. Dor exem!lo, [%o enc8er ou esvaziar reci!ientes...^ = mais conciso e tão claro 'uantoO %o enc8er ou esvaziar os reci!ientes...O. . Foscos chemical candor \% sinceridade 'u+mica de oscou] BBe8s8ee- , Mcto0er 19, 196, !. 45C. :esumo (inormativo, % ncia do artigo en'uanto o segundo sim!lesmente indica de 'ue ele trata. 4. StereotZpes: the +rabs imae \:stere?ti!os a imagem dos "ra0es] B World Press :evie8, Tune 195, !. 39C. :esumo (inormativo, )66
% m+dia norte-americana, !rinci!almente a televisão, !romove uma imagem negativa dos "ra0es e dos !a+ses "ra0es. % 8ostilidade aos "ra0es, exacer0ada !elo conNito "ra0eisraelense e a crise do !etr?leo da d=cada de 196, estende-se a mais de um mil8ão de "ra0es 'ue vivem nos :stados ncia desse 0reve artigo !arece 0em a0rangi da !or essas tr>s rases. dis!ens"vel resumir os detal8es so0re os estere?ti!os, 'ue ocu!am cerca de metade do artigo. % inclusão. dos nomes de instituiçes mencionadas no artigo tornaria o resumo muito minucioso. 5. +ds require sensiti#itZ to +rab culture1 reliion \% !u0licidade exige sensi0ilidade P cultura e religião "ra0es] BMar-eting Be8s, %!ril)4, 195, !. 3C. :esumo evido P 'ueda dos !reços do !etr?leo, = !reciso 'ue uma !u0licidade ecaz estimule os !a+ses "ra0es a consumir. Ms !u0licit"rios devem com!reender os costumes religiosos, sociais e culturais 'ue !residem a vida "ra0e. %!resentam-se alguns exem!los de coisas a serem evitadas. "omentário %!esar de muito sucinto, este = menos um resumo indicativo do 'ue uma tentativa de resumir o 'ue o autor diz, em vez de descrever a'uilo de 'ue trata o artigo. Somente a Hltima rase = realmente indicativa. Isso mostra como os resumos !odem ser redigidos de modo a com0inar elementos inormativos e indicativos. 6. *rance: racism and the -eft \França o racismo e a es'uerda] Bhe Bation, Se!tem0er ), 194, !. )69-)1C. :esumo (inormativo, M !artido ultradireitista, Frente 2acional, !romove ativamente o ?dio racial na França, !rinci!almente contra os norte-aricanos, mas os comunistas e socialistas !ouco t>m eito !ara lutar contra o !reconceito racial. %s cam!an8as contra o racismo são organizadas !or gru!os não-ociais, !rinci!almente de ;ovens. "omentário Eomo no exem!lo anterior, este resumo = mais inormativo do 'ue indicativo. ncias sociais do 'ue nas ci>ncias exatas. Ms artigos em ci>ncias sociais tendem a ser mais a0stratos e conter menos dados concretos. . %ompassion for animals \Eom!aixão !elos animais] B Bational Gorum, Winter 195, !. )-3C. :esumo M estreito v+nculo entre 8omens e animais, 'ue costumava existir em =!ocas !assadas, oi corro+do !elo desenvolvimento ur0ano e a industrialização, !rovocando descaso !ela vida animal em muitas !artes. 2o entanto, um orte v+nculo 8omem-animal = undamental !ara a saHde do indiv+duo, da comunidade e da sociedade. Sugere maneiras !elas 'uais a sociedade !oderia mel8orar sua sensi0ilidade e com!aixão !elos animais. "omentário ais uma vez, !arece 0astante a!ro!riado um resumo com0inado indicativo#inormativo. %s !rimeiras duas rases, ao tentar condensar a mensagem dos autores, são realmente inormativas, en'uanto a Hltima rase = evidentemente indicativa. M resumo caria. totalmente inormativo se ossem resumidos todos os m=todos destinados a des!ertar com!aixão, mencionados na !"gina 3 do artigo, mas eles são tão variados 'ue seria !reciso um resumo 0astante extenso, o 'ue a!arentemente não se ;ustica em ace da 0revidade do !r?!rio artigo. +5'4 3
7e!roduzem-se a seguir oito resumos !u0licados em Irrica% Ba0ril de 19, volume 4, nHmero )C, uma !u0licação de resumos no cam!o da irrigação editada !elo International Irrigation Inormation Eenter \Eentro Internacional de Inormação so0re Irrigação]. *oc> encontra algo de errado nesses resumos Eomo mel8or"-los *e;a, a!?s cada um deles, os coment"rios deste autor. )6
5esumos
\Ms resumos são a'ui re!roduzidos com a gentil !ermissão do International Irrigation Inormation Eenter, &et agan, Israel, e Dergamon Dress Inc. % seleção destes resumos nessa onte oi determinada a!enas !or razes de conveni>ncia e não im!lica de orma alguma 'ue os resumos de Irrrica% se;am de 'ualidade inerior. Eom eeito, em geral, são muito 0ons, sendo di+cil encontrar algum 'ue necessite de grandes mel8orias.] 1. %non. BElarication o 8ig8lA tur0id Vaters 0A means o acoustic ltersC B7usC \Elaricação de "guas excessivamente 0arrentas mediante ltros acHsticos] ncia de v"rios crivos. Dro!e-se o m=todo !ara claricação da "gua sem o em!rego de reagentes 'u+micos.
). *aneAan, S.S.$ aXoveev, *.D. B*olz8anXa side roll s!rinXler or irrigation ovegeta0le cro!sC B7usC \%s!ersor * olz8anXa de rotação lateral !ara irrigação de culturas de 8ortaliças] ncias com a irrigação de culturas de v"rias 8ortaliças em!regando o as!ersor * olz8anXa. M artigo cont=m uma e'uação !ara calcular a duração da irrigação e o nHmero de unidades de as!ersores necess"rios !ara irrigar determinada "rea. %!resenta dados so0re danos causados aos !lantios !elas rodas dos as!ersores.
3. 78oades, T.. etermining soil salinitA and detecting saline see!s using an inductive electromagnetic soil conductivitA sensor B:ngC \eterminação da salinidade do solo e identicação de nascentes salinas !or meio de um senso r indutivo eletromagn=tico de condutividade do solo] In %gronomA %0stracts 196 Annual Meeting othe Soil Science Society o America 13 B
. @isser, .$ Do8orAles, S. Water s8ortage in Israel long-run !olicA or t8e arm sector B:ngC \:scassez de "gua em Israel !ol+tica de longo !razo !ara o setor agr+cola] Water :esources, ec 1966, 13B5C 54-6), 1 go 1 ta0, re B
4. e0rivna, I.qe. BSulate reducing 0acteria orice irrigation sAstems in t8e Sout8ern
7ealizaram-se ensaios de 0om0eamento em 1) !oços tu0ulares com a nalidade de encontrar um m=todo !ara calcular o coeciente de 0om0eamento em !oços tu0ulares !ara irrigação.
6. S8anmugara;a8, Z.$ %tuXorale, s.e. Water management at 7a;angana sc8eme -lessons rom cultivation - qala 1965 B:ngC \ane;o 8+drico no !ro;eto 7a;angana -liçes do !lantio - qala 1965] Jalavrudhi BSri an-aC, ec 1965, 1 B)C 5-54, 4 ta0 BWater anagement ivision, Irrigation e!t. Sri LanXaC :sta = uma descrição de como oi com!rovado 'ue os !lantadores de arroz de uma certa "rea sem!re des!erdiçaram "gua. urante uma seca oram convocados es!ecialistas em 8idrologia, em virtude do temor de !erda da sara, e, graças P mel8oria da eci>ncia na utilização da "gua, o consumo oi reduzido drasticamente, sem 'ue 8ouvesse redução na !rodução agr+cola.
. %r0ar0, .$ an0ecX, .. Intluence o lateral de!t8 and s!acing on com Aield and Vater use in su0surace irrigation sAstem B:ngC \Intlu>ncia da !roundidade lateral e do es!açamento na !rodução de mil8o e utilização da "gua em sistema de irrigação su0su!ercial] Annual Meeting/ ASA!/ Borth "arolina State 7niversity/ :aleigh/ B"/ 7SA/ Jun)T2)Q/ QRR/ Paper Bo. RR)*) , )1 !. g., 1 ta0, 9 re. % vaila0le rom %S%:, DM& 1, St. Tose!8, I 94, ncia de dierentes !roundidades laterais e es!açamentos na !rodução de mil8o e utilização de "gua, e estudar a utilização !r"tica de um sistema de irrigação su0su!ercial e o !adrão de distri0uição da "gua.
%omentários deste autor
1. % !rimeira rase nada acrescenta ao t+tulo. M resumo !oderia ser ainda mais condensado, sem !erda de sentido, como segue Dro!e um m=todo 'ue não re'uer agentes 'u+micos. :studaram-se as caracter+sticas 8idr"ulicas de v"rios crivos, com e sem vi0ração, e se determinaram seus coecientes de resist>ncia.
). 2ovamente ocorre re!etição do t+tulo. Doderia car mais com!acto assim 7elatam-se ex!erimentos com v"rias culturas de 8ortaliças. %!resenta uma e'uação !ara calcular, em determinada "rea, o nHmero necess"rio de unidades de as!ersores e a duração da irrigação. %!resenta dados so0re danos ao !lantio causados !elas rodas dos as!ersores.
B2&. Seria muito mel8or identicar as culturas, !or exem!lo, R7elatam-se ex!erimentos com re!ol8o, 0eterra0a e cenouraO.C 3. Dode-se evitar re!etição desnecess"ria e o resumo se tornaria mais conciso M novo instrumento descrito unciona !or meio da medição da condutividade el=trica do solo, sem sondas ou contato com a terra. Dode-se ler diretamente a condutividade e as mediçes eitas camin8ando-se so0re o solo. Eom!aram-se o instrumento e seus resultados com m=todos anteriores.
. esnecessariamente !rolixo. Doderia ser reduzido a
B2&. Eomo o t+tulo inorma so0re o contexto - escassez de "gua em Israel - não = !reciso re!eti-lo no resumo. M t+tulo e o resumo se com!lementam$ este não deve existir se!arado do )
t+tulo. :ste resumo = muito !rolixo Rlimitado volume de !rovisão de "gua e demandas crescentesO = um circunl?'uio !ara dizer Rescassez de "guaO, o 'ue ;" est" im!l+cito no t+tulo.C 4. :ste !ode ser reduzido em 'uase 4f
5. Dode ser a0reviado ainda mais :m!regaram-se uma 0om0a centr+uga de 3^, um motor de 4 8! e um ental8e em v de 9 graus !ara medir as !roundidades, n+veis de "gua est"tica, n+veis de 0om0eamento e vazes de 1) !oços tu0ulares. M coeciente de 0om0eamento correlacionase !ositivamente com o coeciente de transmissi0ilidade, e negativamente com o re0aixamento. Dode-se utilizar uma ?rmula derivada da teoria de /8iem !ara calcular os coecientes de 0om0eamento.
6. ncia do texto assim :s!ecialistas em 8idrologia, convocados durante uma seca, demonstraram 'ue a eci>ncia de utilização da "gua !odia mel8orar grandemente, causando uma redução dr"stica do consumo sem reduzir a !rodução de arroz.
B2&. *"rias !artes do resumo original são su!=rNuas. % !rimeira rase ac8ase im!l+cita na Hltima [mediante mel8oria da eci>ncia na utilização da "gua^. [evido ao receio de !erda da sara^ = evidente !or si mesmo e nada acrescenta ao resumo. Dor outro lado, como o t+tulo = ines!ec+co, dever-se-la es!ecicar a cultura BarrozC e não RsaraO em geral. :videntemente, não se !oderia trocar RsaraO !or RarrozO sem ver o artigo original.C . 7aro exem!lo de um resumo muito ruim do Irrica%. 2ão acrescenta !raticamente nada P inormação do t+tulo. 2ão seria !oss+vel mel8or"-lo sem examinar o artigo original.
)1
+pndice / 0 S&ntese de princ&pios de redação de resumos/ rinc&pios erais
1. 2ão se deve im!or restrição P extensão a0soluta do resumo. eve ter a extensão 'ue or necess"ria !ara 'ue se;a o enunciado mais direto, conciso e 8omog>neo !oss+vel, 'ue inclua todas as inormaçes !ositivas constantes do artigo e nen8uma inormação nula. Inormação nula 'uer dizer 1C os elementos. 'ue se consideram sem 'ual'uer !ro0a0ilidade razo"vel de, direta ou indiretamente, a!oiar uma decisão de tra0al8o$ )C os elementos 'ue du!licam outros elementos ;" inclu+dos$ e 3C os elementos 'ue constituem con8ecimento de dom+nio comum dos es!ecialistas do setor. ). :xigem-se rases curtas, 0em redigidas e com!letas !ara "cil acesso P inormação. 3. M resumo !ode usar !alavras dierentes das do artigo original \!ar"rase] ou adotar, seletiva e cuidadosamente, as mesmas !alavras do artigo. Kuanto mais 0em organizado e redigido o artigo original, maior ser" a de!end>ncia em relação ao Hltimo m=todo, 'ue = uma orma de ela0oração de RextratosO. . Dalavras e ex!resses t=cnicas devem ser as correntes na ci>ncia em causa. 4. 2ovos termos ou denominaçes devem ser a!resentados com suas deniçes. 5. Somente devem ser em!regados as a0reviaturas e s+m0olos convencionais mais comuns, a m de evitar conusão e contri0uir !ara a legi0ilidade. rinc&pios relati#os ao conteHdo
1. M t?!ico introdut?rio deve oerecer uma indicação exata do assunto tratado e dos m=todos em!regados, caso isso não este;a evidente no t+tulo. :sse t?!ico, no entanto, ser" uma redundncia !erdul"ria, se o t+tulo tiver re!resentado satisatoriamente o conteHdo tem"tico e o m=todo de !es'uisa. ). Se não .estiver evidente no t+tulo e#ou no t?!ico introdut?rio, o t?!ico seguinte dever" indicar o m0ito do artigo e a nalidade e o0;etivos do autor. Se o leitor do resumo estiver 0uscando uma inormação es!ec+ca, esses dois t?!icos deverão indicar-l8e a !ro0a0ilidade de ac8ar a inormação 'ue l8e serve. e ato, esses t?!icos de a0ertura devem ser um resumo descritivo conciso 'ue se usa na maioria dos casos !ara a;udar o leitor a decidir se deve se re!ortar ao artigo original, mas neste caso !ara indicar-l8e se as inormaçes contidas são as 'ue 0usca ou se são ade'uadas a seu tra0al8o. 3. Se o artigo or de car"ter ex!erimental ou te?rico, a 8i!?tese do autor ser" declarada ex!licitamente, caso não este;a evidente nos t?!icos de a0ertura. . Ms m=todos de !es'uisa adotados devem ser identicados. Se orem em!regados t=cnicas ou !rocedimentos convencionais, não = !reciso descrev>-los. Se os !rocedimentos orem novos ou contiverem caracter+sticas originais a!licadas a !rocessos con8ecidos, estes as!ectos serão claramente descritos. evem ser mencionados os !rinc+!ios 0"sicos de m=todos ou tecnologias novas, suas a!licaçes e 'ualidades, aixas de o!eração e graus de exatidão. 4. escrever minuciosamente os m=todos de coleta de dados e medidas, rotação de vari"veis, m=todo de isolamento dos dados, identicação de +ndices, t=cnicas de condensação de dados, etc. M resumidor de!ende do m=todo de coleta de dados, ;unto com o de !es'uisa, !ara avaliar a 'ualidade do tra0al8o do autor e a cona0ilidade e validade de resultados e concluses. 5. Ms dados, se;am eles uma coleção de resultados ex!erimentais ou argumentos te?ricos, serão a!resentados na medida em 'ue, e somente na medida em 'ue, re!resentem integralmente todos os as!ectos im!ortantes do artigo, e se;am sucientes !ara conduzir logicamente Ps concluses do autor. Ms dados de natureza a0soluta serão a!resentados com detal8es sucientes 'ue atendam ao uso 'ue !revisivelmente terão em atividades cient+cas uturas. S+ntese de !rinc+!ios de redação de resumos !ro!osta !or DaAne et al. B195)C. 7e!roduzida com !ermissão de %merican Institutes or 7esearc8. 1
))
Ms dados !odem ser a!resentados de 'ual'uer orma, com 0ase no seguinte crit=rio adote a a!resentação mais econQmica !oss+vel, !or=m a mais lHcida. Dodem-se incluir ta0elas, diagramas, gr"cos, desde 'ue identicados exatamente, mas os dados assim a!resentados devem se 0astar, isto =, ser com!reens+veis sem necessidade de recorrer ao texto do resumo. 6. evem ser indicados os m=todos 'ualitativos e#ou 'uantitativos adotados no tratamento dos dados. 2ão = !reciso descrever t=cnicas convencionais e con8ecidas. *ariaçes ou a!licaçes es!eciais de t=cnicas con8ecidas serão a!resentadas se orem necess"rias !ara re!resentar !or com!leto os as!ectos im!ortantes do estudo e undamentar inteiramente as concluses a1cançadas. . evem ser a!resentadas as concluses l?gicas. Yi!?teses e teorias serão reexaminadas se oram com!rovadas ou invalidadas, aceitas ou reutadas. 2este !onto, ca0e ao resumidor discriminar entre concluses com!rovadas e nãocom!rovadas e concluses reais versus iner>ncias. %cima de tudo, não deve a!resentar concluses 'ue não !ossam ser conrmadas !elas !artes anteriores do resumo. 2ão deve incluir !ro!osiçes errQneas contidas no artigo, anão ser 'ue se;am acom!an8adas de uma advert>ncia 'ue de modo claro c8ame atenção !ara o erro e, se !oss+vel, !ara sua correção. 9. !oss+vel incluir inter!retaçes v"lidas e im!ortantes 'ue o autor aça so0re resultados e#ou concluses a!resentados, caso re!resentem um avanço dos con8ecimentos ao revelar novas relaçes ou rearmar relaçes antigas. 1. :m todo o resumo, o resumidor deve exercer seu direito de esclarecer e sim!licar elementos contidos no artigo.
)3
+pndice 3 0 +nálise de conteHdo modular com mdulos temáticos "ita10o S/MLL, %. .$ EYI%2/%, .%.$ <27M:, L.7. Flame-contact studies. ransactíons o the ASM!/ Seríes "/ Journal o ;eat ranser , vol. 5, 2o. 3, %ugust 195, !. 9-45. :esumo escrevem-se a!arel8o e m=todos de a'uecimento !or contato de c8ama, a!licados com >xito na determinação das tem!eraturas de destruição e caracter+sticas t=rmicas de materiais 0rosos e !l"sticos. %!resentam-se resultados de ensaios 'ue conrmam a an"lise. Inormamse os resultados concernentes a uma 0ra de !oliamido, e ao eeito de isolamento de es!aços de ar entre camadas de tecido. odelos de c8a!a com!osta oram in;etados na c8ama de um maçarico de eXer, e se determinaram, o!ticamente ou mediante !ares t=rmicos, as tem!eraturas da !arede !osterior. M Nuxo de calor !ara a su!er+cie oi determinado o!ticamente. 2o lado da c8ama da c8a!a com!osta, avaliou-se um tecido de !oliamido Bdu Dont Y/ -1C de !esos vari"veis !or unidade de "rea su!ercial B3 onças-4 onças#;arda 'uadradaC. M lado !osterior, ou material de reer>ncia, da !arede consistia num com!osto resinoso B!ele simuladaC de !ro!riedades t=rmicas e ?!ticas con8ecidas. %s tem!eraturas de destruição do tecido Y/ -1 oram de )6±3€E mediante determinação ?!tica e de )3 ±)6€E determinada !or mensuraçes com !ares t=rmicos. % tem!eratura da c8ama era de 1 )€c. % 'ueima com!leta ocorreu em 3-5 segundos de!endendo do !eso. %o !es'uisar a utilização de es!aços de ar como camadas isolantes entre camadas do tecido, intervalos de mm !areceram ser o ideal !ara o material de 3 onças#;arda 'uadrada. Eoncluiu-se 'ue !ara a!licaçes de curta duração a altas tem!eraturas, materiais isolantes desse ti!o seriam o ideal !ara !roteção !essoal. 2os ensaios de validação da an"lise matem"tica oram utilizadas amostras de 0orrac8a de silicone 7/*-) muito nas B,4-,1 cmC. M0teve-se excelente concordncia entre as tem!eraturas de !arede calculadas e as medidas Bdierença !ercentual de ,4 !or centoC$ a an"lise adotada oi a de @rit8 e Yorton. %nalisa-se o em!rego dessas t=cnicas anal+ticas e ex!erimentais em relação P determinação da diusividade e condutividade t=rmicas de ensaios do ti!o de contato de c8ama. Eonclui-se 'ue as t=cnicas !ro!orcionaram um meio sens+vel e exato !ara determinar !ro!riedades t=rmicas. MEdulos temáticos especialiLados B!ar"graos su!lementares ao resumo 0"sicoC Gisiologia e medicina escreve-se um a!arel8o e se desenvolvem ex!resses matem"ticas 'ue !ermitem uma an"lise de dano tissular, devido a ex!osição a c8ama, a !artir do con8ecimento das !ro!riedades e da 8ist?ria de tem!eratura-tem!o de uma camada de revestimento de !roduto t>xtil. Isso constitui um meio relativamente sim!les de estudar as !ro!riedades t=rmicas Binclusive diusividade e condutividadeC de tecido vivo intacto sem alteração do !r?!rio tecido. IndHstria de plásticos Y/-1, uma 0ra t>xtil ex!erimental de !oliamido resistente ao calor, oi ex!osta a contato de c8ama num maçarico de eXer com uma tem!eratura na c8ama de 1 )€c. % tem!eratura de destruição dos tecidos de 3, ,4 e 5 onças# ;arda 'uadrada oi de )61 ±3 €c, medida radiometricamente. % 'ueima total ocorreu em 3-5 segundos, de!endendo do !eso. IndHstria da %orracha ediu-se, !or meio de um calor+metro de contato de c8ama, o Nuxo de calor transit?rio atrav=s de uma montagem de duas camadas de 7/*-), uma 0orrac8a de silicone a0ricada !ela @eneral :lectric, reorçadas com !ele simulada. ediu-se, no interior da camada de reorço, a elevação de tem!eratura em tr>s segundos em camadas de 0orrac8a de ,94, ,44 e ,4) mm, o 'ue concordou de modo excelente com os valores te?ricos. IndHstrias de roupas de prote10o e aeronáutica Ms ex!erimentos descritos, so0re as tem!eraturas de destruição e caracter+sticas t=rmicas de tecidos su0metidos ao calor !or contato de c8ama, são da maior im!ortncia !ara o !ro;eto de rou!as de !roteção contra 'ueimaduras. :m !articular, a;udam a ex!licar !or 'ue, em ex!eri>ncias com macaces de vQo, o0t=m-se signicativo aumento da !roteção contra
)