Passo 1: Escolha um nome de projeto e pasta de destino 1. Alterar Alterar a pasta pasta de destino, destino, se se necessário necessário É mais conveniente para organizar todos os espelhos em um diretório, por exemplo, eus !ites !e voc" já #ez espelhos usando $%%rac&, certi'(ue)se de (ue voc" selecionou a pasta correta.
*. !elecione !elecione o nome nome do proj projeto: eto: o
!elecione um novo nome de projeto
Este nome +, por exemplo, o tema dos locais espelhados, por exemplo site do meu amigo
o
!elecione um projeto existente para atualiza/o 0 nova tentativa
!elecionar diretamente diretamente o nome do projeto existente na lista pop)up
. 2li(ue 2li(ue no 3ot/o 3ot/o A4 A4A56A7 A56A7
Passo *: Preencha os endereos
1. Sele Seleci cion one e uma uma ação ação A ação padrão é baixar sites
o
Baixar web site (s)
Será Transferido Transferido os locais l ocais desejados com opçes padrão o
Baixar web site (s) ! per"untas
Será Transferido os locais desejados com opçes padrão e fa#er per"untas se todas as li"açes (lin$s) são consideradas como potencialmente transfer%&el o
'bter arui&os indi&iduais
S obter os arui&os desejados especi*cados (por exemplo+ arui&os ,-)+ mas não aran/a atra&0s de arui&os T23 o
4ownload de todos os locais em pá"inas (espel/o m5ltiplo)
-rá baixar todos os sites ue aparecem no site (s) selecionada. Se &oc6 arrastar e soltar o arui&o boormar$+ esta opção permite ue &oc6 espel/e todos os seus sites fa&oritos o
3i"açes de teste em pá"inas (teste de indicador)
-rá testar todas as li"açes indicadas. 7til para &eri*car um arui&o de fa&oritos
o
8 9ontinuar download interrompido
:se esta opção se um download ti&er sido interrompido (interrupção do usuário+ acidente ..) o
8 Atuali#ação de download existente
:se esta opção para atuali#ar um projeto existente. ' motor &ai rea&aliar a estrutura completa+ &eri*cando cada arui&o baixado para ualuer atuali#ação no site ;. 4i"ite os endereços do site
>.
Csta opção permite ue &oc6 de*na par@metros adicionais (lo"in D sen/a) para o :3+ ou capturar uma :3 complexa do seu na&e"ador E. 9liue no botão A
Adicionar uma -78
1. 4i"ite um endereço da Ieb t%pico Basta di"itar o seu endereço no campo
': ;. 4i"ite um endereço da Ieb com autenticação ? 5til uando &oc6 precisa de autenticação básica para assistir a pá"ina da Ieb
': >. 9apturar um lin$ do seu na&e"ador da Ieb para TTrac$ :tili#e esta ferramenta apenas para pá"inas com base em formulários (pá"inas entre"ues depois de submeter um formulário) ue precisam al"uma análise
Set+ como explicou+ suas prefer6ncias de proxJ do na&e"ador da Ieb para os &alores indicadosK ajustar o endereço do proxJ e porta do proxJ+ em se"uida+ cliue no botão ou lin$+ como costuma fa#er no seu browser Ieb. ' proxJ temporário+ instalado por TTrac$+ então capturar o lin$ e exibir uma pá"ina de con*rmação.
Passo : Pronto para comear
1. Se &oc6 uiser+ &oc6 pode se conectar imediatamente ou retardar o espel/o Se &oc6 não selecionar nada+ TTrac$ irá assumir ue &oc6 já está conectado L -nternet e ue &oc6 deseja iniciar a ação espel/o a"ora o
9onectar=se a este pro&edor
4esli"ue uando terminar
9liue na caixa de seleção para pedir este /ttrac$ para desconectar a rede uando espel/o está terminado. o
S/utdown 9 uando terminar
9liue na caixa de seleção para pedir este /ttrac$ para desli"ar o computador uando espel/o está terminado. o
Cm espera
>. -r para o passo se"uinte ...
Etapa 9: 2on'ra o resultado
1.
;.
Painel Opção
•
Clique em um dos guia opção abaixo para ter mais informações
Cada guia opção é descrita, incluindo observações e exemplos
Painel p/o: %ipos E
•
Tipos de 2-2C
:m no&o recurso importante para al"umas pessoas. Cste painel informa o mecanismo ue+ se um lin$ 0 encontrado+ com um tipo espec%*co (.c"i+ .asp+ ou .p/p> por exemplo)+ ele de&e assumir ue esta li"ação tem sempre o mesmo tipo de 2-2C+ por exemplo+ a Mtext D /tml MTipo de 2-2C. -sto 0 muito importante para acelerar muitos espel/os. Al"uns arui&os T23 "randes ue t6m muitas li"açes de tipo descon/ecido incorporado+ como MASM+ fa#er com ue o motor para testar todos os lin$s+ e isto atrasa o analisador. Feste caso+ &oc6 pode di#er TTrac$K Mpá"inas.asp estão em pá"inas T23 de fatosM -sto 0 poss%&el+ utili#ando=seK Tipo de Arui&oK identidade 2-2C aspK text D /tml 2-2C identidadeK text D /tml A maioria dos tipos de 2-2C importantes sãoK
text D /tml
Arui&os de /tml+ analisados por TTrac$
ima"e D "if
Arui&os N-O
ima"e D jpe"
Oic/eiros PCN
ima"e D pn"
's arui&os FN
application D x=#ip
arui&os .#ip
application D x=mp>
arui&os .mp>
application D x=foo
.foo arui&os
application D octet=stream
Arui&os descon/ecidos
•
Browser M-dentidadeM
4i"ite aui o nome do motor+ como ele &ai ser &isto por ser&idores de Ieb or exemplo+ di"itar M2o#illa D .E (compatibleQ 2S-C .R1Q Iindows )M &ão disfarçar TTrac$ em um na&e"ador padrão 2S-C Cste campo 0 para *ns estat%sticos+ e &oc6 pode inserir o ue uiser+ um nome de na&e"ador ue não existe ou at0 mesmo o nome da sua a& Fo entanto+ cuidado que &ários sites podem entre"ar um conte5do diferente se o na&e"ador 0 c/amado de MFetscapeM ou MCxplorerM .. al"uns dos mais elitistas &ai mesmo recusar=se a entre"ar ualuer coisa+ dependendo do nome do na&e"ador. Cste caso 0 raro+ feli#mente. •
T23 odap0
4i"ite aui o texto optionnal ue será inclu%do como um comentário em cada arui&o T23 para tornar mais fácil o arui&amento A seU6ncia inserida 0 "eralmente um comentário T23 (VW = 9omentário T23 =X) com optionnalY s+ ue será transformada em uma seU6ncia espec%*ca informaçesK Z 1Y sK nome do /ost (por exemplo+ www.someweb.com) Z ;Y sK nome do arui&o (por exemplo+ Dindex./tml) Y s Z >K data do espel/o Exemplo: < á"ina espel/ado deY s+ arui&oY sW. 4ata Arc/i&eKY s =X !ota:
Painel p/o: s ar(uivos de log, ndex, 2ache
•
Oorça para arma#enar todos os arui&os no cac/e
Oorça para arma#enar todos os arui&os no cac/e+ mesmo arui&os N-O+ arui&os #ip e assim por diante .. Sem esta opção+ o motor s irá poupar em cac/e de arui&os de /tml para a atuali#ação D continuar *nalidade. ode ser 5til+ no entanto+ para manter todos os arui&os no cac/e+ se &oc6 uiser+ no futuro+ para mudar a estrutura do site A&isoW Csta opção irá sensi&elmente in"ar o cac/e ue &ai se tornar tão "rande uanto o prprio espel/oW •
Fão re=download arui&os apa"ados localmente
Csta opção impede ue TTrac$ de &oltar a pedir a um arui&o ue existe no local com taman/o nulo+ ou ue ten/a sido apa"ado pelo usuário (Se o usuário apa"ar o arui&o+ esta opção irá criar um *c/eiro nulo para e&itar ue o motor pe"ar o arui&o da prxima &e#) 7til se &oc6 esti&er apa"ando arui&os "randes pro"ressi&amente no espel/o local e não uer recarre"á=losW •
9riar arui&os de lo"
9riar arui&o de lo"+ onde informaçes+ erros e ad&ert6ncias sobre o espel/o atual será sal&a #e &oc6 não "erar arui&os de lo"+ &oc6 não será capa# de saber o ue erros ocorreuW ? altamente recomendá&el deixar esta opção marcada FotaK
Oaça um %ndice
Nerar um index./tml no topo do diretrio. 2uito 5til. •
Oaça um banco de dados pala&ra
Nerar um banco de dados index.txt no topo do diretrio. 2uito 5til para a análise lin"u%stica+ esse recurso permitirá ue &oc6 listar todas as pala&ras de todas as pá"inas espel/adas no projeto atual. 9om este arui&o de %ndice+ &oc6 será capa# de listar uais foram detectados pala&ras+ e onde. Painel p/o: p
Conselho: deixar estas opções para os valores padrão!
•
:se um cac/e para atuali#açes
Csta opção de$e ser de%nido se &oc6 uiser atuali#ar o site mais tarde+ ou se &oc6 uer ter a oportunidade de continuar um espel/o caiu 4esati&á=lo somente se &oc6 uiser economi#ar al"uns $ilobJtes+ mas+ err+ no&amente+ não 0 aconsel/á&el para desabilitar esta opçãoW •
Oiltro primário (modo scan)
[uais arui&os de&em ser sal&os\
2odo de &ia"em
4e*nir a direção spiderin" padrão ' padrão 0 pe"ar todos os arui&os no mesmo n%&el e n%&eis mais baixos+ o ue 0 o mais l"ico •
2odo "lobal de &ia"ens
4e*nir a direção spiderin" "lobal padrão ' padrão 0 para *car no mesmo endereço+ caso a autori#ação não espec%*ca foi entre"ue •
Ati&e o modo de depuração
ermite ue al"umas informaçes de depuração extras+ como cabeçal/os de depuração e al"umas informaçes de interface (apenas para depuração *ns)
Painel p/o: Prox=
•
roxJ
:sar proxJ para transfer6ncias OT
' motor pode usar proxJ TT padrão para todos ftp (ftpK DD) transfer6ncias. A maioria dos proxies permitir isso+ e se &oc6 esti&er atrás de um *rewall+ esta opção irá permitir ue &oc6 pe"ar facilmente todas as li"açes de ftp. Al0m disso+ transfer6ncias OT "erenciados pelo proxJ são mais con*á&eis do ue padrão cliente OT do motor. Csta opção 0 marcada por padrão •
9on*"urar
9liue neste botão para con*"urar o proxJ. Se o proxJ precisa de autenticação ue &oc6 pode de*nir o lo"on de usuário D sen/a
•
'cultar sen/a
:se=o se &oc6 não deseja exibir a sen/a (se esconde o nome do proxJ)
Painel p/o: 7egras de digitaliza/o
Filtros (digitalizar regras) são a opção mais importante e poderosa que pode ser usada: você pode excluir ou aceitar sudiretrios" ignorar certos tipos de arquivos" e assim por diante ## $e você tem arquivos ausentes (imagens em diretrios de n%vel superior" por exemplo) usando <ros podem a'udlo! •
Cxcluir lin$ (s)
Cste botão permite ue &oc6 adicione um *ltro para excluir ualuer um diretrio+ um dom%nio+ um certo tipo de arui&o ...
-ncluir lin$ (s)
Cste botão permite ue &oc6 adicione um *ltro para autori#ar ualuer um diretrio+ um dom%nio+ um certo tipo de arui&o ...
•
9omo adicionar uma re"ra (aceitar ou li"açes forbide) o
Selecione uma re"ra
o
Cm se"uida+ di"ite a pala&ra=c/a&e (s)
o
9lic no botão Adicionar para adicionar a re"ra
•
'utro exemploK Aceitar um nome de diretrio espec%*co Supon/a ue &oc6 está espel/ando um site em /ttpKDDwww.awondefulsite.comDmi$eDindexDindex./tml mas &oc6 não pode obter ima"ens locali#ados em D ima"es D paisa"ens D (por exemplo+ a ima"em /ttpK DD www. awondefulsite.comDima"esDlandscapesDbluewater.jp" não foi recuperada) o
Selecione uma re"raK neste caso para identi*car todos os itens de um nome de pasta espec%*ca
o
Cm se"uida+ di"ite a pala&ra=c/a&e (s)K neste caso+ 0 o nome do diretrio (sem a inicial e *nal D)
o
9lic no botão Adicionar para adicionar a re"ra
o
Ooi adicionado a re"ra
•
Painel p/o: 8imites
•
rofundidade máxima de espel/o
4e*nir o uão profundo será o motor de busca no site A profundidade de > si"ni*ca ue &oc6 &ai pe"ar todas as pá"inas ue &oc6 indicou+ al0m de tudo o ue pode ser acessado clicando duas &e#es em ualuer lin$
FotaK Csta opção não foi preenc/ido por padrão+ então a profundidade 0 in*nito. 2as porue o motor irá permanecer no local ue &oc6 indicou+ apenas os sites desejados serão espel/ados+ e não toda a webW •
rofundidade externa máxima
4e*nir o uão profundo será o motor de busca em sites externos+ ou em endereços ue foram proibidos. Formalmente+ TTrac$ não &ai passar dos sites externos por padrão (exceto se autori#ada por *ltros)+ e &ai e&itar endereços proibidos pelos *ltros.
' taman/o máximo de um arui&o T23
4e*nir o maior arui&o T23 do motor 0 permitido para pe"ar. Csta opção permite=l/e e&itar "randes arui&os se &oc6 não uiser baixá= los. •
Taman/o máximo de um arui&o não=T23
4e*nir o maior arui&o não=/tml (ima"em+ arui&o ,- ..) o motor 0 permitido para pe"ar. Csta opção permite=l/e e&itar "randes arui&os se &oc6 não uiser baixá= los. •
3imite de taman/o do Site
Csta opção limita a uantidade total de bJtes ue pode ser baixado no espel/o atual •
ausa depois de baixar ..
Csta opção permite ue o motor de fa#er uma pausa a cada &e# ue recuperou uma uantidade espec%*ca de bJtes 7til se &oc6 esti&er espel/ando um site maior ue o espaço dispon%&elK &oc6 pode+ em se"uida+ bac$up e apa"ar os arui&os baixados durante a pausa •
Tempo máximo "lobal
Csta opção limita a uantidade total de tempo ue pode ser "asto com o espel/o de corrente •
Taxa de transfer6ncia de 2ax
Csta opção limita a &elocidade de transfer6ncia sobre o espel/o de corrente 7til se &oc6 não uer TTrac$ para monopoli#ar a lar"ura de bandaW •
9onexes 2ax D se"undo
Csta opção limita o n5mero de conexes por se"undo para o espel/o atual. Cste n5mero pode ser um n5mero ]utuante (tal como R+1 ^^ 1 conexão por 1R se"undos) 7til para limitar a car"a do ser&idor. ' padrão 0 1R+ mas &oc6 pode desati&á=lo com um &alor de R = esta não 0 A<-SA4' A 2CF'S [:C <'9_ SABC ' [:C <'9_ CST` OA,CF4' (riscos de sobrecar"a de ser&idor) •
' n5mero máximo de li"açes
' n5mero máximo de lin$s ue podem ser analisados+ ou seja+ uer baixado+ ou não baixaram. Fão de*na um limite muito baixo para ue+ porue uma &e# ue o limite 0 atin"ido+ o motor pára imediatamente. Fão de*na um limite muito alto+ muito+ porue &ai demorar um pouco de memria .. 1RR.RRR li"açes (padrão) 0 "eralmente su*ciente.
Painel p/o: 2ontrole de >luxo
•
F5mero de conexes
4e*na o n5mero de conexes simult@neas ue podem ser iniciados pelo motor. ecomenda=se a limitar esse n5mero a 1 ou ; se &oc6 esti&er espel/ando "randes arui&os em um site+ mais em sites padrão ( 0 recomendado+ at0 ; se for suportada pelo sistema) •
Tempo es"otado
4e*nir o ue &e# ue o motor tem de esperar se não /ou&er resposta se for dada por um ser&idor. 1;R se"undos 0 recomendada (menos de tubos rápidos+ mais se &oc6 0 desleixado conexão) 'pcionalmente+ 0 poss%&el i"norar todas as li"açes a partir de um /ost ue tem "erado um tempo limite. A&isoK se esta opção for selecionada+ um tempo limite irá eliminar todos os lin$s de ori"em do ser&idor •
Tentati&as
F5mero de no&as tentati&as se um erro não fatal ocorreu (tempo limite+ por exemplo) Fote ue isto não &ai resol&er erros fatais+ como MFot OoundM pá"inas e assim por dianteW •
2in Taxa de Transfer6ncia
Taxa de transfer6ncia m%nima tolerada em um site. Se a taxa de transfer6ncia se mais lento ue o &alor de*nido+ então a li"ação 0 i"norada 'pcionalmente+ 0 poss%&el i"norar todas as li"açes a partir de um /ost ue tem "erado um erro Mmuito lentoM. A&isoK se esta opção for selecionada+ um erro Mmuito lentoM irá eliminar todos os lin$s de ori"em do ser&idor
Painel p/o: 8in&s
•
Tentar detectar todas as li"açes
Solicita o motor para tentar detectar todos os lin$s em uma pá"ina+ mesmo para marcas descon/ecidas ou cdi"o ja&ascript descon/ecido. -sso pode "erar pedidos ruins ou erro em pá"inas+ mas pode ser 5til para pe"ar todos os lin$s desejados 7til+ por exemplo+ em pá"inas com muitos truues Pa&ascript •
Se os arui&os não=/tml relacionada com um lin$
Csta opção permite ue &oc6 pe"ar todas as refer6ncias de arui&o em arui&os T23 capturados+ mesmo os externos or exemplo+ se uma ima"em em uma pá"ina T23 tem a sua fonte em outro site+ esta ima"em será capturada junto. •
Csta opção força o mecanismo para testar todas as li"açes em pá"inas spidered+ ou seja+ para &eri*car se cada elo 0 &álida ou não atra&0s da reali#ação de um pedido para o ser&idor. Se ocorreu um erro+ ele 0 relatado para o arui&o de lo" de erro. 7til para testar todos os lin$s externos em um site •
'bter arui&os T23 primeiroW
9om essa opção ati&ada+ o motor tentará baixar todos os arui&os T23 primeiro+ e depois baixar outros arui&os (ima"ens). -sso pode acelerar o processo de análise+ por forma e*ciente a di"itali#ação da estrutura T23.
Painel p/o: 2onstruir
•
Cstrutura 3ocal Tipo
ermite de*nir a estrutura local do site. ' padrão 0 Mestrutura do siteMK &oc6 &ai ter a mesma pasta D arui&os de nomes e estrutura ue o ori"inal
4'S Fames
Oorçar o motor para "erar nomes 4'S ( caracteres para o nome+ > para o tipo) •
-S'HHR Fames
Oorçar o motor para "erar nomes compat%&eis com -S'HHR para o arma#enamento em m%dias como 94='2 ou 4<4 '2 •
Fão pá"inas de erro
Fão "erar as pá"inas de erro (se um erro R ocorreu+ por exemplo) Se uma pá"ina está faltando no site remoto+ não /a&erá nen/um a&iso sobre o site local •
Fão existem li"açes externas
eescre&er todos os lin$s externos (lin$s ue precisa de uma conexão com a -nternet)+ de modo ue não pode /a&er uma pá"ina de a&iso antes (MAtenção+ &oc6 precisa estar on=line para ir a este lin$ ..M) 7til se &oc6 uiser separar o dom%nio local e on=line •
'cultar sen/as
Fão inclua nome de usuário e sen/a para s%tios prote"idos no cdi"o+ uando um lin$ não será pe"o. -sto permite manter=se a dados pri&ados de acesso. •
'cultar cordas de consulta
Fão incluem cadeias de consulta para li"açes locais. SeU6ncias de consulta (foo ^ E bar ^ H\) Fão são "eralmente necessários para local (*leK DD) arui&os+ mas seU6ncias de consulta pode ser 5til para mostrar &árias informaçes (exemploK\ a"e=./tml index ^ istrico). Fo entanto+ al"uns na&e"adores básicos podem não entender ue (browsers sem *o+ especialmente)+ e escondendo seU6ncias de consulta pode ser uma boa id0ia neste caso. •
Fão limpar arui&os anti"os
Fão pur"ar+ depois de uma atuali#ação+ os arui&os locais ue não existem mais no site remoto+ ou ue ten/am sido i"norado
Painel p/o: Aranha
•
Aceitar coo$ies
Aceitar coo$ies "erados pelo ser&idor remoto Se &oc6 não aceitar coo$ies+ al"umas pá"inas M"erada por sessãoM não &ai ser recuperada •
4e*nir uando o motor tem de &eri*car o tipo de documento ' motor de&e saber o tipo de documento+ para reescre&er os tipos de arui&o. or exemplo+ se um lin$ c/amado Dc"i=binD"enima"e.c"i "era uma ima"em N-O+ o arui&o "erado não será c/amado M"enima"e.c"iM+ mas M"enima"e."ifM C&ite MnuncaM+ porue o espel/o local poderia ser falso •
Analisar arui&os ja&a
4e&em os arui&os .ja&a de análise motor (classes Pa&a) para procurar nomes de arui&o -nclu%do\ Cla 0 marcada por padrão •
Aran/a
' motor de&e se"uir re"ras robots.txt remotos uando eles existem\ ' padrão 0 Mse"uirM