Busca em DICAS
Busca na Internet
Cadernos de Informática
DICAS de MPB
DICAS do Charlab
DICAS do Editor
DICAS dos Leitores
DICAS por E-mail
Internet Kids
Notas na Imprensa
Internet Radios
Internet Shopping
Internet TV
Revistas de Informática
Software na Internet
Turismo Virtual


Os Oráculos da Internet - série de reportagens de Sérgio Charlab, sobre os instrumentos de busca da Internet, conforme publicado na sua coluna "Ciberespaço", do Jornal do Brasil, e que o mesmo, gentilmente, nos autorizou a reproduzir, em DICAS da Semana.


Os Oráculos Digitais: Infoseek (Tutorial, parte 7)

O Infoseek, do qual já falamos um pouco na parte 6, oráculo politicamente correto, customizável, permite que selecionemos até o idioma da home-page. Pedir (e encontrar) texto em português é exagero, por isso temos de nos contentar com o espanhol. Não é mau. Clique em "ayuda" e verá que, para nós brasileiros, a leitura (e a compreensão) em espanhol é apenas uma questão de velocidade e paciência.

A linguagem de busca do Infoseek é semelhante a do AltaVista. Você pode usar aqueles sinais de mais (+) e menos (-) para especificar palavras que "devem" e não devem" aparecer nos resultados. Exemplo: fernando +henrique; fernando -collor.

Para procurar uma frase você deve escrever as palavras entre aspas (aquelas de duas marquinhas antes, duas depois). Não custa reforçar aqui a diferença entre procurar uma "frase" de três palavras e as mesmas três palavras sem ser numa frase. Digamos que, num dia de inspiração nacionalista, você queira encontrar menções à frase da nossa bandeira, "ordem e progresso". Pois então escreva no local de busca: "ordem e progresso". Vai achar três respostas, todas na "mosca". Mas se o seu amigo, que não está lendo esta série, fizer a busca e escrever apenas as palavras sem usar as aspas, vai encontrar 304.120 resultados (!!), porque neste caso a busca terá sido feita individualmente pelas palavras, "ordem", "e" e "progresso". Você pode também usar um hífen (tracinho) para caracterizar palavras que devem aparecer junto uma da outra, como em Itamar-Franco.

Use colchetes para indicar palavras que não estejam mais distantes do que 100 palavras entre uma e outra. [Netscape dicas] me deu 19 resultados, que são as ocorrências das palavras "Netscape" e "dicas" a no máximo 100 palavras de distância entre uma e outra. Ou seja, boas chances de que sejam, de fato, dicas sobre uso do Netscape. Sem os colchetes, encontro 82.989 respostas, porque o Infoseek busca ocorrências das duas palavras. Naturalmente, como o sistema de classificação do Infoseek é de boa qualidade, na hora de apresentar as respostas você encontrará uma classificação por scores que tendem a colocar as mais importantes em primeiro lugar. O score vai de 0 a 100 e é baseado nas palavras e frases que você usa na busca.

Mas vamos agora ao Infoseek Ultra, anunciado como mais eficiente que o AltaVista, Lycos, Excite e HotBot. Clique no botão "special" abaixo do logotipo do Infoseek Ultra e veja quantas opções incomuns, mas interessantes, de busca. Você pode saber a popularidade de um site (medida pelo número de páginas que a ele fazem referências); avaliar quantas páginas de um site estão registradas no Ultra; procurar um site por um pedaço de uma URL (coloquei para procurar por ".br" e achei quase 50 mil URLs, a maioria, claro, brasileiras); localizar um site pelo "título"; e ainda procurar imagens e "applets" Java.

Para estas características, permanecem válidas as regras das aspas, mais e menos, de modo que uma possível busca seria [url:+.br -com.br], o que imediatamente mostra que temos 12.610 sites "com.br" na Internet brasileira registrados no Infoseek. Um bocado, não? Da mesma forma, vi que "gov.br" são apenas 1978. Se você fizer estas buscas, convém colocar também uma restrição para ".br-online" para evitar os sites ligados a http://www.br-online.de/, que fica na Alemanha e, até onde vai meu alemão, não tem nada a ver com o Brasil.
Com buscas em "site:" você descobre tudo o que existe "debaixo" de uma URL, até mesmos páginas perdidas, não-divulgadas (de testes), ou baixarias que os administradores desconhecem.

Claro que alguém vai pensar em buscar [url:http] e vai encontrar os quase 15 milhões de páginas arquivadas no Ultra.

O Infoseek Ultra tem uma série de características que tornam, teoricamente, as buscas mais precisas. Quando usamos duas palavras que iniciam por maiúsculas, como Sérgio Charlab, ele conclui que deve tratar a busca como uma "frase", e portanto não é necessário colocar as aspas tradicionais. Duas frases separadas por vírgula resultam numa excelente busca. Lembre-se que uma frase é sempre melhor do que várias palavras, e três palavras, por exemplo, são melhores do que duas. E não se esqueça de colocar em maiúsculas aquilo que for em maiúsculas. É sempre a mesma regra: pense um pouquinho antes de sair procurando. Também é divertido avaliar as respostas que aparecem a partir de uma busca "natural"; ou seja, quando você simplesmente escreve o que deseja achar. Exemplo: "Pentium 166 multimídia" ou "mulher bonita no Brasil". Boa sorte!

Aliás, procurando o e-mail do Bill Gates acabei me deparando com infame piada que descrevia seu (o dele, claro!) objeto de desempenho como "micro" e "soft".

Um leitor ficou preocupado com as dicas que eu dei aqui, numa das semanas anteriores, sobre como fazer para que uma página seja catalogada com destaque no AltaVista, de modo que surja entre as primeiras como resposta após uma busca. A sensação que tenho é de que não há nada que se deva esconder. Exatamente para evitar isso é que o Ultra, por exemplo, tem um algoritmo original que é capaz de identificar quando alguém "tenta enganá-lo". Se você faz uma home-page sem conteúdo, mas dá a ela o título de "Sexo no Brasil", escreve uma meta tag dizendo que a página é sobre sexo e ainda escreve 100 vezes a palavra sexo nas primeiras linhas de texto da página, o AltaVista julgará que você é autoridade na matéria, mas o Ultra, esperto, percebe que você quer enganá-lo e não classifica sua página. Na Internet, a lição que aprendo, é que inteligência se vence com inteligência e trabalho, e não com segredos e censura.

Esta foi a sétima parte da série tutorial sobre os mecanismos de busca e indexadores da Internet. Envie e-mail para charlab@charlab.com.br e peça as partes deste tutorial que você perdeu. Ainda há muita coisa pela frente e eu não faço idéia de quantas partes este tutorial terá. Mas sei que na semana que vem falarei de alguns oráculos verdes e amarelos, em português, brasileiríssimos, como o Bookmarks e o Argos. Apareça aqui. E chame os amigos. Dominar o uso das técnicas de busca nestes "oráculos digitais" é a melhor estratégia para quem quiser sentir-se à vontade com a Internet.


* Sérgio Charlab (charlab@ax.apc.org) é editor-chefe de Seleções do Reader's Digest, colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros "Você e a Internet no Brasil" e "O Seu Futuro Eletrônico".