Deep Web: conheça o submundo da Internet
Saiba como obter acesso a um conteúdo que pode ser
até 500 vezes maior do que o Google é capaz de lhe mostrar!
Por Ladislau Freitas em 26/Jul/2012
Você já deve ter se deparado com esta
analogia cafona um sem-número de vezes: "a
internet é como um oceano". Sim, a internet é um verdadeiro
oceano de informações, cultura e entretenimento. E, para navegar neste oceano e
ter acesso a tudo o que ele é capaz de oferecer, nos tornamos reféns dos
chamados motores de busca (search engines); mais precisamente, do mais famoso
deles, o Google.
Porém, ao contrário do que muitos
pensam e por razões que fogem ao conhecimento da maior parte dos internautas, o
Google, e outros mecanismos de busca populares, não são capazes de lhe mostrar
exatamente tudo o que existe na rede mundial de computadores.
Na verdade, mecanismos como o Google, o
Bing e o Yahoo são capazes de lhe mostrar apenas o que há na superfície deste
oceano, ou seja, uma parte muito pequena do que realmente é a Internet.
Exagero? Nem um
pouco...
Para se ter uma ideia melhor do quão
superficial é sua experiência na Web ao utilizar um desses mecanismos de busca,
vamos apresentar um dado realmente impressionante: um estudo feito pela Universidade da Califórnia no ano de 2001, estimou que toda a
Internet apresentada pelos mecanismos de busca corresponde a bem menos de 1% do
tamanho real. A conclusão é que a "internet invisível" é entre 400 e
550 vezes maior do que estes mecanismos nos fazem crer.
A falta de indexação de todo este
conteúdo nos motores de busca populares ocorre por inúmeras razões:
·
Determinação do dono do conteúdo: existem algumas 'metatags' (tipo de instrução HTML) que podem ser usadas
no cabeçalho de um site para instruir os mecanismos de busca a não indexar seu
conteúdo, tornando-os, desta forma, inacessíveis ao grande público.
·
Violação de algum termo de indexação: os mecanismos de busca podem deixar de indexar um site se o mesmo
infringir algumas de suas regras. Por exemplo, um sitemap1 mal feito.
·
Dificuldade de acesso ao conteúdo
dinâmico: A maior parte das informações da Web
estão enterradas muito abaixo das páginas geradas de maneira dinâmica. Motores
de busca tradicionais criam seus índices rastreando páginas de
"superfície". Para serem descobertas, as páginas devem ser estáticas
e ligadas a outras páginas. Motores de busca tradicionais não conseguem
"ver" ou recuperar este conteúdo já que, tecnicamente, não existem
até que sejam criados dinamicamente conforme o resultado de uma pesquisa
específica. Ou seja, indexadores de mecanismo tradicionais não podem sondar
abaixo da superfície.
·
Efeito "publicidade": Com o intuito de "melhorar" a exibição de publicidade, os
desenvolvedores dos motores de busca mais populares têm investido pesadamente
na personalização dos resultados. Para tanto, são usados diversos artifícios:
desde simples cookies de sessão até associação com serviços de e-mail e redes
sociais que, literalmente, lêem suas mensagens em busca de palavras que possam
ser relacionadas a propaganda personalizada.
A ideia é tentar, a todo custo, identificar seus hábitos de uso para poder exibir a publicidade que melhor se encaixa em seu perfil pessoal.
Para se ter uma ideia de como estão as coisas hoje em dia, duas pessoas distintas que fazem uso assíduo de redes sociais, costumam fazer determinados tipos de pesquisa com frequência, nunca apagam cookies do navegador e, principalmente, permanecem logadas com nome de usuário e senha a estes mecanismos e seus respectivos servidores de e-mail, certamente não receberão o mesmo resultado de pesquisa para um termo qualquer que for digitado. Ou seja, o mecanismo de busca não estará exibindo, como inicialmente você poderia imaginar, todos os resultados para seu termo de busca, mas sim os resultados que ele"entende que sejam os melhores para você"! Isso faz com que boa parte dos resultados para sua pesquisa permaneçam inacessíveis.
A ideia é tentar, a todo custo, identificar seus hábitos de uso para poder exibir a publicidade que melhor se encaixa em seu perfil pessoal.
Para se ter uma ideia de como estão as coisas hoje em dia, duas pessoas distintas que fazem uso assíduo de redes sociais, costumam fazer determinados tipos de pesquisa com frequência, nunca apagam cookies do navegador e, principalmente, permanecem logadas com nome de usuário e senha a estes mecanismos e seus respectivos servidores de e-mail, certamente não receberão o mesmo resultado de pesquisa para um termo qualquer que for digitado. Ou seja, o mecanismo de busca não estará exibindo, como inicialmente você poderia imaginar, todos os resultados para seu termo de busca, mas sim os resultados que ele"entende que sejam os melhores para você"! Isso faz com que boa parte dos resultados para sua pesquisa permaneçam inacessíveis.
Um mesmo termo de
busca no Google pode gerar resultados diferentes para diferentes perfis
de pessoas. Na imagem, é visível a diferença entre os screenshots tirados
por duas pessoas diferentes aqui na redação do Superdownloads
·
Conteúdo "Proibido": Muitos sites são automaticamente ignorados ou 'desindexados' pelos
mecanismos por apresentarem conteúdo ofensivo ou potencialmente perigoso. Nesta
categoria, encaixam-se redes criminosas de todos os tipos como sites de
terroristas, de nazistas, de pedófilos e de incentivo a violência por
discriminação. Sites de hackers, crackers e de compartilhamento de malwares de
todos os tipos também encontram-se abaixo da superfície da internet visível.
Sites com conteúdo hediondo, como muitos sites nazistas, de sociedades
satânicas e de diversos tipos de bizarrices como zoofilia, necrofilia e snuff
também fazem parte do conteúdo "inacessível".
A besta tem 7 nomes...
Abaixo da superfíce (Surface Web),
existe uma internet totalmente desconhecida pelo usuário comum. Este mundo
submerso e misterioso é, normalmente, mencionado através dos seguintes termos:
1. Deep Web (Web Profunda);
2. Deep Net (Rede Profunda);
3. Invisible Web (Web Invisível);
4. Under Net (Abaixo da Rede);
5. Hidden Web (Web oculta);
6. Dark Net (Rede sombria);
7. Free Net (Rede Livre)
2. Deep Net (Rede Profunda);
3. Invisible Web (Web Invisível);
4. Under Net (Abaixo da Rede);
5. Hidden Web (Web oculta);
6. Dark Net (Rede sombria);
7. Free Net (Rede Livre)
Fazer uma busca por estes termos no
Google irá lhe trazer bastante informação útil, mas não vai levar você muito
além do nível "água no joelho". Para acessar o conteúdo profundo é
necessário usar escafandro e ficar muito esperto com os monstros abissais que
certamente irão se apresentar.
Até onde vai a
toca do coelho?
Se você chegou até este ponto da
matéria, certamente já deve ter percebido que os mecanismos de busca
tradicionais não irão lhe ajudar muito a desvendar o conteúdo oculto da
internet. Mas não é só isso: os navegadores também não!
Na verdade, a Deep Web é um território
"perigoso", onde o risco de contaminar-se com um vírus ou ter o
computador invadido por hackers e crackers é muito maior. Além disso, boa parte
do conteúdo está encriptado, o que requer ferramentas diferentes para
acessá-lo. Por isso, navegadores comuns irão restringir automaticamente
determinados tipos de conteúdo ou simplesmente não vão carregá-los pois, em sua
maioria, estão repletos de miniaplicativos e add-ons que visam
"garantir" sua segurança: filtros anti-phishing, anti-popup, níveis
de segurança por zona, etc...
Sendo assim, a melhor forma de começar
a desbravar este território inóspito é esquecer a forma tradicional de acesso,
fugindo de ferramentas populares e se precavendo ao máximo!
Utilizar uma máquina virtual, ao invés
dos recursos nativos do seu computador, é uma boa ideia. Assim, se algo
acontecer, basta deletar a máquina virtual e nada de importante será perdido.
Tudo de ruim que puder vir a ocorrer (infecção por vírus, invasão por rootkit,
etc, só irá contaminar a máquina virtual). Outra vantagem de se recorrer às
máquinas virtuais é que você não vai ficar paranóico com instalação e
configuração de programas antivírus, firewalls, anti-spywares, etc... Afinal de
contas, fazendo desta forma, tudo o que é importante vai ficar inacessível e
bem longe do alcance dos perigos do mundo Deep.
Sobre máquinas virtuais
Existem alguns programas capazes de
"emular" um PC inteiro dentro de uma janela do Windows (ou de outro
sistema operacional). Você literalmente roda dois sistemas operacionais
distintos simultaneamente em um mesmo computador.
Para saber mais sobre o assunto,
visite:
BetoBerrero - Deep Web One YouTube
Após instalar a máquina virtual, o próximo passo é, literalmente, mergulhar dentro da Deep Web.
Após instalar a máquina virtual, o próximo passo é, literalmente, mergulhar dentro da Deep Web.
The Onion Router
(ou simplesmente Tor)
A navegação anônima é a sua principal
ferramenta para desbravar o conteúdo da Deep Web. A primeira razão para navegar
desta forma é que fica um pouco mais difícil para hackers e sites com conteúdo
nocivo efetuarem um ataque direto contra seu computador. A segunda razão é que,
dependendo do que você for visitar, existe a possibilidade de você ser redirecionado
para sites com conteúdo criminoso. Portanto, navegar sem a proteção do
anonimato, pode colocá-lo na mira de organizações de investigação criminal de
todo o mundo.
Existem inúmeras ferramentas que podem
ser instaladas em seu computador para a navegação anônima. Porém, uma das
melhores é o Tor.
O Tor (https://www.torproject.org/) é, na verdade, uma
rede de computadores que visa prover anonimato através de túneis HTTP e roteadores
que funcionam a partir de máquinas de usuários comuns conectadas à internet e
que rodam uma versão servidor da aplicação.
Para navegar dentro desta rede, é
necessário a instalação da versão cliente do programa para que seja criado um
proxy que se conecta a ela. Feito isso, navegadores e programas que se conectam
à internet (Internet Explorer, Emule, Bittorrent, etc.) devem ser configurados
para usar um servidor do tipo "proxy socks 5" com endereço de destino
no próprio computador, ou seja, IP 127.0.0.1. Em sua maioria, programas que
fazem uso da internet possuem abas de configuração onde é possível fazer este
tipo de modificação.
A partir de então, o Tor roteia todo o
tráfego da conexão do cliente através dos túneis da rede até o destino
desejado. Desta forma, se o usuário visitar um site do tipo http://meuip.datahouse.com.br/ (que serve para
identificar seu IP na internet), vai receber uma resposta diferente do IP real
do computador. O IP apresentado será, no caso, o endereço IP do nó Tor por onde
o tráfego de rede "saiu" para acessar o conteúdo da "rede
convencional".
A rede Tor possui uma topologia
bastante caótica e você não tem como saber qual IP será destinado a sua
navegação ou a que parte do mundo tal IP pertence.
Além disso, existe um tipo de domínio
com extensão ".onion" que é acessível apenas pelos clientes Tor.
Aliás, foi a partir dos sites ".onion" que nasceu a expressão
"Deep Web". Tentar acessar tais sites por um navegador comum irá
resultar em erro.
Links para sites da Deep Web são parecidos com
estes:
http://kpvz7ki2v5agwt35.onion
(The Hidden Wiki - Contém toneladas de informações sobre sites Tor)
http://xmh57jrzrnw6insl.onion
(Motor de busca para sites Deep Web)
(The Hidden Wiki - Contém toneladas de informações sobre sites Tor)
http://xmh57jrzrnw6insl.onion
(Motor de busca para sites Deep Web)
http://eqt5g4fuenphqinx.onion
(Pesquisa em diretório dentro da Internet profunda)
(Pesquisa em diretório dentro da Internet profunda)
http://jhiwjjlqpyawmpjx.onion
(Tormail, gratuito para envio de mensagens anônimas)
(Tormail, gratuito para envio de mensagens anônimas)
http://4eiruntyxxbgfv7o.onion
(Mensagens instantâneas anônimas)
(Mensagens instantâneas anônimas)
http://eqt5g4fuenphqinx.onion/
(Core .onion, pesquisa em diretório)
(Core .onion, pesquisa em diretório)
Existem sites na Deep Web
(".onion") que abordam os mais variados tipos de assunto: desde
treinamento de guerrilha e armamentos até lojas virtuais de drogas e outros
itens ilegais. O conteúdo é vasto, chocante e, muitas vezes, indigesto! Por
razões "óbvias", exibimos apenas os links acima para que você possa
iniciar sua jornada.
Navegador Tor
Felizmente, existe uma maneira mais
fácil de desbravar a Deep Web através do Tor, sem a necessidade de
configurações complicadas. Tudo o que você precisa está em nossa área de
downloads, e se resume ao Tor
Browser
.
Fique ciente, porém, que a navegação
através dele é lenta. O motivo é a já mencionada e intrincada rede de túneis
que são gerados para lhe garantir o anonimato.
Outras fontes
interessantes
Deixando um pouco de lado o conteúdo
"sombrio", apresentamos algumas fontes interessantes que podem
levá-lo além do que o Google é capaz de lhe mostrar. Com estes mecanismos, a
"água vai até a cintura" :-)
1. DeepPeep: Serviço idealizado para gerar resultados não captados por motores de
busca comuns. Ainda em fase beta, portanto, pode apresentar problemas.
2. MetaCrawler: Exibe, em sua
tela de resultados, uma pesquisa conjunta em vários mecanismos de busca
tradicionais. A vantagem é que você não fica limitado aos resultados de
pesquisa personalizados que mencionamos anteriormente, além, é claro, de
receber muito mais informação por termo digitado.
3. Oth.net: Motor de busca
especializado em procurar por arquivos em servidores FTP do mundo todo. Tem,
literalmente, de tudo.
4. Duck Duck Go: Para quem leva
teoria da conspiração a sério e torce o nariz para utilizar serviços de
empresas como Google, Yahoo e Microsoft, o Duck Duck Go é uma boa alternativa
para ser usado como mecanismo de busca principal.
5. InfoMine: Motor de busca desenvolvido por um grupo de bibliotecas Norte
Americanas, dentre elas a da Universidade da California e da Universidade de
Detroit. Lá você encontra muita informação interessante, como periódicos
eletrônicos, livros, boletins, listas de discussão, catálogos de bibliotecas
on-line, artigos, diretórios de cientistas e pesquisadores, etc.
6. The Virtual Library: É considerado um
dos mais antigos catálogos da Web. Foi desenvolvido por alunos de Tim
Berners-Lee, o próprio criador da Web. A caixa de pesquisa funciona como um
motor de busca tradicional. Divirta-se!
7. Complete
Planet: Um dos melhores buscadores
não-populares. Nele, você encontra uma variedade realmente grande de assuntos
que vão desde comidas e bebidas até assuntos militares.
Considerações finais
A Deep Web é realmente um assunto muito
vasto. Infelizmente, é necessário bastante conhecimento em outras línguas para
poder fazer uso de todo seu potencial e, para mantermos a matéria em um nível
mínimo de legalidade, não pudemos abordar alguns tópicos realmente polêmicos e
extremamente difundidos nas profundezas da Internet. Mas esperamos que, com as
informações passadas aqui, você possa aumentar exponencialmente sua cultura e
conhecimento sobre este mundo louco em que vivemos. E tudo está lá, nas
profundezas... É só procurar!
Bom mergulho!







0 comments:
Post a Comment