FYI.

This story is over 5 years old.

Tecnologia

Brewster Kahle, o Bibliotecário de 404 Bilhões de Websites

O criador do Internet Archive é o maior bibliotecário digital do mundo, e trabalha nisso desde 1996.
Image: Flickr/Beatrice Murch

Brewster Kahle, fundador do Internet Archive, é um bibliotecário digital que vem trabalhando para o acesso universal ao conhecimento desde a fundação do site, em 1996, e até mesmo antes disso.

Um engenheiro que já estudou inteligência artificial e co-fundou o site de medição de público Alexa, Kahle, aos 53 anos, está munido com uma obsessão de colecionar tudo. É possível encontrar parte de seu alexandrino acervo físico em uma antiga igreja da Ciência Cristã, em San Francisco, onde bonecos de papel machê quase em tamanho real de amigos e benfeitores do Internet Archive ocupam os bancos. Há também um depósito em Richmond, na Califórnia, que tem cerca de 1 milhão de livros, e, para servir o Wayback Machine-- um backup histórico de páginas da web que foram lançadas desde 2001, que, recentemente, passou a marca de 400 bilhões de registros – há um datacenter armazenado dentro um contêiner que contém três petabytes (ou mil terabytes) e pode processar 500 pedidos por segundo.

Publicidade

Mas não rola descolar um cartão de biblioteca para ver os materiais em pessoa: o lugar para visitar o arquivo é online, onde tudo está disponível gratuitamente, ad infinitum. Pelo menos é o que se espera. Enquanto cópias de dados do Internet Archive são mantidas em outro lugar -- um espelho está na Biblioteca Alexandrina, no Egito -- um incêndio no arquivo em novembro danificou alguns equipamentos caros de digitalização, razão pela qual o arquivo está aceitando doações. Kahle tem tantos dados que ele até recebeu um pouco de afeto da NSA.

Brewster com um impressora em 1992. Imagem: Flickr/Carl Malamud

Este não é um trabalho fácil. Recentemente, Kahle lutou com sucesso contra o  FBI em um caso em que a agência exigiu informações de um usuário. Há também desafios de engenharia, por exemplo, no desenvolvimento da sofisticada coleção do arquivo de programas de televisão, que atualmente contém 564 mil shows, desde o ano 2009. Enquanto isso, Kahle não costuma fugir de debates sobre o acesso digital. Ele questionou o Google Books, lamentou a falta de um sistema de empréstimo decente para materiais digitais e disse se preocupar com a transmissão de conhecimento do setor sem fins lucrativos para o privado.

Recentemente tive a oportunidade de falar com Kahle sobre código aberto e web sem fins lucrativos, o Internet Archive e o Open Library, que procura construir uma página na web para todos os livros já publicados e empréstimo de livros por meio da internet.

Publicidade

MOTHERBOARD: Para organizações que coletam e armazenam informações de toda a humanidade, vocês veem o modelo sem fins lucrativos como bem sucedido?

Brewster Kahle: Acho que estamos vendo uma experimentação ampla. A Wikipedia é um modelo de doação pública; o Internet Archive é uma mistura de oferta de serviços e manutenção de despesas bem baixas e abordagens criativas para essa forma de sustentabilidade. A Public Library of Science é paga quando as pessoas submetem seus artigos. Eu não sei qual é a resposta em termos de todos os modelos de financiamento. Existem diferentes ideias que estão sendo testadas, mas esta estrutura sem fins lucrativos se encaixa bem para a internet.

Falando em abordagens criativas, o Tumblr do Internet Archive é bastante experimental. Qual é o objetivo do site?

Esses são todos voluntários, tumblrs residentes. O que você faria com todo esse material? Eles fazem algo interessante, estranho, divertido, artístico, o que for que eles quiserem fazer com isso.

Peixes abissais, da página de um livro da openlibrary.org, de Kahle

O Internet Archive tem agora um arquivo de notícias de TV, o que é ótimo, pois muitos vídeos são bloqueado pelo GEMA na Alemanha (GEMA é uma organização de direitos de música na Alemanha, que bloqueia muitos vídeos de música no Youtube). Quando o projeto realmente teve início?

Começamos a coletar dados em 2000. Tivemos uma versão que estava sendo executada no ano passado e a refizemos completamente  e a relançamos. É possível fazer referência aos vídeos de maneiras muito específicas e existe uma ferramenta para especificar o que você quer citar. Se você quer pegar emprestado todo o programa, vamos colocá-lo em um DVD e emprestá-lo para o usuário, como em uma biblioteca.

Publicidade

A Open Library é um catálogo online de livros editável e aberto. Pode ser visto como uma biblioteca de e-books. Quais desafios permanecem para o formato de e-book? Você acha que os escritores estão abertos à ideia de empréstimo digital?

A maioria das pessoas apenas vê isso como a continuação do que é uma biblioteca. É basicamente o acesso à cauda longa. Essa é o negócio da nossa biblioteca -- dar acesso a obras do século 20 que, basicamente, estão disponíveis apenas em sua versão impressa.

A maioria das bibliotecas está bloqueada. Isso não funciona bem na internet.

O que você acha das bibliotecas digitais de hoje em dia?

A maioria delas estão bloqueadas. Isso não funciona bem na internet. Nós temos aquelas que requerem assinatura ou são amarradas a um fornecedor em particular, como a Amazon, ou só estão disponíveis se você estiver em uma universidade de prestígio. Nós temos uma oportunidade para que todos possam aprender, então vamos tirar vantagem disso.

A primeira página do Wayback Machine na versão de arquivos, em 30 de novembro de 2001

Enquanto isso, no entanto, sites de notícias ainda estão tentando configurar os paywalls. Você acha que esse modelo vai dar errado?

Eu não sei. Os sites de notícias estão se esforçando. Queremos ver o trabalho editorial e as bibliotecas funcionando na próxima geração. Bibliotecas compram coisas e as emprestam, o que faz sentido na era digital.

Muitas dessas coisas você não está comprando.

Como as páginas da internet, elas não estavam à venda em primeiro lugar. Mas os livros são doados ou nós os compramos. Temos mais de um milhão de livros físicos em Richmond, na Califórnia. Eles não são muito acessíveis, você não pode entrar no estoque. É um bom lugar para ir e fazer um tour, mas não é bom para pegar livros específicos. Era para ser um local de preservação.

O Internet Archive atingiu 404 bilhões de páginas, o que não deixa de ser um pouco engraçado. Como você comemorou?

As pessoas estavam apostando que dia iríamos bater 404 bilhões. Sim, fizemos uma festa!

Tradução: Sarah Germano