segunda-feira, 16 de julho de 2007

Web Semântica 2

Qual é o futuro da web, segundo o seu criador


Por Peter Moon, especial para o IDG Now!


Em entrevista exclusiva, Tim Berners-Lee, o criador da web, fala como a Web Semântica vai deixar a rede mais inteligente.

O Dicionário Houaiss da Língua Portuguesa define o termo semântico como sendo “o componente do sentido das palavras e da interpretação das sentenças e dos enunciados”. Tim Berners-Lee, o homem que inventou sozinho a World Wide Web em 1989, pegou emprestado este termo para batizar a internet do futuro.

Trata-se da Web Semântica, um conjunto revolucionário de tecnologias que ele está desenvolvendo neste exato momento, como diretor do World Wide Web Consortium, órgão ligado ao Instituto de Tecnologia de Massachusetts (MIT). Nesta entrevista exclusiva por telefone, este londrino de 52 anos, agraciado em 2004 com o título de Sir pela Rainha Elizabeth II, explica como imagina o futuro da maior de todas as redes e decreta:

A Web Semântica será muito mais poderosa do que tudo o que conhecemos.

O que vem a ser a Web Semântica?

O modo mais simples de explicar é: no seu computador você tem seus arquivos, os documentos que você lê, e existem arquivos de dados como agendas, programas de planejamento financeiro, planilhas de cálculo. Estes programas contêm dados que são usados em documentos fora da web. Eles não podem ser colocados na web.

Um exemplo: você está procurando uma página na web para encontrar uma palestra que quer assistir ou um evento que quer participar. O evento tem um local e um horário e pessoas associadas a ele. Mas você precisa ler a página da web ao mesmo tempo em que abre a sua agenda para inserir as informações. Se quiser achar novamente aquela página, terá que digitar o seu endereço para ela voltar até ela. Se quiser os detalhes corporativos das pessoas, terá que cortar e colar as informações de uma página na web para dentro da sua agenda, porque o arquivo da sua agenda e os arquivos de dados originais não estão integrados com os dados na web. Assim, a Web Semântica trata da integração desses dados.

Quando você usa um aplicativo, deveria poder inserir seus dados de modo a poder configurá-los, informando o computador: “Eu vou nesta reunião”.

Quando dissesse isso, a máquina iria entender os dados. A Web Semântica é sobre a colocação de arquivos de dados na web. Não é apenas uma web de documentos, mas também de dados. A tecnologia de dados da Web Semântica terá muitas aplicações, todas interconectadas.

Pela primeira vez haverá um formato comum de dados para todos os aplicativos, permitindo que os bancos de dados e as páginas da web troquem arquivos.Mas, afinal, qual é a diferença entre uma web de documentos e outra de dados? Existem muitas diferenças. Pegue, por exemplo, os seus dados financeiros. Existem duas formas de observá-los. Se olhar numa página normal na web, eles parecem com uma folha de papel. A única coisa que se pode fazer é lê-los. Mas se observá-los num site da Web 3.0, você poderá, por exemplo, usar um mecanismo de busca para alterar a ordem dos dados, obtendo desta forma um acesso muito melhor aos mesmos.

Hoje, antes de realizar uma tarefa como pagar seus impostos, você precisa de um programa de gerenciamento financeiro. Ao fazê-lo, os dados não são carregados como uma página na web, mas como arquivos de dados. Esta é a diferença entre documentos e dados. Quando você procura documentos nos seus dados bancários, só é possível lê-los. Quando procura dados, pode descobrir o quanto de impostos está devendo ou qual é o total das contas a pagar. Não podemos fazer isso na web atual. Se fosse possível, as informações reunidas nos seus dados bancários seriam convertidas num padrão que só funcionaria com bancos.

Mas haverá padrões totalmente diferentes, padrões para uso em agendas, por exemplo. Hoje não se pode perguntar ao computador: “Quando foi que eu preenchi este cheque? Qual é o nome da função? Quando eu fui naquela reunião?” Não se podem conectar itens em diferentes arquivos de dados, a não ser que se use a Web Semântica. Ela é muito mais poderosa, porque nela é possível conectar dados sobre pessoas que tenham a ver com um determinado local e um determinado momento.

Mas esta integração completa entre dados pessoais, empresariais e governamentais não pode levar a uma invasão de privacidade?

Sim. Eu também tenho este medo! Um aspecto importante da Web Semântica se chama provenance. Esta palavra é um código que define de onde vêm os dados e o que pode ser feito com eles. Os padrões da Web Semântica permitem que se defina como você deseja manipular os dados aos quais tem direitos de acesso. Estamos desenvolvendo no MIT sistemas para mostrar, sem sombra de dúvidas, quais são os usos permitidos para as informações, de modo que se possa checar de onde elas vêm e o que significam, tendo-se a certeza de que não serão usadas em nenhuma forma não autorizada.

Mas não é preciso ter um mínimo de conhecimento técnico para definir estas preferências, o que não é o caso da maioria da população mundial?

Em primeiro lugar, quando se usa a Web Semântica para dados pessoais, eles não são colocados na internet aberta. Existe dentro do seu computador uma web pessoal para os dados da sua vida, para serem navegados localmente. No caso de softwares de planejamento financeiro, os sistemas dos bancos navegam através da rede no interior de um canal seguro e são executados localmente, no PC. Não se usa tecnologia de web. Seus dados pessoais não estão na internet. O que estamos falando é permitir ao usuário combinar as informações pessoais e empresariais a que tem direitos de acesso com informações públicas de modo a criar um conteúdo muito mais rico. Sobre o fato das pessoas precisarem de algum conhecimento técnico, isso às vezes é verdade. Mas no caso de uma agenda estamos manipulando dados, certo? Quando você usa uma agenda de endereços você está criando dados. Estes programas possuem interfaces amigáveis que permitem uma utilização sem grandes problemas, a menos que se usem programas incompatíveis. Estas interfaces foram desenhadas para facilitar o seu emprego pelo usuário comum. Estamos trabalhando para tornar esta tecnologia disponível àqueles que quiserem manipular documentos nas empresas. É verdade que não existe ainda tecnologia de Web Semântica que seja facilmente utilizável por pessoas idosas ou crianças.

Mas no MIT temos um grupo de pesquisadores trabalhando exatamente nisso, produzindo programas que permitam ao cidadão comum ler, escrever e processar os seus próprios dados.

Foi você quem formulou o termo Web Semântica? É a mesma coisa que a Web 3.0? Qual é a diferença entre a Web 2.0 e a 3.0?

Sim, fui eu. Foi em 1999, no meu livro "Weaving the Web" (Tecendo a Teia). A Web 2.0 é um nome para descrever como operam os arquivos usados na web. Com relação ao conteúdo gerado pelos usuários, isso ocorre quando as pessoas acessam web sites e classificam (tagging) informações, sobem uma fotografia ou constroem sites comunitários.

A Web 2.0, portanto, é baseada em sites comunitários. Mas não fui eu quem inventou este termo. Foi Tim O’Reilly, em 2005.Sobre a Web 3.0, algumas pessoas usam este termo para definir uma nova arquitetura de dados. Já outras usam como uma forma de regulamentação da tecnologia da web. Mas considere o futuro da tecnologia da web. Um problema típico bem conhecido dos arquivos 2.0 é que seus dados não se encontram num site, mas num banco de dados. Eles não estão na web, não podem ser manipulados. Pegue por exemplo um site profissional com informações sobre os seus colegas de trabalho, um outro site com informações sobre os seus amigos, além de sites de diferentes comunidades. Na Web 2.0 você não pode enxergar o quadro completo; ninguém pode ver o quadro completo. É por isso que algumas pessoas dizem que a Web 3.0 será uma realidade quando os sites exibirem dados que possam ser manipulados.Vejamos um outro exemplo: se um determinado site encontra informações úteis sobre os meus amigos no meu blog, então eu posso definir um ícone para informar ao meu computador: “extraia estes dados, analise-os e os adicione aos dados que tenho de outros sites, para então exibi-los todos juntos”.Quando a Web Semântica atingir todo o seu potencial, ela desencadeará um segundo boom da internet?Bem, sob certo ponto de vista isso já está acontecendo. Mas eu não acho que a web já atingiu todo o seu potencial, e ela já está aí faz quase 16 anos. A Web Semântica irá decolar quando as pessoas começarem a colocar links públicos de dados na web, adicionando dados e arquivos pessoais. Mas acredito que ainda vai levar muitos anos, porque muita coisa terá que ser feita para torná-la uma realidade.


O que é a Neutralidade na Net? Qual é a sua posição com relação a isto?

Trata-se do seguinte: quando você e eu pagamos para nos conectar na internet, podemos nos comunicar não importando quem quer que nós sejamos. O que mais chama atenção hoje na rede são os vídeos. Eles estão tomando conta da net. Uma empresa como o YouTube atrai muita atenção porque transmite vídeo pela web, aproveitando-se do fato de que, em muitas regiões do mundo, a largura de banda está se tornando cada vez maior.
Agora suponha que eu esteja em Massachusetts, seja um fã de cinema independente e queira encontrar um filme brasileiro. Eu entro na internet para procurar no Brasil os meus diretores e filmes independentes prediletos. Mas de repente o provedor de acesso em Massachusetts bloqueia a transmissão dizendo: “Não vamos deixar você fazer isso, porque nós vendemos filmes. Sim, nós fornecemos a você acesso à internet, mas impedimos que assista filmes.

Queremos controlar quais filmes você compra.”Eu já vi empresas de tevê a cabo tentarem impedir o uso de ligações telefônicas na internet. Isso me preocupa. Eu não quero que isso aconteça. Acredito ser muito importante manter a internet aberta para quem quer que seja. É isso que chamamos de Neutralidade na Net. É imprescindível preservá-la para o futuro.Em 2003, o governo brasileiro ao lado de outras nações propôs uma administração internacional para a internet, espelhada nos exemplos da União Européia e das Nações Unidas. Será que algum dia Washington irá permiti-lo?

Acredito que a internet irá se burocratizar aos poucos.

Isso é inevitável. É importante permitir que as pessoas de diversos países, dos países emergentes, desenvolvam o seu uso da internet o mais rápido possível. Mas a administração de algo tão grande nunca poderá ser controlada por uma burocracia única. Não sei que forma essa burocracia assumirá, já que existe muita política envolvida. Mas penso que seria importante manter a rede livre da ação dos governos e sem censurar as pessoas que a utilizam.

Certa vez você disse que criou a web para resolver uma frustração que tinha no CERN – o Conselho Europeu para a Pesquisa Nuclear, em Genebra. Como foi isso?

O CERN possui uma maravilhosa diversidade de culturas, porque gente de todo o mundo vai lá para pesquisar física. Em 1989, antes de existir a web, eu escrevi um memorando explicando como ela seria. Eu mencionava o sistema de hipertextos e a World Wide Web como um método para agregar e editar dados. Eu queria que todas as informações na rede do CERN pudessem ser facilmente acessáveis.

Queria desenvolver ferramentas para permitir às pessoas produzir e usar informações de forma colaborativa.

A primeira ferramenta foi um editor de web que permitia aos pesquisadores do CERN usar um documento, editá-lo e alterá-lo para então enviá-lo, inserindo links entre as páginas da web e documentos científicos. Minha frustração era que eu queria trabalhar com pessoas de países diferentes, usando máquinas diferentes, operando bancos de dados diferentes e distribuindo dados em formatos diferentes. A web forneceu um padrão para tudo isso.

Muitos pesquisadores ganharam milhões com a web, mas você preferiu continuar desenvolvendo padrões. Não acha que perdeu a chance de uma vida por não criar uma web proprietária?

Não, não acho, porque se ela fosse proprietária as pessoas não teriam usado nem contribuído para o seu crescimento. Ela não teria decolado e nós não estaríamos conversando agora.Empreendedores como Nova Spivak e o co-fundador da Microsoft, Paul Allen, trabalham com uma linha do tempo que prevê o advento da Web 3.0 em 2010 e até mesmo uma futura Web 4.0 em 2020. Consegue imaginar como seria esta Web 4.0?(Risos) Não, eu não consigo. Eu estudo tecnologia real. Eu não inventei a palavra Web 3.0 (ela surgiu pela primeira vez num blog em janeiro de 2006).

A web está em constante evolução. Na Web 2.0 existem tecnologias, como o JavaScript, que surgiram e se tornaram padrões por auxiliar as pessoas em suas tarefas. A maioria dos padrões que estão surgindo agora dará um grande impulso a iniciativas como a web móvel, que é o uso da web nos mais diversos dispositivos.No futuro teremos a Web Semântica que permitirá muitas outras coisas. Uma das características mais poderosas das tecnologias de rede como a internet, a web ou a Web Semântica é que as coisas que conseguimos fazer vão muito além da imaginação de seus criadores. Pegue, por exemplo, os inventores do TCP/IP (Transmission Control Protocol-Internet Protocol), os protocolos originais para a comunicação entre computadores na internet, criados por Vinton Cerf e Robert Kahn em 1974.

Como eles imaginariam que aqueles protocolos iriam se tornar a maior de todas as redes?

Quando inventei a web, pensava nela como uma infra-estrutura, como uma fundação para muitas outras coisas. A Web 2.0 permitiu o surgimento das redes sociais e muitos outros serviços. Quando a Web Semântica surgir daqui alguns anos, os usuários irão utilizá-la em formas que ainda não podemos prever. Por isso é uma bobagem tentar imaginar como será uma Web 4.0 quando nem sabemos o que será feito na 3.0.As pessoas que a estudam a Web 3.0 terão que desenvolver idéias para fazer esta nova tecnologia ter sucesso. Eles irão projetar coisas fantásticas, assim como os pesquisadores da Web 2.0 estão desenhando coisas fantásticas neste instante. Quem trabalhar com a Web Semântica irá fazer coisas muito mais poderosas. Não podemos imaginar como elas serão. Mas temos que construir a web para ser uma infra-estrutura. Ela nunca deverá ser usada para propósitos particulares. Somente como uma fundação para futuros desenvolvimentos.