Tecnologias ameaçam anonimato na web

Emily Steel e Julia Angwin, The Wall Street Journal
06/08/2010
 

Muita gente nunca ouviu falar de uma empresa chamada [x+1] Inc., mas ela sabe muita coisa sobre muita gente.

A partir de um único clique num website, a [x+1] corretamente identificou Carrie Isaac como uma jovem mãe de Colorado Springs, nos Estados Unidos, que vive com cerca de US$ 50.000 por ano, compra no Wal-Mart e aluga vídeos infantis. Também concluiu que Thomas Burney, um empreiteiro do Estado de Colorado, é um esquiador com diploma universitário e bom histórico de crédito.

A empresa não acertou todos os detalhes. Mas sua capacidade de fazer avaliações de pessoas sem saber seus nomes é tão precisa que a empresa americana de cartões de crédito Capital One Financial Corp. está usando os cálculos da [x+1] para decidir que oferta mostrar aos visitantes que acessam seu site pela primeira vez.

Em resumo: os websites estão ganhando a capacidade de decidir se você vai ou não ser um bom cliente antes mesmo que diga a eles uma única coisa a seu respeito. A tecnologia vai além da personalização praticada por sites como a Amazon.com, que usa dados próprios a respeito dos clientes para mostrar-lhes os itens de que provavelmente gostarão.

Empresas como a [x+1] fazem uso de vastas bases de dados sobre o comportamento on-line das pessoas - em sua grande parte montadas sub-repticiamente por tecnologias de monitoramento que se tornaram onipresentes nos sites internet afora. Elas cruzam esses dados com registros de imóveis, renda familiar, status conjugal e restaurantes favoritos, entre outras coisas. Aí, usando análise estatística, começam a fazer premissas sobre as inclinações de usuários individuais.

"Nós nunca não sabemos nada sobre alguém", disse John Nardone, diretor-presidente da [x+1].

A Capital One informa que não usa todos os recursos da tecnologia da [x+1] e não impede que as pessoas solicitem o cartão que quiserem. "Apesar de sugerir produtos que acreditamos ser do interesse de nossos visitantes, não limitamos a possibilidade de eles explorarem facilmente todos os produtos disponíveis", diz a porta-voz Pam Girardo.

Uma investigação do Wall Street Journal sobre privacidade on-line descobriu que a capacidade analítica de provedores de dados como a [x+1] está transformando a internet num lugar onde as pessoas conseguem ficar anônimas só no nome. A descoberta apresenta uma primeira observação de uma nova internet personalizada, em que os websites têm a capacidade de ajustar muitas coisas - a aparência, o conteúdo, os preços - com base em como eles acham que você vai se comportar.

A firma nova-iorquina Demdex Inc., por exemplo, descreve-se como um "banco de dados comportamentais" que consulta fontes que vão de registros de navegação online a compras de receitas sob prescrição médica organizadas por bairro. Ela computa os dados para personalizar o visual dos sites de varejistas de modo a aumentar o apelo às pessoas que estão visitando.

"Se identificamos um visitante como um homem em crise da meia idade, oferecemos a ele uma experiência diferente que a de uma jovem mãe com uma nova família", diz o diretor-presidente da Demdex, Randy Nicolau.

Essa tecnologia aumenta a perspectiva de que visitantes diferentes de um website possam ver preços diferentes, ou produtos totalmente diferentes. Esse tipo de discriminação de preço geralmente é legal nos EUA - considere, por exemplo, os diferentes preços que as empresas aéreas cobram por assentos no mesmo voo - desde que não seja baseado em raça ou sexo.

A tecnologia da [x+1] funciona assim: um usuário chega à página de cartões de crédito da Capital One e a [x+1] instantaneamente monitora a informação trocada entre o computador dessa pessoa e a página do site, o que pode equivaler a centenas de páginas impressas com códigos que contêm detalhes sobre o computador e seu usuário. A [x+1] também usa um novo serviço da Digital Envoy Inc. que pode determinar o código postal de onde o computador está fisicamente localizado.

Armada com esses dados, a [x+1] usa a Nielsen Co. para atribuir ao visitante uma de suas 66 categorias demográficas.

Em um quarto de segundo, a [x+1] diz que consegue acessar e analisar milhares de informações sobre um único usuário. Ela rapidamente consulta perfis similares entre os clientes já existentes da Capital One para dar um palpite sobre que ofertas de cartão de crédito devem ser mostradas ao visitante.

Para avaliar a precisão do sistema, o WSJ pediu que oito pessoas visitassem a página de cartão de crédito da Capital One e anotassem as ofertas que fossem exibidas. O WSJ também analisou o código de computador que circulou entre os computadores dos participantes e da Capital One.

Separadamente, o WSJ também pediu que os participantes clicassem num site específico que a [x+1] criou para demonstrar sua tecnologia de personalização. Depois que os participantes do teste clicaram nesse site, a [x+1] descreveu ao WSJ o que ela sabia sobre cada pessoa.

Durante todo o processo, os participantes não revelaram nenhuma informação pessoal.

As avaliações da [x+1] foram em geral precisas, embora alguns detalhes específicos tenham escapado. Por exemplo, Thomas Burney, o empreiteiro do Colorado, foi classificado como membro de um segmento da Nielsen chamado "Terra de Deus". As pessoas desse grupo vivem em pequenas cidades ou áreas rurais, têm uma mediana de renda familiar de US$ 86.724, de 35 a 54 anosde idade, sem filhos, trabalho de gerência e a maioria tem casa própria e pós-graduação.

Burney é, de fato, dono de imóvel, pós-graduado e gerente, e não tem filhos. Mas é mais novo que o previsto (28 anos) e sua renda também é menor.

Quando ele viu as 3.748 linhas de código que foram transferidas num instante entre seu computador e o site da Capital One, disse: "Há uma quantidade chocante de informação ali." Perdidas nas linhas havia referências a sua faixa de renda, educação e cidade (Avon).

De fato, a avaliação da [x+1] da localização de Burney e o segmento demográfico da Nielsen são específicos o bastante para que se fique muito perto de identificá-lo como pessoa - ou seja, de acabar com seu anonimato -, segundo Peter Eckersley, um cientista da Fundação Fronteira Eletrônica, um grupo de defesa da privacidade.

Eckersley faz pesquisa no campo da "desanonimização", a matemática de identificar as pessoas com base em apenas alguns detalhes específicos de sua vida. No jargão da área, diz Eckersley, tudo que é preciso para identificar unicamente uma pessoa é um total de 33 "bits" de informação sobre ela.

Eckersley determinou que a localização de Burney e seu segmento demográfico da Nielsen ofereciam juntos uns 26,5 bits de informação que poderiam ser usados para identificá-lo individualmente. É o suficiente para reduzi-lo a 1 de apenas 64 pessoas no mundo. Com uma informação a mais sobre ele, como sua cidade, diz Eckersley, é provável que Burney pudesse ser "desanonimizado".