Por Reuters
HIDERABAD / SÃO FRANCISCO (Reuters) – No ano passado, uma equipe de 260 funcionários contratados em Hiderabade, na Índia, categorizou milhões de fotos do Facebook, atualizações de status e outros dados detalhados desde 2014.
Os funcionários categorizam os itens de acordo com cinco dimensões, como o Facebook denomina.
As medidas incluem o assunto da publicação – Contém comida, por exemplo, ou um selfie ou um animal? Qual é a ocasião – uma atividade cotidiana ou um grande evento da vida? E é uma intenção do autor – planejar um evento, inspirar, fazer uma piada?
O trabalho visa entender como os padrões que os usuários publicam em seus serviços estão mudando, disse o Facebook. Isso pode ajudar a empresa a obter novos recursos, a aumentar a utilização e a receita de anúncios publicitários.
Os detalhes foram criados por vários funcionários da empresa de terceirização Wipro, durante vários meses. Os trabalhadores falaram sob condição de anonimato devido ao medo de retaliação da empresa indiana. O Facebook mais tarde confirmou muitos detalhes do projeto. A Wipro se recusou a comentar e encaminhou todas as perguntas para o Facebook.
O trabalho da Wipro está entre os cerca de 200 projetos de rotulagem de conteúdo do Facebook. Muitos projetos visam “treinar” o software que determinam o que acontece nos feeds de notícias e de sistema de inteligência artificial da rede social.
Os esforços de rotulagem não foram relatados anteriormente.
“É uma parte essencial do que você precisa”, disse Nipun Mathur, diretor de gerenciamento de produtos da AI no Facebook. “Eu não vejo a necessidade de ir embora.”
O programa de rotulagem de novos problemas de privacidade para o Facebook, de acordo com os especialistas jurídicos consultados pela Reuters. A empresa está a investigar em todo o mundo sobre um conjunto não relacionado de supostos abusos de proteção que envolvem o compartilhamento de dados de usuários associados de negócios.
Os funcionários da Wipro disseram que durante o processo de ganhar uma janela para a vida de outras pessoas, quando se vêem uma foto de férias ou uma mensagem que se lembra de um membro falecido da família. O Facebook que permitiu que fosse feita uma pequena exposição periódica de nomes de usuários.
A empresa apresentou as suas formas jurídicas e de emissão de indicativo de todos os esforços de rotulagem, acrescentando que recentemente introduziu um sistema de auditoria “para garantir que as expectativas de asilo são seguidas e as demonstrações financeiras estão activas como esperado”.
Mas um ex-gerente de privacidade do Facebook, sob a condição de anonimato, expressou-se como uma mensagem de alerta dos usuários sendo examinada uma permissão explícita deles. O Regulamento Geral de Proteção de Dados da União Europeia (GDPR) tem regras rígidas sobre as empresas coletivas e em uso de dados pessoais e, em muitos casos, através do consentimento específico.
“Uma das principais peças do GDPR é a limitação de objetivos”, disse John Kennedy, sócio do escritório de advocacia Wiggin e Dana, que trabalha com terceirização, privacidade e inteligência artificial.
A política de uso de dados do Facebook não se refere explicitamente a uma análise manual das informações dos usuários.
Se o objetivo é procurar por publicações para melhorar a precisão dos serviços da rede social, isso deve ser explicitado, disse Kennedy. Usar um fornecedor externo para fazer esse trabalho também pode exigir consentimento dos usuários, disse ele.
Ainda não está desmarcado como o GDPR será interpretado como reguladores e tomadores de férias como ações internas de rotatividade do Facebook como problemáticas. O principal executivo de privacidade de dados da Europa.
Uma porta-voz do Facebook falou “Deixamos de lado a nossa política de acesso às informações que as pessoas fazem ao Facebook para melhorar a sua experiência e precisamos de trabalhar com os prestadores de serviços para este processo”.
O senador Mark Warner, democrata e principal crítico de mídia social, disse à Reuters em comunicado que grandes plataformas estão cada vez mais “tirando cada vez mais dados dos usuários, para usos mais amplos e de maior alcance, sem qualquer compensação correspondente ao usuário”.
Warner disse que está elaborando uma legislação que exige que o Facebook “divulgue o valor dos dados dos usuários e informe aos usuários exatamente como seus dados estão sendo monetizados”.
O projeto
A rotulagem de dados foi feita por humanos, também chamada de “anotação de dados”, é uma indústria em crescimento, já que as empresas buscam aproveitar os dados para treinamento em IA e outras finalidades.
Companhias de veículos autônomos, como Waymo, do google, têm etiquetas de identidade luzes de faróis de trânsito e pedestres em vídeos para fortalecer o sistema de inteligência artificial da companhia. Editores de ajuda, que funcionam como comandos de voz, como um Amazon, utilizam as pessoas para falarem sobre o áudio dos usuários para melhorar a capacidade do sistema de decifrar a fala.
O Facebook lançou o projeto com o Wipro em abril do ano passado. A companhia indiana recebeu um contrato de 4 milhões de dólares e formou uma equipe com cerca de 260 etiquetadores, segundo os funcionários. No ano passado, o trabalho consistiu em analisar a publicação social no cotidiano anterior.
Depois de terminar esta tarefa, a equipe foi reduzida para 30 pessoas e mudou o foco para a etiqueta todo o mês publicado no mês anterior. O trabalho deve continuar pelo menos até o final deste ano, segundo os funcionários.
O Facebook confirmou como mudanças na equipe, mas não comentou sobre detalhes financeiros. A empresa está apresentando uma análise em andamento e não fornece detalhes sobre as descobertas geradas pelo trabalho de etiquetagem ou decisões do produto.
Os funcionários da Wipro e do Facebook afirmam que as publicações analisadas são uma amostragem aleatória de atualizações de textos, links compartilhados, avisos de eventos, vídeos, fotos e capturas de tela de usuários e usuários nos vários aplicativos da mensagem de rede social. As publicações analisadas foram utilizadas por usuários do Facebook e do Instagram ao redor do mundo, em idiomas que incluem inglês, hindi e árabe.
Cada item vai para dois rotuladores para verificar a precisão, e um terceiro se eles não concordarem, disse o Facebook. Os trabalhadores disseram que vêem em média 700 itens por dia. O Facebook disse que a média da meta é menor.
Facebook confirmou rotuladores em Timisoara, na Romênia, e Manila, as Filipinas estão envolvidas no mesmo projeto.
Entre os outros projetos de rotulagem do Facebook, um trabalhador de Hyderabad, da empresa de terceirização Cognizant Technology Solutions Corp, disse que ele e pelo menos 500 colegas procuram tópicos sensíveis ou linguagem profana nos vídeos do Facebook.
O objetivo é treinar uma ferramenta automatizada no Facebook que permita aos anunciantes evitar o patrocínio de vídeos que são, por exemplo, adultos ou políticos, disse o Facebook. A Cognizant não respondeu a um pedido de comentário.
Outra aplicação da rotulagem envolveu o recurso de compras do Marketplace da rede social, onde ele automatizou as recomendações de categoria para novas listagens, primeiro tendo rotuladores e especialistas em produtos categorizando algumas listagens existentes, disse Mathur, do Facebook.
Postagens privadas
Não é oferecida aos usuários do Facebook a chance de optar por não ter seus dados rotulados.
Na Wipro, as postagens que estão sendo examinadas incluem não apenas postagens públicas, mas também aquelas que são compartilhadas de maneira particular com um conjunto limitado de amigos de um usuário. Isso garante que a amostra reflita o alcance da atividade no Facebook e no Instagram, disse Karen Courington, diretora de operações de suporte ao produto no Facebook.
A política de dados do Facebook não menciona explicitamente a análise manual.
“Fornecemos informações e conteúdo a fornecedores e prestadores de serviços que apoiam nossos negócios, fornecendo serviços de infraestrutura técnica, analisando como nossos produtos são usados, prestando atendimento ao cliente, facilitando pagamentos ou realizando pesquisas”, afirma a política.
O GDPR da Europa também exige que as empresas excluam os dados do usuário mediante solicitação. O Facebook disse que tem a tecnologia para sincronizar rotineiramente mensagens com solicitações de exclusão e alterações nas configurações de privacidade do conteúdo.
O Facebook e outras empresas estão testando técnicas para reduzir a necessidade de rotulagem terceirizada, em parte para analisar mais dados de maneira mais rápida e barata. Por exemplo, dados de treinamento de IA para rankings de feed de notícias e descrições de fotos para cegos vieram de hashtags em posts no Instagram, disse Mathur, do Facebook.
“Tentamos minimizar a quantidade de coisas que enviamos”, disse ele.
Por Munsif Vengattil e Paresh Dave