O proprietário do Tumblr está fechando acordos com OpenAI e Midjourney para dados de treinamento, diz relatório

Marcos Paulo Tecnologia 27 Fevereiro 2024

O proprietário do Tumblr e do WordPress.com está em negociações com as empresas de IA Midjourney e OpenAI para fornecer dados de treinamento extraídos das postagens dos usuários, alega um relatório da 404 Media . O relatório, baseado em uma fonte anônima dentro da empresa, afirma que os acordos entre a Automattic e as duas empresas de IA são “iminentes”. Isso segue rumores nebulosos que se espalharam no Tumblr na semana passada, sugerindo que um acordo com a Midjourney poderia fornecer um novo fluxo de receita para o site.

De acordo com o relatório do 404 , a Automattic planeja lançar uma nova configuração na quarta-feira que “permitirá aos usuários cancelar o compartilhamento de dados com terceiros, incluindo empresas de IA”. Mas cita postagens internas que sugerem que a empresa fez um “despejo de dados inicial” contendo “todo o conteúdo de postagens públicas do Tumblr entre 2014 e 2023”, incluindo – aparentemente por engano – conteúdo que não seria publicamente visível em blogs. Não está claro o que foi feito com esses dados e quais dados (se houver) foram enviados para Midjourney e OpenAI.

A Automattic direcionou para uma declaração pública publicada na terça-feira após o relatório do 404 . A postagem, intitulada “Protegendo a escolha do usuário”, alude a parcerias com empresas de IA não identificadas. “Atualmente, bloqueamos, por padrão, os principais rastreadores de plataformas de IA – incluindo aqueles das maiores empresas de tecnologia – e atualizamos nossas listas à medida que novas são lançadas”, diz ele, e “compartilharemos apenas conteúdo público hospedado no WordPress.com e no Tumblr de sites que não cancelaram.” Prossegue, observando que “também estamos trabalhando diretamente com empresas selecionadas de IA, desde que seus planos estejam alinhados com o que interessa à nossa comunidade: atribuição, opt-outs e controle”.

Várias empresas fecharam acordos com fabricantes de ferramentas de IA para fornecer dados de treinamento – que historicamente foram extraídos de dados online disponíveis publicamente, um processo que se tornou legalmente mais arriscado nos últimos anos. O Reddit supostamente tem um acordo anual de US$ 60 milhões com o Google, enquanto a Shutterstock assinou um acordo com a OpenAI para treinar em sua biblioteca de fotos. Mas vários artistas e escritores – em outras palavras, a comunidade criativa que o Tumblr atende em particular – protestaram contra o fato de seu trabalho ser usado para treinamento. As empresas têm lutado para equilibrar a satisfação dos usuários e a experimentação de novas ferramentas de IA, levando a reações contra espaços online como o DeviantArt , que flertaram com a tecnologia.

Por enquanto, não há muita informação sobre o que qualquer acordo implicaria, nem quanto a Automattic tem a ganhar com isso. A empresa tem um negócio de hospedagem na web de longa data com WordPress.com e WordPress VIP, ambos desenvolvidos com base no software WordPress de código aberto. Mas tem lutado com uma variedade de métodos para monetizar o Tumblr – que adquiriu da Verizon em 2019 – e anunciou que reduziria suas ambições para o site no ano passado.

Com informações do The Verge.

Inscreva-se no canal Geek TV, o canal oficial do Geek Fusion no YouTube e acompanhe nossos conteúdos e produções de parceiros. Siga-nos também no Facebook, Instagram e X, para ficar por dentro das novidades que preparamos especialemnte para você!

Tem uma dica de notícia ou quer entrar em contato conosco diretamente? Então faça contato através do e-mail Este endereço de email está sendo protegido de spambots. Você precisa do JavaScript ativado para vê-lo..