Criador do YouTube inicia ação coletiva contra OpenAI por transcrições não consentidas
YouTuber processo OpenAI por lucros não compensados com uso de dados de vídeo
Um criador do YouTube está liderando uma ação coletiva contra a OpenAI, alegando que a empresa forneceu milhões de transcrições de vídeos do YouTube para treinar seus modelos de IA generativa sem concessão ou remuneração para os proprietários dos vídeos.
David Millette, um criador de Massachusetts, iniciou a reclamação na sexta-feira passada no Tribunal Distrital dos EUA para o Distrito Norte da Califórnia. Representada pelo escritório de advocacia Bursor and Fisher, Millette acusa a OpenAI de ter transcrito secretamente seus vídeos, bem como os de outros criadores, para modelos alimentares como o ChatGPT, utilizados em produtos de IA generativa da empresa. Segundo a reclamação, a OpenAI lucrou significativamente com o trabalho dos criadores enquanto violava tanto a lei de direitos autorais quanto os termos de serviço do YouTube, que proíbe o uso de vídeos para aplicações fora da plataforma.
“À medida que os produtos de IA da OpenAI se tornam mais sofisticados com o uso de conjuntos de dados de treinamento, eles se valorizam para usuários atuais e potenciais, que compram assinaturas para acessá-los”, afirma a sinceridade. “No entanto, muito do material nos conjuntos de dados da OpenAI foi copiado sem autorização, crédito ou compensação.”
Millette está buscando um julgamento com júri e mais de US$ 5 milhões em danos para todos os usuários do YouTube cujos dados podem ter sido obtidos pela OpenAI para treinamento.
Modelos de IA generativa, como os da OpenAI, operam com base em grandes volumes de dados de treinamento, incluindo transcrições de vídeos. Enquanto as empresas defendem o uso justo desses dados obtidos de fontes públicas, muitos detentores de direitos autorais contestam essa prática com ações legais para interromper tais usos.
As transcrições de vídeo foram cruciais para o treinamento de modelos de IA generativa, especialmente à medida que outras fontes de dados se tornam mais restritas. Estudos indicam que mais de 35% dos principais sites competitivos demonstraram os rastreadores da web da OpenAI, e aproximadamente 25% dos dados de alta qualidade foram restritos de conjuntos de dados principais usados para treinamento de IA.
Em abril, o The New York Times noticiou que a OpenAI utilizou seu modelo Whisper para transcrever mais de um milhão de horas de vídeos do YouTube, usado para treinar modelos como o GPT-4. Essa prática foi comunicada entre funcionários e observadores sobre a conformidade com as políticas do YouTube.
Em resposta à crescente demanda por dados de treinamento, outras empresas como Anthropic, Apple, Salesforce e Nvidia também utilizam transcrições de vídeos do YouTube em seus modelos de IA generativa, às vezes sem o conhecimento ou consentimento dos criadores originais.
Entramos em contato com a OpenAI e o Google para comentários sobre a ação coletiva e atualizaremos este artigo com suas respostas.
Recentemente, Elon Musk, CEO da Tesla e da X, também moveu um processo contra a OpenAI e seu CEO, Sam Altman, alegando desvio da missão original sem fins lucrativos da empresa e práticas questionáveis.
LINKS RELACIONADOS
- O Dojo da Tesla: O coração da revolução autônoma de Elon Musk
- Warren Buffett surpreende ao reduzir participação na Apple em 50%
Inscreva-se no canal Geek TV, o canal oficial do Geek Fusion no YouTube e acompanhe nossos conteúdos e produções de parceiros. Siga-nos também no Facebook, Instagram e X, para ficar por dentro das novidades que preparamos especialemnte para você!
Tem uma dica de notícia ou quer entrar em contato conosco diretamente? Então faça contato através do e-mail
Vitor Virtuoso Mendes
FenryrFrost