Svoboda | Graniru | BBC Russia | Golosameriki | Facebook
Hlavní navigace

Vytrénovali jste ChatGPT a Bing nelegálně na našich datech. New York Times žalují OpenAI a Microsoft

27. 12. 2023

Sdílet

AI - OpenAI - Micrtosoft - New York Times - soud - autorska prav Autor: David Slížek s využitím DALL-E 3

Ve Spojených státech se rýsuje první spor velkého média s vývojáři velkých jazykových modelů a AI chatbotů. Žalobu na firmy OpenAI (tvůrce chatbota ChatGPT) a Microsoft (tvůrce chatbota Bing Copilot, založeného na velkém jazykovém modelu OpenAI) podalo vydavatelství stojící za deníkem New York Times (NYT).

Ve své stížnosti (PDF v angličtině) tvrdí, že společnost OpenAI použila k trénování svých modelů a chatbotů nelegálně a bez zaplacení texty z New York Times, čímž měla vydavateli způsobit velké škody. Vydavatel proto žádá soud o přiznání náhrady škod a také o zničení modelů, které obsahují texty z New York Times.

Podle žaloby také Microsoft využil data ze svého vyhledávače, který prohledává a kategorizuje obsah NYT, a na jejich základě v chatbotech poskytuje i úryvky a sumarizace z článků, které jsou výrazně delší a podrobnější než výtahy poskytované vyhledávači.

Vydavatel také uvádí, že se od dubna 2023 pokoušel s firmami vyjednat dohodu o tom, že by za svolení s používáním obsahu platily licenční poplatky. Jednání ale skončila bez dohody.

První velký vydavatel oznámil partnerství s OpenAI, ChatGPT nabídne zprávy z Politico či Bildu Přečtěte si také:

První velký vydavatel oznámil partnerství s OpenAI, ChatGPT nabídne zprávy z Politico či Bildu

Spor může pomoci v USA určit hranice tzv. řádného užití (fair use), což je právní princip, který za určitých podmínek povoluje užití autorsky chráněných materiálů bez souhlasu držitele autorských práv. OpenAI a Microsoft se podle New York Times na tento princip odvolávají a tvrdí, že texty využívají k tzv. transformativnímu účelu. Tím je podle amerického práva takové použití, které k dílu přidává něco nového a nenahrazuje původní účel užití díla. 

Podle NYT ale OpenAI a Microsoft využívají texty z deníku k natrénování jazykových modelů, které uživatelům slouží právě jako náhrada mediálního obsahu a listu ubírají čtenáře.

Společnost OpenAI podle vydavatele použila texty NYT mimo jiné v rámci datasetů WebText a WebText 2, které firma používala při trénování svých jazykových modelů. Například u datasetu WebText OpenAI uvádí doménu nytimes.com jakou pátý největší zdroj dat

Vydavatel v žalobě ukazuje také případy, kdy chatbot cituje pasáže z textů, které jsou jinak dostupné jen platícím uživatelům NYT, nebo momenty, kdy vyhledávače doplněné AI chatbotem parafrázují uživatelům části aktuálních zpráv deníku nebo je přímo kopírují. I když je u úryvku uveden odkaz, uživatel už obvykle získal dostatek informací a má menší důvod číst zprávu u zdroje, než když mu odkaz nabídne klasický vyhledávač, dodává NYT.

Našli jste v článku chybu?
  • Aktualita je stará, nové názory již nelze přidávat.

Byl pro vás článek přínosný?

Autor aktuality

Šéfredaktor Lupa.cz a externí spolupracovník Českého rozhlasu Plus. Dříve editor IHNED.cz, předtím Aktuálně.cz a Českého rozhlasu. Najdete mě na Twitteru nebo na LinkedIn

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).