Vytrénovali jste ChatGPT a Bing nelegálně na našich datech. New York Times žalují OpenAI a Microsoft

27. 12. 2023

AI - OpenAI - Micrtosoft - New York Times - soud - autorska prav

Autor: David Slížek s využitím DALL-E 3

Ve Spojených státech se rýsuje první spor velkého média s vývojáři velkých jazykových modelů a AI chatbotů. Žalobu na firmy OpenAI (tvůrce chatbota ChatGPT) a Microsoft (tvůrce chatbota Bing Copilot, založeného na velkém jazykovém modelu OpenAI) podalo vydavatelství stojící za deníkem New York Times (NYT).

Ve své stížnosti (PDF v angličtině) tvrdí, že společnost OpenAI použila k trénování svých modelů a chatbotů nelegálně a bez zaplacení texty z New York Times, čímž měla vydavateli způsobit velké škody. Vydavatel proto žádá soud o přiznání náhrady škod a také o zničení modelů, které obsahují texty z New York Times.

Podle žaloby také Microsoft využil data ze svého vyhledávače, který prohledává a kategorizuje obsah NYT, a na jejich základě v chatbotech poskytuje i úryvky a sumarizace z článků, které jsou výrazně delší a podrobnější než výtahy poskytované vyhledávači.

Vydavatel také uvádí, že se od dubna 2023 pokoušel s firmami vyjednat dohodu o tom, že by za svolení s používáním obsahu platily licenční poplatky. Jednání ale skončila bez dohody.

Spor může pomoci v USA určit hranice tzv. řádného užití (fair use), což je právní princip, který za určitých podmínek povoluje užití autorsky chráněných materiálů bez souhlasu držitele autorských práv. OpenAI a Microsoft se podle New York Times na tento princip odvolávají a tvrdí, že texty využívají k tzv. transformativnímu účelu. Tím je podle amerického práva takové použití, které k dílu přidává něco nového a nenahrazuje původní účel užití díla.

Podle NYT ale OpenAI a Microsoft využívají texty z deníku k natrénování jazykových modelů, které uživatelům slouží právě jako náhrada mediálního obsahu a listu ubírají čtenáře.

Společnost OpenAI podle vydavatele použila texty NYT mimo jiné v rámci datasetů WebText a WebText 2, které firma používala při trénování svých jazykových modelů. Například u datasetu WebText OpenAI uvádí doménu nytimes.com jakou pátý největší zdroj dat.

Vydavatel v žalobě ukazuje také případy, kdy chatbot cituje pasáže z textů, které jsou jinak dostupné jen platícím uživatelům NYT, nebo momenty, kdy vyhledávače doplněné AI chatbotem parafrázují uživatelům části aktuálních zpráv deníku nebo je přímo kopírují. I když je u úryvku uveden odkaz, uživatel už obvykle získal dostatek informací a má menší důvod číst zprávu u zdroje, než když mu odkaz nabídne klasický vyhledávač, dodává NYT.

Našli jste v článku chybu?

Zasílat nově přidané názory e-mailem

Aktualita je stará, nové názory již nelze přidávat.

Podle hodnocení
Podle vláken
Nejnovější

27. 12. 2023 23:31

Mr. McFly

Neměli by v NYT platit Microsoftu, že v Bingu umožňuje vyhledat jejich články a videa, tedy jim přináší čtenáře?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 12. 2023 23:14

Uncaught ReferenceError:

ale to tak dělají, jak uvádějí v žalobě, byla použita i data, která nejsou veřejná a jsou dostupná pouze po zaplacení.

Pokud děláš obsah pro někoho, kdo za něj platí, asi prostě chceš, aby se k obsahu někdo dostal, ne?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 12. 2023 21:12

horde

to bude zajímavé, jak to dopadne.. může to být opravdu docela dobrý precedens v anglosaském právu. Jako laika mě napadá, když existuje už dnes v rámci web kodu robots-donotfollow .. tak bych si dokázal představit i podobnou formulaci aiLM-donotscrap .. donotfollow.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 12. 2023 14:33

Mr. McFly

A kdyby se Bing rozhodl - raději než platit - obsah NYT nezobrazovat a neindexovat, to by bylo ze strany NYT nářků, možná by i žalobička padla. V USA je možné vše. :-)
28. 12. 2023, 14:33 editováno autorem komentáře
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 12. 2023 22:41

Ja_uz_budu_hodny_dedecku

Dodnes jsem nepochopil ten opacny princip. Tedy ze pokud nechci tak musim zamezit robotum prihoedavat web misto toho aby zakaz vyl automaticky a jen v pripade zajmu to povolim…
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 12. 2023 21:33

home-service

NYTimes, onen levicový (probidenovský) deník, pokud má problémy s tím, že někdo se dostane k jeho textům, nic mu nebrání své výstupy (texty a články šifrovat), tak aby se k nim nikdo nedostal.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 12. 2023 13:47

martyd420

Tak v eu bude řevu... A jinak prostě vzniknou alternativní uložta, pardon, vyhledávače... mimo dosah EU a vlk se nažral a torrent tracker zůstal celý zaindexovaný :)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 12. 2023 13:25

bez prezdivky ...

Dodnes jsem nepochopil princip fungovani webu. Kdyz to neni schovanie za prihlasenim, je to verejne, a kdokoli si s tim muze delat cokoli.

Robots ma predevsim zamezit grabovani vsemoznych login stranek, administraci a dalsich veci o ktere nikdo nestoji ale cravler je neumi rozeznat od tech o ktere nekdo stoji.

Pevne doufam, ze se vyhledavace zacnou chovat tak, ze sve sluzby budou poskytovat vyhradne za penize (tedy pro ty prohledavane weby). To bude revu.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 12. 2023 22:11

marx

Ak sa nemýlim, tak to bolo trochu inak. Tie texty za paywallom boli (sú) zámerne zdarma otvorené pre vybrané crawlery (Google, Bing, ...) a zakazováne bežným použivateľom. Cieľom bolo, aby vyhľadávač o obsahu vedel, ale používateľ sa k nemu bez zaplatenie nedostal. Ak sa na túto techniku príde u iných ako "preferovaných" stránkach, tak získavajú automaticky penalizáciu.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 12. 2023 12:59

Mlocik97

Napíšem knihu (článok), mám vlastného distribútora (NYT), a nejaký iný distribútor, ktorý absolútne nedostal žiadny explicitný súhlas (Google, Bing, etc.) začne distribuovať časti tvojej knihy. Mal by si ty alebo tvoj distribútor platiť druhému distribútorovi, za to že on ti kradne obsah ale zároveň má na konci úryvkov "obsah pochádza od NYT"? Podľa mňa je tvoj argument totálne na hlavu. NYT nikdy explicitne nežiadal Bing aby ich obsah distribuoval. Vyhľadávače samé crawlujú obsah webov, a jediné čo môže vlastník webu urobiť je tam dať explicitný nesúhlas (e.g. robots-donotfollow). To ti príde v poriadku že ak nepovieš v Tescu napríklad "ja nechcem tieto cestoviny" tak ti je tam pokladní sama prihodí a zaúčtuje? Normálne distribútor platí autorovi, a zákazník distribútorovi. Nie naopak. Tu by mal práve Bing platiť NYT.
28. 12. 2023, 13:00 editováno autorem komentáře
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 12. 2023 23:29

TrSek

Ne nestezovali by se. To je jenom tvuj sen.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 12. 2023 21:57

Zek

Nic neni zadarmo, ale alespon to stihli :) Ostatni uz maji smulu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 12. 2023 22:44

pojďjsemKamjdeš

Ještě existuje varianta, že je nějaká korporace jam MŠ, Google, Apple koupí. Docela bych jim to přál a pak vidět titulek, že nějaká taková korporace kupuje ny times.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 12. 2023 17:25

MarekM

Žaloba New York Times uvádí, že OpenAI a Microsoft vykradli pro vytrénování jejich datasetu i zabezpečenou sekci, tedy nic veřejného....

Jinak bych se nedivil, kdyby vznikla možnost placeného vyhledávače, pokud to bude bez reklam, klidně si k placenému YT připlatím za Google vyhledávač bez reklam.
- Zobrazit celé vlákno

Zasílat nově přidané názory e-mailem

+16

Líbí

Nelíbí

David Slížek

Šéfredaktor Lupa.cz a externí spolupracovník Českého rozhlasu Plus. Dříve editor IHNED.cz, předtím Aktuálně.cz a Českého rozhlasu. Najdete mě na Twitteru nebo na LinkedIn.

Sdílet

První velký vydavatel oznámil partnerství s OpenAI, ChatGPT nabídne zprávy z Politico či Bildu

Byl pro vás článek přínosný?

Autor aktuality

David Slížek

Témata:

Anketa

Jakou rychlost internetové přípojky považujete pro svou potřebu za dostatečnou?

Vytrénovali jste ChatGPT a Bing nelegálně na našich datech. New York Times žalují OpenAI a Microsoft

Sdílet

První velký vydavatel oznámil partnerství s OpenAI, ChatGPT nabídne zprávy z Politico či Bildu

Byl pro vás článek přínosný?

Autor aktuality

David Slížek

Témata:

Anketa

Jakou rychlost internetové přípojky považujete pro svou potřebu za dostatečnou?

Další aktuality

Radu ČTÚ doplní Marek Vrbík, pokračuje i Lukáš Zelený

Kyberbezpečnostní zákon narazil i na vládě

NoLog spustil sedm nových nástrojů posilujících anonymitu na internetu

Poslanci řešili odvolání Xavera Veselého, debata je zatím bez výsledku

Dále u nás najdete

Únavový syndrom není lenost. Někdo končí v invalidním důchodu

Riziko rakoviny prostaty zvyšuje i špatný jídelníček

Qubity: Kvantová nadvláda pokořena běžným počítačem

Handicapované děti dostávaly k snídani radioaktivní kaši

Božena Němcová zemřela nemocná a vyčerpaná

S migrénou žila od puberty, správnou léčbu má až po letech

Láhve uvolňují škodlivé chemikálie. Mytí v myčce to zásadně zhoršuje

KVÍZ: Míša, Ledňáček, nebo Magnum. Znáte zmrzliny?

Pád na kovovou tyč ho málem stál život. Roxor jen těsně minul srdce

Video: Umělá inteligence hlídá už i třeba kvalitu výroby

Víte, kde je v těle mandibula a kolik lidí má zelené oči?

Na jizvu po císaři první dny nesahejte, radí nová příručka

Podnikáte, studujete a je vám pod 26 let? Máte nárok na výhody

Medicínské omyly: Otestujte si, co víte o lupání kloubů či vejcích

Minimální mzda dál poroste. Zvyšovat se ale bude jinak

Chystáte se do zahraničí? Víme, kolik stojí výběr z bankomatu

Na jizvu po císaři první dny nesahejte, radí ženám příručka

Oteklé a modrající prsty upozornily Evu na závažnou nemoc

Úporné bolesti ho zbavila unikátní operace, elektrody v páteři ji přeměnily v mírné brnění

Některým zaměstnancům byly sníženy příspěvky na stravování