Was passiert, wenn künstliche Intelligenz (KI) wie Google Gemini oder ChatGPT Online-Inhalte ohne Zustimmung nutzt, um Geld zu verdienen, während die Ersteller leer ausgehen? Genau diese Frage landet jetzt auf dem Tisch des Europäischen Gerichtshofs (EuGH). Der Fall C-250/25 könnte dadurch die Spielregeln für die gesamte KI-Branche neu definieren. Im Folgenden werden daher der zugrundeliegende Sachverhalt, die zentralen Rechtsfragen für den EuGH sowie die weitreichenden Konsequenzen für die KI-Entwicklung, die Kreativbranche aber auch den AI Act beleuchtet.
Worum es im Kern geht
Im Mittelpunkt der Auseinandersetzung steht der ungarische Presseverlag „Like Company“, der mehrere Nachrichtenportale unterhält und seine Einnahmen vorwiegend aus Werbeerlösen generiert, die von den Besucherzahlen abhängen. Demgegenüber steht Google Ireland Limited als Anbieter von KI-Diensten, namentlich des auf großen Sprachmodellen (LLM) basierenden Chatbots Google Gemini. Dieser kann, ähnlich einer Suchmaschine, Informationen bereitstellen, aber auch neue Inhalte wie Texte, Bilder oder Code generieren. Gemini greift für seine Antworten auf die Google Search Datenbank zurück und verarbeitet die Informationen durch Umwandlung in sogenannte Token (kleinste Einheiten), die anschließend wieder zusammengesetzt werden, ohne dabei direkte Kopien der erhobenen Daten zu speichern. Der Chatbot verfügt allerdings nicht über eine feste Datenbank, aus der auf Verlangen der Nutzer beliebige Inhalte abgerufen werden können. Zitiert Gemini eine längere Passage einer Webseite unmittelbar, hebt er diese Seite hervor, so dass der Nutzer mit einem Klick direkt auf die Quelle zugreifen kann.
Der Vorwurf
Gemini soll über Monate hinweg die Presseartikel des Verlags sowohl für das Training von Gemini als auch zur direkten Beantwortung von Nutzeranfragen genutzt haben. Dadurch seien die Inhalte vervielfältigt und der Öffentlichkeit zugänglich gemacht worden.
Als ein konkretes Beispiel für die behauptete Rechtsverletzung wird eine Nutzeranfrage an Gemini angeführt: „Kannst du die Pressemeldung von balatonkornyeke.hu über den Plan von Kozsó, Delphine in den See einzusetzen, auf Ungarisch Zusammenfassen?“ Gemini soll daraufhin eine detaillierte Antwort geliefert haben, die Informationen aus den Medien der Klägerin enthielt. Like Company sieht hierin einen unzulässigen Eingriff in ihre Rechte, der zu einer Minderung ihrer Werbeeinnahmen führe. Die exakte Antwort von Gemini wird im Verfahren jedoch nicht aufgeführt.
Die Knackpunkte für den EuGH: Vier Vorlagefragen
Das ungarische Gericht hat dem EuGH vier zentrale Fragen zur Auslegung des EU-Urheberrechts vorgelegt, die nun zu klären sind:
- Liegt eine öffentliche Wiedergabe iSv Art. 15 Abs. 1 DSM-RL und Art. 3 Abs. 2 InfoSoc-RL vor, wenn Chatbot-Antworten Texte aus Presseveröffentlichungen sichtbar machen (und die Texte in einem Ausmaß mit dem Inhalt identisch ist, dass er bereits unter den Schutz des Art. 15 DSM-RL fällt)? Ist es also bereits eine zustimmungspflichtige Nutzung, für die der Urheber bezahlt werden muss, auch wenn die KI den Text nicht 1:1 kopiert, sondern auf Basis von gelernten Mustern neu formuliert?
- Stellt bereits der Trainingsprozess eines LLM, der auf Mustererkennung und Abgleich von Mustern basiert, eine Vervielfältigung gem. Art. 15 Abs. 1 DSM-RL und Art. 2 InfoSoc-RL dar?
- Sollte das Training als Vervielfältigung eingestuft werden: Kann sich der Anbieter dann auf die Ausnahme für Text und Data Mining (Art. 4 DSM-RL) berufen?
- Stellt es eine Vervielfältigung durch den Anbieter eines Chatbotdiensts dar, wenn das System auf eine spezifische Nutzeranfrage hin, die sich auf eine Presseveröffentlichung bezieht, Inhalte daraus ganz oder teilweise in seinen Antworten wiedergibt?
Die gegensätzlichen Standpunkte der Parteien
Die Argumentationslinien von Like Company und Google verdeutlichen die Komplexität der Rechtslage:
- Position von Like Company: Der Verlag ist der Auffassung, dass die von Gemini generierten Antworten sowohl eine zustimmungspflichtige öffentliche Zugänglichmachung als auch eine Vervielfältigung seiner geschützten Inhalte darstellen. Die Art und der Umfang der Nutzung würden über das hinausgehen, was möglicherweise als „Nutzung einzelner Wörter oder sehr kurzer Auszüge“ gem. Art. 15 Abs. 1 DSM-RL zulässig wäre.
- Position von Google: Google bestreitet eine Rechtsverletzung. Die von Gemini erstellten Antworten seien weder eine öffentliche Wiedergabe noch eine Vervielfältigung. Entscheidend sei, dass kein „neues Publikum“ als eine Voraussetzung für eine öffentliche Wiedergabe erreicht werde, da die ursprünglichen Artikel bereits online (ohne Sichtbarkeitsschranken) für dieselbe Nutzerschaft zugänglich gewesen seien. Google betont zudem, dass die Antworten des Chatbots nicht mit den Originalartikeln identisch seien, sondern auch Informationen aus anderen Quellen und sogenannte „Halluzinationen“ enthalten, die der Natur der KI-Technologie geschuldet seien und zu gewissen Ähnlichkeiten führen können. Gemini sei als kreatives Werkzeug konzipiert und keine Datenbank, die auf Abruf spezifische, gespeicherte Inhalte wiedergebe; es nutze vielmehr Google Search zur Informationsbeschaffung und arbeite intern mit Token anstelle von direkten Kopien. Eine Auslegung des Art. 15 DSM-RL müsse auch die Informationsfreiheit der Nutzer (Art. 11 GRCh) berücksichtigen. Ferner sei ungarisches Recht auf den Trainingsprozess nicht anwendbar, da dieser nicht in Ungarn stattgefunden habe. Sollten dennoch relevante Handlungen vorliegen, seien diese durch Ausnahmetatbestände wie die für vorübergehende Vervielfältigungen (Art. 5 Abs. 1 InfoSoc-RL) oder für Text und Data Mining (Art. 4 DSM-RL) gedeckt.
Zu den Vorlagefragen
- Zur 1. Frage: Ein KI-Chatbot stellt Inhalte nicht nur über einen Link (bspw. Hyperlink) bereit, sondern verweist allenfalls auf die jeweilige Webseite, während er eine neue Darstellung generiert und macht hierdurch die Inhalte der Webseite direkt zugänglich. Er schafft damit einen neuen Zugangsweg zu den Informationen, der sich von der ursprünglichen Veröffentlichung auf der Webseite des Presseverlags unterscheidet. Problematisch ist hierbei insbesondere das Zusammenspiel der Google-Suchmaschine und dem Gemini-LLM, das die gefundenen Inhalte “liest” und die für die Nutzeranfrage wichtigen Inhalte extrahiert und anschließend den Text (hier also die Antwort auf die Frage zu den Delfinen) generiert. Durch dieses Zugreifen auf externe Inhalte, werden die dem Modell innewohnenden Wahrscheinlichkeiten (welches Wort als nächstes generiert werden soll) dahingehend modifiziert, dass die fachspezifischen Informationen, die es durch die Suchmaschinen-Abfrage erlangt hat, höher gewichtet und in der Antwort bevorzugt werden. Dies kann dazu führen, dass der LLM-Output wesentlich auf den gefundenen Texten basiert und folglich eine öffentliche Wiedergabe im obigen Sinne darstellen könnte.
- Zur 2. Frage: Nach der weiten Auslegung des Vervielfältigungsbegriffs durch den EuGH in anderen Entscheidungen, können selbst temporäre Nutzungen von Werken im Arbeitsspeicher oder auf dem Server eines Service-Providers Vervielfältigungen sein. Wie oben beschrieben, werden zwar die Daten bei Gemini in Token umwandelt und keine Kopien gespeichert. Der „Tokenisierungsprozess“ beinhaltet jedoch möglicherweise bereits selbst Vervielfältigungshandlungen. Um Text zu tokenisieren, muss der Text zuerst abgerufen und verarbeitet werden, was impliziert, dass er in den Speicher kopiert wird. Die anschließende Erstellung von Token aus Text ist eine Form der Transformation, die mit einer zumindest vorübergehenden Vervielfältigung des Originaltextes beginnt. Selbst wenn das endgültige Modell aus Gewichten und Parametern und nicht aus wörtlichen Kopien der Trainingstexte besteht, beinhaltet der Prozess zur Erlangung dieser Parameter möglicherweise Vervielfältigungen der Eingabedaten.
- Zur 3. Frage: Im Grundsatz erfordert die Verwendung eines urheberrechtlich geschützten Werkes für das KI-Training die Zustimmung des jeweiligen Rechteinhabers, da dieser Prozess eine Vervielfältigung des Werkes darstellt. Die Bestimmungen zum TDM erlauben ein solches Vorgehen für wissenschaftliche Forschungszwecke ohne explizite Zustimmung. Für andere Zwecke, einschließlich kommerzieller Nutzungen, gestatten diese Regelungen TDM unter der Bedingung, dass der Rechteinhaber nicht ausdrücklich einen Nutzungsvorbehalt (Opt-Out) erklärt hat. Eine Berufung auf die Wissenschaftlichkeit scheitert vermutlich an dem gewinnorientierten Einsatz von Gemini.
Im Kontext künstlicher Intelligenz ist noch ungeklärt, ob die Anwendbarkeit der TDM-Ausnahme zu bejahen ist. Allerdings spricht vieles dafür, dass KI-Systeme, deren Funktionalität über die bloße Identifizierung von Mustern, die Erkennung von Trends oder die Erstellung von Prognosen hinausgeht und stattdessen eigenständige kreative Ergebnisse (wie es auch aus den Vorlagefragen hervorgeht) wie Texte, Bilder, Filme oder Code erzeugen, nicht von der urheberrechtlichen Privilegierung durch die TDM-Regelungen erfasst sind.
- Zur 4. Frage: Diese Frage zielt u. a. auf die Zurechnung der Vervielfältigungshandlung ab: Ist der Anbieter (Google) für die Vervielfältigung verantwortlich, die auftritt, wenn der Chatbot eine Antwort basierend auf einem Nutzer-Prompt generiert, insbesondere wenn diese Antwort Teile einer Presseveröffentlichung enthält? Der Prompt des Nutzers fungiert als Auslöser und aktiviert eine vorprogrammierte Fähigkeit, der Chatbot generiert dann autonom die Ausgabe. Der Chatbot-Anbieter entwirft also das System, trainiert es (möglicherweise mit rechtsverletzenden Daten) und stellt es mit dem Wissen zur Verfügung, dass es Ausgaben auf der Grundlage bestehender Werke generieren kann. Daher könnte der EuGH feststellen, dass der Anbieter tatsächlich für die Vervielfältigung verantwortlich ist, die dadurch entsteht, dass Webseiten-Auszüge derart umfangreich sind (und über die eng ausgelegte Ausnahme zur Nutzung einzelner Wörter hinausgehen), dass potenzielle Nutzer nicht mehr auf die ursprüngliche Quelle zugreifen.
Weitreichende Konsequenzen
Die Entscheidung des EuGH wird je nach Ausgang des Verfahrens weitreichende Konsequenzen haben.
Für die KI-Entwicklung: Ein für Like Company günstiges Urteil könnte Änderungen in der Art und Weise erforderlich machen, wie LLMs trainiert werden (z.B. strengere Überprüfung der Datenherkunft und Beachtung von Opt-Outs) und wie sie Ergebnisse generieren/anzeigen (z.B. klarere Quellenangaben, Maßnahmen zur Vermeidung der Vervielfältigung geschützter Inhalte).
Für Verlage und weitere Kreativschaffende: Ein für Like Company günstiges Urteil könnte die Verhandlungsposition gegenüber KI-Entwicklern hinsichtlich der Lizenzierung von Inhalten und der Erzielung von Vergütungen gemäß Art. 15 DSM-RL erheblich stärken. Es könnte auch beeinflussen, wie Inhalte online verfügbar machen gemacht werden (z.B. verstärkte Nutzung technischer Schutzmaßnahmen oder die Anforderungen an Opt-Outs).
Das Zusammenspiel mit dem AI Act: Zudem werden die Äußerungen des EuGH zu Themen wie TDM und Transparenz die praktische Anwendung und Auslegung der urheberrechtsbezogenen Bestimmungen des AI Acts beeinflussen.
Der AI Act sieht spezifische Transparenzpflichten für Anbieter von KI-Modellen vor, insbesondere für sogenannte Allzweck-KI-Modelle (GPAI-Modelle). Gemäß Art. 53 Abs. 1 lit. c AI Act sind Anbieter verpflichtet, Strategien zu implementieren, um die Einhaltung des Urheberrechts der Union sicherzustellen. Dies schließt explizit die Beachtung von Nutzungsvorbehalten (Opt-Outs) durch Rechteinhaber ein, wie sie in Art. 4 Abs. 3 DSM-RL für das Text und Data Mining vorgesehen sind. Die Erwägungen des EuGH zur Anwendbarkeit und Reichweite der TDM-Ausnahme und des damit verbundenen Opt-Out-Mechanismus werden unmittelbar relevant für die Pflicht der KI-Anbieter nach dem AI Act, solche Nutzungsvorbehalte zu beachten.
Darüber hinaus fordert Art. 53 Abs. 1 S. 1 lit. d AI Act von den Anbietern, eine „hinreichend detaillierte Zusammenfassung“ der für das Training des Modells verwendeten Inhalte zu veröffentlichen. Diese Zusammenfassung soll u. a. den Inhabern von Rechten an den Werken ermöglichen, ihre Rechte besser durchzusetzen (vgl. ErwGr 107 S. 2 AI Act). Erst wenn geklärt ist, welche Arten der Datennutzung für das Training zulässig oder rechtsverletzend sind, können Rechteinhaber effektiv beurteilen, ob ihre Rechte durch die in der Zusammenfassung offengelegten Daten potenziell verletzt wurden und KI-Anbieter ihre Compliance Strategien entsprechend anpassen.
Ausblick
Der Fall C-250/25 stellt das europäische Urheberrecht vor einen wichtigen Prüfstein im Kontext der rasanten Entwicklung künstlicher Intelligenz. Für Unternehmen ist es unerlässlich, die eigenen Praktiken im Umgang mit KI und urheberrechtlich geschützten Inhalten kontinuierlich im Lichte der sich wandelnden Rechtslage zu bewerten und proaktive Strategien zu entwickeln, um rechtliche Risiken zu minimieren und gleichzeitig die Chancen neuer Technologien zu nutzen. Die mit Spannung erwartete Entscheidung des EuGH wird grundlegende Weichen für das Zusammenspiel von technologischer Innovation, dem Schutz geistigen Eigentums und dem freien Informationszugang in der digitalen Welt stellen. Wir werden diese Entwicklungen weiterhin aufmerksam beobachten und Sie über die Ergebnisse des Urteils informieren.