OpenAI plant eine Wende im Umgang mit Daten im Netz und entwickelt einen neuen Media Manager, der die klassische robots.txt-Datei ersetzen soll.
In der heutigen digitalen Welt spielt die robots.txt-Datei eine zentrale Rolle, um zu steuern, welche Crawler Zugriff auf eine Webseite haben. Diese Datei bestimmt, welche Informationen für Suchmaschinen und KI-Modelle zugänglich sind. OpenAI sieht jedoch erhebliche Mängel in diesem System und möchte es durch einen innovativen Media Manager ersetzen. Dieses neue Tool soll bis 2025 einsatzbereit sein und die Verwaltung der Rechte an Online-Inhalten verbessern. Der genaue Ablauf dieser Neuerung bleibt allerdings noch vage.
Ein großes Problem des bisherigen Systems ist die Notwendigkeit, Crawler einzeln zu benennen, um sie auszuschließen. Mit der wachsenden Zahl von KI-Modellen und deren Bedarf an Trainingsmaterial wird dies zunehmend unübersichtlich und ineffektiv. Viele Verlage und Urheber möchten nicht, dass ihre Inhalte für das Training von KI-Modellen genutzt werden. Das aktuelle System kann jedoch nicht mit der Geschwindigkeit Schritt halten, mit der neue Crawler entstehen. Gleichzeitig wollen Webseitenbetreiber ihre Inhalte für Suchmaschinen sichtbar machen, was zu einem Dilemma führt, da Google die Nutzung dieser Inhalte für KI-Trainings ebenfalls erlaubt.
Der neue Media Manager von OpenAI soll hier Abhilfe schaffen. Er richtet sich direkt an die Inhalteersteller und ermöglicht ihnen, spezifische Wünsche und Anweisungen bezüglich der Nutzung ihrer Inhalte zu übermitteln. OpenAI plant, diese Informationen mithilfe von Machine Learning zu verarbeiten, um die Rechte der Urheber besser zu schützen. Allerdings bleibt OpenAI in ihren Ausführungen dazu noch recht vage.
Ein weiterer Streitpunkt ist die Frage der Bezahlung der Inhalteersteller. OpenAI hebt die Vorteile hervor, die Links zu den Quellen in ChatGPT bieten, da sie Publishern helfen sollen, mit Lesern in Kontakt zu treten. Kritiker argumentieren jedoch, dass dies nicht ausreicht, da Leser, die die benötigte Information bereits bei ChatGPT finden, oft gar nicht erst die Original-Webseite besuchen.
Zusätzlich verweist OpenAI auf bestehende Verträge mit großen Verlagen wie Axel Springer, der Financial Times und Le Monde, die als vorteilhaft für beide Seiten dargestellt werden. Doch eine globale Abdeckung solcher Verträge scheint unrealistisch und birgt zudem rechtliche Herausforderungen, wie sie im Digital Markets Act (DMA) festgelegt sind.
Die Debatte über die faire Nutzung und Bezahlung von Inhalten im Internet ist nicht neu. Google und Meta befinden sich seit Jahren in Auseinandersetzungen mit Verlagen weltweit, insbesondere in Bezug auf das Leistungsschutzrecht. Im Gegensatz zu diesen Unternehmen bietet ChatGPT keine direkten Links zu den Verlagen an, was die Problematik der Sichtbarkeit und der finanziellen Vergütung verschärft.