The global and independent platform for the SAP community.

AI - from the source to the sink

It is generally known that AI is fed by the vastness of the World Wide Web. For AI, texts, photos, videos and graphics are the source of „knowledge“. The sink is the answers from ChatGPT and co. What if the sources dry up?
Peter M. Färbinger, E3 Magazine
November 24, 2025
avatar
This text has been automatically translated from German to English.

Es ist nicht in allen Fällen bewiesen, aber die Vermutung erscheint offensichtlich: Trotz virtueller Verbotsschilder und Bezahlschranken „plündern“ die Betreiber großer LLMs (Large-Language-Modelle) den Datenschatz des Internets. Die KI-Pioniere gehören zu den besten Informatikern der Welt, damit sollte es ihnen ein Leichtes sein, jede Hürde und Schranke zu umgehen.

Es gibt eine WWW-Etikette: Am Beginn des HTML-Codes einer Website (Homepage) lässt sich ein virtuelles Eintrittsverbot für Bots und Crawler programmieren. Diese Schranke kann aus verschiedenen Gründen sehr sinnvoll sein: Ist etwa eine Website im Aufbau und noch mit Testdaten bestückt, dann macht es für einen Google-Crawler wenig Sinn, diese Seiten zu indexieren. Ein Web-Crawler ist ein automatisiertes Programm (auch Spider oder Bot genannt), das das Internet durchsucht, um Inhalte von Websites zu sammeln und zu indexieren. Der Crawler folgt Hyperlinks, um neue Webseiten zu entdecken, und speichert Informationen wie Titel, Bilder und Schlüsselwörter, um einen durchsuchbaren Index für Suchmaschinen wie Google oder Bing zu erstellen.

Naturgemäß lässt sich dieses Verbotsschild für Web-Crawler am Beginn einer Webseite auch zum Schutz des eigenen Contents nutzen. Voraussetzung ist natürlich die Einhaltung der WWW-Etikette. Anders gesagt: Jeder Schutz lässt sich mit noch raffinierterer Programmierung umgehen. Es gibt zahlreiche Experimente, die belegen, dass die Web-Crawler der großen IT-Pioniere zum Anlernen ihrer LLMs regelmäßig die virtuellen Verbotsschilder umgehen.

Autoren, Journalisten, Künstler, Fotografen und alle Content-Produzenten empfinden diese Umgehung einer technischen Schranke als Copyright-Verletzung und Diebstahl geistigen Eigentums. Es gibt in den USA vorläufige Rechtsgutachten und Gerichtsentscheide zu diesem Thema. Kurz zusammengefasst: Einige US-Richter sind der Meinung, dass die Verbotsschilder zum Zweck des KI-Trainings umgangen werden können. Was aber nicht bedeutet, dass bei KI-Antworten und -Ergebnissen diese Texte und Fotos ausgespielt werden dürfen. Es ist eine dünne Grenze, die vielleicht juristisch haltbar ist, wohl aber dem menschlichen Empfinden widerspricht.

Zum Trainieren darf die KI also die E3-Magazine lesen, aber zitieren darf sie nicht. Dem Hilfesuchenden aus der SAP-Community ist wahrscheinlich schon mit einer guten Zusammenfassung aus dem E3 geholfen, was die KI sicher mit den „Trainingsdaten“ ganz hervorragend schafft. Auf den Luxus eines wörtlichen Zitats kann dann gerne verzichtet werden – die Katze ist ohnehin aus dem Sack, oder?

Letztendlich ist es ein finanzielles Problem: Wer immer sich auch in kommerzieller Art der E3-Inhalte bediente, der stand in einer Geschäftsbeziehung zum Verlag. Damit waren das so wichtige Geben und Nehmen in der SAP-Community gesichert. Und es konnten neue Quellen entstehen. „Plündert“ nun die KI die E3-Quellen ohne entsprechende Gegenleistung, dann besteht die Gefahr, dass die E3-Quelle und viele andere, unabhängige SAP-Quellen versiegen.

In wenigen Jahren könnten der KI dann nur die offiziellen SAP-Webseiten und das WWW-Angebot des Anwendervereins zum Training der Large-Language-Modelle zur Verfügung stehen. Die Antworten in der Senke werden bescheidener sein. (pmf)

avatar
Peter M. Färbinger, E3 Magazine

Peter M. Färbinger, Publisher and Editor-in-Chief E3 Magazine DE, US and ES (e3mag.com), B4Bmedia.net AG, Freilassing (DE), E-Mail: pmf@b4bmedia.net and Tel. +49(0)8654/77130-21


Write a comment

Working on the SAP basis is crucial for successful S/4 conversion. 

This gives the Competence Center strategic importance for existing SAP customers. Regardless of the S/4 Hana operating model, topics such as Automation, Monitoring, Security, Application Lifecycle Management and Data Management the basis for S/4 operations.

For the second time, E3 magazine is organizing a summit for the SAP community in Salzburg to provide comprehensive information on all aspects of S/4 Hana groundwork.

Venue

FourSide Hotel Salzburg,
Trademark Collection by Wyndham
Am Messezentrum 2, 5020 Salzburg, Austria
+43-66-24355460

Event date

Wednesday, June 10, and
Thursday, June 11, 2026

Early Bird Ticket

Regular ticket

Subscribers to the E3 Magazine Ticket

reduced with promocode CCAbo26

Students*

reduced with promocode CCStud26.
Please send proof of studies by e-mail to office@b4bmedia.net.
*The first 10 tickets are free of charge for students. Try your luck! 🍀
EUR 390 excl. VAT
available until November 30, 2025
EUR 590 excl. VAT
EUR 390 excl. VAT
EUR 290 excl. VAT

Venue

Hotel Hilton Heidelberg
Kurfürstenanlage 1
D-69115 Heidelberg

Event date

Wednesday, April 22 and
Thursday, April 23, 2026

Tickets

Early Bird Ticket
Regular ticket
EUR 390 excl. VAT
available until 30.11.2025
EUR 590 excl. VAT
Subscribers to the E3 magazine
reduced with promocode STAbo26
EUR 390 excl. VAT
Students*
reduced with promocode STStud26.
Please send proof of studies by e-mail to office@b4bmedia.net.
EUR 290 excl. VAT
*The first 10 tickets are free of charge for students. Try your luck! 🍀
The event is organized by the E3 magazine of the publishing house B4Bmedia.net AG. The presentations will be accompanied by an exhibition of selected SAP partners. The ticket price includes attendance at all presentations of the Steampunk and BTP Summit 2026, a visit to the exhibition area, participation in the evening event and catering during the official program. The lecture program and the list of exhibitors and sponsors (SAP partners) will be published on this website in due course.