Was ist llms.txt?
llms.txt ist eine einfache Textdatei im Markdown-Format die im Stammverzeichnis einer Website liegt – erreichbar unter yourdomain.com/llms.txt. Sie enthält strukturierte Informationen über die Website, die speziell für Large Language Models (LLMs) wie ChatGPT, Claude und Perplexity aufbereitet sind.
Der Gedanke dahinter ist simpel: Wenn ein KI-System eine Website crawlt, könnte ein kompakter gut strukturierter Überblick dabei helfen den Kontext der Seite schneller zu erfassen. Ob und wie stark dieser Effekt in der Praxis eintritt, ist bislang nicht offiziell belegt.
Kurz gesagt: llms.txt ist eine freiwillige, maschinenlesbare Beschreibung deiner Website – geschrieben in einem Format das KI-Systeme gut verarbeiten können. Der Standard ist noch jung und die Wirkung nicht abschließend nachgewiesen.
Woher kommt der Standard?
Die llms.txt-Spezifikation wurde 2024 von Jeremy Howard vorgeschlagen – dem Mitgründer von fast.ai und einem der einflussreichsten KI-Forscher der letzten Jahre. Die Idee fand schnell Anklang in der KI- und Web-Community. Anthropic (der Hersteller von Claude) hat eine eigene llms.txt auf anthropic.com – das zeigt ein gewisses Interesse, ist aber kein Beleg für aktive Auswertung fremder llms.txt Dateien.
Der Standard ist bewusst einfach gehalten: Keine komplexe Syntax, kein neues Dateiformat, kein besonderer Parser nötig. Einfaches Markdown das jeder lesen und schreiben kann.
Wichtig zu wissen: llms.txt ist kein offizieller W3C-Standard und kein RFC. Es ist ein Community-Vorschlag ohne verbindliche Unterstützung durch die großen KI-Plattformen.
llms.txt vs. robots.txt – der Unterschied
| Merkmal | robots.txt | llms.txt |
|---|---|---|
| Zweck | Sagt Crawlern was sie NICHT crawlen dürfen | Beschreibt KI was die Website IST |
| Format | Eigenes Schlüsselwort-Format | Markdown |
| Zielgruppe | Alle Web-Crawler | Speziell LLMs und KI-Systeme |
| Inhalt | Regeln und Verbote | Beschreibungen und Kontext |
| Standard | Offizieller RFC-Standard | Community-Vorschlag (2024) |
| Verbreitung | Nahezu jede Website | Noch selten – wachsend |
| Nachgewiesene Wirkung | Ja | Noch nicht belegt |
Beide Dateien schließen sich nicht aus. robots.txt steuert den Zugriff, llms.txt liefert Kontext – sofern KI-Systeme sie auswerten.
Wer liest llms.txt?
Das ist die entscheidende Frage – und die Antwort ist ernüchternd. Keiner der großen KI-Anbieter hat offiziell bestätigt, dass llms.txt als Signal für Antwortgenerierung oder Ranking genutzt wird.
- Anthropic / Claude – hat eine eigene llms.txt auf anthropic.com, hat aber keinen dokumentierten Support für das Auswerten fremder llms.txt Dateien angekündigt
- Perplexity AI – kein offiziell bestätigter Support
- OpenAI / ChatGPT – kein offiziell bestätigter Support; GPTBot-Zugriffe auf llms.txt wurden in unabhängigen Log-Analysen nicht gefunden
- Google – hat llms.txt explizit abgelehnt (John Mueller, Juni 2025)
- KI-Agenten – für individuelle Software-Agenten die das Web durchsuchen ist eine strukturierte llms.txt plausibel nützlich, auch wenn das noch nicht systematisch gemessen wurde
Zum aktuellen Forschungsstand: Unabhängige Studien (SE Ranking Nov. 2025, Search Engine Land Jan. 2026, Trakkr März 2026) konnten keinen messbaren Effekt von llms.txt auf KI-Zitierungsraten nachweisen. Der Aufwand für die Implementierung ist gering und das Risiko null – die Wirkung bleibt jedoch spekulativ. llms.txt ist sinnvoll wenn die technischen Grundlagen (robots.txt, Schema.org) bereits stimmen.
Aufbau und Syntax
Eine llms.txt-Datei ist reines Markdown. Es gibt eine empfohlene Struktur:
Pflichtfelder und optionale Felder
Es gibt keine Pflichtfelder – llms.txt ist ein offener Standard. Empfohlen sind mindestens: Name/Titel der Website, eine kurze Beschreibung und Kontaktinformationen. Alles weitere ist optional.
Fertige Beispiele für verschiedene Website-Typen
Beispiel: SaaS-Tool / Web-Applikation
Beispiel: Lokales Unternehmen
Beispiel: Blog / Content-Website
Schritt-für-Schritt: llms.txt erstellen und deployen
Schritt 1: Datei erstellen
Erstelle eine neue Textdatei mit dem Namen llms.txt. Verwende dabei UTF-8-Kodierung ohne BOM. Schreibe den Inhalt im Markdown-Format nach dem Muster oben – angepasst auf deine Website.
Tipp: Der llmshub.de Generator crawlt deine Website automatisch und befüllt alle Felder – du musst nur noch prüfen und herunterladen.
Schritt 2: In das Stammverzeichnis legen
Die Datei muss unter der Haupt-URL der Domain erreichbar sein: https://deinedomain.de/llms.txt. Bei den meisten Webservern bedeutet das: Datei ins Root-Verzeichnis des Webservers legen – dasselbe Verzeichnis wo auch index.html liegt.
Schritt 3: Content-Type prüfen
Der Webserver sollte die Datei als text/plain ausliefern. Das ist bei .txt-Dateien normalerweise automatisch der Fall. Zur Sicherheit testen:
Schritt 4: In robots.txt verlinken (optional)
Man kann einen Kommentar am Ende der robots.txt ergänzen – das ist kein offiziell unterstütztes Format aber schadet nicht:
Hinweis: Eine standardisierte Direktive für llms.txt in robots.txt existiert nicht. Google Search Console meldet die LLMs: Zeile als Syntax-Fehler – wer das vermeiden möchte lässt diesen Kommentar weg. Wichtiger ist dass die Datei unter der korrekten URL erreichbar ist.
llms-full.txt – die erweiterte Variante
Neben llms.txt gibt es eine optionale Erweiterung: llms-full.txt. Diese Datei enthält den vollständigen Inhalt der wichtigsten Seiten in einer für LLMs optimierten Form – als eine einzige lesbare Datei.
Für die meisten normalen Websites ist llms-full.txt ein Nice-to-have, keine Pflicht. Sie macht besonders Sinn für Dokumentationsseiten, Knowledge Bases oder umfangreiche Guides.
Checkliste
- llms.txt im Stammverzeichnis der Domain angelegt
- Datei unter yourdomain.de/llms.txt erreichbar (HTTP 200)
- Content-Type ist text/plain
- Mindestinhalt: Name, Beschreibung, Kontakt
- Markdown-Format korrekt (Überschriften mit ##)
- UTF-8 ohne BOM gespeichert
- Inhalt regelmäßig aktuell halten
- Keine sensiblen oder internen Informationen enthalten
llms.txt jetzt erstellen
Mit dem kostenlosen llmshub.de Generator erstellst du deine llms.txt in Sekunden – automatisch oder manuell.
Zum Generator →