Die 5 häufigsten Fehler
Die meisten llms.txt Dateien scheitern nicht an der Technik – sondern am Inhalt. Diese fünf Fehler begegnen uns am häufigsten:
Zu allgemein und nichtssagend
Beschreibungen wie "Wir sind ein innovatives Unternehmen das Lösungen für unsere Kunden entwickelt" liefern keinen konkreten Kontext und könnten auf tausende Websites zutreffen.
Falsche oder veraltete Informationen
Eine llms.txt mit veralteten Produktnamen, alten Preisen oder nicht mehr existierenden Diensten ist schlimmer als keine llms.txt – falls ein KI-System die Datei auswertet, werden falsche Informationen weitergegeben.
Falsches Encoding oder kaputte Sonderzeichen
Umlaute (ä, ö, ü) oder Sonderzeichen die nicht in UTF-8 gespeichert wurden führen zu Encoding-Problemen die die Lesbarkeit der Datei beeinträchtigen.
Sensible Informationen in der llms.txt
Interne Preislisten, Mitarbeiterdaten, unveröffentlichte Produkte oder vertrauliche Geschäftsinformationen gehören nicht in die llms.txt – die Datei ist öffentlich und für jeden abrufbar.
Falsche Content-Type Ausgabe
Wenn der Webserver die llms.txt nicht als text/plain ausliefert, kann die Datei nicht korrekt verarbeitet werden. Besonders bei CMS-Systemen ein häufiges Problem.
Was gehört rein – und was nicht
Gehört rein
Eine gute llms.txt beantwortet die grundlegenden Fragen über deine Website klar und präzise:
- Klare Identität: Name der Website/Organisation und was sie tut – in einem Satz
- Konkretes Angebot: Welche spezifischen Produkte, Dienste oder Inhalte gibt es?
- Zielgruppe: Für wen ist die Website gemacht?
- Wichtige URLs: Links zu den zentralen Seiten – nicht alle, nur die wichtigsten
- Kontakt: Eine erreichbare E-Mail-Adresse
- Sprache(n): In welcher Sprache ist der Inhalt verfügbar?
✓ Gut: "llmshub.de ist eine deutschsprachige Plattform für llms.txt und LLM-Sichtbarkeit. Wir bieten kostenlose Tools zum Erstellen und Validieren von llms.txt Dateien sowie Guides zu GEO und KI-Crawlern."
✗ Schlecht: "Willkommen auf unserer Website. Wir sind Experten auf unserem Gebiet und helfen unseren Kunden dabei erfolgreich zu sein."
Gehört nicht rein
- Werbetexte und Marketing-Sprache: "Marktführer", "einzigartig", "revolutionär" – llms.txt ist für sachliche Informationen, nicht für Werbebotschaften
- Vollständige Seitentexte: Dafür ist llms-full.txt zuständig – llms.txt ist eine strukturierte Übersicht, kein Content-Dump
- Technische Implementierungsdetails: Welches CMS genutzt wird oder wie der Server konfiguriert ist
- Wiederholungen aus robots.txt: Crawling-Regeln gehören in robots.txt, nicht in llms.txt
- SEO-Keywords ohne Kontext: Eine Liste von Keywords ist kein erklärender Text
Sprache und Ton
llms.txt sollte in klar strukturierter, natürlicher Sprache geschrieben sein. Nicht wie ein Datenbankschema, aber auch nicht wie ein Werbetext.
Präzision schlägt Länge
Zwei präzise Sätze über das tatsächliche Angebot sind wertvoller als ein Absatz vage formulierter Unternehmensphilosophie.
✓ Präzise: "AI-Ready Check prüft kostenlos ob eine Website technisch für KI-Suchmaschinen wie ChatGPT und Perplexity optimiert ist. Das Tool analysiert 20 Faktoren und gibt einen Score von 0–100."
✗ Vage: "Wir helfen Unternehmen dabei ihre digitale Präsenz zu verbessern und in der modernen KI-getriebenen Welt sichtbar zu bleiben."
Sprache der Zielgruppe verwenden
Schreibe die llms.txt in der Hauptsprache deiner Website und Zielgruppe. Wenn deine Website auf Deutsch ist, schreibe die llms.txt auf Deutsch.
Tipp: Schreibe die llms.txt so, als würdest du jemandem in zwei Minuten erklären was deine Website ist und warum sie wichtig ist. Kein Fachjargon, keine Floskeln – direkt und konkret.
Dateigröße und Performance
Die llms.txt sollte schlank bleiben. Eine Faustregel: unter 10 KB für llms.txt, unter 100 KB für llms-full.txt.
Was die Dateigröße unnötig aufbläht
- Vollständige Produktbeschreibungen oder Blogartikel – gehört in llms-full.txt
- Lange Listen von URLs – nur die 5–10 wichtigsten Seiten verlinken
- Redundante Informationen die sich wiederholen
- Binäre Zeichen oder fehlerhafte Encoding-Artefakte
Content-Type und Encoding
Der Server muss die Datei korrekt ausliefern. Das lässt sich einfach testen:
Aktuell halten
Eine veraltete llms.txt ist ein unterschätztes Risiko: Die Datei sollte den tatsächlichen Stand der Website widerspiegeln. Veraltete Informationen können – sofern sie von Systemen ausgewertet werden – zu falschen Auskünften führen.
Wann aktualisieren?
- Neue Produkte oder Dienste werden gestartet
- Bestehende Angebote werden eingestellt oder umbenannt
- Kontaktdaten ändern sich
- Die Zielgruppe oder Positionierung ändert sich
- Wichtige neue Seiten entstehen die verlinkt werden sollten
Datum angeben
Ein ## Letztes Update Abschnitt hilft dabei einzuschätzen wie aktuell die Informationen sind. Format: YYYY-MM oder YYYY-MM-DD.
Achtung: Das Datum nicht als Dekoration verwenden – wenn das Update-Datum vor zwei Jahren liegt aber die Produkte sich seitdem verändert haben, stimmt die Datei nicht mehr mit der Realität überein.
llms-full.txt – wann sinnvoll
llms-full.txt ist die optionale Erweiterung zu llms.txt: Sie enthält den vollständigen Inhalt der wichtigsten Seiten. Der Unterschied liegt im Zweck:
- llms.txt: Strukturierte Übersicht – wer bist du, was bietest du an, wie erreicht man dich
- llms-full.txt: Vollständiger Inhalt – alle relevanten Texte in einer Datei
Wann lohnt sich llms-full.txt?
llms-full.txt macht Sinn wenn deine Website substanziellen Content hat:
- Dokumentationsseiten und Knowledge Bases
- Umfangreiche Guides und Tutorials
- FAQ-Sammlungen mit vielen Einträgen
- Produktdatenbanken oder Kataloge
Für einfache Unternehmenswebsites oder Landing Pages ist llms-full.txt ein Nice-to-have, keine Notwendigkeit. Eine veraltete llms-full.txt ist schlechter als keine.
Größe im Griff behalten
llms-full.txt sollte unter 500 KB bleiben. Was hineinkommt: die wichtigsten Seiten in Volltext, sauber mit Markdown-Überschriften strukturiert. Was nicht hineinkommt: Navigation, Footer, Cookie-Banner, Code-Snippets.
Best Practices Checkliste
Diese Punkte unterscheiden eine gute llms.txt von einer sehr guten:
- Beschreibung ist konkret und spezifisch – kein generisches Marketing-Sprech
- Datei ist unter yourdomain.de/llms.txt erreichbar (HTTP 200)
- Content-Type ist text/plain; charset=utf-8
- Encoding ist UTF-8 ohne BOM – Umlaute werden korrekt dargestellt
- Dateigröße unter 10 KB
- Keine sensiblen oder internen Informationen enthalten
- Nur die 5–10 wichtigsten Seiten verlinkt – keine vollständige URL-Liste
- Letztes Update Datum ist aktuell und korrekt
- Sprache stimmt mit der Hauptsprache der Website überein
- Inhalt wird bei größeren Website-Änderungen aktualisiert
- Mit dem llms.txt Validator technisch geprüft
llms.txt direkt prüfen
Der llmshub.de Validator zeigt in Sekunden ob deine llms.txt technisch korrekt ist und wo noch Verbesserungspotenzial liegt.
llms.txt jetzt validieren →