Die 5 häufigsten Fehler
Die meisten llms.txt Dateien scheitern nicht an der Technik — sondern am Inhalt. Diese fünf Fehler begegnen uns am häufigsten:
Zu allgemein und nichtssagend
Beschreibungen wie "Wir sind ein innovatives Unternehmen das Lösungen für unsere Kunden entwickelt" sind für KI-Systeme wertlos. Sie liefern keinen konkreten Kontext und könnten auf tausende Websites zutreffen.
Falsche oder veraltete Informationen
Eine llms.txt mit veralteten Produktnamen, alten Preisen oder nicht mehr existierenden Diensten ist schlimmer als keine llms.txt — KI-Systeme geben dann falsche Auskünfte über deine Website.
Falsches Encoding oder kaputte Sonderzeichen
Umlaute (ä, ö, ü) oder Sonderzeichen die nicht in UTF-8 gespeichert wurden führen zu Encoding-Problemen. KI-Systeme können die Datei dann nicht korrekt verarbeiten.
Sensible Informationen in der llms.txt
Interne Preislisten, Mitarbeiterdaten, unveröffentlichte Produkte oder vertrauliche Geschäftsinformationen gehören nicht in die llms.txt — die Datei ist öffentlich und für jeden abrufbar.
Falsche Content-Type Ausgabe
Wenn der Webserver die llms.txt nicht als text/plain ausliefert, können einige KI-Systeme die Datei nicht korrekt verarbeiten. Besonders bei CMS-Systemen ein häufiges Problem.
Was gehört rein — und was nicht
Gehört rein
Eine gute llms.txt beantwortet die Fragen die ein KI-System über deine Website haben würde, bevor es anfängt zu crawlen:
- Klare Identität: Name der Website/Organisation und was sie tut — in einem Satz
- Konkretes Angebot: Welche spezifischen Produkte, Dienste oder Inhalte gibt es?
- Zielgruppe: Für wen ist die Website gemacht?
- Wichtige URLs: Links zu den zentralen Seiten — nicht alle, nur die wichtigsten
- Kontakt: Eine erreichbare E-Mail-Adresse
- Sprache(n): In welcher Sprache ist der Inhalt verfügbar?
✓ Gut: "llmshub.de ist die deutschsprachige Plattform für llms.txt und LLM-Sichtbarkeit. Wir bieten kostenlose Tools zum Erstellen und Validieren von llms.txt Dateien sowie Guides zu GEO und KI-Crawlern."
✗ Schlecht: "Willkommen auf unserer Website. Wir sind Experten auf unserem Gebiet und helfen unseren Kunden dabei erfolgreich zu sein."
Gehört nicht rein
- Werbetexte und Marketing-Sprache: "Marktführer", "einzigartig", "revolutionär" — KI-Systeme bewerten Substanz, nicht Superlative
- Vollständige Seitentexte: Dafür ist llms-full.txt zuständig — llms.txt ist eine strukturierte Übersicht, kein Content-Dump
- Technische Implementierungsdetails: Welches CMS genutzt wird oder wie der Server konfiguriert ist interessiert KI-Systeme nicht
- Wiederholungen aus robots.txt: Crawling-Regeln gehören in robots.txt, nicht in llms.txt
- SEO-Keywords ohne Kontext: Eine Liste von Keywords ist kein erklärender Text
Sprache und Ton
LLMs verarbeiten natürliche Sprache — das ist ihre Stärke. Eine llms.txt sollte deshalb in klar strukturierter, aber natürlicher Sprache geschrieben sein. Nicht wie ein Datenbankschema, aber auch nicht wie ein Werbetext.
Präzision schlägt Länge
Zwei präzise Sätze über das tatsächliche Angebot sind wertvoller als ein Absatz vage formulierter Unternehmensphilosophie. KI-Systeme extrahieren konkrete Fakten — je klarer diese formuliert sind, desto besser können sie genutzt werden.
✓ Präzise: "AI-Ready Check prüft kostenlos ob eine Website technisch für KI-Suchmaschinen wie ChatGPT und Perplexity optimiert ist. Das Tool analysiert 20 Faktoren und gibt einen Score von 0–100."
✗ Vage: "Wir helfen Unternehmen dabei ihre digitale Präsenz zu verbessern und in der modernen KI-getriebenen Welt sichtbar zu bleiben."
Sprache der Zielgruppe verwenden
Schreibe die llms.txt in der Hauptsprache deiner Website und Zielgruppe. Wenn deine Website auf Deutsch ist, schreibe die llms.txt auf Deutsch. Wenn du internationale Reichweite anstrebst, erstelle separate llms.txt-Dateien oder füge einen englischen Abschnitt hinzu.
Tipp: Schreibe die llms.txt so, als würdest du jemandem in zwei Minuten erklären was deine Website ist und warum sie wichtig ist. Kein Fachjargon, keine Floskeln — direkt und konkret.
Dateigröße und Performance
Die llms.txt sollte schlank bleiben. Eine Faustregel: unter 10 KB für llms.txt, unter 100 KB für llms-full.txt. KI-Crawler haben begrenzte Timeouts — eine zu große Datei wird möglicherweise nicht vollständig geladen.
Was die Dateigröße unnötig aufbläht
- Vollständige Produktbeschreibungen oder Blogartikel — gehört in llms-full.txt
- Lange Listen von URLs — nur die 5–10 wichtigsten Seiten verlinken
- Redundante Informationen die sich wiederholen
- Binäre Zeichen oder fehlerhafte Encoding-Artefakte
Content-Type und Encoding
Der Server muss die Datei korrekt ausliefern. Das lässt sich einfach testen:
Falls der Content-Type falsch ist, hilft bei den meisten Webservern eine .htaccess Regel (Apache) oder eine Nginx-Konfiguration.
Aktuell halten
Eine veraltete llms.txt ist ein unterschätztes Risiko: KI-Systeme geben Auskünfte auf Basis der Daten die sie gecrawlt haben. Wenn deine llms.txt noch alte Produkte, abgelaufene Angebote oder falsche Kontaktdaten enthält, werden diese falschen Informationen in KI-Antworten auftauchen.
Wann aktualisieren?
- Neue Produkte oder Dienste werden gestartet
- Bestehende Angebote werden eingestellt oder umbenannt
- Kontaktdaten ändern sich
- Die Zielgruppe oder Positionierung ändert sich
- Wichtige neue Seiten entstehen die verlinkt werden sollten
Datum angeben
Ein ## Letztes Update Abschnitt hilft KI-Systemen einzuschätzen wie aktuell die Informationen sind. Format: YYYY-MM oder YYYY-MM-DD.
Achtung: Das Datum nicht als Dekoration verwenden — wenn das Update-Datum vor zwei Jahren liegt aber die Produkte sich seitdem verändert haben, ist das ein Warnsignal für KI-Systeme.
llms-full.txt — wann sinnvoll
llms-full.txt ist die optionale Erweiterung zu llms.txt: Sie enthält den vollständigen Inhalt der wichtigsten Seiten in einer für LLMs optimierten Form. Der Unterschied liegt im Zweck:
- llms.txt: Strukturierte Übersicht — wer bist du, was bietest du an, wie erreicht man dich
- llms-full.txt: Vollständiger Inhalt — alle relevanten Texte, damit ein LLM ohne weitere Crawls antworten kann
Wann lohnt sich llms-full.txt?
llms-full.txt macht Sinn wenn deine Website substanziellen Content hat der regelmäßig als Quelle genutzt werden soll:
- Dokumentationsseiten und Knowledge Bases
- Umfangreiche Guides und Tutorials
- FAQ-Sammlungen mit vielen Einträgen
- Produktdatenbanken oder Kataloge
Für einfache Unternehmenswebsites, Landing Pages oder kleinere Blogs ist llms-full.txt ein Nice-to-have, keine Notwendigkeit. Der Aufwand der Pflege muss sich lohnen — eine veraltete llms-full.txt ist schlechter als keine.
Größe im Griff behalten
llms-full.txt kann größer sein als llms.txt, sollte aber trotzdem unter 500 KB bleiben. Was hineinkommt: die wichtigsten Seiten in Volltext, sauber mit Markdown-Überschriften strukturiert. Was nicht hineinkommt: Navigation, Footer, Cookie-Banner, Code-Snippets.
Best Practices Checkliste
Diese Punkte unterscheiden eine gute llms.txt von einer sehr guten:
- Beschreibung ist konkret und spezifisch — kein generisches Marketing-Sprech
- Datei ist unter yourdomain.de/llms.txt erreichbar (HTTP 200)
- Content-Type ist text/plain; charset=utf-8
- Encoding ist UTF-8 ohne BOM — Umlaute werden korrekt dargestellt
- Dateigröße unter 10 KB
- Keine sensiblen oder internen Informationen enthalten
- Nur die 5–10 wichtigsten Seiten verlinkt — keine vollständige URL-Liste
- Letztes Update Datum ist aktuell und korrekt
- Sprache stimmt mit der Hauptsprache der Website überein
- Inhalt wird bei größeren Website-Änderungen aktualisiert
- Mit dem llms.txt Validator technisch geprüft
llms.txt direkt prüfen
Der llmshub.de Validator zeigt in Sekunden ob deine llms.txt technisch korrekt ist und wo noch Verbesserungspotenzial liegt.
llms.txt jetzt validieren →