Plik llms.txt – co to jest i jak wpływa na SEO?
Spis treści
Spis treści
Budując widoczność w sieci, warto koncentrować się nie tylko na Google, ale również na odpowiedziach w ChatGPT, Claude, Gemini czy Perplexity. Co zrobić, aby ułatwić modelom LLM (Large Language Models) znalezienie najważniejszych treści na Twojej stronie? Często mówi się o roli pliku llms.txt. Co to jest i czy ma wpływ na SEO?
Czym jest plik llms.txt?
Llms.txt to plik tekstowy w formacie Markdown (język znaczników przeznaczony do formatowania tekstu), który ma pomóc modelom językowym lepiej zrozumieć strukturę i sens treści na stronie. Możesz w nim wskazać m.in. najważniejsze podstrony dla Twojego biznesu. Llms.txt ma poprowadzić modele językowe tam, gdzie chcesz. AI ma wiedzieć, gdzie może szukać najbardziej wartościowych treści – nie przegapić najważniejszych informacji, znajdujących się gdzieś w strukturze strony.
Jaka jest struktura pliku llms.txt?
Jak wspomniałem, plik musi być zapisany w formacie Markdown. Ogólna struktura wygląda jak w poniższym przykładzie:

Źródło: https://llmstxt.org/
Kolejne elementy to:
- nazwa strony,
- krótki opis,
- główne zasoby – tytuł, link, ewentualnie opis,
- dodatkowe zasoby – tytuł i link.
Według Jeremy’ego Howarda, twórcy pliku, LLM-y mają dzięki tym danym lepiej czytać strony internetowe i interpretować je jako całość. Poza podstawową wersją llms.txt możesz mieć również rozszerzoną – llms-full.txt, która zawiera więcej contentu.
Llms.txt a robots.txt i sitemap.xml
Pliki robots.txt i sitemap.xml są doskonale znane specjalistom SEO, a można powiedzieć, że llms.txt łączy ich cechy. Oto ich funkcje:
- Llms.txt – wskazuje AI treści, które są przyjazne LLM-om.
- Robots.txt – służy do zarządzania dostępem dla robotów. Wskazuje, do których zasobów w witrynie mają dostęp.
- Sitemap.xml – wskazuje strony, z których składa się witryna. Wspomaga indeksowanie.
Jak przygotować plik llms.txt?
Możesz to zrobić ręcznie, zgodnie z zaprezentowaną strukturą, albo skorzystać z pluginu, np. do systemu WordPress. Plik powinien się znaleźć w katalogu głównym strony. Jeśli chodzi o WordPress, znajdziesz już wiele generatorów pliku. Przykładowy zobaczysz poniżej:

To bardzo proste, automatyczne rozwiązanie. Wybierz Ustawienia, a następnie LLMS Full TXT Generator. Po wejściu w zakładkę Generate zobaczysz adres już wygenerowanego pliku. W Settings możesz, np. wybrać linki do treści, które mają się w nim znaleźć. W ramach ustawień warto także wskazać konkretne adresy URL, które mają być wykluczone z pliku.

Llms.txt to w dalszym ciągu nowość. Według analizy SE Ranking korzysta z niego tylko 1 na 10 stron. Analiza objęła 300 tys. domen.

Źródło: https://seranking.com/blog/llms-txt/
Czy llms.txt cokolwiek daje?
Analiza wykonana przez SE Ranking wykazała, że dodanie pliku nie ma wpływu na częstość cytowania przez LLM-y. Poza tym nie ma jednoznacznych dowodów, że główne platformy AI wykorzystują ten plik przy tworzeniu odpowiedzi. Wiemy, że:
- Google oświadczyło, że funkcje AI Overviews i AI Mode nadal opierają się na tradycyjnych sygnałach SEO a nie pliku llms.txt.
- OpenAI zaleca zezwolenie na dostęp swoich robotów indeksujących, takich jak OAI-SearchBot, w pliku robots.txt witryny. Nie ma jednak potwierdzenia, że plik llms.txt wpływa na sposób, w jaki ChatGPT ocenia lub cytuje treści.
- Niektóre logi SEO pokazują, że GPTBot czasami pobiera pliki llms.txt, ale nie dzieje się to często.
Na temat pliku wypowiedział się John Mueller:

Źródła: https://www.reddit.com/r/TechSEO/comments/1k0kcx9/llmtxt_where_are_we_at/
Według niego, żadna z usług AI nie potwierdza, że korzysta z llms.txt (a patrząc na logi serwera można stwierdzić, że nawet tego nie sprawdzają). Jego zdaniem można to porównać do metatagu słów kluczowych – jest to opis zawartości strony podany przez jej właściciela. Czy strona naprawdę taka jest? Cóż, można to sprawdzić. W takim razie dlaczego nie bezpośrednio na stronie?
Czy zatem dodawanie pliku llms.txt ma sens? Obecnie nie przynosi on mierzalnych korzyści, jednak jego wdrożenie może okazać się istotne w przyszłości wraz z rozwojem sposobów wykorzystania treści przez systemy AI.