Eine Sitemap ist ein Verzeichnis der Seiten einer Webpräsenz. Ursprünglich waren Sitemaps zur Orientierung für den Besucher einer Website gedacht. Heutzutage hat sich die Bedeutung einer Sitemap gewandelt: Sie spielt nun auch eine Rolle, wenn es um Suchmaschinenoptimierung (SEO) geht, denn mit ihrer Hilfe kann man das Crawling durch Suchmaschinen beschleunigen.

Sitemaps für SEO
Eine Sitemap, die für SEO relevant ist, ist eine einfach aufgebaute XML-Datei. Sie benennt alle Dateien, die für eine Suchmaschine relevant sind. Sitemaps heissen normalerweise sitemap.xml, main-sitemap.xml o.ä. und liegen oft im Hauptverzeichnis einer Webpräsenz. Sitemaps sind nicht unbedingt erforderlich, haben aber einen großen Nutzen im Rahmen der Suchmaschinenoptimierung (weiter unten beschreiben wir, warum das so ist).
Sitemaps haben einen Inhalt wie diesen:
<?xml version="1.0" encoding="UTF-8"?>
<urlset
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
<url>
<loc>http://www.irgendwas-online.de/</loc>
<lastmod>2015-04-21T20:34:01+00:00</lastmod>
</url>
<url>
<loc>http://www.irgendwas-online.de/index.html</loc>
<lastmod>2015-04-21T20:34:01+00:00</lastmod>
</url>
<loc>http://www.irgendwas-online.de/index.htm</loc>
<lastmod>2015-04-21T20:34:01+00:00</lastmod>
</url>
</urlset>
…
Schon nach kurzem Betrachten erkennt man das Prinzip hinter dem Aufbau von Sitemaps dieser Art. Es wird einfach jede Datei aufgelistet und zu jeder der Pages der Zeitpunkt der letzten Änderung. Erzeugt man eine solche Sitemap automatisch mit WordPress (hierzu gibt ein geeignetes Plugin für Sitemaps, das für Search Engines wie Google, Bing und Yahoo eine solche automatisch generiert) , heisst die Datei nach aktuellem Stand sitemap_index.xml und sieht so aus:
<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="//www.irgendwas-online.de/main-sitemap.xsl"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.irgendwas-online.de/post-sitemap.xml</loc>
<lastmod>2015-05-01T15:40:56+02:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.irgendwas-online.de/page-sitemap.xml</loc>
<lastmod>2015-04-30T20:27:23+02:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.irgendwas-online.de/category-sitemap.xml</loc>
<lastmod>2015-05-01T15:40:56+02:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.irgendwas-online.de/post_tag-sitemap.xml</loc>
<lastmod>2015-05-01T15:40:56+02:00</lastmod>
</sitemap>
</sitemapindex>
Diese Sitemap ist hierarchisch aufgebaut: Klickt man auf einen der Links, öffnet sich eine weitere Sitemap-Datei, die wiederum bestimmte Pages referenziert. So enthält die Sitemap für Posts die WordPress-Artikel aus denen eine WordPress-Webseite besteht.
Sitemaps, wie man sie von früher kennt, sind keine XML sondern HTML-Dateien, die zur Ansicht für den menschlichen Leser gedacht sind. Sie haben auch einen Nutzwert im SEO/SEM-Bereich, aber sind vernachlässigbar, wenn eine XML-Sitemap vorliegt. Der einzige Nutzen von HTML-Sitemaps ist de facto nur noch (immerhin!) der, dass ein Leser sich möglicherweise auf einer Website besser orientieren kann. Allerdings meinen wir, dass eine gute Suchfunktion auf einer Webpräsenz (Blog, Webseite etc.) eine Sitemap im HTML Format obsolet macht.
Der Nutzen von Sitemaps für SEO
Eine Sitemap garantiert, dass eine Suchmaschine wie Google alle relevanten Seiten indizieren kann. Weil eine Sitemap systematisch aufgebaut ist, kann Google die Webseite viel schneller indizieren als wenn alle Links gecrawlt (verfolgt) werden müssten.
Man kann seine Sitemap direkt in den Google Webmaster Tools einreichen, unser extra Artikel dazu erklärt genau, wie das geht und welche weiteren Vorteile Sitemaps als SEO-Maßnahme bringen. Google beschreibt übrigens auch offiziell noch einmal, warum Sitemaps für die Suchmaschine insbesondere wichtig sind.
Bevor man seine Sitemap bei Google einreichen (und auch testen lassen) kann, muss man seine Webseite bei den Webmaster Tools eintragen und verifizieren (Google erklärt in den Tools, wie das geht und wir auch im o.g. Artikel).
Nachdem die Sitemap für Deine Web Site eingereicht wurde, sieht man so etwas in den Tools:

Alternativ kann man seine Sitemap auch über die robots.txt Datei bekanntmachen, indem man folgende Zeile hinzufügt:
Sitemap: http://www.deine-website.de/name-deiner-sitemap.xml
Wir empfehlen, der HTML Sitemap den weit verbreiteten und von vielen Suchmaschinen direkt gefundenen Namen sitemap.xml zu geben. Wer noch HTML verwendet, nimmt natürlich eine andere Dateiendung.
Wenn viele Daten auf einer Webseite liegen und der Betreiber Crawling unterbinden möchte, dann sollte man stattdessen einen geheimen Namen für die Sitemap wählen und diesen NICHT in der robots Datei hinterlegen, sondern NUR in den Webmaster Tools:

Wenn eine Website mit WordPress erstellt wurde, ist das Erstellen einer Sitemap grundsätzlich kein Problem, da ein Generator auf dem Server verwendet werden kann: In diesem Grundlagenartikel wird es erklärt.
Interessante Fakten zu XML-Sitemaps
Sitemaps unterliegen gewissen Restriktionen und bieten andererseits ein paar Freiheitsgrade:
- Sitemaps sollten nicht mehr als 50000 URLs beinhalten und nicht größer als 10 Megabytes sein, ansonsten können sie nicht mehr vernünftig eingelesen werden und gelten als nichtexistent
- Man kann Sitemaps komprimiert einreichen, etwa ZIP-komprimiert. Ein Generator erleichtert diese Arbeit enorm.
- In den Webmaster Tools kann man sowohl Fehler in der Struktur einer eingereichten Sitemap für seine Websites erkennen als auch, ob und wann Google diese bereits indiziert hat (initial dauert das bis zu mehreren Tagen)
- Sitemaps können auch andere Ressourcen auf dem Server als HTML-Dateien referenzieren, beispielsweise Mediendateien oder XML-Dateien (siehe folgenden Punkt)
- Gibt es mehrere Sitemaps pro Webpräsenz, dann kann man diese in einer übergeordneten Sitemap-Datei für die Websites zusammenfassend benennen. Diese übergeordnete Sitemap ist dann die einzige, die eingereicht werden muss, da sie eine Referenz auf die anderen Maps enthält
- Laut Google Mitarbeiter Matt Cutts ist eine Sitemap erst für Webseiten erforderlich, die nicht als klein eingestuft werden. Konkret bedeutet das nach der Definition von Google, dass die Webpräsenz mehr als 10000 Seiten umfasst. Eine Sitemap zu haben, schadet aber in keinem Fall, daher sollte man eine haben…
Weitere Informationen zu Sitemaps
- Wikipedia-Artikel zu Sitemaps
- Sitemap erstellen, so geht es ganz einfach
- Suchmaschinenoptimierung: Anleitung für erfolgreiches SEO
- Eine Sitemap bei Yahoo oder Bing einreichen
PS: Dies ist ein älterer Beitrag.