Файл sitemap

Sitemap.xml - файл в формате XML (расширяемый язык разметки), в котором содержится вся информация, связанная с организацией содержимого на сайте. Благодаря ему, поисковики узнают о страницах (видео, фото), которые нужно проиндексировать и добавить в поисковую выдачу. Это один из способов продвижения по SEO, который не требует много сил, времени и денег.

Стоит ли добавлять sitemap?

Чтобы ресурс появился в поиске, его нужно проиндексировать. Для этого поисковые роботы "гуляют" по сайту, пока не проверят все страницы, либо пока не закончится время, выделенное для этого. Заходя на сайт, боты просматривают каждую страницу, находят доступные ссылки (не закрытые атрибутом и файлом robots.txt), переходят по ним, и вновь сканируют. Казалось бы, раз роботы и так справляются, зачем создавать файл sitemap.xml?

Представим, что вы ходите по магазину в поиске нужных продуктов. Перемещаетесь из одного отдела в другой, пока не купите все необходимое из списка. Согласитесь, если бы у вас была карта магазина, вы справились намного быстрее. Также и с роботами. Безрассудно странствуя по просторам сайта, им может понадобиться много времени. Из-за этого боты могут пропустить какие-то изменения и не зафиксировать их в своей "записной книжке". Поэтому лучше создать sitemap.xml для сайта. Ведь с помощью существующих инструментов, можно создавать sitemap онлайн.

Для полноты картины, определим, в каких же случаях sitemap.xml необходим:

  • Сайт содержит много контента. Если на вашем ресурсе более 500 элементов (страницы, видео, картинки), которые должны попасть в поиск, то отсутствие файла sitemap может привести к тому, что робот пропустит измененные или созданные страницы.
  • Наличие изолированных страниц. Поскольку на сайте может не быть ссылки на некоторые страницы, поисковики просто не смогут на них попасть.
  • Новый сайт. Чтобы робот попал на сайт, на него должна быть ссылка из вне. Так как сайт создан недавно, никто не размещал ссылку на него на своих страницах. Чтобы оповестить роботов о своем присутствии, можно добавить файл sitemap, и указать ссылку на него в Google Search Console и Яндекс.Вебмастер.

Структура sitemap.xml

Данный файл чаще всего лежит в корне сайта (https://example.com/sitemap.xml). Но также можно указать его местоположение в robots.txt:
Sitemap: https://example.com/sitemap.xml

Внутри XML-карты сайта содержится перечень всех индексируемых элементов: страницы, картинки, видео.
Пример файла sitemap.xml:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
    <lastmod>2017-02-05</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

В зависимости от типа описываемого элемента, sitemap может содержать различные атрибуты.

Sitemap для видео

Для видео можно задать preview, название, описание, продолжительность, рейтинг и многое другое. Достигается это путем задания атрибутов video:thumbnail_loc, video:title, video:description и тд.
<video:video>
  <video:thumbnail_loc>https://example.com/thumbs.png</video:thumbnail_loc>
  <video:title>Название видео</video:title>
  <video:description>Описание видео</video:description>
  <video:duration>600</video:duration>
  <video:rating>4.0</video:rating>
</video:video>

Sitemap для изображений

Также внутри XML-карты можно перечислить картинки, о которых нужно уведомить поисковые системы. Используя атрибуты можно указать название, место снимка, подпись и прочее.
<image:image>
  <image:loc>https://example.com/image.png</image:loc>
  <image:geo_location>Kazan, Russia</image:geo_location>
  <image:title>Заголовок</image:title>
</image:image>

Sitemap для страниц

Файл sitemap может содержать следующие атрибуты, описывающие страницы сайта:

  • Расположение страницы на сайте (URL): <loc>http://www.example.com/mypage</loc>
  • Дата последнего редактирования контента: <lastmod>2013-10-10</lastmod>
  • Частота обновления страницы: <changefreq>monthly</changefreq>
  • Важность страницы по отношению к другим на сайте: <priority>1</priority>