Файл Sitemap.xml

Файл sitemap нужен для роботов поисковых систем, что бы они “понимали”, какие страницы нужно индексировать. В противном случае очень долго будет проиндексирована только одна главная страница. По ссылкам с нее роботы пойдут намного позже (страниц и сайтов стало много и робота на всех не хватает). Файл sitemap влияет только на индексацию сайта и никак не влияет на показ сайта в поисковой выдаче (т.е. роботы про сайт знают, а уж как его показывать в выдаче – это их дело).

Официальный сайт находится здесь sitemap.org (версия на русском языке)

Теперь подробнее:
– формат файла может быть как xml (предпочтительнее) и txt – в любом случае это простой текстовый файл, который можно открыть “блокнотом”
– необходимо использовать кодировку utf-8
– файл может содержать как список страниц так и список других файлов sitemap (индекс)
– файл может называться как угодно, вида mysitemap.xml (например, часть систем создания сайтов формируют свой файл sitemap и не дают возможности его изменить, можно сделать свой файл mysitemap.xml и “скормить” его роботам)
– файл может располагаться в любой папке сайта
– расположение файла указывается в файле robots.txt
– 
все ссылки, перечисленные в файле Sitemap, должны находиться в том же домене, что и сам Sitemap
– ссылки в файле Sitemap должны указывать на страницы, находящиеся в том же каталоге (или его подкаталогах), что и сам файл Sitemap
– ссылки, указанные в файле Sitemap, должны использовать тот же протокол (например, HTTP), по которому доступен файл Sitemap

Пример файла sitemap для данного сайта https://seotable.ru/sitemap.xml

Файл sitemap можно проверить на валидность.
Для определения элементов и атрибутов, которые могут появляться в файлах Sitemap, используются следующие XML-схемы:

Для файлов Sitemap: http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd
Для файлов индекса Sitemap: http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd

Основные xml тэги для файла sitemap, который содержит информацию о страницах сайта:

Атрибут Статус Описание
<urlset> обязательный Инкапсулирует этот файл и указывает стандарт текущего протокола.
<url> обязательный Родительский тег для каждой записи URL-адреса. Остальные теги являются дочерними для этого тега.
<loc> обязательный URL-адрес страницы. Этот URL-адрес должен начинаться с префикса (например, HTTP) и заканчиваться косой чертой, если Ваш веб-сервер требует этого. Длина этого значения не должна превышать 2048 символов.
<lastmod> необязательно Дата последнего изменения файла. Эта дата должна быть в формате W3C Datetime. Этот формат позволяет при необходимости опустить сегмент времени и использовать формат ГГГГ-ММ-ДД.

ВАЖНО: если ВЫ используете плагин для CMS / автогенератор – обязательно проверьте, какая именно дата там показана. У некоторых плагинов (в т.м. числе и хороших) выводится дата создания,  а не дата последнего изменения. Т.е. если Вы создали пост 1 января, а потом вносили в него изменения 2,3 и так далее до 10 января =в файле sitemap.xml будет стоять дата 1 января….Не хорошо.

Обратите внимание, что этот тег не имеет отношения к заголовку “If-Modified-Since (304)”, который может вернуть сервер, поэтому поисковые системы могут по-разному использовать информацию из этих двух источников.

<changefreq> необязательно Вероятная частота изменения этой страницы. Это значение предоставляет общую информацию для поисковых систем и может не соответствовать точно частоте сканирования этой страницы. Допустимые значения:

  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never

Значение”всегда” должно использоваться для описания документов, которые изменяются при каждом доступе к этим документам. Значение “никогда” должно использоваться для описания архивных URL-адресов.

Имейте в виду, что значение для этого тега рассматривается как подсказка, а не как команда. Несмотря на то, что сканеры поисковой системы учитывают эту информацию при принятии решений, они могут сканировать страницы с пометкой “ежечасно” менее часто, чем указано, а страницы с пометкой “ежегодно” – более часто, чем указано. Сканеры могут периодически сканировать страницы с пометкой “никогда”, чтобы отслеживать неожиданные изменения на этих страницах.

<priority> необязательно Приоритетность URL относительно других URL на Вашем сайте. Допустимый диапазон значений — от 0,0 до 1,0. Это значение не влияет на процедуру сравнения Ваших страниц со страницами на других сайтах — оно только позволяет указать поисковым системам, какие страницы, по Вашему мнению, более важны для сканеров.

Приоритет страницы по умолчанию — 0,5.

Следует учитывать, что приоритет, который Вы назначили странице, не влияет на положение Ваших URL на страницах результатов той или иной поисковой системы. Поисковые системы используют эту информацию при обработке URL, которые относятся к одному и тому же сайту, поэтому можно использовать этот тег для увеличения вероятности присутствия в поисковом индексе Ваших самых важных страниц.

Кроме того, следует учитывать, что назначение высокого приоритета всем URL на Вашем сайте не имеет смысла. Поскольку приоритетность – величина относительная, этот параметр используется для того, чтобы определить очередность обработки URL в пределах сайта.

Основные xml тэги для файла sitemap, который содержит информацию о других файлах sitemap (индекс):

Атрибут  Статус Описание
<sitemapindex> обязательный Инкапсулирует информацию о всех файлах Sitemap в этом файле.
<sitemap> обязательный Инкапсулирует информацию об отдельном файле Sitemap.
<loc> обязательный Указывает местоположение файла Sitemap.

Этим местоположением может быть файл Sitemap, файл Atom, файл RSS или простой текстовый файл.

<lastmod> необязательно Указывает время изменения соответствующего файла Sitemap. Не соответствует времени изменения ни одной из страниц в этом файле Sitemap. Значение тега “lastmod” должно быть представлено в формате W3C Datetime.

Предоставляя отметку времени последнего изменения, Вы позволяете сканерам поисковой системы извлекать только часть файлов Sitemap в индексе, то есть сканер может извлекать только те файлы Sitemap, которые были изменены после определенной даты. Этот механизм частичного извлечения файлов Sitemap позволяет быстро обнаруживать новые URL на сайтах больших размеров.

И самый главный вопрос – а создать файл sitemap? Вариантов несколько:
– через внешнюю программу
– через плагин к CMS
– через встроенный генератор, например в CMS 1C-Bitrix создаются и индексные файл и файлы с указанием на страницы

Сохранить URL
close slider

Вы можете сохранить себе URL этой страницы.

Введите Ваш e-mail:


Извините, простая капча от роботов. Какой сейчас год? Например:

Если всё заполнено корректно - к Вам на почту придет письмо, в котором будет ссылка на данную страницу, её заголовок и описание.

Это работает на любых устройствах :)

P.S. Это не подписка на рассылку!

 

Для размещения рекламных постов пишите на электропочту

site_post@bk.ru

 


Яндекс.Метрика