Sitemap.XML

Если вы решили основательно подойти к вопросу SEO-оптимизации вашего интернет-ресурса и обратились к нам за аудитом -- мы непременно проверим присутствие такого файла, как Sitemap.xml. Почему же наличие этого файла так важно? Давайте разберемся.

Sitemap.xml (либо же XML-карта сайта) являет собой файлик, в котором хранятся все необходимые подробности о страницах, которые нужно индексировать, предоставляемые для поисковиков. Весь список ссылок внутри имеет формат XML. Важно понимать, что существует и другая, стандартная карта сайта, обычно доступная по адресу http://mysite.ua/sitemap/, так что прежде, чем поднимается вопрос о наличии карты сайта, нужно четко понимать, о каком конкретном виде идёт речь.

Что дает нам наличие XML-карты?

Для начала, это помогает определять местонахождение страниц файла. Сайтмап умеет показывать частоту обновления, а также приоритетность каждой страницы. Ещё, в карте сайта всегда указывается информация о времени последнего обновления любой из страниц вашего ресурса.

Таким образом, мы видим, что для каждого поискового робота предоставляется детальная инструкция, которая безусловно играет положительную роль в индексации интернет-ресурса. А теперь давайте рассмотрим непосредственно составляющие карты сайта XML.

Главные элементы

В первой строчке файлика, обычно, указывается версия xml, включая кодировку - UTF 8. Карта сайта XML также имеет собственные теги, о которых хотелось бы рассказать поподробней:

  • sitemapindex — это родительский тег. Употребляется как в начале, так и в конце файла.
  • sitemap — данный тег также является родительским, однако с тем отличием, что указывается для абсолютно каждого файла sitemap. Всё дело в том, что на сайте их может присутствовать несколько штук. Такое решение применимо для крупных сайтов, к примеру — интернет магазинов, где разумно создать один сайтмап для страниц категорий, а другой — для карточек товара. Стоит упомянуть, что данный тег является дочерним относительно sitemapindex;
  • url — блок, содержащий значение ссылки, а также другие элементы;
  • loc — здесь указывается сам URL;
  • changefreq — параметры регулярности обновления страницы, для настройки которых используются следующие команды: hourly, daily, weekly, monthly, yearly, always, never;
  • lastmod — второстепенный параметр, отображающий время последнего обновления содержания страницы. Не играет важной роли, так как для интернет-ресурсов со статическим содержанием хватает changefreq.
  • priority — полезная настройка, помогающая определить страницы, которые имеют больший приоритет для краулинга. Значения указываются до единицы (пример: 0,5).

Для того, чтобы в голове не возникала каша, мы покажем, как это выглядит:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
 <loc>http://example.com/</loc>
 <lastmod>2017-02-05</lastmod>
 <changefreq>monthly</changefreq>
 <priority>0.8</priority>
 </url>
</urlset>

Как уже упоминалось ранее, для больших интернет-ресурсов рекомендуется не ограничиваться использованием одной XML-карты, а реализовывать сразу несколько. Покажем, какой это имеет вид. В данном примере сформулировано два файла sitemap:

<?xml version="1.0" encoding="UTF-8"?>
 <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <sitemap>
 <loc>http://www.example.com/sitemap1.xml</loc>
 </sitemap>
 <sitemap>
 <loc>http://www.example.com/sitemap2.xml.</loc>
 </sitemap>
 </sitemapindex>

XML-карты можно создать и автоматическим путем. Для этого чаще всего используются различные плагины, которые могут быть как платными, так и совершенно бесплатными.

Прежде, чем внедрять Sitemap.xml для своего сайта, не будет лишним ознакомиться с основными рекомендациями от поисковых систем. Это поможет избежать лишних ошибок в индексации вашего интернет-ресурса.

Что следует знать о требованиях Google

В первую очередь нужно помнить, что у всех поисковиков существует ограничение по общему количеству ссылок на файлики sitemap. Для Гугла это количество не должно превышать число в 50 000. Общий размер файла не должен весить больше 50 мегабайт.

Какие стоит использовать форматы файлов, которые поддерживает Гугл в качестве sitemap:

  • XML — является стандартным и самым распространенным вариантом расширения.
  • .txt — текстовый формат
  • Для блогов с фидом RSS или Atom подойдут форматы RSS, media RSS и Atom 1.0.

Также стоит упомянуть, что любой интернет-ресурс всегда можно создать с помощью сервиса «Google Сайты». Учитывая то, что для поисковика сделанный сайт является родным, то и sitemap у него будет реализован автоматически, соблюдая все критерии.

К текстовым файлам также имеются четкие требования. Во первых, необходимо использовать кодировку UTF-8. Во вторых, в файле не должно содержаться никакой другой информации, кроме списка URL. Текстовый файл можно называть по-разному, однако расширение .txt должно присутствовать. (например, sitemap.txt).

Что следует знать о требованиях Яндекса

В этом поисковике дела обстоят немного строже. Например, Яндекс поддерживает только ключевые форматы сайтмапа - основной XML и текстовый .txt, а объем должен быть не выше десяти мегабайт. При этом, Яндекс умеет распознавать Punycode в оригинале и закодированном виде.

Теперь, когда мы узнали, из чего состоит сайтмап и в каком виде его необходимо предоставлять для поисковиков, давайте же разберемся непосредственно с самим процессом внедрения файла.

Внедрение Sitemap.xml

Первое, что вы должны сделать - поместить файл в корневую директиву сайта: http://mysite.ua/sitemap.xml. В случае, если у Вас присутствует сразу несколько файлов - создаем индекс карт, где будут расположены ссылки на каждый XML-файлик. Затем, мы в обязательном порядке добавляем директиву в robots.txt!
Пример:
Sitemap: http://mysite.ua/sitemap.xml

Ссылку файлика следует также указать в панелях вебмастеров тех поисковиков, с которыми мы работаем, т.е. в большинстве случаев это Google Search Console и Яндекс.Вебмастер.

Анализ файлов Sitemap в панелях вебмастеров

Если вы хотите проверить вашу XML-карту в Google Search Console, вам достаточно будет зайти в раздел «Сканирование», где вы отыщете пункт “Файлы Sitemap”.

Тут вы сможете добавлять и проверять файлы Sitemap, отслеживать количество отправленных, а также проиндексированных страниц и оперативно реагировать на возникновение ошибок в картах сайта. Вдобавок ко всему, вы всегда можете заново отправить карты XML, или вообще удалить их.

Схожим образом, проверка Sitemap осуществляется и в Яндекс.Вебмастер. Для этого достаточно выбрать в меню слева “Индексирование” и там отыскать нужный нам “Файлы Sitemap”.

Выводы

Несмотря на важность наличия Sitemap на сайте, большинство пользователей всё-таки не всегда учитывает факт того, что не все ссылки, указанные в файле, могут быть добавлены в поисковый индекс. Создавая и отправляя сайтмап в вебмастерах, мы таким образом даем поисковику крайне важную подсказку, рекомендуя определенные URL, которые считаем достаточно качественными для взаимодействия с поисковыми системами.