G|Translate: English EN Français FR Deutsch DE Italiano IT Русский RU Español ES

Что хотят роботы поисковых систем

4/5 - (1 голос)

Как говорят математики — «существует необходимое, но недостаточное условие». Что это для SEO? Что бы поисковый робот не ругался :) Если роботу изначально «не нравится» Ваш сайт — то дальнейшие усилия по продвижению не имеют смысла.

Что хотят роботы поисковых систем

Подробнее про хотелки роботов можно прочитать в Вебмастере.

Яндекс.Вебмастер любезно предоставляет список (скан первой части), что именно проверяет робот (конечно, список не полные и время от времени он меняется).

Что хотят роботы поисковых систем

Далее попробуем оценить со стороны этого здравого смысла, ЧТО НАДО и ЧТО НЕ НАДО делать, что бы поисковые машины хорошо относились к сайту. В целом любая поисковая машина/робот пытаются оценить два основных параметра сайта (используя самые разнообразные алгоритмы):

А) насколько сайт интересен для пользователей

А.1. Не надо делать страницы с объемом текста менее 2000 знаков и оригинальностью ниже 90% (методом копи/паста). Вполне очевидно, что пользователю на этих страницах нечего читать (или текст уже есть в интернете) — вот поисковые машины и не будут такие страницы нормально индексировать, робот читать не умеет, но умеет анализировать.

А.2. Не надо вставлять картинки ссылкой с чужих сайтов, картинка должна храниться на сервере/хостинге Вашего сайта. Если поисковая машина видит, что ВСЕ картинки на странице не Ваши (а в виде ссылок на чужие сайты) — значит опять копи/паста и опять плохо.

А.3. Плохая юзабилити сайта (сайтом пользоваться невозможно, кривая и непонятная навигация), т.е. посетитель не понимает, что ему дальше нажимать. Это хорошо видно в отчетах любого счетчика — если средняя глубина просмотра Вашего сайта 2,0-2,5 — это означает только одно = Ваш сайт никому не интересен. Т.е. посетитель зашел на сайт (1 страница), что-то там нажал, перешел на 2-ю страницу и ушел. И смысла заниматься раскруткой нет, пока не будет решен вопрос с глубиной просмотра, так как все с таким трудом полученные визиты ни к чему не приведут (2 страницы просмотра и уход с сайта).

А.4. 2000 знаков на страницу — это порядка 4-5 абзацев, т.е. где-то 2-3 раздела. Если выделить разделы жирным шрифтом и отступами — для пользователя это будет хорошо, но робот поисковой машины не оценит. Выделять названия разделов надо через тэги <h3> или <h4>, тогда робот понимается, что с точки зрения пользователя текст читаемый.

А.5. На страницах обязательно должна быть внутренняя перелинковка на другие страницы сайта, т.е. переходы между страницами не только через элементы меню. Это облегчает навигацию для пользователя (и роботы это оценивают хорошо).

А.6. Посадочная страница, она же landing page. Проблема в том, что для хорошей индексации страницы нужна хорошая текстовая страница от 2000 знаков, а для хорошей конверсии (т.е. переход пользователя на страницу заказа по кнопке КУПИТЬ) нужна страница с минимальным текстом крупным шрифтом и большой кнопкой. Поэтому делается два основных варианта — для рекламы используется отдельная посадочная страница, оптимизированная под высокую конверсию ИЛИ на видимой части экрана делается часть страницы для заказа, а ниже на на 2-3 экрана — подробное описание на 2000 символов :)

Б) насколько сайтом занимаются разработчики

Б.1. Не обновлять информацию на сайте. Если информация не обновляется, сайт не меняется — он начинает в выдаче показываться все ниже и ниже, роботы видят, что сайтом не занимаются, новой информации на нем не появляется. Как неплохой вариант — новости, которые показываются на всех страницах. Одна новость в месяц — и роботы видят обновления всех страниц. Т.е. раздел «Новости» на сайте — это не для людей, это для роботов.

Б.2. Заполненность всех мета-тэгов «TITLE» «KEYWORDS» «DESCRIPTION». Да, сейчас часть этих тэгов напрямую не участвует в алгоритмах индексирования — но если тэги не заполнены, роботы «видят», что сайт сделан спустя рукава, не все данные заполнены.

ВАЖНО: тэг DESCRIPTION используется (частично) поисковыми машинами для формирования снипета и (тоже частично) кнопками «Поделиться» для передачи информации о странице в социальные сети. Если у Вас этот тэг пустой — роботы посмотрят на Ваш сайт «плохо».

Б.3. Низкая скорость загрузки сайта. Очевидно, что если сайт грузится медленно (менее 70 баллов по сервису Google), то нет особого смысла показывать сайт пользователям.

Б.4. Роботы не очень любят одинаковые тексты на разных страницах (как в интернете, так и внутри одного сайта). Что у нас на сайте одинаковое на всех страницах? Правильно — меню, значит, надо запретить роботам его видеть. Это делается через специальные тэги, которые запрещают индексацию части html страницы:

для Яндекса <!— noindex —> пункты меню <!—/ noindex —> (несмотря на обертку как комментарий. Яндекс понимает, и тэг получается валидный)

для Google можно закрыть для робота переход по ссылке (например, непроверенные ссылки или вход для регистрации), <a href=»/signin.php» rel=»nofollow»>Войти</a> Яндекс тоже понимает этот тэг. Это также отпугнет спамеров (и повысит доверие роботов), которые пытаются размещать ссылки в комментариях, если они будут видеть, что незнакомая ссылка закрыта для индексации.

Б.5. Установка счетчиков на сайт, как минимум от Яндекса и Google. Поисковые системы будут «видеть», что разработчики сайта занимаются анализом статистики и значит, что сайтом занимаются.

Б.6. Регистрация сайта в Вебмастере Яндекса и Google. Аналогично — разработчикам интересна аналитика индексации.

Б.7 Наличие на страницах сайта ОДНОГО комплекта тэгов h1. Тэгами h1 выделяется заголовок страницы. Это в помощь роботам. представьте себе обычный сайт — меню вверху, меню сбоку, колонка  с комментариями, внизу новости и в центре наша страница с информацией. Теперь посмотрите на код этой страницы — как бедным роботам понять, где основная информация… Иногда в выдаче в снипете видна часть меню сайта, а не основная информацию. Это как раз, когда робот не разобрался. А с тэгом h1 поисковый робот сразу «понимает», что далее идет основная информация.

Б.8. Актуальность информации на сайте. Да, роботы читать не умеют — но они смотрят на последнюю дату/время обновления страницы (получают информацию от сервера) и сравнивают размер страницы (было/есть сейчас). Как сделать все страницы сайта с актуальными обновлениями?

Блок «новости» — вот наше решение. Внизу (чуть выше футера) в три/шесть колонок на всех страницах выводится блок новостей. Выкладка  одной новости обновляет все страницы. Да, там внизу, новости читать особо никто не будет — но так это и делается не для людей. а для роботов. Робот «видит», что у всех страниц стоит актуальная дата последнего изменения и да и размер всех страниц немного изменился.

В) Отсутствие дублей страниц сайта

Дубли страниц бывают разные

В.1 Дубли с www и без www

Эти дубли появляются от сервера хостинга (прямо указано в записях домена, что нужно с www), так как исторически сложилось, что сайт должен начинаться с www, хотя у самого домена никакого www нет. Более подробно здесь. В принципе поисковые машины это хорошо «знают» и умеют склеивать два этих дубля в одну страницу.

B.2 Еще есть дубли от хостинга, когда сайт открывается по некоторым техническим адресам.

Нужно писать в поддержку хостинга, что бы они более корректно настроили свой сервер. Иногда это нигде не указано в документации на хостинге и случайно обнаруживается в выдаче поисковых машин.

В.3 Дубли страниц от CMS

Вот тут много работы для вебмастера, у каждой CMS свои нюансы, больше всего копий страниц генерирует Joomla.

Г) Отсутствие дублей метатэгов

Необходимо проверять сайт на наличие дублей title (название страницы) и description (краткое описание страницы — частично используется поисковыми машинами для создания  снипета). Для проверки можно использовать Гугль вебмастер (естественно только для уже проиндексированных страниц) или специализированные программы типа Xenu или Netpeak Spider

Д) Роботы хотят узнать, как сайт выглядит для пользователя

Не очевидная вещь. Роботам поисковых систем недостаточно текста с сайта — они хотят видеть и таблицу стилей и картинки. Но в в большинстве CMS индексация служебных каталогов заблокирована в файле robots.txt  Информацию, что хочет увидеть робот — можно увидеть в Гугль вебмастер.

Для основных CMS в файле robots.txt надо разрешить (или закомментировать или удалить запрет) следующие строки.

для 1C Bitrix

# Disallow: /bitrix/ — в папке хранятся шаблоны сайта

# Disallow: /upload/ — в папке хранятся изображения

для WordPress

# Disallow: /wp-includes/ — и шаблоны и изображения

для Joomla

# Disallow: /images/ — изображения

# Disallow: /media/ — изображения

# Disallow: /templates/ — макеты сайта


Вы можете сохранить ссылку на эту страницу себе на компьютер в виде htm файла



Вы будете видеть наш сайт у себя в ленте


Нажмите "Подписаться"


Нажмите "Нравится" или напишите сообщение



Почитать в разделе: SEO — ЧТО ЭТО?

  • Всего статей в разделе: 10
  • Показано статей в списке: 9
  • Сортировка: название по алфавиту

«Черное» SEO

Черное SEO - продвижение сайта за счет обмана поисковых систем. Поисковые системы обижаются и выбрасывают сайт из поиска. 1. Накрутка поведенческого фактора - бан 6 месяцв - Userator, Movebo, WebEffector, SerpClick, Seopult 2. Накрутка подсказок в поисковой...
(Читать полностью...)

Биржи ссылок

Поисковые роботы оценивают Ваш сайт. в том числе, насколько он интересен другим сайтам. Т.е. по объему ссылочной базы. Если никто не ссылается на Ваш сайт - значит там нет ничего интересного. Как пример - сайт www.adme.ru - порядка 1 млн. визитов в месяц при 300 000 страниц и 300 000 ссылок. Кстати, простая грубая оценочная модель: - страниц и ссылок должно быть примерно поровну - кол-во визитов на сайт в месяц = число ссылок *3 Поэтому стали появляться биржи...
(Читать полностью...)

Кнопки «Поделиться»

Кнопки "Поделиться" используются для передачи информации о странице в ленту соответствующей социальной сети. Следует понимать, что Ваш пост в ленте увидят не все друзья. Все социальные сети по своим алгоритмам принимают решение, что именно показывать в ленте. В среднем порядка 10-15% друзей увидят Вам пост. Алгоритмы везде разные, а логика одинаковая - показывать только интересные (данному пользователю) посты: - если Вы увлекаетесь котиками и Ваши друзья увлекаются котиками - то Ваш пост о котиках увидят под 90% друзей  +  = 90% - если Ваш пост о собачках, а Ваши друзья увлекаются котиками - то Ваш пост о собачках увидят 5%...
(Читать полностью...)

Нужен ли www в начале адреса сайта

Почему существуют сайты в двух вариантах http://site.ru и http://www.site.ru Откуда это появилось? Когда Интернет был маленьким, а сервера слабые, то на на разных серверах стояло разное программное обеспечение для разных целей: www.site.ru - сам сайт mail.site.ru - почтовый сервер Потом Интернет вырос и указание www перед сайтом стало ненужным. Откуда вообще появляется www перед адресом сайта? Вы обращали внимание, что после запуска сайта он доступен в двух вариантах - как с www, так и без www. Причем это не зависит от применяемой CMS, даже для сайта на простом html префикс www все равно будет существовать. Это собственно идет от сервера хостинга. Если внимательно...
(Читать полностью...)

Нужен ли слеш в URL?

Периодически на просторах интернета всплывает вопрос: "Нужен ли слеш (косая черта /) на конце адреса сайта? Как правильно: - так http://comphome.ru/2018/09/25/vybiraem-messendzher-na-zamenu-skype/ - или так http://comphome.ru/2018/09/25/vybiraem-messendzher-na-zamenu-skype  Давайте по порядку. 1. Для всех страниц (за исключением Главной) наличие / отсутствие слеша означает для поисковых машин 2 разных адреса. Следует понимать, что никакого отношения к реальным папкам на сервере это не относится. Просто сервер по данному адресу (который URL) отдает html страницу. Да, на заре интернета, когда сайты делались руками - URL совпадал с реальными папками и файлами на...
(Читать полностью...)

Семантическое ядро

Семантическое ядро сайта - вот оно :) Или все-таки не оно? На Ваш сайт посетители переходят на конкретные страницы, а не в целом на сайт. Соответственно можно и нужно говорить о семантическом ядре каждой страницы. Зачем это нужно? К сожалению, роботы пока не такие умные, как хотелось бы. Например, Вы написали статью про процессоры на socket 775 или LGA 775. А что ищут люди? Смотрим статистику Яндекса по словам https://wordstat.yandex.ru/    Ищут  Запросов в месяц  775 сокет  23685  socket 775  12398  lga 557   5313 Поиск в бытовом написании "775 сокет" самый популярный, в отличии от правильного написания. В результате, Вашу...
(Читать полностью...)

Снипет

Снипет - это то краткое описание сайта, которое показывается в выводе поисковых систем. Название спипета - этот title Вашей страницы Описание сайта для Яндекса: - длина текста в спипете 240 символов (с пробелами) - по умолчанию робот сам составляет описание из текста страницы (иногда используя тэг Description) Описание сайта для Google: - длина текста в снипете 160 символов (с пробелами) - робот берет или из Description (длина до 160 символов) или сам составляет описание из текста страницы ВАЖНО: снипет не является неотемлимой частью страницы. Заголовок снипета не меняется, а вот текст зависит от запроса, по которому была показана страница. Т.е. при показе...
(Читать полностью...)

Социальные сети и SEO

Как социальные сети помогают продвинуть сайт? Посмотрите на свой трафик в метрике. Что обычно видим: прямые заходы переходы с поиска переходы с рекламы переходы с социальных сетей Ну и что? Понятно, что если будут переходы с социальных сетей - это хорошо. Но как это повлияет на продвижение сайта? Есть такой параметр - новые посетители. Их обычно под 90%. И они всё обычно одноразовые. Нашел через поиск, зашел на сайт, посмотрел, ушел. Как их сделать многоразовыми посетителями? Что бы они при появлении новых статей/страниц заходили на сайт? Есть разные варианты: сделать подписку на сайте (т.е. пользователь регистрируется на сайте) пользователь оставляет свой email и...
(Читать полностью...)

Счетчики и их основные параметры

Счетчики, установленные на сайт, позволяют анализировать много параметров Вашего сайта. Как правило, используются два основных счетчика - от Яндекс и от Гугль. Счетчик от Яндекса называется Метрика и находится здесь https://metrika.yandex.ru В рамках одного аккаунта можно заводить несколько счетчиков на разные сайты. В Яндексе поддерживается возможность переноса счетчика из одного аккаунта в другой: - письмо в саппорт - подтверждение прав на сайт (разные варианты, самый простой - определенный файл в корень сайта) - техподдержка переносит счетчик :) Счетчик от Гугль называется Аналитикс и находится здесь https://www.google.ru/analytics. Аналогично, в рамках одного аккаунта...
(Читать полностью...)