Семантическое ядро

Семантическое ядро сайта – вот оно :)

Семантическое ядро
Или все-таки не оно?
На Ваш сайт посетители переходят на конкретные страницы, а не в целом на сайт. Соответственно можно и нужно говорить о семантическом ядре каждой страницы.

Зачем это нужно?
К сожалению, роботы пока не такие умные, как хотелось бы.
Например, Вы написали статью про процессоры на socket 775 или LGA 775. А что ищут люди? Смотрим статистику Яндекса по словам https://wordstat.yandex.ru/

 

 Ищут  Запросов в месяц
 775 сокет  23685
 socket 775  12398
 lga 557   5313

Поиск в бытовом написании “775 сокет” самый популярный, в отличии от правильного написания. В результате, Вашу правильно написанную статью будут плохо получать в выдаче, потому что ищут другой текст. Конечно, это немного утрировано – роботы “примерно” понимают, о чем идет речь в запросе (синонимы, словоформы и т.д.) – но все равно показ по такому поиску будет на 3-5-ой странице выдачи. А за пределами ТОП-10 выдачи (2-я и далее страницы) жизни нет. Более того, уровень переходов с 1-й и 10-й позиции в ТОП-10 (1 страница) будет отличаться в сотни раз.

Итак, что это – семантическое ядро.

Возьмем для примера страницу
http://comphome.ru/kompyuter/kak-ustanovit-xeon-771-na-lga775.html
(откроется в отдельном окне)

Начнем подбирать к ней слова / словоформы / выражения, которые имеют отношение к содержимому. Получится примерно такая таблица. В колонке “В тексте” указано, сколько раз указанные слова встречаются в нашем тексте (часть добавлена по итогам поиска, ранее по отдельным словам были нули).

Словоформа Частота / мес В тексте страницы
1 intel 1 561 000 22
2 intel core 577 437 4
3 stepping 248 387 6
4 XEON 189 275 57
5 guad core 85 865 1
6 intel xeon 65 571 9
7 dual core 63 464 1
8 процессор разгон 41 760 1
9 характеристика процессора 39 590 5
10 core 2 quad 37 143 2
11 процессор частота 28 457 5
12 e5450 (анг) 24 118 8
13 775 сокет 23 685 10
14 p5q 20 371 1
15 xeon e5450 18 154 8
16 FSB 14 750 5
17 q6600 13 867 1
18 TDP 12 618 10
19 socket 775 12 398 5
20 процессор 775 12 054 1
21 прошивка биос 11 881 1
22 overclock 9 662 2
23 xeon 775 5 847 2
24 LGA775 5 313 6
25 x5460 5 201 2
26 разгон xeon 4 980 1
27 зион 4 523 1
28 серверный процессор 3 139 1
29 степпинг 2 883 2
30 p5q3 2 672 1
31 модифицированный биос 2 670 1
32 параметры процессора 2 541 1
33 bios xeon 2 402 1
34 ксеон 2 275 1
35 е5450 (русс) 1 564 2
36 xeon 771 1 227 5
37 LGA771 930 1
38 771 сокет 911 4
39 socket 771 911 3
40 процессор 771 604 1
41 bios 771 342 1
42 биос 771 324 1
43 адаптер 771 120 1
44 tcase 81 7
45 переходник 771 80 1

Обращаем внимание:
– набралось 45 словоформ
– в таблице есть вложенные данные, очевидно, что Xeon входит в состав Intel Xeon = но нам нужно узнать именно поисковые фразы, а не только слова
– необходимо учитывать и английское и русское написание = все эти “xeon, зион, ксеон”, “stepping, степпинг” и так далее
– то же относится к буквам в названиях х5450 и x5450 = выглядит одинаково, хотя одна буква русская, а одна английская = но для поиска это разные слова

Если посмотреть внимательно, таблица разбивается на три категории:
– высокочастотные запросы = более 10 тыс запросов
– среднечастотные запросы = от 1000 до 10 000
– низкочастотные запросы = менее 1000

И это еще не всё…..

Вспоминаем комбинаторику. Проблема в том, что человек ищет по запросу, который состоит из 3-4 слов.

Как

установить XEON 771 на socket 775
(пусто)
Зион
Процессор
Сокет
Socket
LGA
Ксеон
(Пусто)
Сокет
LGA

даже по первой строке мы получаем 6! простого перебора вариантов = 720 словоформ. У нас еще есть синонимы – во второй строке.
Грубо говоря – надо всё это перемешать, проверить, что именно и сколько ищут, отбросить бессмысленные варианты.

А еще есть по смыслу запрос “Чем отличается socket 771 от 775”. Итого, даже в рамках оптимизации одной страницы работы много.

Без перемешивания и без слова “установить” – получаем следующую таблицу + добавлены данные из Вебстат:

сокет 771 на 775 211
сокет 771 на сокет 775 197
Xeon 771 на 775 107
LGA 771 на 775 94
Xeon 771 на сокет 775 70
процессор 771 на 775 61
Socket 771 на 775 32
Socket 771 на Socket 775 32
процессор 771 на сокет 775 28
Xeon 771 на Socket 775 6
процессор 771 на Socket 775 6
LGA 771 на Socket 775 5
LGA 771 на сокет 775 2
Socket 771 на сокет 775 1
сокет 771 на Socket 775 1
Ксеон 771 на 775 0
Зион 771 на 775 0
Ксеон 771 на сокет 775 0
Зион 771 на сокет 775 0
Ксеон 771 на Socket 775 0
Зион 771 на Socket 775 0

Соответственно, что бы Ваша страница находилась – как минимум первые 5 словосочетаний в тексте должны быть :)

Итого: как сделать SEO страницу?

1. Написать полезный текст
2. Подобрать одиночные слова, которые относятся к этому тексту
3. Проверить их через Вордстат
4. Из основной массы слов сгенерировать выражения, по которым их будут искать
5. Проверить свои предположения через Вордстат
6. Обеспечить включение основной группы выражений в текст

ВАЖНО. Практически невозможно угадать, какая поисковая фраза будет в топе.  Например для нашего текста про XEON 771 это фраза “сокет 771 на 775”. Надо всё проверять и всё тестировать.

Спойлер. Для контекстной рекламы (подбор поисковых фраз) используется этот же принцип.

Казалось бы, в первую очередь надо обеспечить соответствие высокочастотным запросам. Но таких “умных” много (ищут же часто), а в на первой странице выдачи всего 10 мест (тот самый ТОП-10). И поисковая система будет смотреть на другие факторы, насколько данная страница популярна на других сайтах, т.е. на число ссылок.

Таким образом:
1. Если ссылочная база мала (или совсем нет ссылок на данную страницу) оказываем наибольшее внимание низкочастотным запросам. Да, ищут мало – но зато есть шанс попадания страницы в ТОП-10 (конкурентов мало)
2. По мере роста ссылочной базы уделяем больше внимания среднечастотным запросам.
3. При хорошей ссылочной базе можно побороться и за ТОП-10 по высокочастотным запросам.

К сожалению, в поисковых машинах не предусмотрен вариант показа, на каких позициях находится Ваша страница по конкретным поисковым фразам. Можно воспользоваться сторонними сервисами, которые парсят выдачу. Бесплатно для ограниченного количества запросов, платные тарифы для большого количества запросов.

http://analizsaita.com/proverit-pozicii
https://seolib.ru/tools/positions/analysis/#/
http://parserrf.ru/proverka_pozicij.php

И еще вспоминаем о наличии метатэга KeyWords.
Хотя он особо сейчас и не используется для ранжирования – его заполненность ключевыми словами (которые совпадают с тем, что ищут пользователи) “подскажет” поисковому роботу, что со страницей работали. С учетом ограничений (не более 10 слов, разделенными запятыми) лучше указать низкочастотные ключевые слова. Именно по ним в первую очередь будет продвигаться страница.
И как дополнительная памятка вебмастеру – заполненность метатэга KeyWords означает, что с данной страницей проведена SEO-оптимизация.

Не забываем после превращения (внесения ключевых слов в текст) обычной страницы в “seo-страницу” запросить у поисковых роботов переиндексацию в Вебмастере.

“Вебмастер Яндекс” – сайт – “Индексирование” – “Переобход страниц”
“Вебмастер Гугль” – сайт – “Сканирование” – “Посмотреть как Googlebot” – “Запросить индексацию”

Прошло 2 недели, роботы сходили, посмотрели, добавили в индекс, выложили в поиск. Смотрим Яндекс.Метрику с фильтрами:
– конкретная страница
– визиты только из поиска

Семантическое ядро
Произошло то, что и должно быть. Появились визиты с поиска – один/два в день. А раньше их вообще не было, все переходы были внутренние.

И так нужно сделать по каждой странице сайта.
С какой начать?
Смотрим отчеты по посещаемости страниц – начинаем с самой посещаемой (обычно это главная станица, хотя и не всегда). Почему так? Может начать с самой плохо посещаемой страницы? Нет, не выгодно.

Для примера – пусть оптимизация страницы с помощью семантического ядра увеличивает визиты в 10 раз. Для страницы с 1 заходом в месяц это даст всего 10 страниц (плюс 9 визитов), а для страницы со 100 заходами это даст 1000 визитов (плюс 900 визитов).
Кроме того как бы очевидно – что самая посещаемая страница – это самая интересная страница для пользователя.

Конечно. не забываем, что после оптимизации всех страниц (все тексты превратились в seo-тексты) распределение наиболее посещаемых страниц изменится. Теперь на интересы пользователей (что им нужно) наложится seo-оптимизация (качество самого поиска). И дальше можно заняться наращиванием ссылочной базы на топ рейтинговых страниц (скажем первые 10-100 страниц, зависит от размера сайта).

А что, семантическое ядро для всего сайта так и не нужно? Нужно.
Скажем так, создание тематического ядра для всего сайта (по всей тематике) позволяет выявить отсутствующие страницы. Это самое сложное – найти то, чего нет.

Как пример. У Вас сайт по стоматологии. При подготовке тематического ядра по всем запросам выясняется, что есть ряд популярных запросов “как чистить зубы”.
А у Вас на сайте такой страницы нет.
Значит Вы теряете трафик по своей тематике, надо такую страницу создать.