Поисковая машина Гугль для российского сегмента находится здесь www.google.ru
Для международного сегмента находится здесь www.google.com
Search Google
Есть проблема – гугль все равно Вас переадресует на российский вариант, определив Ваше расположение. Если Вы хотите искать без привязки к территории, то нужно использовать вариант www.google.com/ncr (и Вы останетесь в домене .com)
Наиболее известные сервисы Гугль для вебмастеров:
Вебмастер – https://www.google.ru/webmasters/
Контекстная реклама – https://www.google.ru/adwords/
Анализ сайта на быстродействие – https://developers.google.com/speed/pagespeed/insights/
Основные ключевые слова Гугль для поиска:
Ключевое слово | Как работает |
site:somesite.ru – найдет все страницы по данному домену и поддоменам | Поиск только на указанном сайте. Учитывает только url |
inurl:news – найдет все страницы, где в uri встретится данное слово | Поиск по словам, присутствующим в uri. В отличие от кл. слова “site”, ищет совпадения после имени сайта |
intext:”пробки” – полностью аналогично обычному запросу “пробки” | Поиск в теле страницы |
intitle:”index of” — найдет все страницы с листингом директории | Поиск в заголовке страницы. Текст, заключенный между тэгами <title> |
ext:pdf – найдет все pdf-файлы | Поиск страниц с указанным расширением |
filetype:pdf – аналогично | В настоящее время полностью аналогично кл. слову “ext” |
Поиск сайтов со схожей тематикой | related:google.ru – покажет свои аналоги |
link:somesite.ru — найдет все сайты, на которых есть ссылка на данный | Поиск сайтов, ссылающихся на данный |
define:0day — определение термина | Показать определение слова |
cache:google.com – откроет страницу из кэша | Показать содержимое страницы в кэше (если имеется) |
Поисковые алгоритмы
Фильтры
PR – page rank
PageRank — это числовая величина, характеризующая «важность» веб-страницы. Чем больше ссылок на страницу, тем она «важнее». Кроме того, «вес» страницы А определяется весом ссылки, передаваемой страницей B. Таким образом, PageRank — это метод вычисления веса страницы путём подсчёта важности ссылок на неё.
В 1996 году Сергей Брин и Ларри Пейдж, тогда ещё аспиранты Стэнфордского университета, начали работу над исследовательским проектом BackRub — поисковой системой по Интернету, использующей новую тогда идею о том, что веб-страница должна считаться тем «важнее», чем больше на неё ссылается других страниц, и чем более «важными», в свою очередь, являются эти страницы. Через некоторое время BackRub была переименована в Google. Первая статья с описанием применяющегося в ней алгоритма ранжирования, названного PageRank, появилась в начале 1998 года, за ней следом вышла и статья с описанием архитектуры самой поисковой системы. Их система значительно превосходила все существовавшие тогда поисковые системы, и Брин с Пейджем, осознав её потенциал, основали в сентябре 1998 года компанию Google Inc., для дальнейшего её развития как коммерческого продукта.
PageRank можно перевести с английского языка как «ранг страницы», однако Google Inc. связывает слово Page в названии алгоритма не с английским словом «страница», а с именем Ларри Пейджа (англ. Larry Page).
Analytics.Google
Webmaster.Google
Сервис Webmaster Google
Находится здесь https://www.google.ru/webmasters/
Регистрируем аккаунт (если еще нет), заходим в сервис и регистрируем свои сайты (через разные варианты подтверждения прав). Ничего сложного.
Важные нюансы, которые совсем не очевидны.
1. Гугль достаточно условно реагирует на инструкции в файле robots.txt
1.а Запрет индексирования отдельных частей/страниц сайта. Гугль все равно проиндексирует все, до чего дотянется, просто страницы, запрещенные к индексированию, не будет показываться в выдаче. Если Вы хотите полностью что-то закрыть от Гугля – надо ставить пароль на папку на сервере.
1.б Основное зеркало сайта – на инструкцию в robots.txt Гугль не обращает внимания, робот выбирает вариант автоматически. Можно вручную дать указание в вебмастере: завести два варианта сайта (с www и без www), указать нужный вариант (например, без www), второй вариант сайта из вебмастера удалить.
1.в Файл sitemap. Робот сам обходит сайт, не обращая внимания на sitemap, нужно указать вручную в настройках вебмастера (где этот файл находится и загрузить его в сервис).
2. Удаление отсутствующих страниц (код ошибки 404) сайта из индекса Гугль. Само не удаляется.
Надо:
2.а Внести запрет на страницы/папки в robot.txt
2.б Указать вручную роботу, что их надо удалить из индекса
3. Гугль хочет “видеть” сайт как человек, т.е. просто текста ему недостаточно. Нужны картинки и таблицы стилей. Если на них стоит запрет в robots.txt – надо разрешить, иначе сайт будет понижаться в выдаче.
Для использования возможностей сервисов необходимо подтвердить права на сайт. Скрин из панели Гугль.Вебмастер
Т.е. основные способы:
– указание специального кода в заголовке head
– размещение файла с кодом в корневой директории сайта
– настройка записи в редакторе DNS
Подпишитесь в VKontakte - нажмите кнопку | ||
Подпишитесь в Telegram - нажмите кнопку | ||
Наша группа ODNOKLASSNIKI |
Вы можете сохранить ссылку на эту страницу себе на компьютер в виде htm файла
Запрос на размещение Вашего рекламного поста (тема и email будут добавлены автоматически в письмо)
В Вашем браузере должна быть настроена обработка ссылок mailto
site_post@bk.ru
или просто скопируйте адрес e-mail
Почитать в разделе
ИНДЕКСИРОВАНИЕ САЙТА

(Читать полностью...)
- Всего статей в разделе: 8
- Показано статей в списке: 7
- Сортировка: название по алфавиту
Update поиска

(Читать полностью...)
Индексация и коды сервера

(Читать полностью...)
Кто такой User Agent?

(Читать полностью...)
Поисковая машина Яндекс

(Читать полностью...)
Счетчики и их основные показатели

(Читать полностью...)
Файл robots.txt

(Читать полностью...)
Файл Sitemap.xml

(Читать полностью...)