G|Translate: English EN Français FR Deutsch DE Italiano IT Русский RU Español ES

Поисковая машина Google

Поисковая машина Гугль для российского сегмента находится здесь www.google.ru
Д
ля международного сегмента находится здесь www.google.com

Поисковая машина Google

Search Google

Есть проблема – гугль все равно Вас переадресует на российский вариант, определив Ваше расположение. Если Вы хотите искать без привязки к территории, то нужно использовать вариант www.google.com/ncr (и Вы останетесь в домене .com)

Наиболее известные сервисы Гугль для вебмастеров:

Вебмастер – https://www.google.ru/webmasters/
Контекстная реклама – https://www.google.ru/adwords/
Анализ сайта на быстродействие – https://developers.google.com/speed/pagespeed/insights/

Основные ключевые слова Гугль для поиска:

Ключевое слово Как работает
 site:somesite.ru – найдет все страницы по данному домену и поддоменам  Поиск только на указанном сайте. Учитывает только url
 inurl:news – найдет все страницы, где в uri встретится данное слово  Поиск по словам, присутствующим в uri. В отличие от кл. слова “site”, ищет совпадения после имени сайта
 intext:”пробки” – полностью аналогично обычному запросу “пробки”  Поиск в теле страницы
 intitle:”index of”  — найдет все страницы с листингом директории  Поиск в заголовке страницы. Текст, заключенный между тэгами <title>
 ext:pdf – найдет все pdf-файлы  Поиск страниц с указанным расширением
 filetype:pdf – аналогично  В настоящее время полностью аналогично кл. слову “ext”
 Поиск сайтов со схожей тематикой  related:google.ru – покажет свои аналоги
 link:somesite.ru  — найдет все сайты, на которых есть ссылка на данный Поиск сайтов, ссылающихся на данный
 define:0day  — определение термина  Показать определение слова
 cache:google.com – откроет страницу из кэша  Показать содержимое страницы в кэше (если имеется)

Поисковые алгоритмы

Фильтры

PR – page rank

PageRank — это числовая величина, характеризующая «важность» веб-страницы. Чем больше ссылок на страницу, тем она «важнее». Кроме того, «вес» страницы А определяется весом ссылки, передаваемой страницей B. Таким образом, PageRank — это метод вычисления веса страницы путём подсчёта важности ссылок на неё.
В 1996 году Сергей Брин и Ларри Пейдж, тогда ещё аспиранты Стэнфордского университета, начали работу над исследовательским проектом BackRub — поисковой системой по Интернету, использующей новую тогда идею о том, что веб-страница должна считаться тем «важнее», чем больше на неё ссылается других страниц, и чем более «важными», в свою очередь, являются эти страницы. Через некоторое время BackRub была переименована в Google. Первая статья с описанием применяющегося в ней алгоритма ранжирования, названного PageRank, появилась в начале 1998 года, за ней следом вышла и статья с описанием архитектуры самой поисковой системы. Их система значительно превосходила все существовавшие тогда поисковые системы, и Брин с Пейджем, осознав её потенциал, основали в сентябре 1998 года компанию Google Inc., для дальнейшего её развития как коммерческого продукта.
PageRank можно перевести с английского языка как «ранг страницы», однако Google Inc. связывает слово Page в названии алгоритма не с английским словом «страница», а с именем Ларри Пейджа (англ. Larry Page).

Analytics.Google

 

Webmaster.Google

Сервис Webmaster Google
Находится здесь https://www.google.ru/webmasters/

Регистрируем аккаунт (если еще нет), заходим в сервис и регистрируем свои сайты (через разные варианты подтверждения прав). Ничего сложного.

Важные нюансы, которые совсем не очевидны.

1. Гугль достаточно условно реагирует на инструкции в файле robots.txt

1.а Запрет индексирования отдельных частей/страниц сайта. Гугль все равно проиндексирует все, до чего дотянется, просто страницы, запрещенные к индексированию, не будет показываться в выдаче. Если Вы хотите полностью что-то закрыть от Гугля – надо ставить пароль на папку на сервере.
1.б Основное зеркало сайта – на инструкцию в robots.txt Гугль не обращает внимания, робот выбирает вариант автоматически. Можно вручную дать указание в вебмастере: завести два варианта сайта (с www и без www), указать нужный вариант (например, без www), второй вариант сайта из вебмастера удалить.
1.в Файл sitemap. Робот сам обходит сайт, не обращая внимания на sitemap, нужно указать вручную в настройках вебмастера (где этот файл находится и загрузить его в сервис).

2. Удаление отсутствующих страниц (код ошибки 404) сайта из индекса Гугль. Само не удаляется.
Надо:
2.а Внести запрет на страницы/папки в robot.txt
2.б Указать вручную роботу, что их надо удалить из индекса

3. Гугль хочет “видеть” сайт как человек, т.е. просто текста ему недостаточно. Нужны картинки и таблицы стилей. Если на них стоит запрет в robots.txt – надо разрешить, иначе сайт будет понижаться в выдаче.

Для использования возможностей сервисов необходимо подтвердить права на сайт. Скрин из панели Гугль.Вебмастер

Поисковая машина Google

Т.е. основные способы:
– указание специального кода в заголовке head
– размещение файла с кодом в корневой директории сайта
– настройка записи в редакторе DNS


Вы можете сохранить ссылку на эту страницу себе на компьютер в виде htm файла