Почему существуют сайты в двух вариантах http://site.ru и http://www.site.ru

Откуда это появилось? Когда Интернет был маленьким, а сервера слабые, то на на разных серверах стояло разное программное обеспечение для разных целей:

www.site.ru - сам сайт

mail.site.ru - почтовый сервер

Потом Интернет вырос и указание www перед сайтом стало ненужным.

Откуда вообще появляется www перед адресом сайта?

Вы обращали внимание, что после запуска сайта он доступен в двух вариантах - как с www, так и без www. Причем это не зависит от применяемой CMS, даже для сайта на простом html префикс www все равно будет существовать.

Это собственно идет от сервера хостинга. Если внимательно посмотреть на структуру записей DNS, Вы увидите там следующее:

Вот, внизу две записи = www IN A / www IN AAAA - это как раз указание серверу добавлять и показывать страницу с www (вариант А - для IPv4, вариант АААА - для IPv6)

Сайты с www - это дубль сайта?

Это одна и та же страница, которая показывается всем под ДВУМЯ разными адресами. Ранее это было большой проблемой для поисковых машин, т.к. это выглядело как ДВА разных сайта. Сейчас в вебмастерах поисковых систем предусмотрено прямое указание со стороны пользователя, что считать основным сайтом и что считать его зеркалом. Далее поисковые машины "склеивают" два сайта в один (если содержимое на этих сайтах совпадает на 100% - а оно совпадает, т.к. физически страница одна).

И в выдаче показывают только основной сайт.

Как выбрать вариант с www или без www

В основном зависит от Вашего желания. Если сайт уже не первый год в интернете - то надо смотреть, на какой вариант сайта больше всего существует внешних ссылок

- если на вариант с www - выбирайте www

- если ссылок больше на вариант http://titovsergei.ru - то выбирайте без www

Если у Вас корпоративный сайт и Вы его активно рекламируете вне интернета - то вариант www.titovsergei.ru более привычен для пользователей (и ссылки потом надо на вариант с www ставить).

Фактически большая часть вебмастеров выбирает вариант без www, как собственно и домен без www. Вариант с www - это дополнительный вариант, который дополнительно генерирует хостинг.

Почему плохо иметь два дубля сайта с www и без www

Роботы конечно умеют "клеить" два сайта в один - но нам-то надо, что сайт рос в поисковой выдаче. А одним из основных критериев полезности сайта с точки зрения поискового робота является наличие ссылок на страницы сайта. И как на чужих сайтах поставят на Вас ссылку - Вы повлиять не можете. 

В результате часть внешних ссылок ведет на http://www.titovsergei.ru,  а часть на http://titovsergei.ru  И получается, что "разные" части Вашего сайта по разному популярны в сети. Нужно помочь немного поисковым роботам, что бы они правильно "склеили" сайт в единое целое и правильно учитывали ссылочную базу.

Как избавиться от дублей сайта с www?

Варианты у нас есть следующие:

1. Простой и неправильный - идем у хостинга в редактирование записей DNS-зоны и убираем записи с www. Вот даже кнопка есть "отключить". Все - больше сервер хостинга не будет делать дубль с www. Но это плохой и неправильный вариант - может уже кто-то ссылку поставил на www, кто-то привык набирать адрес сайта с www.

2. Прямое указание в вебмастерах поисковых систем. И для Яндекса можно еще в файле robots.txt прописать директиву Host с указанием основного сайта.

Для Гугль в панели надо создать записи для двух сайтов с www и без www, подтвердить права на оба сайта, потом выбрать основной сайт и удалить запись со вторым сайтом (который стал зеркалом основного сайта)

3. Редирект формата 301.

Мы указываем серверу, что необходимо все заходы с www переадресовывать на сайт без www. Тут существует масса вариантов, как это можно сделать. Но лучше обратиться в саппорт хостинга, что это сделали они.

- прописать нужное в файле .htaccess - это служебный файл в корне сайта под управлением сервера Apache (для Lunux)

- соответствующие настройки на служебного файла для Windows-систем

- нужный jawa-скрипт

- специальный файл на php

- включить переадресацию средствами хостинга через панель управления

Вариантов много и лучше данный вопрос отдать специалисту. Потом надо обязательно проверить, что переадресация работает на всех страницах сайта, а не только на главной странице.

Все должно быть одинаково для роботов

Да, и что бы не путать бедных роботов поисковых систем - все должно быть одинаково:

- выбрано в вебмастерах главное зеркало http://titovsergei.ru

- в файле sitemap.xml все указано без www

http://titovsergei.ru/
http://titovsergei.ru/me/abc.htm
http://titovsergei.ru/me/admin.htm
http://titovsergei.ru/me/activ.htm

и так далее

- в файле robots.txt все тоже должно быть указано без www

Host: titovsergei.ru

Sitemap: http://titovsergei.ru/sitemap.xml

(да, директива Host - только название домена, а директива Sitemap - полный путь к файлу)

Как узнать о склейке сайтов (Яндекс)

Если сайт Ваш - можно посмотреть в вебмастере Яндекс, до склейки там будет указано два сайта

Если сайт чужой - воспользоваться помощью Яндекса

https://yandex.ru/support/webmaster/yandex-indexing/site-mirrors.xml#main-mirror

Проверить является ли сайт зеркалом можно с помощью формы Сообщить о новом сайте. Если сайт является чьим-либо зеркалом, появится сообщение: «Указанный вами сайт является неглавным зеркалом сайта...».

 

 

  • SEO - что это? (1106)

    SEO - это на английском search engine optimization Т.е. буквально оптимизация сайта под индексирование поисковыми машинами (в первую очередь конечно Яндекс и Google). Проблема в том, что алгоритмы индексации являются закрытой информацией и можно только догадываться из опыта и здравого смысла, как эти алгоритмы работают (хотя и у Яндекса и у Google есть...

  • Кнопки "Поделиться" (996)

    Кнопки "Поделиться" используются для передачи информации о странице в ленту соответствующей социальной сети. Следует понимать, что Ваш пост в ленте увидят не все друзья. Все социальные сети по своим алгоритмам принимают решение, что именно показывать в ленте. В среднем порядка 10-15% друзей увидят Вам пост....

  • Нужен ли www в начале адреса сайта (901)

    Почему существуют сайты в двух вариантах http://site.ru и http://www.site.ru Откуда это появилось? Когда Интернет был маленьким, а сервера слабые, то на на разных серверах стояло разное программное обеспечение для разных целей: www.site.ru - сам сайт mail.site.ru - почтовый сервер Потом Интернет вырос и...

  • Автопостинг в социальные сети (883)

    В последнее время для продвижения своих товаров/услуг стали занимать социальные сети. Если посмотреть внимательно, там уже идет война роботов с роботами, т.е. большая часть постингов в Вашей ленте сделана роботами. В принципе, у нас есть несколько путей добавления контекста в социальные сети: 1. Посадить...

  • Снипет (783)

    Снипет - это то краткое описание сайта, которое показывается в выводе поисковых систем. Название спипета - этот title Вашей страницы Описание сайта для Яндекса: - длина текста в спипете 240 символов (с пробелами) - по умолчанию робот сам составляет описание из текста страницы (иногда используя тэг Description) Описание сайта для...

  • Счетчики и их основные параметры (750)

    Счетчики, установленные на сайт, позволяют анализировать много параметров Вашего сайта. Как правило, используются два основных счетчика - от Яндекс и от Гугль. Счетчик от Яндекса называется Метрика и находится здесь https://metrika.yandex.ru В рамках одного аккаунта можно заводить несколько счетчиков на разные сайты. В Яндексе...

  • Что хотят роботы (поисковых систем) (695)

    Попробуем оценить со стороны этого здравого смысла, ЧТО НАДО и ЧТО НЕ НАДО делать, что бы поисковые машины хорошо относились к сайту. В целом любая поисковая машина/робот пытаются оценить два основных параметра сайта (используя самые разнообразные алгоритмы): А) насколько сайт интересен для...

  • Биржи ссылок (646)

    Поисковые роботы оценивают Ваш сайт. в том числе, насколько он интересен другим сайтам. Т.е. по объему ссылочной базы. Если никто не ссылается на Ваш сайт - значит там нет ничего интересного.Как пример - сайт www.adme.ru - порядка 1 млн. визитов в месяц при 300 000 страниц и 300 000 ссылок. Кстати, простая грубая оценочная...

  • Семантическое ядро (314)

    Семантическое ядро сайта - вот оно :)Или все-таки не оно?На Ваш сайт посетители переходят на конкретные страницы, а не в целом на сайт. Соответственно можно и нужно говорить о семантическом ядре каждой страницы.Зачем это нужно? К сожалению, роботы пока не такие умные, как хотелось бы. Например, Вы...

  • "Черное" SEO (218)

    Черное SEO - продвижение сайта за счет обмана поисковых систем. Поисковые системы обижаются и выбрасывают сайт из поиска.1. Накрутка поведенческого фактора - бан 6 месяцв - Userator, Movebo, WebEffector, SerpClick, Seopult2. Накрутка подсказок в поисковой строке