Что такое зеркало сайта
Вы наверняка сталкивались с ситуацией, когда один и тот же сайт открывается по нескольким адресам. Например, с префиксом `www` и без него. Это и есть классический пример зеркал.
Зеркало сайта — это полная или частичная копия сайта, доступная в интернете по другому URL-адресу (доменному имени или протоколу). Для поисковых систем каждый такой адрес — это отдельный ресурс.
Если вы не указали поисковому роботу, какой из адресов является основным, он выберет его самостоятельно. И этот выбор может оказаться не в вашу пользу.
Виды зеркал
В своей практике я разделяю зеркала на несколько категорий. Понимание этих различий помогает быстрее находить и устранять проблему.
Основные технические зеркала
Это самый распространенный тип дублей, который встречается почти на каждом втором проекте до начала SEO-оптимизации. Они возникают из-за настроек сервера по умолчанию.
- С `www` и без `www`. Адреса `www.site.ru` и `site.ru` — это два разных хоста для поисковых роботов.
- По протоколам HTTP и HTTPS. После установки SSL-сертификата сайт может стать доступным по адресам `http://site.ru` и `https://site.ru`. Это тоже зеркала.
- Со слешем (/) в конце URL и без него. Адреса `site.ru/catalog/` и `site.ru/catalog` могут восприниматься как дубли, если сервер настроен некорректно.
Алиасы домена (доменные зеркала)
Иногда владелец регистрирует несколько доменных имен для одного проекта. Это делается для защиты бренда или на случай, если пользователь введет адрес с опечаткой.
Например, `megamarket.ru` и `мегамаркет.рф` могут вести на один и тот же сайт. Если не настроить перенаправление, поисковые системы увидят два идентичных ресурса.
Зеркала для распределения нагрузки
Крупные порталы и сервисы (как Википедия) используют зеркала, чтобы распределить нагрузку между серверами в разных странах. Это ускоряет доступ к контенту для пользователей из разных географических точек.
Для коммерческих сайтов в большинстве случаев такой подход не требуется и является избыточным.
Почему зеркала — это проблема для SEO
Наличие неуправляемых зеркал — прямой путь к проблемам с ранжированием. Поисковые системы не любят неопределенность и дублированный контент.
- Дублирование контента. Google и Яндекс видят несколько сайтов с одинаковым содержимым. Это может привести к пессимизации (понижению в выдаче) всех копий, так как поисковик не может определить первоисточник.
- Размывание ссылочного веса. Внешние ссылки — важный фактор ранжирования. Если разные сайты ссылаются на разные версии вашего домена (с `www` и без), ссылочный вес "размазывается" между зеркалами, вместо того чтобы концентрироваться на одном, главном адресе.
- Путаница в индексации. В индекс поисковой системы могут попадать страницы с разных зеркал. В результате в поиске может отображаться не та версия страницы, которую вы считаете основной (например, версия с HTTP вместо защищенной HTTPS).
- Риск санкций. В редких случаях, если зеркала созданы умышленно для манипуляции поисковой выдачей, Яндекс может наложить на них фильтр "Аффилиат", исключив все копии, кроме одной, из поиска по многим запросам.
В итоге вы теряете трафик и позиции, даже если у вас качественный контент и хороший сайт.
Как найти все зеркала сайта-дубли
Перед тем как решать проблему, нужно понять ее масштаб. Я использую простой и надежный алгоритм для поиска всех копий ресурса.
- Ручная проверка. Попробуйте ввести в адресной строке браузера все возможные вариации вашего адреса: `http://site.ru`, `https://site.ru`, `http://www.site.ru`, `https://www.site.ru`. Если вас не перенаправляет на один и тот же итоговый URL, значит, у вас есть зеркала.
- Поиск по уникальному тексту. Скопируйте уникальный фрагмент текста с главной страницы (например, из раздела "О компании") и вставьте его в кавычках в поисковую строку Яндекса и Google. Если в выдаче появятся разные домены с этим текстом, вы нашли зеркала.
- Проверка через оператор `host:`. В Яндексе можно использовать специальный оператор. Введите в поиске `host:site.ru` и `host:www.site.ru`. Сравните количество страниц в индексе.
Главное зеркало: как выбрать и указать поисковикам
Цель всей работы с зеркалами — выбрать один-единственный адрес, который будет считаться основным (главным зеркалом), и "склеить" с ним все остальные.
Как выбрать главное зеркало
Если вы только начинаете, выбор прост. Я рекомендую придерживаться следующих правил:
- Использовать HTTPS. Сегодня это стандарт безопасности и небольшой плюс для ранжирования.
- Выбрать один вариант `www`. Исторически сложилось, что домены без `www` короче и проще для запоминания. Я советую выбирать именно их. Но это дело вкуса, главное — последовательность.
Таким образом, идеальный вариант для нового сайта — `https://site.ru`.
Если сайт уже давно существует, главным зеркалом стоит выбрать тот адрес, у которого больше проиндексированных страниц и внешних ссылок.
Настройка 301 редиректа
Это главный инструмент для склейки зеркал. 301-й редирект — это серверная команда, которая сообщает браузерам и поисковым роботам, что страница навсегда переехала на новый адрес. Он передает почти весь ссылочный вес со старого URL на новый.
Настройка выполняется в файле `.htaccess` (для серверов Apache). Вам нужно добавить в него специальный код, который будет перенаправлять все запросы на главный домен. Обратитесь к вашему хостинг-провайдеру или разработчику за помощью, если не уверены в своих силах.
| Исходный адрес | Итоговый адрес после редиректа |
|---|---|
| http://site.ru | https://site.ru |
| http://www.site.ru | https://site.ru |
| https://www.site.ru | https://site.ru |
Использование файла robots.txt (директива Host)
Для Яндекса можно дополнительно указать главное зеркало в файле `robots.txt`. Для этого используется директива `Host`.
Важно: директива `Host` должна быть одна, и она должна указывать на главный домен, включая протокол. Например:
User-agent: *
...
Host: https://site.ru
Это не замена 301 редиректу, а дополнительный сигнал для Яндекса. Google эту директиву не учитывает.
Атрибут rel="canonical"
Этот атрибут размещается в коде страницы (`
`) и указывает поисковому роботу канонический (предпочтительный) URL для данной страницы. Он полезен в ситуациях, когда невозможно настроить 301 редирект.Например, если у вас есть страницы с параметрами для сортировки товаров (`/catalog?sort=price`), `canonical` поможет указать основную версию страницы (`/catalog`), чтобы избежать индексации дублей.
Инструменты для вебмастеров
И Яндекс.Вебмастер, и Google Search Console позволяют указать основной домен. В Google это делается через раздел "Настройки" -> "Настройки домена". В Яндексе правильное главное зеркало определяется автоматически после настройки 301 редиректов и директивы `Host`. Контролировать процесс можно в разделе "Индексирование" -> "Переезд сайта".
Склейка зеркал
Склейка зеркал — это процесс, в ходе которого поисковая система "осознает", что несколько адресов являются копиями одного сайта, и начинает учитывать в ранжировании только главное зеркало. Все накопленные показатели (ссылочный вес, поведенческие факторы) передаются основному домену.
После правильной настройки 301 редиректов процесс склейки происходит автоматически. Обычно он занимает от двух недель до нескольких месяцев. Скорость зависит от частоты посещения вашего сайта поисковыми роботами.
Заключение
Работа с зеркалами — это фундаментальная задача технической оптимизации. Ваш сайт должен иметь один главный адрес. Все остальные возможные URL-адреса должны вести на него через 301 редирект. Это обеспечит корректную индексацию, концентрацию ссылочного веса и избавит вас от множества потенциальных проблем с SEO.