атрибут canonical что это
Зачем нужен rel canonical
Canonical — в переводе с английского канонический, то есть принятый за образец, эталонный. У web-мастеров это слово имеет свое утилитарное назначение: в HTML-коде оно указывает на приоритетную для индексации страницу, контент которой частично или полностью дублируется в других документах на сайте. Попробуем разобраться с логикой применения тега canonical.
Содержание
Что такое rel canonical
Чтобы объяснить на пальцах, что такое тег «рел каноникал», нужно начать с базовых терминов из словарика юного HTML-щика.
Атрибут rel (от англ. relationship — взаимосвязь) определяет отношения между текущей страницей и документом, на который ведет ссылка под атрибутом href.
В свою очередь, атрибут href (от англ. hypertext reference — гиперссылка) сообщает, о какой ссылке вообще идет речь, т. е. задает адрес документа.
Rel с помощью разных атрибутов сообщает поисковому роботу, что ему делать с указанной далее ссылкой. Например:
Именно каноническую страницу поисковик будет выводить на SERP (страницу выдачи). Правда, это не совсем команда, а, скорее, пожелание. Поисковик волен его проигнорировать и посчитать приоритетной любую из дублирующихся страниц.
Часто canonical называют meta-тегом, т.к. он прописывается в контейнере и передает уточняющую информацию краулеру, но, строго говоря, это не тег, а значение атрибута rel, который прописывается для тега .
Зачем вообще нужны эти заморочки с каноническими ссылками? Атрибут каноникал решает проблему с дублями страниц, которые негативно отражаются на продвижении сайта:
Чтобы как-то навести порядок с дублями, в 2009 г. команда Google дала возможность web-мастерам канонизировать URL определенной страницы. Как это было, читайте здесь: Specify your canonical | Google Search Central Blog.
Настройка канонических документов не только обеспечивает приоритет при индексировании и избавляет от проблем с совпадающими кусками контента, но и передает ссылочную массу со всех дублей на основной адрес.
Когда нужна канонизация
Атрибут rel canonical помогает закрывать от индексации дубли. Ситуации, когда на различающихся URL оказывается одинаковый контент, чаще всего возникают по трем причинам.
HTTP:// и HTTPS:// протоколы
С точки зрения робота это 4 разных сайта, но для пользователя, с какого бы адреса он ни зашел, не будет никакой разницы. Это классический случай, когда на пустом месте поисковый алгоритм может обнаружить дубли, поэтому нужно указать ему canonical URL.
Важно! Если вы работаете по SSL-протоколу, каноническим нужно назначить адрес HTTPS, т.к. защищенный домен — это важный фактор ранжирования.
Генерирование дублей CMS
Сейчас даже самый скромный интернет-магазин предлагает покупателям возможность настроить параметры выбора товара.
Например, мы продаем садового гнома. Основная его категория в каталоге — «Садовые фигуры», но к 8 марта мы решили предложить гнома в разделе «Подарок маме». И вот у нас уже 2 URL на одну позицию:
Таких категорий может быть очень много: «Садовые гномы до 50 см», «Фигуры для сада производства Франции» и т.п. И все это дубли исходной карточки нашего гнома-001 на различающихся URL. Чтобы поисковик не запутался и не пессимизировал сайт из-за кучи дублирующегося контента на разных адресах, нужно присвоить приоритетному URL атрибут rel со значением canonical.
По такому принципу CMS генерируют дублирующиеся страницы везде, где возможна сортировка позиций по различным параметрам: цене, популярности, отзывам, прочим фильтрам (цвет, размер, сезон, бренд и т.п.). Сюда же можно отнести адреса с динамическими GET-параметрами и UTM-метками для отслеживания рекламных кампаний или переходов из соцсетей.
Пагинация
Пагинация — это распределение большого массива данных по страницам. Она существенно облегчает работу пользователя с большими объемами информации и увеличивает скорость загрузки сайта. Без пагинации страница сайта с каталогом товаров или библиотекой статей будет разворачиваться этаким бесконечным манускриптом.
Пагинация реализуется разными способами. Обычно это или список с номерами страниц, или буквенный каталог, или цифры, задающие диапазон отображаемых карточек.
Пагинация делает удобным взаимодействие с сайтом, но переходы между страницами провоцируют формирование дублей. Чтобы этого избежать, можно использовать canonical одним из двух способов:
Правила формирования канонических страниц
Чаще всего канонической назначается первоисходая страница, где с самого начала был опубликован дублирующийся в дальнейшем контент. Прописывая для тега атрибут rel=canonical, нужно соблюдать определенные правила.
Как правильно настроить канонизацию
Путь настройки canonical зависит от характера дублирующихся документов и от способа управления содержимым сайта.
Вручную в HTML-коде
Характер дублей: HTML-документы.
Где руками прописывать атрибут rel=canonical, мы уже выяснили: выбираем приоритетную страницу и даем указания боту в HTML-коде в контейнере по формуле: . После остается ввести эту команду на все дубли.
В плагине CMS
Характер дублей: HTML-документы.
На большинстве популярных движков — в базовой комплектации или в виде отдельного плагина — предусмотрен функционал для автоматической настройки канонизации. Например:
В заголовке HTTP
Характер дублей: документы не в формате HTML.
На запрос дубля сервер должен отдавать адрес первоисточника.
Внесение команды в HTTP-заголовок через PHP:
В файле Sitemap
Характер дублей: HTML-документы. Карта сайта создается для ускорения индексации и не заменяет указание canonical в коде.
Google настаивает, что в Sitemap нужно указывать только канонические ссылки. Соответственно, все URL в XML-файле поисковики будут по умолчанию считать приоритетными при индексировании.
Через 301 редирект
Характер дублей: зеркала сайта, устаревшие данные.
Перенаправить трафик и передать вес на основную страницу с дублей можно, настроив 301 редирект. Способ актуален для следующих ситуаций:
Ошибки настроек canonical
Ошибки канонизации сводят всю кропотливую работу на нет: поисковые роботы просто игнорируют некорректные рекомендации. Перечислим самые распространенные траблы.
Проверка настроек canonical
Для контроля канонических ссылок удобен многофункциональный инструмент комплексной SEO-проверки Screaming Frog SEO Spider Website Crawler. Если вам нужно проверить меньше 500 URL, будет достаточно бесплатной версии. За безлимитную лицензию придется платить £149.00 в год. Отчет Canonical доступен во вкладке Canonicals.
В Google Search Console есть свой инструмент для анализа URL. Подробнее о работе с инструментом читайте в справке суппорта Google здесь.
В Yandex отчет по canonical находится в панели Вебмастера во вкладке «Индексирование» → «Страницы в поиске». При корректной настройке каноничности дубли страниц исчезают из поиска и попадают в список «Исключенные страницы».
Когда Яндекс-бот находит какие-то нестыковки, он присылает уведомление с разъяснениями, что не так и как это исправить. Но известны случаи технических сбоев, когда web-мастера получали странные послания, что «у важных страниц изменился атрибут rel canonical», хотя никаких манипуляций с канонизацией перед этим не проводилось.
Выводы
Руководство по работе с канониклами
В этой статье собраны свежие данные на лето 2021 года о канонических страницах. Разобраны все возможные случаи использования атрибута rel=“canonical”. Рассмотрены основные ошибки при работе, а также даны ответы на популярные вопросы.
Определения каноничности
Каноническая страница — это страница, которую поисковая система считает главной в группе схожих по содержимому.
Неканоническая страница — это страница на которой размещен атрибут rel=»canonical» с адресом другой страницы.
Как выглядит атрибут каноникал
Атрибут rel=“canonical” может быть прописан двумя способами:
Какой из этих методов выбрать лучше всего, разберем в главе «Как указать канонический адрес страницы».
Процесс канонизации
Канонизация — это процесс выбора главной страницы среди дублей (одинаковых страниц доступных по разным адресам) и/или среди страниц с похожим контентом.
В подкасте Search Off the Record от 4 ноября 2020 сотрудник Google Мартин Сплитт рассказал, как поисковик обрабатывает канонизацию:
Сначала нужно обнаружить дубликаты, сгруппировать их вместе и отметить, что эти страницы дублируют друг друга. Затем для всех них нужно найти страницу лидера.
На вопрос: «Обнаруживает ли такой метод только точные дубли или частичные тоже?» специалист ответил:
У нас есть несколько алгоритмов, которые пытаются обнаружить и не учитывать шаблонную часть страниц. Так, например, мы исключаем навигацию из расчета контрольной суммы, убираем нижний колонтитул. Тогда у нас остается то, что мы называем центральным элементом, то есть центральное содержимое страницы, что-то вроде самой сути страницы.
После вычисления и сравнения контрольных сумм, те, которые похожи между собой (сильно или частично) мы объединяем в дублирующий кластер.
Далее по словам Мартина, необходимо выбрать один документ из кластера, который и будет показываться в результатах поиска:
Но вычислить какая из них будет ведущей в кластере не так просто. Есть случаи, когда даже людям будет сложно определить, какая именно страница должна отображаться в результатах поиска. Мы используем более 20 сигналов, чтобы решить, какую страницу выбрать как каноническую из дублирующего кластера.
После сравнения всех сигналов для всех пар страниц, мы приближаемся к фактическому определению канонической.
Почему канониклы важны для SEO
1) Поисковики не любят дублирующийся контент, потому что он засоряют выдачу. Так же алгоритмам бывает непросто выбрать правильно главную страницу. Атрибут rel=»canonical» подсказывает какой URL стоит индексировать.
Google и Яндекс заявляют, что они не всегда признают указанный канонический адрес. Из-за того, что теги каноничности считаются подсказками, а не директивами (указаниями). Учитываются различные сигналы (были рассмотрены выше). Грамотное использование тегов каноничности помогает снизить риск того, что робот сочтет канонической не ту страницу.
Что такое атрибут rel=“canonical”, когда и как его использовать?
В этой статье мы разберём, как и для чего нужно использовать атрибут rel=“canonical”, а также на конкретных примерах опишем, когда его лучше применять.
Что такое rel canonical и для чего он нужен?
Таким образом, если на вашем сайте есть идентичный или очень похожий контент, доступный по разным URL, с помощью атрибута rel=“canonical” можно указать тот URL, который является предпочтительным для индексации.
Когда нужно использовать канонические ссылки
1. Для предупреждения появления различных дублей. Например:
В этом случае нужно добавить атрибут rel=“canonical” на все статические страницы сайта. Например, для страницы https://site.ru/category-1/page-2, rel=“canonical” будет выглядеть следующим образом:
2. Для доступных по разным URL страниц с очень похожим контентом.
Например, это могут быть страницы одной серии товара, который отличается только расцветкой или страницы товара, который расположен сразу в нескольких категориях.
В этом случае нужно указать со всех страниц rel=“canonical” на основную, приоритетную страницу.
3. На страницах пагинации, если в категориях сайта есть страницы «Показать всё».
В таком случае на каждой из страниц пагинации нужно указать канонической страницу «Показать всё».
Например, для страницы https://site.ru/category-1/page-2 нужно прописать канонический URL:
Как указать основной URL при помощи атрибута rel=“canonical”?
Прописать между тегами любой HTML-страницы
Это основной способ. Чтобы указать каноническую ссылку, пропишите между тегами на странице полный URL страницы, которая должна быть в индексе.
Например, для страницы https://site.ru/*utm_content= канонической будет https://site.ru/.
Для получения такого результата, на странице https://site.ru/*utm_content= мы указали тег:
Важно!
Чтобы снизить вероятность ошибки в элементах link, после атрибута rel=“canonical” используйте абсолютные, а не относительные ссылки.
В файле Sitemap
В XML-карте сайта вы можете прописать канонический (основной) URL для любой страницы.
Важно!
Атрибут rel=“canonical” — это рекомендация для поисковой системы, а не правило. В этом случае ПС могут проигнорировать их.
В заголовке HTTP
Лучше всего использовать для документов не HTML-формата. Например, для файлов формата PDF.
В таком случае сервер, при запросе дублирующего файла, должен отдавать ссылку на файл-оригинал:
Важно!
Этот способ подойдёт, если у вас есть доступ к настройкам сервера. Не рекомендуется использовать для HTML-документов.
С помощью плагина
Для CMS существуют различные плагины, которые позволяют настроить канонический URL. Например:
— для WordPress можно настроить canonical с помощью Yoast SEO;
— в OpenCart — реализовано в настройках CMS (нужно зайти в настройки товара и задать параметр SEO URL);
— для настройки атрибута canonical в Joomla (версии 3.х и выше) нужно включить в настройках CMS функцию SEF. После включения для технических страниц вида /index.php?option будет добавлен атрибут rel=“canonical” (с указанием URL на страницу с настроенным ЧПУ).
Как проверить правильно ли настроен rel=“canonical”?
Провести анализ можно специальной программой для SEO-анализа сайта — Screaming Frog SEO Spider.
С помощью этой программы вы увидите:
— какие страницы на сайте без атрибута rel=“canonical”;
— на каких страницах стоит атрибут rel=“canonical”, и какие страницы являются для них каноническими;
Основные ошибки использования rel=“canonical”
— Канонический URL отдаёт 404 ошибку.
— Указанный канонический URL находится на другом домене или поддомене.
— Каноническая ссылка не является индексируемой.
— Использование rel=“canonical” со страниц пагинации на первую страницу.
Для всех страниц пагинации неправильно прописывать канонической первую страницу. Это делает индексацию всех страниц пагинации невозможной.
Для страниц пагинации в качестве канонических нужно указывать эти же страницы.
Например, страница https://site.ru/category-1/page-2 должна содержать каноническую ссылку:
Если в категориях сайта есть страницы «Показать всё», на которых доступны все товары из категории — на каждой из страниц пагинации можно указать канонической страницу «Показать всё».
— Несколько ссылок rel=“canonical” с одной страницы.
Для одной страницы должна быть одна каноническая страница, в ином случае будет учтён только первый URL.
— Разные канонические URL.
Указывайте одни и те же канонические страницы при разных способах реализации атрибута (например, через XML-карту сайта и через rel=“canonical” на самой странице).
Заключение
Атрибут rel=“canonical” — удобный и полезный инструмент для поискового продвижения. При правильном использовании, он повысит эффективность работы и ускорит индексирование сайта, что, в свою очередь, существенно повлияет на его ранжирование.
Хотите узнать правильно ли настроен canonical на вашем сайте — обратитесь к нам.
Оптимизирую сайты с 2009 года. Люблю сложные кейсы, которые оказались не по зубам специалистам с других компаний. Делаю очень подробные аудиты.
Пишу статьи-инструкции на блог SiteClinic по SEO-инструментам и аналитике.
Любимая цитата: Чтобы добиться успеха, надо искренне любить то, чем вы занимаетесь.
Оцените мою статью:
Задайте их прямо сейчас, и мы ответим в течение 8 рабочих часов.
7 комментариев к статье “ Что такое атрибут rel=“canonical”, когда и как его использовать? ”
Про использование со страниц пагинации на первую страницу — полная чушь. Именно это и является единственным верным решением, если на странице «Показать все» очень много товаров. Такая страница будет долго грузиться и плохо восприниматься поисковиками.
Попадать страницам пагинации в индекс категорически не нужно, это практически бесполезные дубли. А ссылки с этих страниц поисковики прекрасно индексируют.
Добрый день, Александр!
Тут на самом деле ситуация какая-то скользкая…
я поднимал эту тему и с Еленой Першиной и отсматривал все возможные рекомендации от Google.
Смотрите,
— да, гугл порекомендовал делать на вьюол,
— Яндекс сначала рекомендовал ссылаться канониклом каждой страницы пагинации на 1-ю страницу, но потом понял, что моменты конфликтуют. и согласились, что да, давайте на вьюол.
Проблема, которая из этого возникает (во всяком случае для Яндекса) — это то, что (ссылаюсь на эксперименты Шакина (вроде)) Яндекс нормально в первые места не выводит страницы с весом более 10 мб. Т.к. долгая по-любому загрузка снижает ПФ.
Lazyload не решает этой проблемы, т.к. Яндекс НАСТАИВАЕТ, чтобы ему при первом обращении выдавали ВСЮ инфу. Но не для каждого владельца сайта просто сделать такую возможность — боту отдавать всю, а пользователю подгружать по лэзилоад.
Поэтому интересно Ваше мнение, как Вы бы сделали? Или, если Сергей Кокшаров близок (а я думаю, к сеоклинике он близок), то предложить ему поделиться своим золотым рецептом канониклов при пагинации + лэзилоад, который подойдет и для Яндекса и для Гугла.
Атрибут rel=»canonical»
Canonical – это атрибут метатега link. Его используют для определения важности отдельной страницы сайта. Адреса этих страниц называют каноническими. При наличии дублей поисковый робот проиндексирует тот контент, который расположен на странице с адресом, помеченным метатегом link с атрибутом canonical. Метатегом пользуются в процессе оптимизации сайта, на котором имеются страницы с одинаковым содержимым. Таким образом удается избежать попадания в поиск множества дублей одного контента с разными сетевыми адресами. Появляются дубли из-за особенностей работы систем управления содержимым сайта. Тег прописывают в заголовок кода страницы.
Возможные причины появления дублей
Атрибут rel=»canonical» необходимо использовать, если на разных страницах сайта присутствует контент, частично или полностью дублирующий содержимое статей, расположенных на страницах с другими сетевыми адресами.
Важность применения атрибута
Система управления содержимым позволяет обращаться к странице по разным сетевым адресам. Проблема возникает при индексации таких страниц. Поисковые роботы начинают думать, что сайт преимущественно состоит из дублей, поэтому понижают его рейтинг в поисковой выдаче. Большое количество одинаковых страниц приводит к ухудшению индексации сайта, что оказывает негативное влияние на эффективность СЕО-продвижения.
Удаление дублей путем использования канонических адресов
Избежать появления в поиске страниц с одинаковым содержимым поможет расположение атрибута rel=»canonical» в коде статей. Поисковики увидят ссылку, помеченную таким атрибутом, и быстро проиндексируют нужную страницу. Адреса страниц с контентом, который должен попасть в поиск, можно писать в абсолютном или относительном значении. При СЕО-оптимизации сайта под Google рекомендуется использовать абсолютный путь к предпочитаемой странице. Риск возникновения ошибки в процессе индексирования будет снижен.
Преимущества использования метатега с атрибутом canonical
Метатег упрощает оптимизацию, делая поисковое продвижение более простым и быстрым. Пользователь исключает из работ по SEO-продвижению необходимость заполнения файла robots.txt, например адресами страниц для печати.
Установка метатега с атрибутом canonical
Как проверить наличие атрибута canonical
Существует несколько способов проверки наличия метатега, указывающего роботу на страницу с каноническим адресом, и присутствия частично или полностью дублированного контента на сайте.
Правильно настроенный метатег с атрибутом canonical повысит эффективность оптимизации и продвижения сайта в интернете.
Что имеют в виду веб-мастера, когда говорят «закрыть тегом каноникал», или что такое Canonical Tags?
На самом деле прижившиеся выражение «закрыть тегом каноникал» не совсем верное. Его суть — использование в секции тега link с атрибутом rel, равным canonical, а также атрибута href со значением, равным URL документа. Визуально исходный код выглядит так:
Соответственно, canonical — это не тег, а значение атрибута rel, которое дает понять поисковикам, какую версию страницы нужно ранжировать.
Для чего следует использовать canonical?
Canonical используют, когда на сайте кроме основной версии документа (страницы сайта с отдельным URL) есть другие документы с похожим контентом. В таком случае canonical указывает поисковым машинам на основную версии страницы.
Особое внимание обратите на слово «похожим» — далее мы еще вернемся к этому определению.
Вот, что о canonical говорит cправка Google:
Если у вас есть одна страница, доступная по нескольким URL, или разные страницы с похожим контентом (например, версии для мобильных устройств и компьютеров), Google будет считать один URL каноническим, а остальные – его копиями. Сканирование канонического URL будет выполняться намного чаще, чем его копий.
Сообщите нам, какой из URL является каноническим. В противном случае мы выберем его самостоятельно или будем считать оба адреса равноценными, а это может привести к нежелательным последствиям.
В справке Яндекса видим аналогичное определение:
Если на сайте есть страница, доступная по нескольким адресам, а также страницы с одинаковым или схожим содержимым, робот Яндекса может посчитать их дублями. Тогда он объединит страницы в группу дублей и выберет для показа в результатах поиска только одну из них — наиболее информативную и релевантную поисковым запросам. Такая страница называется канонической.
Как можно указать канонические URL-адреса?
В качестве альтернативы canonical также можно использовать 301 редирект, но нужно учитывать, что переадресация создает совершенно иной эффект, делая доступным только одну версию страницы. Поэтому вы должны быть уверены, что выбранный метод дает именно тот результат, который вы ожидаете.
Практики применения canonical
Canonical обычно используется с целью избежать появления похожего или дублированного контента в результатах поиска. Сценарии появления такого контента рассмотрим ниже.
Важно! Использование rel=“canonical” href=“” /; не запрещает индексацию либо сканирование документа. Canonical является рекомендацией и может быть проигнорирован поисковой системой. Canonical сообщает поисковой машине, какая версия документа должна появиться в результатах поиска и является по вашему мнению основной.
Запрет индексации осуществляется с помощью:
Кликнем на изменение способа отображения. Получим отображение в столбик:
Обратите внимание на появившиеся в конце URL-адреса параметры. Таким образом реализуется сортировка отображения либо другие необходимые действия. В зависимости от возможных опций сортировки таких страниц с параметрами может генерироваться бесконечное количество. А с точки зрения поисковой машины, каждая вариация с новыми параметрами — это отдельный URL.
Именно для предотвращения подобных проблем необходимо использовать canonical — он позволяет указать на основную версию документа, которую мы хотим видеть в выдаче. В нашем случае страница сортировки имеет следующий canonical:
То есть страница указывает на основную версию документа без параметров.
Неоптимизированная фильтрация
Часто при выборе множества параметров фильтрации в интернет-магазине могут создаваться страницы, которые не оптимизированы под какой-либо кластер запросов.
Когда мы говорим об оптимизации под кластер ключевых слов, имеется в виду, что документ имеет:
Стоит отметить, что стандарт HTML5 допускает использование заголовков любого уровня. Упоминая заголовок Н1, мы рассматриваем классическую ситуацию, которая применяется в стандарте HTML4.
Основной тезис, который вы должны понять: одна посадочная страница = одна потребность пользователя. Например, в категории Laptops & Netbooks https://www.ebay.com/b/Laptops-Netbooks/175672/bn_1648276?_dmd=1 есть фильтры, которые создают отдельные посадочные страницы под разные потребности пользователя.
Выбрав фильтр Workstation, мы попадем на отдельную посадочную страницу https://www.ebay.com/b/Workstation-Laptops-Netbooks/175672/bn_7116632031, которую рассматривали в предыдущем примере.
Но вернемся к ситуации, когда фильтры не оптимизированы либо не могут быть оптимизированы. Например, мы хотим посмотреть товары двух брендов. Очевидно, что нет смысла оптимизировать страницу под такие запросы, так как страница каждого бренда должна иметь собственную посадочную. Подобные результаты фильтрации «скрываются» с помощью canonical.
Важно! В каждом конкретном случае canonical нужно рассматривать индивидуально.
Дубли товаров
В некоторых популярных CMS, например Shopify, товар может содержать полный путь к категории, в которой находится. При добавлении товара в несколько категорий создается дублирование одного товара по нескольким URL.
Третий URL-адрес является предпочтительным и два предыдущих должны указывать на него как на основной канонический документ.
Важно! Рекомендуется избегать таких ситуаций и в категориях ссылаться только на основные версии документов, не прибегая к canonical.
UTM-метки и параметры отслеживания
Параметры в URL могут использоваться для сбора определенной информации, но в то же время создавать страницы с дублированным контентом. Например, URL вида https://site.com/page/ может иметь версию с параметрами https://site.com/page/?fbclid=IwAR3cnDV4ERw24pQNVLTFlwKzchPDA1.
Похожая ссылка формируется при переходе из Facebook. В данном случае применение canonical является отличным решением.
Указание основного зеркала сайта
Сайт, доступный по HTTP- и HTTPS-протоколу одновременно, в глазах поисковика является двумя разными сайтами, как и сайты с использованием www и без.
Указанные ниже вариации — это 4 разных сайта:
Для указания главного зеркала можно использовать canonical.
Например, если главное зеркало — https://site.com/, то остальные:
Чтобы выбрать, какую версию вы хотите сделать основным зеркалом, используйте команду в site:site.com — она поможет определить, какую версию сайта проиндексировали Google и Яндекс, и понять, каких страниц в поиске больше.
Учтите, что между версией на HTTP-протоколе и версией на HTTPS обязательно стоит выбрать последнюю. Почему HTTPS-протокол предпочтительнее и как переехать на HTTPS без потери позиций и трафика, читайте в этом руководстве. С www все не так однозначно — сделать правильный выбор вам поможет эта статья.
Для указания главного зеркала и простоты управления сайтом рекомендуется использовать 301 редирект.
Канонизация междоменных дубликатов
Если дубли страниц принадлежат разным доменам и вы контролируете оба домена, вы можете выбрать основную каноническую версию страницы на другом домене.
Ошибки при использовании Canonical
Канонизирование страниц разного типа
Вернемся к описанию canonical из справок поисковиков. Google рекомендует использовать canonical, «если у вас есть одна страница, доступная по нескольким URL, или разные страницы с похожим контентом». Яндекс также воспринимает как дубли «страницы, доступные по нескольким адресам, а также страницы с одинаковым или схожим содержимым».
Популярная ошибка заключается в указании канонической страницы продукта для страницы категории либо наоборот. В таком случае поисковик может проигнорировать canonical. Аналогично, не стоит указывать для статьи на блоге в качестве canonical страницу продукта.
Ключевой принцип здесь такой: контент на канонической и неканонической странице должен быть одного типа.
Канонические цепочки
Прописывая URL в атрибуте href, обязательно убедитесь, что страница, на которую вы указываете, не имеет canonical, указывающего на другую либо текущую страницу.
Рассмотрим пример. Страница, которую вы хотите канонизировать: https://site.com/phone/iphone12/. Страница, которую вы хотите выбрать канонической: https://site.com/iphone12/. Она уже содержит такой canonical:
Такой вариант использования canonical некорректный, поскольку он создает каноническую цепочку:
Последняя в этой цепочке — страница https://site.com/phone/apple/iphone12/, а значит скорее всего именно ее поисковики посчитают канонической, но возможна и другая интерпретация. Чтобы не запутать поисковых роботов, лучше все-таки указывать одну каноническую страницу.
В нашем примере это значит, что вам необходимо определиться, какую страницу вы хотите сделать канонической: https://site.com/iphone12/ или https://site.com/phone/apple/iphone12/.
В первом варианте нужно заменить canonical на странице https://site.com/iphone12/, чтобы она указывала на саму себя. При этом страницы https://site.com/phone/iphone12/ и https://site.com/phone/apple/iphone12/ нужно канонизировать.
Чтобы оставить канонической страницу https://site.com/phone/apple/iphone12, нужно сделать так, чтобы остальные похожие страницы ссылались именно на нее. Также страница должна ссылаться на саму себя.
Важно! Будьте осторожны при изменении канонических URL. Обязательно выясните, почему используется те или иные значения.
Указание на URL, недоступный для сканирования или индексации
Доступность документа вы можете проверить в Google Search Console, Яндекс.Вебмастере либо инструменте SE Ranking «Аудит сайта».
Указание на URL, отдающий код, отличный от 200
Выбирая канонический URL, также убедитесь, что документ доступен и отдает ответ сервера 200. Проверить это можно с помощью аудита сайта в SE Ranking.
Указание на URL c неверным протоколом
При указании канонической страницы ссылайтесь на протокол, который используется в основной версии сайта. Если основная версия сайта использует HTTPS-протокол, то в атрибуте href вы должны указать также HTTPS-версию страницы.
Неканонические страницы в карте сайта
Следите, чтобы в карте сайта фигурировали только основные версии страниц. Другими словами, в карту сайта необходимо включать только те страницы, которые указывают с помощью canonical сами на себя.
Внутренние ссылки на канонизированные URL
Внутренние ссылки должны указывать на основную версию документа. Исключением являются случаи, когда вы с целью улучшения пользовательского опыта или по иной осознанной причине ссылаетесь на канонизированную, не основную версию документа.
Использование canonical в пагинации
Мнения специалистов по этому вопросу разделились.
Вариант 1. Следуем «правилу хорошего тона»: каждая страница пагинации ссылается сама на себя. Например:
Я придерживаюсь именно этого метода, поскольку считаю, что пагинация должна быть открыта для поисковых роботов.
Мнение 1 приведено для всестороннего освещения существующих проблем. Мнение 1 не является ошибкой использования canonical.
Вариант 2. Второй вариант сводится к закрытию пагинации от поисковика с помощью canonical, который указывает на первую страницу. Например:
Подобная конструкция часто игнорируется поисковиком из-за разного контента на страницах пагинации.
Вариант 3. Существует еще и третий вариант: вовсе не использовать canonical и закрывать пагинацию от поисковиков с помощью
Кейс из практики
Сайт на CMS Shopify содержал ошибку, описанную в разделе Дубли товаров. Структура сайта имела вид:
Как видите, на схеме преобладают красные точки — канонизированные страницы. После устранения этой проблемы схема стала выглядеть куда лучше, с преобладающим зеленым цветом:
И мы получили результат в плане улучшения показов:
Стоит ли использовать canonical или лучше обходить их стороной?
Правильное использование canonical — несложная базовая механика в работе SEO-специалиста. Однако при некорректном применении канонизация может не принести желаемого результата. В итоге сайт будет хуже ранжироваться из-за проблем с дублированным контентом.
Для правильного использования canonical необходимо понять один простой тезис: избегайте создания и генерации дублированного и похожего контента с помощью указания основной версии документа как канонической.
Но во всех правилах бывают исключения. Касаются они и методов борьбы с похожим контентом, и ситуаций, когда в таком дублировании нет ничего плохого. Поэтому вы должны рассматривать каждую ситуацию индивидуально.