Тег каноникал что это
Теги canonical: простое руководство для новичков (перевод)
Теги Canonical существуют с 2009 года. То есть, почти десять лет. Цель, для которой их создали — помочь вебмастерам решить проблему дублирующегося контента.
Что такое тег canonical
Это фрагмент HTML-кода, который определяет основную версию для нескольких страниц с похожим или полностью дублирующимся контентом. Другими словами, если по разным адресам есть одинаковый контент, вы можете использовать этот тег, чтобы указать, какая страница является основной, и следовательно, которую нужно проиндексировать.
Как выглядит тег canonical
Теги используют простой и согласованный синтаксис, размещаются в разделе веб-страницы:
Что значит каждая часть:
Важность канонических тегов для SEO
Google не любит дублирующийся контент, потому что сложно выбирать оригинал:
Слишком большое количество дублирующегося контента также может повлиять на бюджет сканирования. Это значит, что Google будет тратить время на сканирование нескольких версий одной и той же страницы вместо поиска другого важного материала на вашем сайте.
Канонические теги решают все эти проблемы. Они позволяют вам сообщить, какую версию страницы следует сканировать и ранжировать, где консолидировать любые ссылки.
Если вы не укажите канонический адрес, Google все решит за вас. Самостоятельно.
А полагаться на его грамотный выбор — опрометчиво. Система может выбрать в качестве основной страницы ту, которая в действительности таковой не является.
. но у меня же нет дублирующегося контента!
Да, наверняка вы не стали публиковать одну и ту же статью несколько раз. Но поисковые системы обходят URL, а не страницы.
Это значит, что они воспринимают адреса example.com/product и example.com/product?color=red как уникальные, даже если на них содержится, по факту, один и тот же контент.
Это — параметрические адреса. Они — частая причина возникновения дублирующегося контента. Особенно, если у вас интернет-магазин с фасетной или фильтрованной навигацией.
Например, Brown Bag Clothing продает рубашки. Вот адрес для основной категории товаров:
Если в фильтре выбрать показы только рубашки размером XL, в адрес добавится параметр:
А если нам нужны вдобавок только рубашки голубого цвета, увидим еще один параметр:
Это все отдельные страницы для Гугла, а содержание практически одно и то же.
Однако, такая проблема встречается не только для сайтов электронной коммерции. Вот еще несколько случаев:
В этих случаях использование канонических тегов имеет решающее значение. Кроме того, важны проблемы дублирования контента на разных доменах. Например, при синдикации контента: газета хочет процитировать ваш текст. В таком случае вам надо попросить разместить на вас каноническую ссылку.
Во-первых, вы будете получать реферальный трафик. Во-вторых, обезопасите уникальность вашего контента.
Основы применения тега canonical
Применять легко. Мы рассмотрим четыре способа это сделать далее. Пока — пять основным правил, которые нужно знать и соблюдать.
Правило 1. Использовать абсолютные URL
Джон Мюллер из Google утверждает, что не рекомендуется использовать относительные ссылки вместе с тегом canonical. Чтобы они точно корректно обработались, используйте абсолютные URL.
Правило 2: Соблюдать нижний регистр
Google может обработать и нижний, и верхний регистры как два разных адреса. Поэтому вначале установите принудиттельно строчные адреса на своем сервере, а затем используйте нижний регистр для написания адресов в ссылках с каноническим тегом.
Правило 3: Правильно использовать версию домена
Если переходите на SSL-сертификат, проверьте, что используете верный протокол передачи данных в адресе, то есть, HTTPS. Теоритически, это тоже может привести к путанице и неожиданным результатам.
Правило 4: Использовать самоссылочные канонические теги
Джон Мюллер говорит, что это — рекомендация, а не обязательство.
Это — каноническая ссылка сама на себя.
Располагаться она будет на этой же странице.
Большинство популярных CMS делают это автоматически. Но на всякий случай проверьте.
Правило 5: Использовать один канонический тег на странице
В противном случае Googlebot проигнорирует вообще все канонические теги на странице.
Как применять канонические адреса
Всего есть 4 способа:
Для подробностей можно посмотреть официальную справку.
1. Установка в HTML-тегах
Самый простой способ — указать тег rel-canonical в адресе. Добавьте нижеследующий код в раздел header:
Пример
Предположим, у вас есть интернет-магазин футболок. Вы хотите установить адрес каноническим. Учтем, что по разным адресам доступен одинаковый контент.
Можно просто на все дублирующиеся страницы добавить такую строку кода:
Обратите внимание, что если вы используете CMS, возиться с кодом не нужно. Есть более простой способ.
Настройка канонических тегов в WordPress
Установите плагин Yoast SEO. Сможете автоматически добавлять канонические адреса. Используйте вкладку “Дополнительно”.
Установка канонических тегов в Shopify
Shopify добавляет по умолчанию канонические адреса для продуктов и блогов. Чтобы установить пользовательские каноничные URL, отредактируйте файлы шаблона напрямую.
Установка канонических тегов в Squarespace
Squarespace добавляет рекурсивные URL-адреса также по умолчанию. Как и в случае со Shopify, придется редактировать код напрямую, если нужно добавить пользовательский канонический тег.
2. Установка канонических тегов в HTTP header
Для документов — например, PDF — нет возможности разместить канонические теги в заголовке страницы, потому что нет раздела. В таких случаях нужно использовать заголовки HTTP.
Пример
Например, представим, что создаем PDF-версию поста в блоге Ahrefs.
3. Установка канонических адресов через карту сайта
Google заявляет, что неканонические страницы не нужно включать в карту сайта. Т. е. все страницы из карты сайта Google считает каноническими.
Но тем не менее, система не всегда воспринимает все адреса из sitemap должным образом: “Мы не гарантируем, что размещение адреса в sitemap — подтверждение его каноничности. Карта сайта — способ сказать Google, какие страницы сайта владелец считает наиболее важными”.
4. Настройка канонических тегов при помощи 301 редиректа
Используйте 301 редирект в случае, если вам надо перенаправить трафик с дубликата URL-адреса на каноническую версию.
Пример
Ваша страница доступна по адресам:
Выбираем страницу, которая будет основной. На остальных размещаем редирект на нее.
Обратите внимание: обязательно должно быть соответствие протоколов передачи данных (HTTPS/HTTP и наличие/отсутствие www).
Распространенные ошибки и их профилактика
Есть много недоразумений и неправильных представлений о том, как правильно устанавливать каноничные адреса. Вот некоторые распространенные ошибки.
Ошибка 1: Блокирование канонического адреса через robots.txt
Блокировка URL-адреса в файле robots.txt не позволит Google его просканировать. А значит, он не увидит канонический тег на этой странице. В свою очередь, он не сможет определить отношение между страницами с одинаковым или схожим контентом.
Ошибка 2: Канонический URL и тег noindex
Никогда не смешивайте теги noindex и rel=canonical. Они противоречат друг другу.
Google обычно отдает приоритет каноничности, а не noindex, по словам Джона Мюллера. Но это все равно плохая практика. Если вам нужно запретить индексировать канонический URL, воспользуйтесь 301 редиректом.
Ошибка 3: Установка 4XX статуса HTTP для канонического URL
Установка состояния 4XX для канонизированного URL имеет те же последствия, что и использование тега noindex. Google не сможет увидеть канонический адрес и передать вес ссылок нужной версии страницы.
Ошибка 4: Канонизация всех страниц навигации на корневую директорию
Страницы навигации не нужно канонизировать относительно первой странице в цепочке. Вместо этого нужно использовать канонические ссылки на саму страницу.
Джон Мюллер заявил, что иной способ канонизации нецелесообразен.
Ошибка 5: Не использование hreflang при канонизации
Hreflang используют, когда нужно указать языковую версию страницы.
Google утверждает, что при использовании hreflang вам также нужно указывать каноническую страницу на том же языке.
Как найти и решить проблемы с каноническими адресами на сайте
1. Проблемы с 4XX
Возникает, когда вебмастер на страницах указывает канонический URL с кодом ответа вида 4ХХ.
Поисковые системы не индексируют страницы 4ХХ, потому что они — не рабочие. В результате поисковик игнорирует любые канонические теги, которые указывают на такие страницы. В итоге в индекс попадает неверная версия страницы.
Поэтому проверьте канонические ссылки, и если в них указан адрес с подобным кодом ответа — исправьте.
2. Проблемы с 5ХХ
Аналогично предыдущему пункту.
Коды ответа такого вида сигнализируют о проблемах на сервере. В результате каноническая страница все равно оказывается недоступна (как и в предыдущем случае).
Нужно, опять-таки, заменить все канонизированные урлы с кодом ответа 5ХХ на доступные. Однако отметим, что код ответа 5ХХ может быть временной проблемой на сервере — например, когда сервер перегружен. В таком случае ничего делать не нужно.
3. Проблемы с редиректами
Предупреждение срабатывает, когда на канонизированном адресе стоит перенаправление на другой URL.
Канонические урлы всегда должны указывать на самую авторитетную версию страницы. Сами понимаете, если на этой “авторитетной” странице стоит редирект, ее надежность под сомнением.
Замените канонические ссылки прямыми линками на наиболее авторитетную версию страницы, которая возвращает код 200.
4. Дублирующие страницы без канонизации
Возникает, когда существует одна или несколько дублирующихся страниц, для которых не указана каноническая версия.
Google будет пытаться самостоятельно определить наиболее подходящую страницу для показа в результатах поиска. В итоге он может выбрать не ту версию, которую хотите увидеть в выдаче вы.
Посмотрите группы дублирующихся страниц. Выберите одну каноническую версию, на остальных укажите ее в качестве основной версии. А на канонической странице установите рекуррентную каноническую ссылку.
5. Hreflang и non-canonical
Срабатывает, когда одна или несколько страниц содержат неканонический URL в аннотациях hreflang.
Ссылки в теге hreflang всегда должны указывать на канонические страницы. Ссылки на неканоническую версию могут ввести в заблуждение поисковую систему.
Поэтому проверьте и замените.
6. Канонический URL не имеет входящих ссылок
Проблема возникает, когда один или несколько указанных канонических адресов не имеет внутренних входящих ссылок.
Канонические адреса без внутренних ссылок недоступны для пользователей сайта. Вместо этого человек попадает на неканоническую версию страницы.
Поэтому проверьте на сайте внутренние ссылки на канонические адреса.
7. Неканонические страницы в sitemap
Возникает, когда в карте сайта указаны неканонические страницы.
Google утверждает, что указывать в картах сайта неканонические страницы не следует. Поэтому он предполагает, что все страницы в файле — те, которые вы хотите проиндексировать.
Не канонические страницы из карты сайта уберите.
8. Неканоническая страница определена как каноническая
Проблема возникает, когда на одной или нескольких страницах указывается канонический URL, который одновременно является каноническим для другой страницы.
Такие цепочки могут ввести в заблуждение поисковик.
Замените неканонические ссылки в канонических тегах затронутых страниц прямыми ссылками на канонические версии. Например, если для страницы А канонической страницей указана В, а для В — страница С, замените каноническую страницу для А с В на С.
9. Open Graph URL не соответствует каноническому
Возникает при несоответствии между указанным каноническим и URL-адресом Open Graph на одной или нескольких страницах.
Если URL-адрес Open Graph не совпадает с каноническим, то неканоническая версия страницы будет опубликована в социальных сетях.
Замените в OpenGraph адрес на канонический, чтобы в соцсети попадала правильная версия страницы.
Заключение
Canonical — это не сложно, если как следует разобраться в логике их работы.
Просто помните, что канонические теги — это не директива, а сигнал для поисковых систем. Другими словами, они могут выбрать каноническую страницу отличную от той, которую укажете вы.
Можно использовать URL Inspection Tool в GSC, чтобы понимать всю картину.
На сайте компании SEMANTICA вы можете заказать продвижение сайта юридических услуг. Оставьте заявку, и мы вам перезвоним в ближайшее время.
Все о rel canonical: как указывать атрибут правильно и зачем он нужен
Разбираемся, что нужно знать оптимизатору о работе с каноническими тегами. Материал для начинающих или тех, кто хочет освежить знания в памяти.
В статье:
Что такое rel canonical и для чего он нужен
Одинаковый контент на разных страницах — плохо, за это следуют санкции. Но есть случаи, когда дубли оправданы. К примеру, одна и та же страница может входить в несколько категорий, один и тот же сайт может быть доступен с www и без, а еще в каталогах товаров есть сортировка и фильтрация.
Страницы могут быть не полностью одинаковыми. К примеру, на одной включен фильтр товаров по сезона, а на другой — сортировка по цене. Тем не менее, от включенных фильтров уникальными они не станут.
Фильтр в каталоге сайта www.asos.com
В таких случаях нужно указывать, какой вариант страницы роботу считать основным, то есть каноническим, а какие дублями. Для этого придумали канонический тег — rel = «canonical», он решает проблему дублирования контента.
Каноническая страница — это основной URL. Атрибут rel = «canonical» добавляют на страницы-дубли и в нем указывают адрес канонической страницы, чтобы дать боту знать, какую страницу они повторяют.
Зачем указывать основную версию страницы?
Причины указывать canonical:
избежать санкций поисковиков за дублирование контента;
корректно передавать ссылочный вес на нужную версию сайта и страницы;
из контента, доступного по нескольким URL, выбрать страницу, которая будет получать все сигналы и показываться в выдаче;
Краткая информация о канонических URL из первых уст есть в справке Google и Яндекса.
Например, есть страница, доступная по трем адресам:
Допустим, мы хотим, чтобы страница site.ru/blog/category/tema ранжировалась в выдаче, получала весь положенный ей ссылочный вес и другие сигналы — считалась канонической.
Тогда эту страницу мы не трогаем, в коде страниц дублей site.ru/page?id=123 и site.ru/blog/tema указываем ее как каноническую. В коды дублей мы добавляем такую строчку:
Неканонические страницы не попадут в индекс?
Страницы, отмеченные как неканонические, все равно могут попасть в выдачу. Яндекс отмечает:
«Они будут показаны в том случае, если они более релевантны запросу и их контент существенно отличался от канонической версии во время сканирования роботом».
В Вебмастере у всех страниц появилась пометка «каноническая», «неканоническая» и «каноническая страница не указана». Вы можно посмотреть неканонические страницы, попавшие в выдачу, для этого откройте «Страницы в поиске» и ищите строчки с пометкой «Неканоническая».
Неканоническая страница в выдаче
Google тоже заявляет, что система признает указанный канонический URL, но не всегда, поскольку тег canonical — рекомендация, а не приказ к действию. Если неканоническая покажется ему релевантнее, она и появится в выдаче.
Но если сеошник указывает этот атрибут, уменьшается риск, что Google сам определит основной не ту версию страницы.
Канонические страницы все равно появляются в поиске чаще и имеют приоритет при показе в выдаче, а ошибки с настройкой canonical могут привести к проблемам в индексировании страниц. Разберем все варианты, когда нужно использовать канонический тег.
Когда нужно прописывать канонический тег
Используйте canonical, когда одинаковый контент доступен по разным URL. Когда дублирующиеся URL создаются системой, фактически сам контент не дублируется — разные URL обслуживают одно содержимое. Тем не менее, это дубли, канонический тег стоит указать. Разберем разные случаи.
Дублирование страниц
Дублирующиеся страницы с похожим содержанием, которые генерируются CMS. Они бывают на всех сайтах интернет-магазинов, где можно настраивать параметры выбора товара. Ссылки для навигации по каталогу, сортировка товаров, фильтрация, ссылки с UTM-метками для отслеживания, другие страницы с GET-параметрами в URL.
К примеру, если в каталоге есть несколько позиций одного дивана, отличающиеся только цветом обивки, можно выбрать самый популярный вариант и указать его каноническим. Все варианты диванов будут доступны пользователям, но ссылочный вес и другие сигналы будут идти на страницу с основным вариантом.
Другой вариант — страница товара подходит сразу под несколько категорий, так что образовываются множественные URL одного предмета. Решение такое же: выбрать популярную в качестве основной и указать ее на остальных дублирующих страницах в rel = «canonical».
Страницы пагинации
Переключение страниц в каталоге рождает дубли. Иногда для всех страниц пагинации указывают первую страницу в качестве канонической — это советуют не делать, потому что тогда проиндексируется только первая страница.
Пагинация на сайте www.petshop.ru
Вариант 1
Если на странице есть «Показать все», страница со всеми вариантами и будет канонической. На каждой из страниц пагинации укажите ее в атрибуте rel = «canonical».
Например, для страницы https://site.ru/category1/page-2 нужно прописать канонический URL:
Вариант 2
Если «Показать все» нет, для каждой страницы пагинации советуют указывать эти же страницы как канонические.
Например, на странице https://site.ru/category1/page2 нужно указать каноническую ссылку:
Вариант 3
Есть и другое мнение: если указать canonical страницы саму на себя, все страницы пагинации пойдут в выдачу. Если вы считаете, что плохо, если у разных URL с отличающимся контентом будут одинаковые Title и Description, то не делайте так.
В таком случае не нужно проставлять canonical, а лучше закрыть страницы пагинации в noindex, follow и использовать dissalow в robots для /page. Это значит, что индексировать нельзя, а переходить по ссылкам можно.
Напомним, что noindex подходит только для Яндекса.
HTTPS, HTTP, www
Один сайт может быть доступен по трем вариантам: http://site.ru и http://www.site.ru и https://www.site.ru. Но поисковые системы будут рассматривать все три как наборы отдельных страниц, если не указать canonical. Из-за чего могут быть проблемы со сканированием и индексацией сайта.
Мобильный URL
Google уже давно переходит на Mobile-First Indexing, то есть при индексировании он ориентируется на мобильную версию сайта.
Представитель Google Джон Мюллер рассказал, что делать с каноническим тегом в этих условиях.
Если у вас есть мобильная версия сайта m.site.ru, обычно у нее указывают rel = «canonical», ведущий на десктопную. А для десктопной используют тег rel=alternate, ведущий на мобильную. Если вы сделали так, ничего менять не надо. Бот распознает мобильную версию как каноническую, даже если в коде канонической указана десктопная. Если и в Sitemap.xml также, то тоже можно не трогать.
URL страны
Бывает, что для конкретной страны у сайта есть несколько версий с разными URL. При этом язык один и контент одинаковый с несущественными отличиями. Тогда нужно выбрать каноническую и сделать отсылки к ней на всех дублях.
Но если речь идет о разных языковых версиях, нужно использовать hreflang, чтобы поисковики выдавали отдельные результаты. Атрибут hreflang нужен для указания дополнительных URL с аналогичным или похожим содержимым на других языках или для отдельных регионов.
Из-за перехода Google на Mobile-First Indexing, нужно правильно настроить hreflang. Десктопные hreflang-теги должны ссылаться на десктопные URL, мобильные — соответственно на мобильные URL. И редиректить пользователей на нужную версию в зависимости от устройства.
Верхний и нижний регистр
Поисковик может посчитать разными два адреса, написанные в разном регистре. При назначении URL система должна применять только нижний регистр, чтобы одни и те же ссылки были действительно одинаковыми.
Итак, с помощью rel = «canonical» можно указать поисковику, какую страницу считать основной и главной среди дублей, чтобы сканировать ее, индексировать, показывать в выдаче и направлять на нее ссылочный вес. Разберемся, как настраивать тег.
Как настроить canonical правильно: 6 способов указать основной URL
Для использования канонического тега нужно выбрать среди дублей основной URL, вписать его в атрибут:
и добавить ко всем неосновным страницам.
Для добавления есть несколько способов:
С помощью плагина CMS
Большинство CMS имеют встроенную функцию или плагины, которые позволяют автоматизировать настройку канонического URL.
настроить canonical на WordPress можно с помощью плагина Yoast SEO;
в OpenCart в настройках товара можно задать SEO URL;
в Joomla версии от 3 и выше можно включить функцию SEF. Тогда в код технических страниц вида /index.php?option добавится атрибут rel = «canonical» с указанием основной страницы с ЧПУ.
Для примера подробнее рассмотрим WordPress как самую популярную CMS среди наших подписчиков.
Настройка canonical WordPress
Все просто: установите плагин Yoast SEO, чтобы канонические теги добавлялись автоматически.
Настроить теги для конкретной страницы можно в разделе «Дополнительно» («Advanced»), там нужно указать основной URL:
Настройка канонического тега WordPress
Yoast SEO делает так, что если на странице появляется noindex или nofollow, тег canonical пропадает, чтобы не было проблем с представлением сайта в выдаче.
Если вы не используете CMS и не можете реализовать канонический тег плагинами, можно сделать все иначе.
Прописать между тегами любой HTML-страницы
Основной способ — прописать rel = «canonical» в секцию любой страницы-копии.
Например, если для страницы https://site.ru/*utm_content= канонической будет https://site.ru/, на страницу https://site.ru/*utm_content= нужно добавить код:
В заголовке HTTP
При запросе дублирующего файла сервер должен отдавать ссылку на оригинальный файл:
К примеру, вы составили руководство, выложили его в блог и отдельно оформили в PDF-файл для скачивания, который разместили в подкаталоге http://site.ru/blog/*. HTTP-заголовок для этого руководства в PDF может выглядеть так:
С другими страницами так тоже можно.
В файле Sitemap
Поисковики по умолчанию думают обо всех ссылках в XML-файле как о канонических. У Google есть требование включать в Карту сайта только канонические адреса страниц. Но Карта не свод правил для поисковых ботов, а список рекомендаций, который поисковики могут проигнорировать.
Через 301 редирект
Отвести трафик и ссылочный вес от дублей к канонической страницы можно с помощью 301 редиректа. Этот способ можно использовать, если сайт, к примеру, доступен по нескольким адресам:
Можно выбрать в качестве основного https://site.ru/, а со всех остальных настроить перенаправление.
Дополнительный сигнал — ссылки
Представитель Google Джон Мюллер в этом видео перечислял все сигналы, которые поисковик использует для определения канонического адреса.
К примеру, между адресами HTTPS и HTTP Google выберет HTTPS, а еще он может предпочесть привлекательный с его точки зрения URL. В числе сигналов каноникализации числятся ссылки с одной страницы на другую. Если вы указали канонической одну страницу, а по совокупности факторов другая кажется поисковику более подходящей, он не будет вас слушать.
Неправильной настройкой можно навредить индексированию страниц. Разберем несколько типичных ошибок оптимизаторов.
Неправильно указан canonical: популярные ошибки настройки
Использование нескольких канонических ссылок для одной страницы
Для одной страницы нужно указать один канонический адрес. Если указано несколько, бот либо проигнорирует страницу вообще, либо примет к сведению первый указанный URL.
Проверяйте, как плагин CMS реализует canonical, иногда из-за неправильной настройки он может указывать несколько адресов.
Настройка разных канонических URL одной странице
Похожий пункт, но речь идет не о нескольких канонических адресах для одной страницы, а в о разных, указанных разными способами.
Настройка цепочки канонических URL
Бот не будет учитывать канонический адрес, если для страницы, которую вы указали основной, настроена какая-то своя основная страница. Например, для адреса site.ru/1 канонической ссылкой указана site.ru/2, а для нее указана site.ru/3.
Размещение rel = «canonical» не в секции head
Указание первой страницы пагинации как канонической
Если для всех страниц пагинации канонической указать первую, бот не проиндексирует остальные. Выше мы писали, как лучше сделать, есть три варианта:
сделать канонической страницу «Показать все», если она есть;
для каждой страницы поставить ее же URL в качестве канонической, если нет общей страницы.
Использование канонических URL вместо 301 редиректа
Тег canonical и 301 редирект кажутся похожими — перенаправляют бота на основную страницу. Но не стоит использовать canonical вместо редиректа. Редирект переводит весь трафик на один URL, а при использовании rel = «canonical» страница откроется, будет активной и сможет получать трафик, но не появится в индексе.
Выбор главной как канонической для всех страниц
Ошибкой будет указать главную страницу в качестве канонической для всего сайта. Боты могут проигнорировать все страницы, кроме главной.
Закрытие канонической страницы от индексирования
Если канонический URL закрыт от индексирования или по другой причине недоступен для поискового бота, он не сможет участвовать в формировании выдачи. В этом случае бот возьмет доступный неканонический URL.
Как проверить canonical
Проверить, для каких страниц вы настроили canonical и какие канонические страницы указали, можно с помощью сервиса Screaming Frog SEO Spider.
Результаты проверки страниц краулером
Узнать, какую страницу Google считает основной для конкретного URL, можно через инструмент проверки URL.
Проверить, как поступил Яндекс, можно в Вебмастере: если вы верно указали каноническую страницу, дубли пропадут из поиска. Посмотрите страницу «Индексирование» — «Страницы в поиске». Если страницу исключили из результатов, она будет в блоке «Исключённые страницы».
Проверка наличия дубля в выдаче
Рассказывайте, о каких необходимых вариантах использования canonical мы забыли, и какие еще ошибки настройки вы встречали в своей практике!