Текст страницы. Об оптимальной плотности
Лицензии, соглашения и пособия для веб-мастеров, публикуемые поисковыми системами, в принципе не рассматривают плотность ключевых слов в тексте и предлагают в качестве идеальной концепцию «создавайте интересный пользователям контент». При этом представители поисковых систем на конференциях честно говорят, что при прочих равных интересная статья от журналиста будет ранжироваться хуже оптимизированного, но невыдающегося с точки зрения журналистики текста. Таким образом, они признают важность прямых вхождений ключевых слов и словосочетаний, однако, разумеется, отказываются от комментариев по поводу идеальной плотности. И правильно делают.
На самом деле понятие «оптимальная плотность ключевых слов» давно лишено смысла. Текстовое ранжирование рассчитывается по формулам TF-IDF и ВМ25, но это математические формулы, которые не вписываются в концепцию данной книги. К этому следует добавить, что роль плотности в общей формуле ранжирования незначительна: в этом легко убедиться, изучив контент страниц, входящих в любой мало-мальски конкурентный топ-10. Вы не сможете вычислить оптимальную плотность для запроса даже приблизительно, поскольку у разных сайтов в топе она может различаться в разы. Поэтому, создавая контент, следует искать баланс между привлекательностью текста для пользователей и использованием всех необходимых словосочетаний.
Прямые вхождения. Еще пять лет назад выдачи по запросам «пластиковые окна Москва» и «пластиковые окна в Москве» могли различаться на 100 %, причем в каждом серпе находились только страницы, переспамленные конкретной фразоформой. Сегодня алгоритмы стали гораздо лучше анализировать текст запроса и выдачи хоть и различаются, но незначительно. При этом ни в первом, ни во втором серпе вы не найдете страниц с вхождениями «пластиковые окна Москва», поскольку текст с такими вхождениями рассматривается пользователями как бред, а алгоритмами – как спам. Разумеется, алгоритмы далеки от совершенства и периодически подобные прямые вхождения еще встречаются, но тенденция к улучшению ранжирования более качественных в литературном смысле текстов очевидна. Задумайтесь об этом, когда будете составлять техническое задание (ТЗ) для создателей контента, – многие из них привыкли понимать его слишком буквально.
Микроразметка
Микроразметка, или семантическая разметка, призвана упростить анализ структуры контента алгоритмами поисковых машин, а потому поисковые системы рекомендуют использовать ее. При этом представители ПС не утверждают, что ее использование может улучшить ранжирование сайта. В этой рекомендации есть определенная доля лукавства: фактически разработчики поисковиков признают, что не справляются с анализом контента на должном уровне и хотят переложить часть работы по ее анализу на создателей сайтов.
Микроразметка влияет главным образом на формирование сниппетов (рис. 4.2).
Рис. 4.2
Склейка дубликатов
При продвижении порталов и крупных интернет-магазинов оптимизатору часто приходится сталкиваться с проблемой дублирования контента. Карточки товаров и страницы с описаниями моделей могут различаться буквально одним параметром или даже одной буквой в названии. С точки зрения поисковых систем такие страницы являются дублями, а дублирование контента нежелательно. Результаты – ухудшение ранжирования, исключение части страниц из индекса, а при совпадении нескольких негативных факторов – АГС.
Для того чтобы избежать проблем с дубликатами, их следует склеивать, однако при этом надо хорошо понимать, что мы склеиваем, как и зачем.
□ Если разные товары имеют практически идентичные описания и список характеристик, но различаются ценой, их следует оставить несклеенными. Это разные товары, и они должны иметь отдельные карточки.
□ Не следует склеивать карточки товаров, если они отличаются только одной, но значимой характеристикой. Карточки, на которых предлагаются красная футболка «Найк», синяя футболка «Найк», зеленая футболка «Найк», склеивать не надо, поскольку пользователи часто ищут одежду конкретного цвета. Применительно к цифровым фотоаппаратам цвет корпуса не является существенным параметром, и потому лишние карточки следует удалить, а в единственной оставшейся указать все возможные цвета.
□ Нечеткие дубли (страницы, которых совпадает лишь фрагмент текста) склеивать не надо. Идеальным вариантом будет просто закрыть дублируемый фрагмент от индексации на всех страницах, кроме той, на которой этот фрагмент важен для поискового продвижения.
□ Нечеткие дубли, когда одна страница полностью вложена в другую, также не склеивают. Необходимо просто закрыть текст от индексации на большей странице.
Как искать дубликаты? Проверять контент инструментами на основе анализа шинглов. Таковыми являются, в частности, сервис «Сайт-Репорт.рф», одна из утилит AllSubmitter и некоторые другие.
Более простой вариант – использовать выдачу поисковых систем для поиска дубликатов по содержимому тега Title. Введя в поисковую строку содержимое тега, мы получим страницы, которые могут быть дублями.
Еще одно решение предоставляет панель «Яндекс.Вебмастер». К сожалению, этот инструмент не способен выявить все дубли, а при смене CMS или структуры URL и вовсе будет давать неудовлетворительные результаты.
Тегирование
Под тегированием мы будем понимать создание семантических срезов для каталогов товаров, предприятий и других массивов данных. Использование тематических срезов в структуре сайта позволяет получить множество страниц с базовой оптимизацией под достаточно частотные запросы. Эти страницы будут действительно интересны пользователям, поскольку представят им максимально полный и точный ответ на их вопрос. Рассмотрим тегирование на уже знакомом нам примере мебельного портала.
Работа по созданию срезов начинается со сбора семантики. В процессе составления семантического ядра семантик выделяет запросы, связанные с теми или иными группами товаров, например: «угловые диваны», «кожаные диваны», «диваны за 6000 рублей» и т. д. Такой запрос представляет собой практически готовый тег и основу для создания тематического среза. В некоторых тематиках количество тегов может доходить до нескольких десятков тысяч (недвижимость, туризм).
Следующий этап – присваивание тематических тегов страницам каталога. В идеале список тегов должен быть готов до начала работы над контентом. В этом случае вы можете доверить работу по присваиванию тегов специалистам, которые будут работать над наполнением каталога. К сожалению, часто бывает, что не только уже размещенный и проиндексированный каталог не имеет полноценного тегирования, но и структура таблиц в базе данных, которая хранит каталог, не позволяет создать тегирование. В этом случае необходимо поставить перед разработчиками соответствующую задачу и одновременно начать работу по простановке тегов.