Кластеризация поисковых запросов

2 076 просмотров

01.11.2017 |

Кластеризация поисковых запросов представляет собой процесс разбиения запросов на группы. При этом каждая группа запросов будет соответствовать одной странице сайта.

Кластеризация семантического ядра

Один запрос будет присутствовать только в одной группе, то есть этот запрос может использоваться лишь на одной странице в качестве ключа.

Правила группировки запросов

1 проблема (интент) = 1 группа = 1 страница

1 запрос может находиться только в 1 группе.

Это важный момент при работе над оптимизацией текстовых факторов на сайте. Поисковый запрос продвигается только на одной странице. Попытки двигать его на двух или более страницах, как правило, приводят к проблемам.

Поисковым системам будет сложно определить, какая же страница соответствует продвигаемой фразе, что приводит к смешению релевантности от одной странице к другой.

В результате ни одна из этих страниц не сможет успешно продвинуться и все они будут находиться далеко от первых позиций.

Как проводить кластеризацию

Кластеризация запросов является одним из основных этапов при работе над семантикой сайта. Поделюсь своим опытом. На практике это выглядит следующим образом.

На входе берем список запросов и подсказок, прошедший финальную чистку и проделываем следующие действия:

Загружаем в сервис для кластеризации. Это могут быть Just-Magic, Rush-Analytics или другие сервисы и программы.
Настраиваем необходимые параметры по кластеризации. Об этом немного ниже.
Ждем какое-то время и получаем результат.
Выгружаем полученные данные к себе на компьютер в формате Excel.
Присоединяем частотность, которую собрали на предыдущих шагах. Может кто-то присоединяет еще какие-то дополнительные данные.
Дорабатываем полученные данные вручную.

Другими словами, загружаем список запросов в сервис и, через некоторое время, выгружаем результаты и доводим до ума.

Настройка для кластеризации, например, в Rush-Analytics состоит из следующих пунктов:

Выбираем источник. Здесь 2 варианта – Яндекс или Google.
Настраиваем региональность.
Выбираем метод – soft или Hard.
Выбираем тип кластеризации – По Вордстат/По маркерам/Смешанный
Задаем точность группировки.
Есть возможность задания списка стоп-слов. Учитывая, что список запросов уже прошел чистку, то эту возможность я практически не использую.

В этом ролике Олег Шестаков более полно расскажет Вам о работе модуля кластеризации в сервисе Раш-Аналитикс.

Признаюсь честно, ни разу полученные данные меня полностью не устроили ни с одного сервиса. Всегда приходилось серьезно дорабатывать при помощи мозгов, глаз и рук.

Тем не менее использование в работе сервисов при кластеризации экономит кучу времени и заметно облегчает труд оптимизатора. Он делает черновую работу по группировке запросов. А чистовой вариант, блеск и глянец уже приходится доводить руками.

Во время этого процесса в результате чистовой доработки перераспределяются запросы, не попавшие в группы, большие группы делятся на подгруппы, строится окончательная структура сайта. Определяются основные разделы и их подразделы.

Что такое интент

При работе над семантикой при группировке запросов часто встречается термин интент. Что обозначает это слово?

Интент это намерение пользователя. Если говорить на простом языке, то это информационная проблема пользователя, которую он хочет решить, задавая свой запрос поисковой системе.

В переводе Intent обозначает цель, намерение.

Следует отметить, что запросы, содержащие одинаковые слова не всегда содержат одну и ту же проблему (интент).

Например:

Внедорожник БМВ.
Стоимость внедорожника БМВ.

В первом случае пользователь интересуется характеристиками автомобиля, а во втором желает его приобрести или прицениться.

Такие запросы должны присутствовать на разных страницах.

Виды кластеризации

Головой и руками

При небольших объемах семантики, размером в 2 – 3 сотни запросов эта задача будет несложной. При количестве запросов в несколько сотен и более, задача становится значительно более трудоемкой и ее решение вручную займет довольно много времени.

По включению НЧ в СЧ, НЧ и СЧ в ВЧ

В некоторых ситуациях это может сработать. Но в большинстве случаев велика вероятность получить не вполне корректный результат.

Например, у нас три запроса:

Купить холодильник
Купить холодильник Bosh
Купить холодильник недорого

При таком виде кластеризации их можно отнести к одной группе, но эти запросы имеют разные намерения пользователей и их следует разносить по разным страницам.

По выдаче (ТОПу)

Этот метод представляет собой попытку максимально подстроиться под алгоритмы поисковых систем. Принцип такого подхода состоит в следующем. Если поиск по каким-то ключам выводит в ТОП какие-то сайты, значит он относит эти фразы к одной группе.

Недостатки этого метода могут проявиться в том, что через какое-то время алгоритмы изменятся и Ваша группировка окажется устаревшей. Также не стоит забывать о многоруком бандите от Яндекса, да и Гугл частенько использует похожие приемы, подмешивая в выдачу сайты для набора статистических данных.

Особенно это касается информационных запросов.

Поэтому этот подход, хоть и является наиболее приемлемым и популярным, но его никак не следует считать эталонным.

Если у Вас после кластеризации получается каша, а не группировка, то придется засучить рукава и дорабатывать информацию руками.

На практике мы чаще всего проводим кластеризацию в несколько приемов.

Сразу используем сервис, а затем головой и руками доводим результаты до приемлемого результата.

Иерархическая кластеризация от сервиса SerpStat

Подход специалистов Серпстата при проведении кластеризации запросов Семантического Ядра несколько отличается от других сервисов. Этот подход также можно отнести к «Кластеризации по выдаче», но он все таки отличается от того, как это делают в Раш или Джаст-мэджике.

Основные отличия, на мой взгляд, состоят в следующем:

Формирование по выдаче происходит на основании анализа ТОП30, то есть берут для анализа первые 30 позиций. Такая глубина позволяет получить более точные данные.
Кластеры формируются нескольких уровней. Самые мелкие группы называют кластерами, и они содержат перечень запросов в традиционном виде. Кластеры низового уровня объединяются в более крупные группы – суперкластеры.
А при больших объемах суперкластеры уже входят в состав протокластеров.
Таким образом на выходе мы получаем прототип структуры сайта. С этой структурой еще придется поработать конечно.
Правда, такие подразделы нам предоставляет и Just-magic. Но это у них получается несколько завуалировано.
Введен интересные показатель – «Сила связи». Он формируется для каждой ключевой фразы и показывает сколько таких фраз находятся в анализируемых ТОП30. Этот показатель (значение — Weak/Strong), наряду с типом кластеризации (Soft/Hard) участвует в настройках.
Сервис позволяет проводить ручную работу с семантикой непосредственно после получения результатов работы программного модуля. Добавлять запросы, удалять, перемещать и т.п.
Результаты кластеризации в Серпстат плотно увязаны с разделом «Текстовая аналитика».
Наверняка что-то еще, но я протестировал только один раз и увидел пока вот эти отличия.

Более подробно Вы можете познакомиться с работой инструмента, перейдя по этой ссылке — «Кластеризация» в сервисе Serpstat

Сервисы кластеризации

Для проведения кластеризации приведу наиболее популярные сервисы:

Rush-analytics.ru
Just-magic.com
Advodka.com
Topvisor.ru
Seo-case.com
Semparser.ru
Serpstat.com
Программа KeyCollector

Большинство вышеперечисленных ресурсов используют метод «Кластеризация по выдаче». У каждого из сервисов есть свои сильные стороны и слабыми, но ни один из них не является эталоном при проведении кластеризации семантики.

Я работаю с Раш-Аналитикс или Джаст-Мэджик, у каждого сервиса есть свои плюсы и минусы. Одни лучше работают с коммерческими запросами, другие с информационными.

Да и по разным тематикам у них результаты несколько отличаются.

Работа с большой семантикой

В большинстве случаев перечень действий по составлению семантики будет вполне достаточно. Но если Вам приходится работать с очень большим Семантическим Ядром, то временные и денежные затраты будут достаточно ощутимы.

Не всякий клиент готов выкладывать много денег и при этом долго ждать отдачи от своих вложений.

Как следует поступать в таком случае? Ведь традиционные программы, такие как Excel, KeyCollector просто не в состоянии работать с миллионными списками. А сервисы, если и смогут проглотить такой список влетят Вам в копеечку.

Делить ядро на разделы и подразделы и работать постепенно? Как наполнять эти разделы? Все понемногу или по очереди? В общем, возникает много вопросов.

Я работаю в основном с корпоративными сайтами, Семантическое Ядро которых не очень большое. Поэтому все шаги, описанные в статье «Составление СЯ» дают неплохие результаты и полностью удовлетворяют и меня и моих заказчиков. Но у меня есть для Вас познавательная информация на эту тему.

Если Вам это интересно, то смотрите что Алексей Данилин рассказывает о работе с большими объемами семантики. Нетривиальный подход, но требующий определенной подготовки, знаний и умения.

P.S. Итак, мы провели группировку запросов Семантического Ядра. Теперь нам придется доработать ее руками, глазами и головой. И на основе этих данных приступать к построению окончательной структуры сайта и формированию «Карты релевантности».

Уважаемые читатели, если у Вас есть какие-либо дополнения, укажите это в комментариях.