Вход для пользователей

Поиск наиболее релевантных страниц

Поисковые системы по умолчанию сортируют ссылки в результатах поиска по убыванию релевантности. Как уже говорилось, релевантность — это рассчитываемая поисковой системой мера соответствия найденного документа поисковому запросу. Поэтому можно считать, что первая ссылка — это ссылка на страницу, наиболее соответствующую смыслу поискового запроса, вторая ссылка — на чуть менее соответствующую страницу, и т.д.
На одном сайте может находиться несколько релевантных запросу страниц. Это типичная ситуация, поэтому поисковая система старается не перегружать результаты поиска ссылками на один и тот же сайт.

Для каждого сайта поисковик показывает в результатах поиска ссылку только на одну, наиболее релевантную запросу страницу.

Наиболее релевантная страница сайта

Найти для любого запроса наиболее релевантную страницу вашего сайта очень просто. Для этого нужно выполнить поиск по данному запросу с условием, что поисковик должен показать только страницы вашего сайта
Такая возможность есть обычно в языке запросов, а также предоставляется в интерфейсе расширенного поиска. Расширенный поиск и язык запросов имеется в большинстве популярных поисковиков, в том числе в Яндексе, Рамблере и Google.
Например, в Яндексе ограничить поиск только страницами вашего сайта можно с помощью оператора языка запросов uri = "www.mysite.ru"либо задать ограничение поиска страницами вашего сайта на странице расширенного поиска Яндекса. Для вашего удобства в конце главы мы даем ссылки на страницы расширенного поиска и описания языка запросов в Яндексе, Рамблере и Google.
В результатах поиска при таком ограниченном запросе будет выдан список ссылок на те страницы вашего сайта, которые поисковая система считает релевантными запросу. Алгоритм ранжирования этого списка — тот же, что и в "большом" поиске.
Естественно, наиболее релевантная страница (далее — НРС) в результатах поиска по сайту — это первая, самая верхняя страница в списке результатов.

Заметим, что именно эта страница будет находиться и отображаться поисковиком в результатах "большого" поиска по данному запросу, если поиск не ограничен вашим сайтом.
Процесс подбора страницы для отображения в результатах поиска описан ниже. Для любого запроса и любого сайта поисковая система выполняет следующее:

  • сначала выбирает все релевантные запросу страницы сайта и определяет лучшую из них, наиболее релевантную;
  • затем выбранная поисковиком НРС с вашего сайта начинает конкурировать с отобранными тем же способом НРС, находящимися на других сайтах. В результате такой конкуренции и формируется общая поисковая выдача.

Чтобы понять, как поступит поисковик со страницами вашего сайта на первом этапе, следует провести контент-анализ сайта по семантическому ядру.

Контент-анализ

Анализ содержимого сайта с целью нахождения его наиболее релевантных страниц называется контент-анализом. Выполняется он следующим образом.

Для каждого запроса семантического ядра в Яндексе осуществляется по¬иск по анализируемому сайту. Адрес каждой найденной наиболее релевантной страницы заносится в таблицу.

Та же процедура выполняется в Рамблере и Google.
Подобная методика поиска НРС избавляет вебмастера от необходимости про¬смотра десятков страниц общей выдачи поисковика. Ведь НРС, стоящая первой в результатах поиска по сайту, не обязательно окажется в первой десятке или даже сотне результатов "большого" поиска. С помощью поиска по сайту НРС находится всего за один запрос в поисковую систему.
После того как будут найдены наиболее релевантные страницы по всему семантическому ядру, можно заполнить таблицу результатов контент-анализа

URL Яндекс Рамблер Google Частота Титул
НРС Запрос 1   Запрос 1 10000 Титул НРС 1
  Запрос 2     1400  
  Запрос 7 Запрос 7   450  
НРС 2   Запрос 4 Запрос 4 850 Титул НРС 2
    Запрос 5 Запрос 5 700  
  Запрос 6     550  
НРС 3     Запрос 7 450 Титул НРС 3
  Запрос 8 Запрос 8 Запрос 8 300  

Здесь запросы сгруппированы вокруг адресов найденных НРС. В приве¬денном выше примере хорошо видно, что HPC 1 соответствует запросу 1 семантического ядра в Яндексе и Google, запросу 2 в Яндексе, а также запросу 7 в Яндексе и Рамблере, НРС 3 во всех трех поисковых системах соответствует запросу 8 и т.д.
Для большей информативности каждому запросу сопоставлена его частота. Для каждого адреса НРС приводится титульная фраза, чтобы можно было быс¬тро оценить, как выглядит ссылка на эту страницу в результатах поиска.
Таблица контент-анализа также сравнивается с полной таблицей видимости, и тогда она может выглядеть, например, так, как показано в табл.

URL Яндекс Рамблер Google Частота Титул
НРС Запрос 1   Запрос 1 10000 Титул НРС 1
  Запрос 2     1400  
  Запрос 7 Запрос 7   450  
НРС 2   Запрос 4 Запрос 4 850 Титул НРС 2
    Запрос 5 Запрос 5 700  
  Запрос 6     550  
НРС 3     Запрос 7 450 Титул НРС 3
  Запрос 8 Запрос 8 Запрос 8 300  

Здесь светло-серым фоном выделены запросы, в ответ на которые ссылка в соответствующей поисковой системе уже находится в диапазоне ТорЮ. Темно-серым фоном выделены запросы, в ответ на которые ссылка в соответствующей поисковой системе найдена в диапазоне Top 11-50.
Составленная описанным образом таблица контент-анализа дает исчерпывающую информацию о том, какие страницы, по каким запросам и в каких поисковиках легче всего продвигать. Так, в нашем примере, анализируя табл. , можно сделать следующие выводы.

  • Страницу НРС 1 лучше не трогать. Она уже находится в Тор 10 Яндекса и Google по высокочастотному целевому запросу. Любые изменения текста на странице или ее HTML-тегов могут повлиять на позиции сайта. Поэтому, когда хорошие позиции уже достигнуты, вебмастеру следует быть очень осторожным.
  • Страница НРС 2 довольно легко может быть продвинута в Тор 10 Google по запросу 4. Здесь необходимо применить приемы продвижения, которые дают хороший эффект именно в Google.
  • Страница НРС 3 является наиболее удачной для продвижения во всех поисковиках по запросу 8.

В составленной таблице хорошо видно, какие страницы и по каким запросам находятся уже почти "в десятке". Возможно, для того, чтобы они попали в зону гарантированных показов (диапазон ТорЮ), будет достаточно минимальной правки. Это наиболее перспективные "цели" для текстовой коррекции, о которой мы будем говорить в следующей главе.
Смысл контент-анализа в том, чтобы избежать ненужных усилий по продви¬жению страниц, которые поисковые системы не считают наиболее релевантными по запросам семантического ядра. Это позволит сосредоточиться на работе над страницами, которые сами поисковики выбрали в качестве "лидеров" по необходимым вебмастеру запросам.