Хиврин Николай

Онлайн трансляция конференции "SEO 2016"

0 0
11:53 18 мая 2016 — опубликовал Хиврин Николай
Сегодня проходит онлайн трансляция конференции "SEO 2016"

Присоединяйтесь: http://megaindex.tv/seo2016/
Хиврин Николай

Анализ внешних ссылок по ТОПам

1 1
10:08 13 мая 2016 — опубликовал Хиврин Николай
Мы запустили новое приложение для анализа внешних ссылок по SERP'ам. Вы задаете поисковый запрос, поисковую систему и регион, а сервис анализирует ссылочные параметры сайтов из ТОП 10.

Сервис покажет общее количество ссылок на домен и тот URL, который находится в ТОПе. Также покажет долю анкорных и безанкорных ссылок.



Также мы запустили две новые метрики для доменов: Host Rank и Trust Rank.

Host Rank рассчитывается по алгоритму, аналогичному Page Rank, но учитывает только ссылочный граф между доменами. При первой итерации каждому домену было присвоено значение 1, а далее через множество итерации мы посчитали значение, которое перетекло по ссылкам.
Хиврин Николай

Определения тематик доноров по LDA

2 0
14:10 11 мая 2016 — опубликовал Хиврин Николай
Мы внедрили алгоритм LDA для определения тематик доноров ссылок.

Подробнее об алгоритме — https://en.wikipedia.org/wiki/Latent_Dirichlet_allocation

Суть алгоритма лежит в текстовом анализе сайтов или документов, при котором исследуемый сайт сравнивается с заданной коллекцией. В качестве базовой коллекции мы взяли сайты, разбитые по категориям Яндекс Каталога.

Для каждого из исследуемых сайтов рассчитывает тематический вектор, который сравнивается с векторами, посчитанными для сайтов из каждой тематической категории. По самому близкому вектору категории определяется тематика для исследуемого сайта или документа.

Для полного обновления базы внешних ссылок нам потребуется ещё месяц, но уже сейчас данные по размеченным донорам начали появляться в отчетах:



Хиврин Николай

Онлайн конференция "SEO 2016"

2 0
17:50 10 мая 2016 — опубликовал Хиврин Николай
18 мая команда MegaIndex проводит онлайн конференцию "SEO 2016". Перед Вами выступят всем хорошо известные эксперты, которые поделятся актуальной информацией и свежими тенденциями рынка.



В этом году ведущим выступит Дмитрий Севальнев. Вопросы докладчикам Вы сможете задать непосредственно в прямом эфире через социальные сети или специальную кнопку на странице трансляции.

Регистрация уже открыта: http://megaindex.tv/seo2016/
Хиврин Николай

Видео обзор сервисов MegaIndex.com от Михаила Шакина

1 0
12:27 18 марта 2016 — опубликовал Хиврин Николай
Михаил Шакин сделал обзор наших 15 аналитических сервисов на своем блоге — http://shakin.ru/seo/megaindex-review.html

Ролики быстро и понятно позволяют разобраться в каждом инструменте:

1. Внешние ссылки
https://ru.megaindex.com/a/backlinks


Хиврин Николай

Как найти реальных конкурентов в поисковой выдаче?

2 1
19:58 2 марта 2016 — опубликовал Хиврин Николай
Поиск реальных конкурентов в поисковой выдаче является достаточно сложной задачей. В этом посте я расскажу, как мы решили эту проблему и покажу возможности нового сервиса.

Поиск сайтов, которые находятся по тем же поисковым запросам, что и Ваш сайт не является достаточным условием того, что именно этот сайт будет Вашим конкурентов. Например, Wikipedia высоко ранжируется по многим коммерческим запросам, но совершенно не является конкурентом для остальных сайтов.

Другая важная проблема — это поиск сопоставимых по размеру и охвату компаний. Если у Вас совсем маленькая компания и слабая видимость в поиске, скорее всего Вы не являетесь реальным конкурентом с лидером тематики.
Хиврин Николай

Обновление базы запросов для подбора семантики и кластеризации

2 0
16:12 1 марта 2016 — опубликовал Хиврин Николай
Мы в очередной раз обновили базу запросов, которая используется для подбора семантики и кластеризации. В этот раз нам удалось практически полностью избавиться от перестановок слов в запросе. Например, для запросов "грузовые перевозки" и "перевозки грузовые", последнее практически на запрашивается в поисковых системах.



Мы анализируем качества подбора запросов по двум основным параметрам:
— полнота
— отсутствие мусорных запросов
Хиврин Николай

Анализ релевантности текстов по ТОПам и TF*IDF

0 0
12:00 1 марта 2016 — опубликовал Хиврин Николай
У нас появилось новое приложение для анализа релевантности текста на продвигаемых страницах.



Видео о работе приложения по анализу релевантности текстов:



Новый инструмент отличается от массы уже существующих анализаторов двумя основными технологическими подходами:

1. Сравнение контента Вашей страницы и страниц, которые уже ранжируются в ТОПе по данному запросу
2. Анализ документа по метрике TF*IDF (подробнее о метрике в Wikipedia)

Метрика TF*IDF уже давно является основой определения текстовой релевантности в поисковых системах. Для её подсчета сначала необходимо определить IDF для каждого слова.

IDF (inverse document frequency) — инверсия частоты, с которой определенное слово встречается в большой коллекции документов. В нашем случае эта коллекция состоит из всех страниц, которые обрабатывает наш индексатор. Например, если в коллекции 500 млрд документов, а слово "перевозки" встречается в 5 млрд документов, то значение IDF = log (500 млрд / 5 млрд) = log (100) = 2 (В нашем случае мы берем основание логорифма равное 10)
Хиврин Николай

Подбор семантики в реальном времени до 100 000 запросов

0 0
14:17 12 февраля 2016 — опубликовал Хиврин Николай
Теперь наш сервис подбора и кластеризации запросов может подобрать семантику в реальном времени с объемом до 100 000 запросов.

Прошлое ограничение было на уровне 1000 запросов, таким образом мы расширили объемы данных сразу в 100 раз. Хотя подавляющему большинству сайтов вполне достаточно 10 000 поисковых запросов для составления эффективного семантического ядра.

Рассмотрим, на сколько это может быть полезно на реальных кейсах.

1. Подбор семантики по 15 конкурентам из категории "пластиковые окна", где по запросу находятся хотя бы 3 из них:


Хиврин Николай

Обновление семантики для подбора запросов и кластеризации

2 0
18:28 28 января 2016 — опубликовал Хиврин Николай
В конце декабря мы запустили сервис кластеризации запросов в тестовом режиме, о чем писали на нашем блоге

На текущий момент мы обновили ядро запросов, которое используется для подбора семантики и кластеризации. Общее количество запросов было увеличено в 4 раза, а более 90% мусорных запросов нам удалось исключить. Таким образом, качество базы было значительно улучшено, хотя ешё остается поле для дальнейшей работы. Новая семантика доступна для подбора запросов и кластеризации только по поиску Яндекс Москва.

Перейти к подбору запросов и кластеризации — https://ru.megaindex.com/a/keywords