Хиврин Николай

Рубрикация поисковых запросов

5 1
17:43 19 апреля 2013 — опубликовал Хиврин Николай
В базе запросов MegaIndex на сегодня 23 000 000 фраз. В это количество входят все фразы из подсказок Яндекс и Google, все запросы с wordstat больше 0 и запросы наших пользователей.

1. Если рассматривать это как простой список запросов, то эти данные фактически бесполезны.
Использовать этот массив можно в том случае, если сделать его полную рубрикацию. Под полной рубрикацией я понимаю разделение запросов на категории, в рамках которых конкурируют отдельные продукты или услуги.
Например нам не нужна в базе категория «Банки», а нужны «Ипотечный кредит», «Автокредит», «Потребительский кредит» и т.д…

2. Кроме этого, нужно сделать так, чтобы категории были выстроены в виде иерархической структуры. Что это значит? А то, что на каждом уровне пользователь увидит не более 15 вариантов, при этом он однозначным образом сможет добраться до интересующей его категории. Например, Бизнес -> Финансы -> Forex

Например, в Яндекс Каталоге уже есть достаточно неплохая рубрикация, но есть две проблемы:
— она недостаточно разделена. Следовательно, внутри одной категории могут быть совсем неконкурирующие товары или услуги
— их категоризация не удовлетворяет первому пункту

Создать алгоритм, который мог бы составить такое дерево, по моему убеждению невозможно. Однако можно сделать подготовительные вычисления, которые помогут людям легко найти все возможные категории.

Что можно сделать?
1. Выявить популярные слова в запросах
2. Выявить кластеры запросов автоматически

С первым пунктом все понятно. Подключаем морфологический анализатор и делаем прогон всей базы запросов, а потом делаем группировку по фразам.
А вот вторая задача значительно сложнее. Её решение лежит в плоскости того, что по запросам одной тематики (кластера), поисковыми системами ранжируются одни и те же сайты. Остается собрать позиции, что мы и так делаем регулярно, и сделать анализ базы на поиск кластеров.
Сам алгоритм поиска кластеров не такой простой, как кажется. Есть тематики, где ограниченное количество сайтов ранжируется почти по всем запросам этой категории. А есть тематики, где распределение запросов по сайтам-конкурентам достаточно размазанное. Это как правило большие тематики (с большим количеством запросов). Например, у интернет-магазина плитки может различаться ассортимент по коллекциям и фабрикам. Для этого приходится придумывать алгоритмы автоматического обучения для подбора параметров кластеризации.

На выходе получают почти готовые тематики.

Кроме того, есть и базовый метод поиска запросов по маске. Например, все запросы, которые включаются слова «окна» и «пластиковый» в различных морфологических формах.

По факту, реализация этих методов позволяет разобрать базу запросов на 5000-10000 тематик за вполне разумное время.

Скоро обновление базы по категоризации запросов появится в MegaIndex.

После прочтения материала может возникнуть вопрос, зачем столько усилий для решения обычной прикладной задачи?
Все дело в том, что такая категоризация позволит решить целый пласт аналитических и необходимых для продвижения задач:
— точное определение тематик сайтов (необходимо для использования в закупке ссылок)
— анализ динамики продвижения сайтов в каждой категории
— быстрый поиск основных конкурентов
— эффективных подбор семантического ядра
и т.д.

Безусловно стоит ждать и появление новых сервисов, которые будут использовать эти данные.
interlimited

Вакцина для Пингвина

6 5
14:31 9 декабря 2013 — опубликовал Угниченко Дмитрий

О естественном продвижении. В связи с шорохом вокруг ссылок, решено опубликовать несколько мыслей. Одним из аспектов фильтра Панда (Google) есть наложение санкций на проект за покупные ссылки.

Дзюба Иван

5 функций, которые отсутствуют в iPhone, но есть в любом Android

6 4
11:36 20 мая 2013 — опубликовал Дзюба Иван

5 функций, которые отсутствуют в iPhone, но есть в любом Android

1. Обои
Даже такая простая деталь, как фоновое изображение рабочего стола, имеет в Android пространство для творчества. Вы можете указать какую часть картинки использовать в качестве обоев, а также выбрать красивый эффект прокрутки, при котором ваши обои будут плавно перемещаться при переходе между экранами. Кроме этого, Android предлагает использование живых анимированных обоев. С их помощью вы сможете значительно оживить и украсить свой телефон, заставив его играть бликами подводной жизни, тенями дикого леса или просто переливами абстрактной анимации.

2. Домашний экран и виджеты
Домашний экран iPhone является одной из самых знаковых функций платформы IOS — большие иконки в сетке 4 × 4 (4 × 5 в iPhone 5) и четыре кнопки в нижней панели для часто используемых приложений. Кроме изменения обоев и изменения порядка иконок нет больше ничего, что пользователь iPhone мог бы сделать для изменения этого вида. Скукотища-то какая…
Для обладателя Android домашний экран является цифровым полотном, на котором он широкими мазками рисует свое представление о идеальном мобильном интерфейсе. Различные виджеты, часики, погодные информеры, контакты, иконки, папки — все это может быть организовано именно таким образом, как это удобно пользователю данного девайса.

3. Приложения по умолчанию
В iPhone замечательные дефолтные программы, но совершенства, как известно, не бывает и если вы захотите изменить, например, браузер на Google Chrome, то просто так у вас ничего не получится. То же самое касается и других программ.
В Android вы можете для любого действия назначить свое любимое приложение. Открывать музыку в самом удобном для вас проигрывателе, использовать архиваторы для распаковки файлов, заменить стандартную галерею изображений, установить более функциональную камеру и так далее. Полная свобода и потакание вкусам пользователей.

4. Клавиатура
Если вам не нравится клавиатура iPhone, то вам не повезло. Но придется терпеть, ничего не поделаешь. В то же время довольные пользователи Android выбирают между десятками различных платных и совершенно бесплатных клавиатур, использующих различные технологии ввода и алгоритмы предсказния. Это позволяет выбрать именно тот способ работы с текстом, который удобен именно вам, а не создателям и дизайнерам устройства.

5. Лаунчеры
В Google очень старались и к выходу четвертой версии добились действительно красивого, удобного и современного вида своей мобильной операционной системы. Но если вы заскучали, то всегда можно попробовать что-то новенькое с одним из десятков доступных лаунчеров для Android. C их помощью вы можете кардинально изменить не только внешний вид, но и поведение своего гаджета. Вы можете поменять иконки, количество рабочих столов, добавить или убрать панели запуска, настроить реакцию телефона на прикосновения и события и многое другое. Поле для экспериментов просто огромное, жаль что пользователи iPhone всего этого лишены.
Разумеется, список возможностей мобильной системы Android, о которых обладатели iPhone могут только мечтать, этими пунктами далеко не ограничивается…
Хиврин Николай

Яндекс сделал статистику почтовых рассылок (postoffice.yandex.ru)

9 0
18:23 19 ноября 2013 — опубликовал Хиврин Николай
Яндекс сделал интересную возможность получения статистики почтовых рассылок.
Если у Вас большая база подписчиков, то можно провести аналитику по всем получателям, у которых почта на Яндексе.

Для этого в новом сервисе postoffice.yandex.ru нужно подтвердить права на домен, и Вы сможете получать данные по доставке Вашей рассылки и статистику по прочтению писем.

Пример отчета по рассылке MegaIndex, которая только что ушла:
Postoffice.yandex.ru
Хиврин Николай

Построение рейтинга видимости

2 0
12:11 12 мая 2013 — опубликовал Хиврин Николай
Довольно важной задачей для любого маркетолога является оценка того, на сколько эффективно задействован тот или иной канал продвижения? Какая часть Ваших потенциальных клиентов узнает о Вашей компании или продукте? В рамках поискового продвижения эти показатели можно оценить с достаточно высокой точностью, выбрав соответствующую модель. Далее я хочу поделиться той моделью, которую мы сейчас реализуем для нового рейтинга MegaIndex.

Ранее я писал о том, как мы делаем рубрикацию поисковых запросов. В результате неё мы получаем множество тематик, которые представлены в виде дерева. Данная модель позволяет рассматривать как широкие тематики (пример «Товары и услуги»), так и вполне конкретные (пример «такелажные работы»)

Теперь рассмотрим математическую модель для построения рейтинга видимости сайтов внутри каждой тематики. Для начала нужно определить, что такое «видимость сайта».
Видимость сайта — это вероятность того, что пользователь увидит ссылку на сайт в результатах поиска по конкретному запросу или группе запросов. Если мы говорим о группе запросов, соответствующих тематике, то это вероятность того, что по случайному запросу в тематике сайт будет замечен случайным пользователем.

Видимость сайта по запросу

Если мы рассматриваем один запрос, то определить видимость по нему довольно просто. Безусловно она зависит от формата отображения выдачи в поисковых системах и типа устройства, на котором пользователь просматривают саму поисковою выдачу. Однако эти параметры можно усреднить, получив незначительную погрешность результатов.

В рамках модели примем следующие значения:
Позиции 1-3: 100%
Позиции 4-5: 70%
Позиции 6-10: 50%
Позиции 11-20: 10%
и т.д.

Фактически мы задаем функцию, которая определяет значение видимости в зависимости от позиции сайта по запросу Vid(word[pos])

Если у нас имеется несколько поисковых систем, то видимость по одному запросу можно представить как:
Vid(word) = Vid(word[pos][1]) * (rate[1]) + Vid(word[pos][2]) * (rate[2]) +… + Vid(word[pos][N]) * (rate[N])
word[pos][i] — позиция сайта по запросу в поисковой системе i
rate[i] — популярность поисковой системы i от 0 до 1.

Например, если взять две поисковые системы Яндекс и Google с соответствующими долями 67% и 33%, то формула будет иметь следующий вид:
Vid(word) = Vid(word[pos][yandex]) * 0.67 + Vid(word[pos][google]) * 0.33

Например, мы анализируем сайт и запросу «пластиковые окна», который занимает 3 место в Яндекс и 10 место в Google:
Vid(word) = Vid(3) * 0.67 + Vid(10) * 0.33 = 100% * 0.67 + 50% * 0.33 = 83.5%

Видимость сайта по группе запросов

Теперь поставим задачу анализа видимости сайта по группе запросов, которые образуют тематику. Каждый запрос имеет определенную статистику, выраженную в среднем количестве запросов в месяц по соответствующей фразе. Необходимо посчитать взвешенную видимость по группе запросов в соответствие с популярностью каждого запроса.
Vid(group) = (Vid(word1) * wordstat(word1) + Vid(word2) * wordstat(word2) +… + Vid(wordN) * wordstat(wordN)) / (wordstat(word1) + wordstat(word2) +… + wordstat(wordN))
Рассмотрим простой пример тематики, состоящий из двух запросов:
— пластиковые окна (63035 запросов в месяц, видимость сайта 83.5%)
— пластиковые окна цены (16199 запросов в месяц, видимость сайта 50%)
Vid(group) = (83.5% * 63035 + 50% * 16199) / (63035 + 16199) = 76.65%

Понятно, что любая тематика состоит не из двух запросов, а из значительно большего количества. В базе MegaIndex есть тематики в которых даже более 100 000 запросов.
Также понятно, что нельзя собрать все запросы тематики для анализа.
Однако опыты показывают, что если тематика состоит из большого числа запросов, то видимость по двум различным подгруппам запросов из одной тематики совпадает с высокой точностью.
Например, если в тематике 1000 запросов, то видимости сайта по случайным 500 запросам и другим 500 запросам практически совпадают. Таким образом можно утверждать, что для определения видимости сайт достаточно выбрать несколько запросов из тематики. Как правило достаточно 100-200 запросов для получения погрешности в 2-3% от полученного значения по сравнению с расширением тематики до 1000 и 10000 запросов.

Для того, чтобы посчитать видимость сайта в категории верхнего уровня (в такой категории вложено несколько тематик), нужно взять все запросы из вложенных тематик этой категории.

Пример построения рейтинга в тематике «Грузовые автоперевозки»:
Рейтинг сайтов грузовые автоперевозки
Хиврин Николай

Новое телевизионное шоу "На осмотре у Cтартап-Хирурга"

6 0
01:13 18 июня 2014 — опубликовал Хиврин Николай
Сегодня на MegaIndex.tv выходит новое телевизионное шоу "На осмотре у Cтартап-Хирурга" — известный серийный предприниматель Вячеслав Семенчук вооружившись скальпелем и белым халатом прямо на глазах у зрителей будет делать вскрытие проектов наших гостей, вытаскивать наружу все органы проектов, что-то выбрасывать, что-то подрезать, что-то вставлять и потом зашивать. Если проект выдержал это и франкештейн пошел дальше, то проект можно считать успешным. А в некоторые проекты Вячеслав после этого лично или в синдикате готов проинвестировать. Хотите узнать все об ошибках Российских стартапов? Смотрите прямой эфир на MegaIndex.org и повтор передачи на личном сайте Вячеслава на Semenchuk.com и MegaIndex.tv



И так в гостях:
Хиврин Николай

Сегодня 3 прямых эфира о SMM

4 1
01:34 11 июня 2013 — опубликовал Хиврин Николай
В 11:00 Шигапов Ришат: "Продающий SMM"
1) Курсы изучения иностранных языков по Skype (анализ стоимости каждого покупателя, пришедшего через соц сети)
2) Стимулирование продаж в интернет магазине туров туроператора Sunmar
тезисы:
1) продавать через соц сети можно и нужно
2) анализ каждой покупки возможен, даже из топ сообществ
3) чтобы стимулировать покупки, нужно не только рекламировать, но и объяснять аудитории как это делать, общаться со своей аудиторией
компания: Positive Media
должность: Аккаунт-директор