Уникализация изображений финтом Зидана |
||
19:25 2 июня 2013 — Угниченко Дмитрий |
Первый основной принцип Яндекса:
Уникализация изображений актуальная тема. Если текст люди научились легко изменять/рерайтить, то с изображениями процесс более интересный. Используя в Photoshop я проводил множество экспериментов, но задачу уникализации не помогали решить даже профессиональные actions. Actions — это запрограммированные наборы шагов для обработки изображений, которыми используют фотографы. А уж такие банальные вещи как уменьшение, водяной знак, рамки, изменение яркости и освещения и подавно не решают задачу ни на процент.Я зае... Столько усилий затрачено. Решение стало делом принципа.
Если решать задачу наверняка, то необходимо углубляться в алгоритмы Яндекса и Google, которые они используют для определения нечетких копий. Интересныне придурки не придумки, а интересно было найти алгоритм который работает сейчас. Не люблю, знаете, гадалок и догадки. Люблю эксперименты и официальные источники. Источником информации выступил сам Яндекс:
Сначала очень легко снимаю вопрос по EXIF. Просто создаю новое пустое изображение и копирую в него сохраненное изображение взятое из Интернета, сохраняю. У нового изображения EXIF будет пуст.
Далее необходимо изменить расположение характерных точек. По-моему, минимум сделать это можно двумя способами.
Способ 1: Flip Canvas Horizontal
С помощью одноименного инструмента в Photoshop отражаю холст по горизонтали. Результат (кликабельно):
Плюсы: Расположение характерных точек изменилось. Проверка на images.google.com показала что копий нет. Сработало!
Минусы: надо понимать, что этот способ технически не сложный, а это означает что рано или поздно Яндекс и Google это учтут и, иногда, не одни мы такие умные, ведь если изображение популярное кто-то воспользуется этим же способом и коса найдет на камень. Способ работает, но в перспективе хочется альтернативу.
Способ 2: "Финт Зидана" :)
Я делаю поворот изображение на угол более 5 градусов. Затем обрезаю края, чтобы изображение стало прямоугольным/адекватным. Результат (кликабельно):
Плюсы: при повороте еще на 5 градусов мы будем иметь еще одно новое положение характерных точек и соответственно новое изображения. Коса на камень на найдет, коса все еще будет косить. Еще одно преимущество "финта Зидана" в избавлении от палева с текстом, которое наблюдается в первом способе.
Минусы: нет.
Напоследок интересные данные из официальных источников:
PSS: Легендарный финт Зидана!
www.youtube.com/watch?feature=player_detailpage&v=jUSU82W3kac#t=44s
Информационные сайта должны располагать уникальным текстом. Для коммерческих сайтов уникализация текста не обязательна. Рекомендованное чтиво по теме на сайте социальное сети интернет-специалистов MegaIndex.org по ссылка далее — Проверка текстов на уникальность ОНЛАЙН И БЕСПЛАТНО
Анализ текста на основе лидеров поиска органической выдачи онлайн и бесплатно можно проводить используя приложение "Анализ текста" от MegaIndex.
Ссылка для регистрации — MegaIndex. Ссылка на приложение — Анализ текста.
Создавайте сайты с оригинальным контентом или сервисомЦитата из рекомендаций Google в отношении содержания:
Некоторые веб-мастера предпочитают копировать содержание с более популярных сайтов. При этом они не обращают внимания на релевантность и уникальностьФинт Зидана — это фирменный поворот Зинедина (ссылка на видео в конце статьи). Поворот — это ключевое слово в этой статье. На реальном примере я покажу уникализировать изображение у которого множество копий в Интернете (кликабельно):
Уникализация изображений актуальная тема. Если текст люди научились легко изменять/рерайтить, то с изображениями процесс более интересный. Используя в Photoshop я проводил множество экспериментов, но задачу уникализации не помогали решить даже профессиональные actions. Actions — это запрограммированные наборы шагов для обработки изображений, которыми используют фотографы. А уж такие банальные вещи как уменьшение, водяной знак, рамки, изменение яркости и освещения и подавно не решают задачу ни на процент.
Если решать задачу наверняка, то необходимо углубляться в алгоритмы Яндекса и Google, которые они используют для определения нечетких копий. Интересны
- Вначале, с проиндексированного изображения считывается EXIF. EXIF — это стандарт, который цепляет к изображениям раличные данные, например авторе, модель камеры и так далее. Это как meta теги в SEO. На некоторых фотокамерах EXIF заполняется автоматически.
- Обработка самого изображения начинается с перевода изображения в цветовой режим из оттенков серого, так называемый grayscale. Простым языком, изображения переводят черно-белый формат.
- Далее изображение обрезается по краям. Это делается для того, чтобы убрать возможность уникализации изображения путем наложения ничего не значащей модификации, например рамки.
- "Причесывается" изображение выравниванием яркости и освещения.
- И основное — это применение DoG-фильтра. Математически это страшилище выглядит так (кликабельно):
Если сказать простым языком, то с изображения удаляется все, кроме характерных точек. - И последнее что происходит, это финальная валидация.
Сначала очень легко снимаю вопрос по EXIF. Просто создаю новое пустое изображение и копирую в него сохраненное изображение взятое из Интернета, сохраняю. У нового изображения EXIF будет пуст.
Далее необходимо изменить расположение характерных точек. По-моему, минимум сделать это можно двумя способами.
Способ 1: Flip Canvas Horizontal
С помощью одноименного инструмента в Photoshop отражаю холст по горизонтали. Результат (кликабельно):
Плюсы: Расположение характерных точек изменилось. Проверка на images.google.com показала что копий нет. Сработало!
Минусы: надо понимать, что этот способ технически не сложный, а это означает что рано или поздно Яндекс и Google это учтут и, иногда, не одни мы такие умные, ведь если изображение популярное кто-то воспользуется этим же способом и коса найдет на камень. Способ работает, но в перспективе хочется альтернативу.
Способ 2: "Финт Зидана" :)
Я делаю поворот изображение на угол более 5 градусов. Затем обрезаю края, чтобы изображение стало прямоугольным/адекватным. Результат (кликабельно):
Плюсы: при повороте еще на 5 градусов мы будем иметь еще одно новое положение характерных точек и соответственно новое изображения. Коса на камень на найдет, коса все еще будет косить. Еще одно преимущество "финта Зидана" в избавлении от палева с текстом, которое наблюдается в первом способе.
Минусы: нет.
Напоследок интересные данные из официальных источников:
- поисковые системы не хранят изображения на своих серверах, вместо это они записывают сигнатуры
- в Интернете 10 млрд картинок
- каждые сутки добавляется 10 миллионов новых картинок
- объём сигнатур 70 терабайт
- в Яндексе за сутки на картинки приходится 200 миллионов хитов, из которых 5.5 миллионов уникальных посетители
- Яндекс-картинки обслуживает 1000 серверов
- всего в "команде картинок" Яндекса трудятся 30 человек
PSS: Легендарный финт Зидана!
www.youtube.com/watch?feature=player_detailpage&v=jUSU82W3kac#t=44s
Информационные сайта должны располагать уникальным текстом. Для коммерческих сайтов уникализация текста не обязательна. Рекомендованное чтиво по теме на сайте социальное сети интернет-специалистов MegaIndex.org по ссылка далее — Проверка текстов на уникальность ОНЛАЙН И БЕСПЛАТНО
Анализ текста на основе лидеров поиска органической выдачи онлайн и бесплатно можно проводить используя приложение "Анализ текста" от MegaIndex.
Ссылка для регистрации — MegaIndex. Ссылка на приложение — Анализ текста.
Понравился пост?Да НетПонравилось 154, не понравилось 72 |
Расскажите о нас... |
39 комментариев
+ Добавить комментарийбыло — стало — google
http://kremen.ua/images/uniqalization.png
вот тебе уникальное изображение для мужского сайта :)
у меня работает, а у вас другой Google?))
Жаль с лицом знаменитостей такой финт ушами не сделать )))
Не каждое удается? В Photoshop можно каждое.
Про алгоритм ранжирования сайтов мало информации. Это сложная формула, которая учитывает множество различных факторов и их комбинаций, но фундамент закладывали асессоры. Возможно, как ценитель формул напишите статью?
На счет "финта Зидана" не впервые в Skype присылают благодарность. Это реальная проблема и реальное решение.
Я не уверен за Яндекс, но вот Google 100% использует методы выявления ключевых точек, т.н. http://en.wikipedia.org/wiki/Feature_detection_(computer_vision) — там много методов описано...
Вся суть этих методов в том, что поворот, отражение по горизонтали и иные операции не уникализируют изображение — если ключевые точки, кучность, количестко и т.п. совпадает — то и изображение одинаковое. И поисковик это поймет.
Не пойму это ли ж бы сказать?
Берем Вашу картинку: http://kremen.ua/images/small_rotate.png
и пытаемся найти в Google.Картинки по URL'у
Получаем: http://d.pr/i/Qm9X
Примерно 102 сайта с похожим изображением, хотя тут на лицо и поворот и рамка...
P.S.: Выпрашивать лайк в личку — не спортивно!
Я же говорил смысл алгоритмов вявляющих features состоит в том что бы искать нечеткие копии, а в том числе обрезки, повороты и т.п.
Единственное с чем согласен — отражение по горизонтали на удивление сработало, реально удивлен — задумался...
http://kremen.ua/images/logo.jpg
/> «Если картинка на сайте взята из фотобанка, повлияет ли это на позиции ресурса в выдаче?». По словам руководителя команды Google WebSpam, пока что поисковик не учитывает фактор уникальности/неуникальности картинок на сайте. Однако в будущем все может измениться
Подробнее: http://www.seonews.ru/events/google-soobschit-o-stranitsah-poluchivshih-sanktsii/
— ИНТЕРЕСЕН веб-мастерам
— не рерайт, уникальность статьи 99%