Уникализация изображений финтом Зидана

154 72
19:25 2 июня 2013 — Угниченко Дмитрий
Первый основной принцип Яндекса:
Создавайте сайты с оригинальным контентом или сервисом
Цитата из рекомендаций Google в отношении содержания:
Некоторые веб-мастера предпочитают копировать содержание с более популярных сайтов. При этом они не обращают внимания на релевантность и уникальность
Финт Зидана — это фирменный поворот Зинедина (ссылка на видео в конце статьи). Поворот — это ключевое слово в этой статье. На реальном примере я покажу уникализировать изображение у которого множество копий в Интернете (кликабельно):
уникализация изображений

Уникализация изображений актуальная тема. Если текст люди научились легко изменять/рерайтить, то с изображениями процесс более интересный. Используя в Photoshop я проводил множество экспериментов, но задачу уникализации не помогали решить даже профессиональные actions. Actions — это запрограммированные наборы шагов для обработки изображений, которыми используют фотографы. А уж такие банальные вещи как уменьшение, водяной знак, рамки, изменение яркости и освещения и подавно не решают задачу ни на процент. Я зае... Столько усилий затрачено. Решение стало делом принципа.

Если решать задачу наверняка, то необходимо углубляться в алгоритмы Яндекса и Google, которые они используют для определения нечетких копий. Интересны не придурки не придумки, а интересно было найти алгоритм который работает сейчас. Не люблю, знаете, гадалок и догадки. Люблю эксперименты и официальные источники. Источником информации выступил сам Яндекс:
  1. Вначале, с проиндексированного изображения считывается EXIF. EXIF — это стандарт, который цепляет к изображениям раличные данные, например авторе, модель камеры и так далее. Это как meta теги в SEO. На некоторых фотокамерах EXIF заполняется автоматически.
  2. Обработка самого изображения начинается с перевода изображения в цветовой режим из оттенков серого, так называемый grayscale. Простым языком, изображения переводят черно-белый формат.
  3. Далее изображение обрезается по краям. Это делается для того, чтобы убрать возможность уникализации изображения путем наложения ничего не значащей модификации, например рамки.
  4. "Причесывается" изображение выравниванием яркости и освещения.
  5. И основное — это применение DoG-фильтра. Математически это страшилище выглядит так (кликабельно):

    Если сказать простым языком, то с изображения удаляется все, кроме характерных точек.
  6. И последнее что происходит, это финальная валидация.
Это все что нас интересует. И все это правда. За соломинку DoG-фильтра и ухватимся. Изображение Зидана, что вначале статьи, имеет 430 копий в Интернете, это видно по images.google.com. Отлично. Попробуем сделать это изображение уникальным! Погнали

Сначала очень легко снимаю вопрос по EXIF. Просто создаю новое пустое изображение и копирую в него сохраненное изображение взятое из Интернета, сохраняю. У нового изображения EXIF будет пуст.

Далее необходимо изменить расположение характерных точек. По-моему, минимум сделать это можно двумя способами.

Способ 1: Flip Canvas Horizontal
С помощью одноименного инструмента в Photoshop отражаю холст по горизонтали. Результат (кликабельно):

Плюсы: Расположение характерных точек изменилось. Проверка на images.google.com показала что копий нет. Сработало!
Минусы: надо понимать, что этот способ технически не сложный, а это означает что рано или поздно Яндекс и Google это учтут и, иногда, не одни мы такие умные, ведь если изображение популярное кто-то воспользуется этим же способом и коса найдет на камень. Способ работает, но в перспективе хочется альтернативу.

Способ 2: "Финт Зидана" :)
Я делаю поворот изображение на угол более 5 градусов. Затем обрезаю края, чтобы изображение стало прямоугольным/адекватным. Результат (кликабельно):
уникализация
Плюсы: при повороте еще на 5 градусов мы будем иметь еще одно новое положение характерных точек и соответственно новое изображения. Коса на камень на найдет, коса все еще будет косить. Еще одно преимущество "финта Зидана" в избавлении от палева с текстом, которое наблюдается в первом способе.
Минусы: нет.

Напоследок интересные данные из официальных источников:
  • поисковые системы не хранят изображения на своих серверах, вместо это они записывают сигнатуры
  • в Интернете 10 млрд картинок
  • каждые сутки добавляется 10 миллионов новых картинок
  • объём сигнатур 70 терабайт
  • в Яндексе за сутки на картинки приходится 200 миллионов хитов, из которых 5.5 миллионов уникальных посетители
  • Яндекс-картинки обслуживает 1000 серверов
  • всего в "команде картинок" Яндекса трудятся 30 человек
PS: Прошу не злоупотреблять данным материалом, используйте приведенные здесь решения по необходимости. Рекомендую применять "финт Зидана" для больших фотографий, из них можно вырезать часть и эта часть будет смотреться достаточно самобытной.

PSS: Легендарный финт Зидана!
www.youtube.com/watch?feature=player_detailpage&v=jUSU82W3kac#t=44s

Информационные сайта должны располагать уникальным текстом. Для коммерческих сайтов уникализация текста не обязательна. Рекомендованное чтиво по теме на сайте социальное сети интернет-специалистов MegaIndex.org по ссылка далее — Проверка текстов на уникальность ОНЛАЙН И БЕСПЛАТНО

Анализ текста на основе лидеров поиска органической выдачи онлайн и бесплатно можно проводить используя приложение "Анализ текста" от MegaIndex.
Ссылка для регистрации — MegaIndex. Ссылка на приложение — Анализ текста.

39 комментариев

+ Добавить комментарий
Работает как-то не очень. При повороте на 6-8 градусов ищется масса дублей, и только повторный поворот изображения дает как бы уникальную картинку. Но после двойной манипуляции и обрезания картинка получается мягко говоря не совсем красивая.
Александр, слова вроде "не очень", "как бы" — я не воспринимаю. Приведите пример конкретного изображения. Очевидно, дело не в автомобиле, а в прокладке между рулем и сиденьем.
За ролик Зиданища, +5!
Баловался однажды "уникализацией". Гугл безошибочно всё равно определяет картинку и показывает первоисточник. На момент, когда дубли не нашлись, это уже была совсем не та картинка, которая задумывалась :)
Леонид, могу так ответить.
было — стало — google
http://kremen.ua/images/uniqalization.png
вот тебе уникальное изображение для мужского сайта :)
у меня работает, а у вас другой Google?))
Дмитрий - шикарно! ;)
Жаль с лицом знаменитостей такой финт ушами не сделать )))
Когда увидел формулу, подумал: "Ну сейчас будет что-то интересное..." А нет, ошибся, формула лишь для красоты...
Формула вообще внутри статьи. Что же до нее дочитали? Можно попросить ссчыку на ваши интересные материалы, с формулами и так далее
Просто Вы тут минусите многие статьи, говорите о том что пользы от них 0 и т.д. Давайте разберем что Вы тут нового написали? Или чего сами придумали? Или может что полезного? Почему-то описание шинглового алгоритма у Терехова Вам не понравился, а сами написали тоже самое про изображения. Я ничего не говорю про себя. Я этого не знал. Насчет полезности тоже можно поспорить. Не каждое фото удастся повертеть. Далеко не каждое.... Это ИМХО, ведь у каждого оно должно быть. Вот у меня оно такое. Для себя я ничего интересного не нашел.
Мне не нравится статья/заметка Терехова. Во-первых, потому что практический выхлоп от нее нулевой. Во-вторых, потому что так унижать Яндекс, чтобы сделать себе имя — так нельзя, в конце концов кто Терехов и кто Яндекс чтобы он их учил делать поиск, понимаете. Элементарное уважение. Читал про алгоритм давно, много лет назад.
Не каждое удается? В Photoshop можно каждое.
Правда? Может статью напишите? Откроете занавес перед сирыми и убогими.
Только что писали про не интересность статьи, поставили мне дислайк. Вспомнили и поддержали Терехова, который опускает Яндекс в своем материале. Теперь пытаетесь приписать мне то что сами делаете. Не солидно.
Про алгоритм ранжирования сайтов мало информации. Это сложная формула, которая учитывает множество различных факторов и их комбинаций, но фундамент закладывали асессоры. Возможно, как ценитель формул напишите статью?
На счет "финта Зидана" не впервые в Skype присылают благодарность. Это реальная проблема и реальное решение.
Дислайк я убрал, если что. Воздержусь... На счет того что вас благодарят, да ради Бога. Я сказал лишь что для себя ничего интересного не нашел. Может Вы хотите мне доказать что это мне же интересно? По-моему, по Вашему есть 2 мнения: Ваше и неправильное. Как то вы не адекватно реагируете на чужие коменты, в которых не восхищаются Вами.
Коллеги,
Я не уверен за Яндекс, но вот Google 100% использует методы выявления ключевых точек, т.н. http://en.wikipedia.org/wiki/Feature_detection_(computer_vision) — там много методов описано...
Вся суть этих методов в том, что поворот, отражение по горизонтали и иные операции не уникализируют изображение — если ключевые точки, кучность, количестко и т.п. совпадает — то и изображение одинаковое. И поисковик это поймет.
Опять "догадки"? Примеры!
Дмитрий,
Не пойму это ли ж бы сказать?
Берем Вашу картинку: http://kremen.ua/images/small_rotate.png
и пытаемся найти в Google.Картинки по URL'у
Получаем: http://d.pr/i/Qm9X
Примерно 102 сайта с похожим изображением, хотя тут на лицо и поворот и рамка...
P.S.: Выпрашивать лайк в личку — не спортивно!
Я не выпрашивал — не заблуждайте. Я попросил поставить ЕСЛИ интересно. Зачем взяли фото с окном обработчика))
это же скрин)))фото берите
Смысл в том что даже с окном обработчика Google выделяет фото Зидана четко и находит 102 сайта минимум...
Я же говорил смысл алгоритмов вявляющих features состоит в том что бы искать нечеткие копии, а в том числе обрезки, повороты и т.п.
Единственное с чем согласен — отражение по горизонтали на удивление сработало, реально удивлен — задумался...
Получается можно сделать хитрый ход — флипать в редакторе, а в html средствами css флипать обратно :) Этические моменты опустим — этика на совести, а совесть у всех разной степени испорченности...
Шутите? Из картинок идет траф. С такой картинки ни трафа, только санкции
И посмотрите еще раз пример в комментариях)
Я привел уже в комментария к материалу реальный пример. На скорую руку, уникализация к 4 похожим, а не 102
http://kremen.ua/images/logo.jpg
Очень не люблю, когда уникальные картинки с нашего сайта переделывают и выдают за свои. Давайте лучше не чужие переделывать, а делать свои. А уж если брать чужие, то не претендовать на уникальность
согласен. этика самоограничения. если сайт небольшой и только начинает, то нет ничего зазорно взять картинку, уникализировать и оставть подпись откуда взято.
Спасибо, очень ценно!!!
Спс
И Skypом благодарят))
Брату брат)
Спасибо за приглашение. Изображение потеряет качество, но тем не менее правда
) Больше не zae.buy
где здесь спросить про Яндекс?
Проверил на tinyeye. Работоспособность 100%
Kyocera попробовал повертеть http://global.kyocera.com/application/automotive/product/device/auto_c.html - получилось.
Ну что можно сказать. Статья никакая. Весь финт в рерайте более грамотных статей, которые в нете лежат более 2 лет. Для новичков, которым лень подумать 10 минут - вполне сносный материл, а для остальных - прошлый век. Есть много способов сделать картинку уникальной в фотошопе, но видимо автор или не в теме или не хочет раскрывать секреты (тут я поддержу обеими руками).
— способ РАБОЧИЙ
— ИНТЕРЕСЕН веб-мастерам
— не рерайт, уникальность статьи 99%
Интересно, как быть с квадратом))!
Никак. Даже с цветным квадратом - никак

Только зарегистрированные пользователи могут добавлять комментарии.