tracking pixel что это
Tracking pixel что это
Tracking pixel – что это такое и как использовать трекинг пиксель для заработка в интернете: полезная информация и сервисы.
Независимо от того, как вы это называете (Tracking pixels, Retargeting pixels, Conversion pixels), этот инструмент может помочь вам увеличить продажи в CPA сетях и лучше оценить свои собственные маркетинговые усилия.
Но что такое Tracking pixel (дословно – пиксель отслеживания), как вы его устанавливаете и каковы реальные примеры его использования?
• Тип используемой операционной системы, которая может рассказать вам больше об использовании мобильных устройств;
• Тип устройства ((Mobile, Desktop, Tablet);
• Время посещения сайта или чтения электронной почты;
• Тип используемой электронной почты: на компьютере или мобильном устройстве;
• Тип используемого клиента (почтовая программа или браузер);
• Что человек делал на сайте;
Несмотря на то, что пиксель очень мал и скрыт, выгода от его использования огромна.
Его используют все крупные сервисы:
Поэтому важно для своего сайта добавлять данные для входа через соцсети, чтобы потом что-то предлагать и продавать…
Функционально куки и пиксели похожи. Оба отслеживают поведение пользователей на разных сайтах, и оба могут использоваться для показа рекламы людям.
Файлы cookie также используются, чтобы сайт запоминал определенные пользовательские настройки, например, ваше имя пользователя в Facebook, поэтому вам не нужно вводить его каждый раз.
Это означает, что кто-то может посетить ваш сайт, где установлен пиксель, с десктопного устройства, и в дальнейшем вы сможете показывать ему рекламу на его мобильном устройстве и заработать в интернете на этом. Наиболее тематичную рекламу даже после того, как он покинул ваш сайт.
Кроме того, пользователи могут блокировать куки в своем браузере. Некоторые пользователи испытывают большие опасения по поводу файлов cookie и конфиденциальности, поэтому они отключают их. Tracking pixel, на данный момент, не могут быть отключены таким образом.
Если вы работаете с почтовыми рассылками, то эта информация будет полезной вам. В этих сервисах можно отследить открытие писем даже на тех браузерах, где у пользователей отключены картинки, то есть в чистом виде графический файл размером 1 пиксель не сработал бы.
И всю эту статистику вы получите автоматически – без дополнительных подтверждений со стороны пользователя. То есть просто по факту открытия.
Также смотрите в сторону Mailtrack (только для Gmail), расширение для браузеров Firefox, Opera и Chrome.
Большинство новых CPA сетей и партнерских программ на собственной платформе позволяют размещать отслеживающий пиксель. Для более старых партнерок вместо этого вам нужно будет использовать отслеживание SubID.
Платные сервисы для трекинга:
• Loggly – есть бесплатная версия.
• LinkTrackr – от 7 долларов в месяц.
• Clickmeter – от 29 долларов в месяц.
• ADSBRIDGE – 14 дней триальная версия. От 29 долларов в месяц.
• REDTRACK – 14 дней триальная версия. От 41 доллара в месяц.
В емейлы встраивают невидимые маячки: как за нами шпионят через Pixel Tag
Просматривая электронную почту, можно наткнуться на множество разнообразных рекламных писем с предложениями от магазинов, просьбами пройти опрос и другими не особо интересными для обычного юзера ивентами. Готов поспорить, вы не задумывались о том, что даже банальное открытие такого письма может повлечь за собой не самые приятные последствия. В этой статье мы поговорим о том, как организована подобная «слежка», какие данные о вас может получить отправитель письма и где может быть применена полученная информация.
Содержание
Что такое Pixel Tag
Он также известен как Web Beacon, Web Bug, Tracking Bug, Tag, Web Tag, Page Tag, Tracking Pixel, Pixel, 1×1 GIF и clear GIF
Pixel Tag или пиксель отслеживания — это изображение размером в один пиксель, которое загружается со специального сервера. Так, открыв письмо, содержащее такой тег, браузер автоматически пытается прогрузить картинку, переходя по ссылке и оставляя свой «след» на стороннем сервере. В свою очередь сервер регистрирует этот переход, собирая необходимые данные, при том что пользователь даже не понял, что произошло какое-то действие. Этот пиксель сделан таким образом, чтобы быть одного цвета с фоном, либо же вообще прозрачным, поэтому просто так найти его у вас вряд ли выйдет. Стоит отметить, что эти пиксели также повсеместно используются и на веб-сайтах для сбора статистики работы пользователя с ресурсом.
Данные, которые можно собрать, используя Pixel Tag:
Как вы уже могли понять, информация собирается без ведома пользователя, что может быть не очень приятным с точки зрения конфиденциальности. Также не стоит забывать и о том, что такая информация может быть использована не только в «благих целях» крупных компаний для улучшения качества их сервисов, но и попасть в руки к тем, кто захочет воспользоваться ей для получения прибыли.
Как Pixel Tag используют крупные корпорации
Это стандартная практика в современной аналитике
Большим корпорациям, владеющим крупными интернет-платформами, для существования необходимо продвигать свою продукцию либо услуги. Одним из путей такого «продвижения» является рассылка рекламных предложений своим клиентам. В любой уважающей себя крупной организации существует свой отдел аналитики, главной задачей которого является сбор данных по различным направлениям работы всей компании. Для рекламных кампаний, как это ни странно, необходимо знать, насколько тот или иной способ продвижения эффективен. Для сбора такой аналитической статистики по разосланным электронным письмам потребовался инструмент, который не будет создавать на пользователе лишней нагрузки в виде просьб перейти по ссылке, а будет сам в автоматическом режиме собирать всю необходимую информацию и направлять ее на сервера компании. На помощь «рекламщикам» пришел тот самый «пиксельный тег». Он позволяет без труда собрать статистику заинтересованности теми или иными предложениями для последующего анализа и улучшения качества предоставляемых услуг.
Pixel Tag могут использовать вовсе не для благих намерений
Опасность инструмента зависит от рук, в которые он попал
Нельзя не согласиться с тем, что собранная информация о пользователе без его ведома может быть использована не только для улучшения качества сервисов, но и для разных «темных» дел. Например, собранная информация о факте открытия письма может использоваться в последующем для формирования баз активных почтовых ящиков и отправки разнообразного спама на них либо банальной продажи этой базы заинтересованным лицам.
Также не стоит забывать, что Pixel Tag может способствовать передачи не только вашей электронной почты, но и вашего IP-адреса. Так, если злоумышленник приложит достаточно усилий, он сможет узнать информацию о вашем местоположении и, зная вашу электронную почту, даже найти соцсети, а с этими данными уже ваши контакты и куда более личные материалы.
С Pixel Tag можно бороться
По крайней мере, вы с лёгкостью можете обнаружить слежку
Существует множество различных способов бороться с пикселями отслеживания. Так, некоторые анонимные браузеры (например, Tor) не разрешают загрузку таких пикселей. Также вы можете воспользоваться прокси-серверами или заблокировать использование скриптов в практически любом браузере, но не стоит забывать, что это может сломать некоторые функции сайтов. Самым же простым способом борьбы со слежкой может стать установка специального расширения, которое будет определять и блокировать попытки отправить ваши данные сторонним серверам.
Например, расширение Ugly Email (аналоги: PixelBlock, Trocker и Ghostery) умеет находить пиксели отслеживания в Gmail. Установив его, вы можете начать замечать «глаз» рядом с письмами от некоторых компаний. Это означает, что компания очень хочет узнать, какие действия с письмом вы производите. Также, наведя курсор на новый значок, расширение вам подскажет, каким сервисом сбора статистики пользуется та или иная компания.
Также альтернативным вариантом обхода отслеживания может стать использование специальных почтовых клиентов (например, Thunderbird, Mailspring и Sylpheed). Большинство таких программ предоставляет возможность отключить в настройках выполнение HTML-кода в письмах и отображать только текст, что также может помочь в борьбе с веб-маяками. Если вас не устраивают способы, описанные выше, вы можете попробовать отключать интернет перед открытием письма. Это точно не даст вашему браузеру перейти на серверы компании и оставить «свой след», но, в таком случае, следует озаботиться удалением почты после прочтения, чтобы восстановление интернет-соединения не вызвало срабатывания пикселя отслеживания.
Дискриминация котов: веб-трекинг через невидимые картинки
Вы когда-нибудь задумывались над тем, по какому принципу вам показывают таргетированную рекламу? Почему, даже не лайкая ничего во время сёрфинга вы, возвращаясь на Facebook, видите рекламу, связанную с посещёнными вами сайтами? И кто заинтересован в том, чтобы отслеживать пользователей? В рамках моего учебного проекта, мне предстояло выяснить, какие компании стоят за трекингом посещений сайтов, и что они используют, чтобы делать это, не привлекая особого внимания.
Почему дискриминация
Что понимать под дискриминацией пользователей в интернете? Это когда цены на товары в онлайн магазинах меняются в зависимости от того, какие устройства используются для просмотра каталога. А нарушение приватности начинается тогда, когда сайты показывают вам рекламу средств от бессонницы, потому что вы засиживаетесь допоздна, так как это указывает на то, что данные о времени вашего пребывания в интернете передаются сторонним компаниям.
Что такое веб маяки
Веб маяк (в английском варианте «web beacon», или «1×1 pixel image») — это крошечная или прозрачная картинка, которая встраивается в страницу и используется для отслеживания действий пользователей.
Такие невидимые маяки могут использоваться не только для веб аналитики, но и для сбора агрегированной информации с целью продажи её сторонним сайтам, для построения социальных графов. Ещё одним из способов применения веб маяка это проверка, что электронное письмо прочитано. Отправитель узнает об этом, как только по определенной ссылке картинку запросили, а адресат может и не заметить, что она была в теле письма.
Сбор данных и статистика
В качестве начальных данных у меня было несколько JSON файлов со ссылками на картинки (как статически, так и динамически подгружаемых) с топ 800 доменов (по версии ALEXA). Оставалось разработать скрипт, который парсит эти файлы, проходит по ссылкам, закачивает картинки и сохраняет информацию о них в базе данных SQLite.
Эти JSON файлы содержали все ссылки на картинки, как 1st party (картинки находятся на том же сайте, где размещена ссылка на них) так и 3rd party (картинки хранятся на сторонних сайтах). И если в первом случае, маяки могут использоваться вполне в безобидных целях (для веб аналитики в пределах сайта), то во втором случае задействовано несколько сторон, и это уже межсайтовый трекинг. Так как интересовал именно последний случай, я использовала библиотеку tld, чтобы извлекать домен верхнего уровня.
Скрипт работает так, как если бы все cookies очищались перед каждым запросом, поэтому в первоначальных запросах к серверам поле Cookies пустое. Если в ответе от сервера есть заполненное поле set-cookie, это значение заносится в базу данных.
Есть два способа вычисления маяка: проверка размера и проверка поля в HTTP заголовке content size. Но не все ответы на запросы содержат поля content length и content type, так как они опциональные и даже могут содержать неправильные данные. Также встречаются маяки, которые при размере 1×1, возвращаются в пакете с content length > 100, так как картинка PNG формата. Поэтому при построении графиков я не учитывала значение content length.
Что делать, если в ответе нет картинки? Бывает, что сервер возвращает статус 204. Это означает, что контента нет, но, тем не менее, прохождение по ссылке зафиксировано. Поэтому если статус 204 и content type в HTTP заголовке содержит «image/», скрипт предполагает, что это веб маяк и помещает в базу значения width = 0 и height = 0. Таких маяков встретилось 37 294 (1.53%).
Всего было проверено 8 586 314 ссылок на картинки, в базе содержатся данные о 5 873 372 3rd party картинках, из них 2 431 277 маяка (41% от количества сторонних картинок это веб маяки!).
И еще немного статистики
В таблице image_domains хранится информация о провайдерах картинок (то есть это не те 800 топ сайтов со ссылками на картинки, а сервера, непосредственно хранящие эти картинки).
Количество доменов: 800
Количество доменов, где встретился хотя бы один маяк: 760
Количество страниц: 124 214
Количество страниц, где встретился хотя бы один маяк: 111 442
Количество провайдеров картинок: 4 348
Количество провайдеров картинок-маяков: 1 325
И то, что есть 40 доменов, на которых не встретился ни один маяк, не говорит о том, что они их не используют. Возможно, они используют маяки нестандартного размера (1×2, 3×1), которые тоже встречались при выборочной проверке ссылок.
Топ игроки на рынке веб трекинга
Итак, в базе 2 431 277 маяков. Интересно узнать, маяки каких из 1 325 провайдеров чаще всего встречались на страницах топ 800 доменов.
Tracking Pixel vs Postback URL: Что лучше для отслеживания конверсий?
Те, кто не первый день работают с продвижением офферов и предложений, знают, что отслеживание и оптимизация всегда имеют решающее значение для успеха. Здесь нет обходных путей. По этой причине сегодня мы решили детально рассмотреть что лучше для отслеживания конверсий: Tracking Pixel vs Postback URL?
Для некоторых партнерских сетей доступен еще третий метод: интеграция API. Но самые результативные все же — Pixel и Postback URL.
Знание всех плюсов и минусов каждого варианта поможет вам выбрать наиболее подходящий метод именно для ваших целей.
Conversion Tracking Pixel
Пиксель отслеживания — это метод, который позволяет пользователям отслеживать посещения веб-страниц, показы объявлений, конверсии и другие виды онлайн-активности.
Пиксель отслеживания — это HTML-фрагмент кода, который можно разместить на целевой странице или странице предложения для отслеживания действий посетителей.
ВАМ МОЖЕТ БЫТЬ ИНТЕРЕСНО:
Пиксель Яндекс.Дзен — подробно о работе и настройке
Пиксель ВКонтакте: что это такое и как создать?
Как установить и настроить пиксель в ТикТок?
Чтобы использовать пиксель для отслеживания конверсий ваших офферов, вам необходимо сперва разместить пиксель отслеживания на странице подтверждения офформления оффера или же на странице благодарности. Т.е. и в том, и в другом случае на страницах, которые видит пользователь, совершая конверсию на вашем лендинге.
Когда пользователь посещает эту страницу, ваш трекер отмечает совершенную конверсию для конкретного объявления и кампании именно благодаря HTML-фрагменту кода или пикселю отслеживания.
Мы можем разместить и позже прочитать cookie с уникальным значением клик ID, который идентифицирует пользователя в воронке кампании. Этот файл cookie помещается в браузер пользователя при показе объявления.
Отслеживание ваших офферов с помощью пикселя очень просто и не требует сложной технической смекалки. Это просто размещение фрагмента кода на странице сразу после преобразования.
Плюсы:
Минусы:
Postback Tracking
Отслеживание Postback URL-адресов также известно как отслеживание на стороне сервера или между серверами (S2S). При выборе такого метода отслеживания значение click ID будет сгенерировано и отправлено в вашу партнерскую сеть через HTTP-запрос.
Позже, когда происходит конвертация, партнерская сеть передает это значение обратно в трекер. После чего, вы увидите конверсию в своих отчетах. Получив значение click ID, трекер может распознать точное посещение и связать конверсию с нужной кампанией.
ВАМ МОЖЕТ БЫТЬ ИНТЕРЕСНО:
PostBack в Telegram из любой ПП за 10 минут
Настройка Postback для CPA
Плюсы:
Минусы:
Да, мы не зря в самом начале упомянули API. Есть и третий метод отслеживания конверсий, основанный на интеграции API рекламного трекера с партнерской сетью.
Это самый надежный метод отслеживания конверсий, потому как он происходит на backend’е обеих платформ. Когда происходит конверсия, инфраструктура партнерской сети пингует рекламный трекер со всей необходимой информацией.
Однако, поскольку этот метод требует намного большей работы по разработке с обеих сторон, он не очень распространен в партнерском маркетинге.
Плюсы:
Минусы:
Что в итоге выбрать?
После нашего материала, мы считаем, у вас появилось достаточно хорошее представление о двух основных методах отслеживания и как они работают. А также примерно представляете чем является третий метод отслеживания, используемый очень редко.
Отслеживание имеет действительно фундаментальное значение. Без любого из трех методов не обойтись, если вы хотите добиться успеха в партнерском маркетинге. Поэтому стоит заранее убедиться, что вы делаете все правильно и не упускаете зря конверсии.
В случае оставшихся вопросов не забудь подписаться:
Больше годноты на канале — Довольный Арбитражник
Обсудить и задать вопросы в чате — Арбитраж трафика | Довольный
Поделиться ссылкой:
Добавить комментарий Отменить ответ
Для отправки комментария вам необходимо авторизоваться.
Продвинутое компьютерное зрение. Введение в Прямое визуальное отслеживание
Сперва, мы представим некоторые типы методов визуального отслеживания. После, мы объясним как классифицировать их. Мы также поговорим о фундаментальных аспектах прямого визуального отслеживания, уделяя особое внимание методам, основанным на регионах, и методам основанным на градиентах. В будущих статьях мы представим подробный математический вывод алгоритма Лукаса-Канаде с акцентом на выравнивание изображений. И наконец, мы представим, как реализовать эти методы в Python. Давайте начнем!
Визуальное отслеживание, также известное как отслеживание объектов или отслеживание в видео, представляет собой задачу оценки траектории целевого объекта в сцене с использованием визуальной информации. Визуальная информация может поступать из различных источников изображений. Мы можем использовать оптические камеры, тепловизоры, ультразвук, рентген или магнитный резонанс.
Список наиболее распространенных устройств обработки изображений:
На следующем изображении приведены примеры областей применения визуального отслеживания:
Теперь рассмотрим как мы можем классифицировать решения, доступные сегодня.
Классифицирование методов визуального отслеживания
Методы визуального отслеживания могут быть классифицированы по следующим основным компонентам:
Рассмотрим каждый компонент подробнее.
Представление цели
Во-первых, нам нужно выбрать, что мы отслеживаем. Этот компонент визуального отслеживания называется представление цели (target representation). Согласно Альперу Йилмазу (Alper Yilmaz) и его статье “Object tracking: A Survey”, опубликованной в 2006 году, существует несколько типичных представлений целей. Он выделил следующие представления:
Однако среди этих целевых представлений, bounding box (ограничивающая рамка) является наиболее распространенным методом. Причина в том, что bounding box легко определяет множество объектов.
Модель внешнего вида
Гистограмма изображения
Например, на изображении ниже мы можем заметить футболиста в синей форме, бегущего по полю. Игрок представлен bounding box’ом.
Данный bounding box определит гистограмму. Обычно мы используем гистограмму на изображении в оттенках серого, но также мы можем использовать цветовую гистограмму. На изображении выше мы можем представить цветовую гистограмму прямоугольного bounding box’а. Мы можем использовать эту гистограмму, чтобы отличить целевого игрока от зеленого фона.
Теперь проиллюстрируем это на примере. Например, у нас есть гистограмма где 70% синего цвета и 30% зеленого цвета. Это означает, что когда игрок движется нам необходимо передвигать bounding box по области и найти место с самым высоким процентом синего цвета. Таким образом, найдя рамку, мы всегда будем иметь идеальное совпадение с исходной гистограммой. Таким образом, мы сможем отследить игрока.
Интенсивность изображения
Мы также можем представить цель с помощью filter bank, который вычисляет результирующее изображение, используя исходные значения интенсивности пикселей. В качестве модели внешнего вида мы можем использовать поля распределения. Эти типы моделей внешнего вида также называются методами на основе регионов (Region-based methods).
Признаки изображения
Еще одним очень популярным типом модели внешнего вида являются признаки изображения. Он основан на эталонном изображении целевого объекта, где набор различимых признаков может быть вычислен для представления цели. Для извлечения признаков часто используются несколько алгоритмов обнаружения объектов. Например такие алгоритмы как SIFT, SURF, ORB, Shi-Tomasi, которые мы рассмотрели в нашей статье “Как извлечь признаки из изображения в Python” (How to extract features from the image in Python).
Разложение подпространства
Далее мы сосредоточимся на типах моделей внешнего вида, которые часто используются в методах отслеживания на основе региона.
Методы отслеживания на основе региона
Отслеживание на основе региона пришло из идеи отслеживания региона или части изображения. Как мы говорили раньше, мы будем представлять целевой объект с помощью bounding box’а. Чтобы отслеживать объекты, ограниченные bounding box’ом, нам необходимо определить подходящую модель внешнего вида. В приведенном ниже примере модель внешнего вида это шаблон интенсивности изображения. Здесь у нас есть эталонное изображение целевого объекта слева и мы ищем лучшее совпадение в исходном изображении.
Теперь когда мы приняли модель внешнего вида для нашего целевого объекта, нам необходимо смоделировать его движение в сцене. Это означает, что задача отслеживания решается путем нахождения параметров модели движения. Параметры модели движения максимизируют сходство между референсом и исходным изображением целевого объекта. Например, предположим, что целевой объект перемещается в сцене только в горизонтальном и вертикальном направлениях. В этом случае, простой трансляционной модели с двумя параметрами tx и ty будет достаточно для моделирования положения эталонного изображения.
Естественно, если целевой объект движется более сложным образом, то нам необходимо настроить и использовать более сложные модели преобразования с дополнительными степенями свободы, как показано ниже:
К примеру, если мы отслеживаем обложку книги, затем мы должны использовать проекционную модель которая имеет 8 степеней свободы. С другой стороны, если целевой объект не жесткий, то нам необходимо использовать деформируемую модель. Таким образом, мы могли бы использовать B-spline (Базисный сплайн) или Thin-Plate Splines (Тонкие пластинчатые сплайны) чтобы корректно описать деформацию объекта.
Деформируемы параметрические модели:
Splines (B- Splines, TPS, Multivariate)
Triangular meshes (Треугольная сетка)
Другой аспект прямых методов в том, что часто на практике мы используем позиции целевого объекта в предыдущих кадрах для инициализации поиска его текущей позиции. Итак, учитывая вектор параметров pt-1, нашей движущейся модели в предыдущем кадре t-1, наша задача это найти новый вектор pt, которая наилучшим образом соответствует эталонному и текущему изображениям.
Функция сходства
Это подводит нас к очень интересному вопросу: Что является лучшим совпадением для референса и текущего изображения? Чтобы найти лучшее совпадение нужно найти ту часть текущего изображения которая наиболее похожа на эталонное изображение. Это означает, что мы должны выбрать функцию сходства f между эталонным и исходным изображением. Это было использовано при сопоставлении шаблонов. В следующем примере мы видим, что сходство между первыми двумя изображениями должно быть больше, чем сходство между вторыми двумя изображениями.
Чтобы вычислить схожесть между шаблоном и исходным изображением, используется несколько функций сходства. Вот несколько из них:
Sum of Absolute Differences (SAD)
Sum of Squared Differences (SSD)
Structural Similarity Index (SSIM)
Итак, мы выяснили, что для отслеживания необходимо выбрать модель внешнего вида целевого объекта, модель движения и функцию сходства, чтобы определить, насколько эталонное изображение похоже на исходное изображение в видео. Учитывая параметры pt-1 для предыдущего кадра t-1, нам нужно разработать стратегию поиска новых параметров модели pt в текущий момент времени t. Наиболее простой подход заключается в определении локальной области поиска вокруг предыдущих параметров pt-1. В приведенном ниже примере мы будем двигаться от -20 пикселей до +20 пикселей по оси x и от -20 пикселей до +20 пикселей по оси y от положения целевого объекта в предыдущем кадре (предполагается, что у нас есть только трансляция).
Если мы хотим улучшить исчерпывающий поиск в широкой окрестности предыдущего положения объекта, мы можем сократить поиск, используя наши предварительные знания о движении объекта. Например, мы можем использовать классическую систему фильтрации Калмана или более сложные фильтры, такие как фильтр частиц.
Методы основанные на градиентах
Другой очень популярной стратегией поиска является градиентный спуск. Сначала мы выбираем функцию сходства, которая дифференцируема относительно параметров отслеживания и имеет гладкий и выпуклый ландшафт вокруг наилучшего соответствия. Затем мы можем использовать градиентные методы и найти оптимальные параметры модели трансформации (движения).
В следующем примере у нас есть случай, когда нам нужно рассчитать SSD (Sum of Squared Differences).
Предположим, что зеленый прямоугольник является эталонным изображением, и мы хотим проверить его сходство с исходным изображением (синим прямоугольником). Мы вычислим SSD, сдвинув синий прямоугольник так, чтобы он совпадал с зеленым прямоугольником, и вычтем эти два изображения. Затем возведем разницу в квадрат и просуммируем. Если мы получим небольшое число, это означает, что у нас есть похожий шаблон. Этот процесс показан на следующем рисунке.
В примере выше справа мы видим двумерную функцию с высоты птичьего полета. В центре находится минимум, а затем вокруг него располагаются большие значения. Теперь, если мы захотим нарисовать эту функцию в одномерном виде, это будет выглядеть следующим образом:
Допустим, что мы ищем вдоль направления x. Сначала мы случайным образом выберем начальную позицию для x. Допустим, x=4. Затем вычислим градиент функции SSD. Далее мы узнаем, что нам нужно двигаться к минимуму функции. Градиент подскажет нам, в каком направлении нужно двигаться в исходном изображении.
Итак, в чем же основное преимущество градиентного спуска? Представьте, что у нас есть модель преобразования с несколькими степенями свободы, например, проективная модель, которую мы используем для отслеживания платы в следующем примере.
Сначала объясним, что значит несколько степеней свободы. Допустим, у нас есть исходное изображение прямоугольника и шаблонное изображение. Обратите внимание, что в приведенном ниже примере прямоугольник на оригинальном изображении слева является спроецированной версией шаблонного изображения справа.
Однако теперь вычислить SSD будет невозможно. Одним из способов решения этой проблемы является обнаружение ключевых точек на обоих изображениях, а затем использование некоторого алгоритма сопоставления признаков, который найдет их совпадения. Однако мы также можем выполнить поиск, используя значения интенсивности изображения шаблона. Для этого мы применим трансформационное искривление. Как мы уже объясняли ранее в этой статье, мы умножим изображение на следующую матрицу перехода:
Это означает, что здесь у нас 8 степеней свободы, потому что в матрице у нас всего 8 параметров и одно число, которое фиксировано на 1. Таким образом, наш исходный прямоугольник теперь будет иметь изменение в перспективе. Это означает, что для расчета SSD, помимо нахождения параметров трансляции x и y, нам также необходимо найти другие параметры для представления вращения, масштабирования, перекоса и проекции.
Итак, основное преимущество градиентного спуска заключается в том, что при вращении, масштабировании и деформации искомого объекта нам не нужно перебирать 1000 и 1000 комбинаций, чтобы найти наилучшие параметры преобразования. С помощью градиентного спуска мы можем получить эти параметры с очень высокой точностью всего за несколько итераций. Таким образом, это значительная экономия вычислительных усилий.