Отслеживание кликов - Click tracking

Отслеживание кликов это когда поведение пользователя при нажатии или поведение пользователя при навигации собирается для получения информации.[1][2] Поведение кликов обычно отслеживается с помощью журналов сервера, которые включают щелкните пути и щелкнул URL-адреса (Единый указатель ресурсов).[2][3] Этот журнал часто представлен в стандартном формате, включая такую ​​информацию, как имя хоста, дата и имя пользователя.[2] Однако по мере развития технологий новое программное обеспечение позволяет проводить глубокий анализ поведения пользователей при кликах, используя гипервидео инструменты.[1] Учитывая, что Интернет можно рассматривать как опасную среду, исследование стремится понять, почему пользователи переходят по одним ссылкам, а не по другим.[4] Также были проведены исследования для изучения Пользовательский опыт конфиденциальности, сделав пользователя личная идентификационная информация индивидуальная анонимность и улучшение написания и структурирования форм согласия на сбор данных.[5][6]

Отслеживание кликов актуально в нескольких отраслях, включая Взаимодействие человека с компьютером (HCI), программная инженерия, и Реклама.[1][7] Отслеживание электронной почты, отслеживание ссылок, веб-аналитика, и исследование пользователей также связаны концепции и приложения отслеживания кликов.[8] Обычно данные о кликах из отслеживания кликов используются для улучшения позиций результатов в поисковых системах, чтобы сделать их заказ более релевантным потребностям пользователей.[9] В отслеживании кликов используются многие современные методы, такие как машинное обучение и сбор данных.[9]

Технология отслеживания и записи

Технологии отслеживания и записи (TRT) можно разделить на две категории: TRT для учреждений и TRT для конечных пользователей.[10] Институциональные TRT и TRT конечных пользователей различаются по тому, кто собирает и хранит данные, и это можно соответственно понимать как учреждения и пользователей. Примеры TRT включают: определение радиочастоты (RFID), кредитные карты и магазинные видеокамеры. Исследования показывают, что люди озабочены конфиденциальностью, но их меньше беспокоит то, как TRT используются ежедневно.[10] Это несоответствие объясняется тем, что общественность не понимает, как собирается информация о них.[10]

Другой способ получения пользовательского ввода - отслеживание глаз или отслеживание взгляда. Технология отслеживания взгляда особенно полезна для людей с двигательными нарушениями.[11] Системы, использующие отслеживание взгляда, часто пытаются имитировать поведение курсора и клавиатуры.[11] В этом процессе система отслеживания взгляда разделяется на отдельную панель в системном интерфейсе, и пользовательский опыт этой системы ставится под угрозу, поскольку люди должны переключаться между панелью и другими функциями интерфейса. Опыт также сложен, потому что пользователи должны сначала представить, как выполнить задачу, используя функции клавиатуры и курсора, а затем использовать взгляд. Это заставляет задачи занять дополнительное время.[11] Поэтому исследователи создали собственный веб-браузер под названием GazeTheWeb (GTW), и основное внимание в их исследованиях уделялось пользовательскому опыту. Они улучшили интерфейс, чтобы лучше воспринимать взгляд.[11]

Отслеживание движения глаз также применяется в юзабилити-тестирование при создании веб-приложений.[12] Однако для отслеживания движений глаз пользователя часто требуется лаборатория с соответствующим оборудованием. Активность мыши и клавиатуры можно измерить удаленно, так что это качество можно использовать для тестирования удобства использования.[12] Алгоритмы могут использовать движения мыши для прогнозирования и отслеживания движений глаз пользователя. Такое отслеживание в удаленной среде обозначается как метод удаленной регистрации.[12]

Это пример записанного отслеживания взгляда для нескольких участников.

Дактилоскопия браузера это еще один способ идентификации пользователей и их отслеживания.[13] В этом процессе информация о пользователе собирается из его веб-браузера для создания отпечаток браузера. Отпечаток браузера содержит информацию об устройстве, его операционной системе, браузере и его конфигурации. Заголовки HTTP, JavaScript и плагины браузера можно использовать для создания отпечатка пальца.[13] Отпечатки браузера могут изменяться со временем из-за автоматических обновлений программного обеспечения или настроек браузера пользователя. Меры по повышению конфиденциальности в этой области могут снизить функциональность из-за блокировки функций.[13]

Методы отслеживания кликов

Поведение пользователей при просмотре часто отслеживается с помощью журналов доступа к серверу, которые содержат шаблоны URL-адресов, запросов и путей, по которым были щелкнуты ссылки.[1] Однако более современное программное обеспечение для отслеживания использует JavaScript для отслеживания поведения курсора. Собранные данные мыши можно использовать для создания видео, позволяя воспроизводить и легко анализировать поведение пользователя. Гипермедиа используется для создания таких визуализаций, которые позволяют отслеживать такие действия, как выделение, колебание и выбор.[1] Технологии, которые используются для записи такого поведения, также могут использоваться для его прогнозирования. Один из этих инструментов мониторинга, SMT2є, собирает пятнадцать функций курсора и использует остальные четырнадцать для прогнозирования результата последней функции.[1] Это программное обеспечение также генерирует анализ журнала, который суммирует действия курсора пользователя.[1]

В сеансе поиска пользователей можно идентифицировать с помощью печенье, идентификатор протокол или их айпи адрес. Затем эту информацию можно сохранить в база данных, и каждый раз, когда пользователь снова посещает веб-страницу, его поведение при нажатии будет добавлено в базу данных. DoubleClick Inc. является примером компании, которая имеет такую ​​базу данных и сотрудничает с другими компаниями, чтобы помочь в их веб-майнинге.[2] Файлы cookie добавляются в HTTP (Протокол передачи гипертекста), и когда пользователь щелкает ссылку, он подключается к соответствующему веб-серверу.[3] Это действие пользователя, нажимающего на ссылку, рассматривается как запрос, и сервер «отвечает», отправляя информацию пользователя, и эта информация представляет собой файл cookie.[3] Файлы cookie служат «закладкой» для сеансов пользователей на веб-сайте и хранят информацию для входа в систему и страницы, которые пользователи посещают на веб-сайте.[3] Это помогает сохранить состояние сеанса. Если таких серверов более одного, информация должна быть согласованной для всех серверов; следовательно, информация передается. Данные, собранные с помощью файлов cookie, могут использоваться для улучшения веб-сайтов для всех пользователей, а также для профилирования пользователей для рекламы.[3]

Когда для понимания данных веб-журнала применяются методы интеллектуального анализа данных и статистические процедуры, процесс обозначается как анализ журнала или же майнинг веб-использования. Это помогает определять закономерности в поведении пользователей при навигации.[2] Некоторые особенности, которые можно наблюдать, включают продолжительность просмотра страниц пользователями, длину пути клика и количество кликов.[2] Анализ использования веб-ресурсов состоит из трех этапов. Во-первых, данные журнала «предварительно обрабатываются» для просмотра содержимого пользователей и поисковых сеансов. Затем для поиска шаблонов применяются такие инструменты, как ассоциация и кластеризация, и, наконец, эти шаблоны сохраняются для дальнейшего анализа.[2] Инструмент интеллектуальный анализ ассоциативных правил помогает находить «закономерности, ассоциации и корреляции» среди страниц, которые пользователи посещают в ходе сеанса поиска. Последовательное обнаружение шаблонов - это анализ ассоциативных правил, но он также учитывает время, такое как просмотры страниц за выделенный период времени.[2] Классификация это инструмент, который позволяет добавлять страницы в группы, представляющие определенные схожие качества.[2]

Некоторые примеры инструментов, которые люди могут использовать при проведении аналитики кликов: Гугл Аналитика инструмент In-Page Analytics, ClickHeat и Crazy Egg.[14] Эти инструменты создают визуализацию из данных о кликах пользователя на веб-странице.[14] ClickHeat и Crazy Egg демонстрируют плотность пользовательских кликов с использованием определенных цветов, и все эти инструменты позволяют разделить посетителей веб-страницы на группы по таким качествам, как использование мобильного устройства или использование определенного браузера. Данные конкретных групп могут быть проанализированы для дальнейшего понимания.[14]

Поведение при нажатии

Один из основных факторов, которые пользователи учитывают при переходе по ссылкам, - это положение ссылки в списке результатов. Чем ближе ссылки к началу, тем больше вероятность того, что пользователи выберут их.[15] Когда пользователи имеют личную связь с темой, они склонны чаще нажимать на эту статью. Изображения, положение и конкретные лица в новостном контенте также в большей степени влияли на решения пользователей. Источник новостей был признан менее важным.[15]

Отношение к щелчку и намерение щелкнуть играют большую роль в поведении пользователя при щелчке.[8] В одном исследовании, когда участникам были представлены положительные и отрицательные фотографии с рекламой страховки, было замечено, что эмоции имеют положительную связь с намерением щелкнуть и отношением к щелчку. Исследователи также заметили, что отношение к клику влияет на намерение клика, и положительные эмоции оказывают большее влияние на отношение к клику, чем отрицательные.[8]

Интернет можно рассматривать как опасную среду из-за большого количества возможных атак кибербезопасности и распространения вредоносного ПО. Следовательно, всякий раз, когда люди пользуются Интернетом, они должны решить, переходить ли по различным ссылкам или нет.[4] Исследование 2018 года показало, что пользователи, как правило, нажимают больше URL-адресов на знакомых им веб-сайтах; эта черта пользователя затем используется киберпреступники, и личная информация может быть скомпрометирована. Следовательно, считается, что доверие также увеличивает намерение перейти по ссылке.[4] Когда дано Гугл Хром предупреждения, в 70% случаев люди переходят по ссылкам. Они также стремятся изменить настройки компьютера по умолчанию в этом процессе.[4] Было также установлено, что пользователи лучше распознают риски, связанные с вредоносным ПО, когда существует больший потенциал раскрытия их личной информации.[4]

Актуальность результатов поиска

Страницы, просматриваемые пользователями во время определенного сеанса поиска, представляют собой данные о кликах.[9] Такие данные можно использовать для улучшения результатов поиска двумя способами: явной и неявной обратной связью. Явная обратная связь - это когда пользователи указывают, какие страницы имеют отношение к их поисковому запросу, а неявная обратная связь - это когда поведение пользователя интерпретируется для определения релевантности результатов. Некоторые действия пользователя на веб-странице, которые могут использоваться как часть процесса интерпретации, включают: закладки, сохранение или печать определенной веб-страницы.[9] Благодаря сбору данных о кликах от нескольких человек можно повысить релевантность результатов для всех пользователей по заданным запросам. В сеансе поиска пользователь указывает, какие документы ему больше всего интересны, с помощью щелчков мышью, и это указывает на то, что имеет отношение к поиску. Наиболее релевантными данными о кликах для определения релевантности результатов часто является последняя просмотренная веб-страница, а не все страницы, на которые нажимали во время сеанса поиска. Данные о кликах вне поисковых сеансов также могут использоваться для повышения точности релевантных результатов для пользователей.[9]

Результаты поиска по заданному запросу обычно подвержены позиционному смещению.[16] Это потому, что пользователи склонны выбирать ссылки, которые находятся в верхней части списков результатов. Однако такая позиция не означает, что результат является наиболее актуальным, поскольку актуальность может меняться со временем. Как часть подхода машинного обучения к улучшению порядка результатов, редакторы-люди начинают с предоставления алгоритму исходного ранга для каждого результата. Затем обратная связь с пользователем в реальном времени в виде отслеживаемых показателей кликабельности (CTR) в поисковых сеансах может использоваться для повторного ранжирования результатов на основе данных.[9] Это улучшает порядок результатов в зависимости от актуальности, указанной пользователями.[16]

Информация о времени задержки и последовательности нажатий также может использоваться для повышения релевантности результатов поиска.[17] Время ожидания клика - это время, которое требуется пользователю, чтобы вернуться в страница результатов поисковой системы (SERP) после нажатия на конкретный результат, и это может указывать на то, насколько пользователь доволен конкретным результатом.[17] Исследование слежения за глазами показывает, что при просмотре результатов поиска пользователи проявляют множество непоследовательных действий при просмотре.[17] Модели кликов, которые придерживаются «нисходящего» поведения пользователя при нажатии, не могут интерпретировать пользовательский процесс повторного посещения страниц.[17]

Расширения

Реклама

Требование поставки Стоимость несоответствия может быть уменьшена за счет отслеживания кликов.[18] Хуанг и другие. определяет стратегических клиентов как «дальновидных» людей, которые знают, что их клики отслеживаются, и ожидают, что компании будут заниматься соответствующей бизнес-деятельностью. В проведенном исследовании исследователи использовали данные о потоках кликов от клиентов, чтобы оценить их предпочтения и желаемое количество товаров. Шумные щелчки - это когда клиенты нажимают, но на самом деле не покупают продукт. Это приводит к несовершенной информации о расширенном спросе или ADI.[18]

Отслеживание кликов можно использовать в сфере рекламы, но существует вероятность негативного использования этого инструмента. Издатели отображают рекламу на своих веб-сайтах, и они получают деньги в зависимости от объема трафика, который измеряется как количество кликов, которые они отправляют на веб-сайт рекламодателя.[7] Мошенничество с кликами это когда издатели подделывают клики для получения дохода. На конференции 2012 года «Обнаружение мошенничества в мобильной рекламе» (FDMA) командам разработчиков была поставлена ​​задача использовать методы интеллектуального анализа данных и машинного обучения для определения «мошенников-издателей» на основе заданного набора данных.[7] Успешный алгоритм может наблюдать и использовать шаблоны трафика кликов утром и вечером. Когда между этими основными шаблонами существует плотность кликов, это часто свидетельствует о мошенничестве издателя.[7]

Контент веб-сайта можно настроить, чтобы сделать его специфичным для пользователей, используя «поведение пользователя при навигации» и интересы пользователей в процессе, называемом веб-персонализацией.[2] Веб-персонализация полезна в сфере электронная коммерция. В процессе веб-персонализации есть уникальные шаги, и первый шаг отмечен как «профилирование пользователей.”[2] На этом этапе пользователь понимается и определяется его поведением, предпочтениями и качествами. После профилирования пользователей следует «анализ журналов и анализ использования Интернета».[2]

Электронное письмо

Фишинг обычно администрируется через электронную почту, и когда пользователь нажимает на сообщение электронной почты с попыткой фишинга, его информация попадает на определенные веб-сайты.[19] Целевой фишинг - это более «нацеленная» форма фишинга, при которой пользовательская информация используется для персонализации электронных писем и побуждения пользователей нажимать на них.[19] Некоторые фишинговые письма также будут содержать другие ссылки и вложения. После того, как они будут нажаты или загружены, конфиденциальность пользователей может быть нарушена. Линь и другие. провели исследование, чтобы выяснить, какие психологические «орудия влияния» и «сферы жизни» больше всего влияют на пользователей при попытках фишинга, и обнаружили, что дефицит был самым влиятельным фактором влияния, а правовая сфера - наиболее влиятельной сферой жизни.[19] Возраст также является важным фактором при определении тех, кто более уязвим для попыток фишинга.[19]

Когда вирус заражает компьютер, находит адреса электронной почты и рассылает по ним свои копии. Эти электронные письма обычно содержат вложения и отправляются нескольким лицам.[20] Это отличается от поведения учетной записи электронной почты пользователя, поскольку пользователи, как правило, имеют определенную сеть, с которой они регулярно общаются.[20] Исследователи изучили, как можно использовать Email Mining Toolkit (EMT) для обнаружения вирусов, изучив такое поведение учетной записи электронной почты пользователя, и обнаружили, что было легче расшифровать быстрое широкое распространение вирусов по сравнению с медленными, постепенными вирусными распространениями.[20]

Чтобы узнать, какие электронные письма открыли пользователи, отправители электронной почты отслеживают электронную почту.[21] Просто открыв электронное письмо, адреса электронной почты пользователей могут быть переданы третьим лицам, а если пользователи нажимают ссылки в сообщениях электронной почты, их адрес электронной почты может быть передан большему количеству третьих лиц.[21] Кроме того, каждый раз, когда пользователь открывает отправленное ему электронное письмо, его информация может быть отправлена ​​новому третьему лицу из числа тех, чей адрес уже просочился. Многие сторонние почтовые трекеры также участвуют в веб-отслеживании, что ведет к дальнейшему профилированию пользователей.[21]

Конфиденциальность

Модели защиты конфиденциальности анонимизировать данные после того, как они отправлены на сервер и сохранены в базе данных.[6] Следовательно, личная идентификационная информация пользователя по-прежнему собирается, и этот процесс сбора основан на том, что пользователи доверяют таким серверам. Исследователи изучают, что дает пользователям возможность контролировать, какая информация отправляется с их мобильных устройств. Они также наблюдают за предоставлением пользователям контроля над тем, как эта информация представлена ​​в базах данных в области данных о траектории, и создают систему, которая допускает такой подход. Такой подход дает пользователям возможность повысить свою конфиденциальность.[6]

Когда нарушается конфиденциальность пользователей, часто распространяются формы согласия. Тип активности пользователя, требуемый в этих формах, может повлиять на объем информации, которую пользователь сохраняет из формы.[5] Карегар и другие. сравнивает простой формат «согласен / не согласен» с формами, в которых есть флажки, функции перетаскивания (DAD) и смахивания. При тестировании того, какую информацию пользователи согласились бы раскрыть в каждом из форматов формы согласия, исследователи отметили, что пользователи, которым были представлены формы DAD, имели большее количество глазков и на данной форме согласия.[5]

Когда третья сторона связан со сторонним веб-сайтом или мобильным приложением, каждый раз, когда пользователь посещает основной веб-сайт или мобильное приложение, его информация будет отправлена ​​третьей стороне.[22] Стороннее отслеживание вызывает больше проблем с конфиденциальностью, чем собственное отслеживание, поскольку оно позволяет объединить многие записи веб-сайтов или приложений о конкретном пользователе, что дает более качественные профили пользователей.[22] Бинны и другие. обнаружили, что из 5000 популярных веб-сайтов только на двух самых популярных веб-сайтах было 2000 трекеров. Из 2000 встроенных трекеров 253 использовались на 25 других веб-сайтах.[22] Исследователи оценивали охват сторонних трекеров на основе их контактов с пользователями, а не с веб-сайтами, поэтому более «популярными» трекерами были те, кто получал информацию о наибольшем количестве людей, а не код, встроенный в большинство первых сторон.[22] Google и Facebook считались первым и вторым по величине веб-трекерами, а Google и Twitter считались первым и вторым по величине мобильными трекерами.[22]

Смотрите также

Рекомендации

  1. ^ а б c d е ж грамм Лейва, Луис (ноябрь 2013 г.). «Анализ поведения при просмотре веб-страниц и интерактивное гипервидео». ACM-транзакции в Интернете. 7 (4): 1–28. Дои:10.1145/2529995.2529996. HDL:10251/39081. S2CID  14720910.
  2. ^ а б c d е ж грамм час я j k л Эйринаки, Магдалини (2003). «Веб-майнинг для веб-персонализации». ACM-транзакции по интернет-технологиям. 3: 1–27. Дои:10.1145/643477.643478. S2CID  2880491.
  3. ^ а б c d е Кристол, Дэвид (2001). «Файлы cookie HTTP: стандарты, конфиденциальность и политика». ACM-транзакции по интернет-технологиям. 1: 151–198. arXiv:cs / 0105018. Дои:10.1145/502152.502153. S2CID  1848140.
  4. ^ а б c d е Огбануфе, Оби (2018). ""Насколько это в любом случае рискованно? «Роль восприятия риска и доверия в намерении перейти по ссылке». Управление информационными системами. 35 (3): 182–200. Дои:10.1080/10580530.2018.1477292. S2CID  49411483.
  5. ^ а б c Карегар, Фарзане (2020). «Дилемма участия пользователей в уведомлениях о конфиденциальности». Транзакции ACM о конфиденциальности и безопасности. 23: 1–38. Дои:10.1145/3372296. S2CID  211263964.
  6. ^ а б c Ромеро-Трис, Кристина (2018). «Защита конфиденциальности в траекториях с ориентированным на пользователя подходом». Транзакции ACM при обнаружении знаний из данных. 12 (6): 1–27. Дои:10.1145/3233185. S2CID  52182075.
  7. ^ а б c d Oentaryo, Ричард (2014). «Обнаружение мошенничества с кликами в онлайн-рекламе: подход к интеллектуальному анализу данных». Журнал исследований в области машинного обучения. 15: 99–140 - через ACM.
  8. ^ а б c У, Цзяньсин (2018). «Индукция эмоций в намерении щелчка изображения рекламы: полевой экзамен». Журнал интернет-коммерции. 17 (4): 356–382. Дои:10.1080/15332861.2018.1463803. S2CID  158798317.
  9. ^ а б c d е ж Юнг, Сейкён (2007). «Данные о кликах как неявная обратная связь по релевантности в веб-поиске». Обработка информации и управление. 43 (3): 791–807. Дои:10.1016 / j.ipm.2006.07.021.
  10. ^ а б c Нгуен, Дэвид (2009). «Конфиденциальность информации в технологиях отслеживания и записи институциональных и конечных пользователей». Персональные и повсеместные вычисления. 14: 53–72. Дои:10.1007 / s00779-009-0229-4. S2CID  8546306.
  11. ^ а б c d Менгес, Рафаэль (2019). «Улучшение пользовательского опыта взаимодействия на основе отслеживания взгляда». Транзакции ACM о взаимодействии компьютера и человека. 26 (6): 1–46. Дои:10.1145/3338844. S2CID  207834246.
  12. ^ а б c Бой, Паоло (2016). «Реконструкция внимания пользователей в Интернете с помощью движений мыши и идентификации контента на основе восприятия». Транзакции ACM о прикладном восприятии. 13 (3): 1–21. Дои:10.1145/2912124. S2CID  15346882.
  13. ^ а б c Лапердрикс, Пьер (2020). «Отпечатки браузера: обзор» (PDF). ACM-транзакции в Интернете. 14: 1–33. Дои:10.1145/3386040. S2CID  145051810.
  14. ^ а б c Фарни, Табата (2011). «Click Analytics: визуализация данных об использовании веб-сайта». Информационные технологии и библиотеки. 30 (3): 141–148. Дои:10.6017 / ital.v30i3.1771.
  15. ^ а б Кесслер, Сабрина Хайке (2019). «Почему мы нажимаем? Изучение причин выбора пользователя на сайте агрегатора новостей». Европейский журнал коммуникационных исследований. 44: 225–247.
  16. ^ а б Луна, Taesup (2012). «Структура онлайн-обучения для уточнения результатов поиска с момента последнего посещения с помощью отзывов пользователей». ACM-транзакции в информационных системах. 30 (4): 1–28. Дои:10.1145/2382438.2382439. S2CID  15825473.
  17. ^ а б c d Лю, Ицюнь (2016). «Модель кликов с учетом времени». ACM-транзакции в информационных системах. 35 (3): 1–24. Дои:10.1145/2988230. S2CID  207243041.
  18. ^ а б Хуанг, Тинлян (2011). «Обещание стратегического поведения клиентов: о ценности отслеживания кликов». Управление производством и операциями. 22 (3): 489–502. Дои:10.1111 / j.1937-5956.2012.01386.x.
  19. ^ а б c d Линь, Тиан (2019). «Восприимчивость к электронным письмам с адресным фишингом: влияние демографических данных пользователей Интернета и содержания электронной почты». Транзакции ACM о взаимодействии компьютера и человека. 26 (5): 1–28. Дои:10.1145/3336141. ЧВК  7274040. PMID  32508486.
  20. ^ а б c Стольфо, Сальваторе (2006). «Моделирование поведения и его применение в анализе электронной почты». ACM-транзакции по интернет-технологиям. 6 (2): 187–221. Дои:10.1145/1149121.1149125. S2CID  13438014.
  21. ^ а б c Энглехардт, Стивен (2018). «Я никогда не подписывался на это! Последствия для конфиденциальности отслеживания электронной почты». Труды по технологиям повышения конфиденциальности. 1: 109–126. Дои:10.1515 / попец-2018-0006. S2CID  41532115.
  22. ^ а б c d е Биннс, Рубен (2018). «Измерение мощности сторонних трекеров в Интернете и на мобильных устройствах». ACM-транзакции по интернет-технологиям. 18 (4): 1–22. Дои:10.1145/3176246. S2CID  3603118.