Отслеживание кликов - Click tracking
Отслеживание кликов это когда поведение пользователя при нажатии или поведение пользователя при навигации собирается для получения информации.[1][2] Поведение кликов обычно отслеживается с помощью журналов сервера, которые включают щелкните пути и щелкнул URL-адреса (Единый указатель ресурсов).[2][3] Этот журнал часто представлен в стандартном формате, включая такую информацию, как имя хоста, дата и имя пользователя.[2] Однако по мере развития технологий новое программное обеспечение позволяет проводить глубокий анализ поведения пользователей при кликах, используя гипервидео инструменты.[1] Учитывая, что Интернет можно рассматривать как опасную среду, исследование стремится понять, почему пользователи переходят по одним ссылкам, а не по другим.[4] Также были проведены исследования для изучения Пользовательский опыт конфиденциальности, сделав пользователя личная идентификационная информация индивидуальная анонимность и улучшение написания и структурирования форм согласия на сбор данных.[5][6]
Отслеживание кликов актуально в нескольких отраслях, включая Взаимодействие человека с компьютером (HCI), программная инженерия, и Реклама.[1][7] Отслеживание электронной почты, отслеживание ссылок, веб-аналитика, и исследование пользователей также связаны концепции и приложения отслеживания кликов.[8] Обычно данные о кликах из отслеживания кликов используются для улучшения позиций результатов в поисковых системах, чтобы сделать их заказ более релевантным потребностям пользователей.[9] В отслеживании кликов используются многие современные методы, такие как машинное обучение и сбор данных.[9]
Технология отслеживания и записи
Технологии отслеживания и записи (TRT) можно разделить на две категории: TRT для учреждений и TRT для конечных пользователей.[10] Институциональные TRT и TRT конечных пользователей различаются по тому, кто собирает и хранит данные, и это можно соответственно понимать как учреждения и пользователей. Примеры TRT включают: определение радиочастоты (RFID), кредитные карты и магазинные видеокамеры. Исследования показывают, что люди озабочены конфиденциальностью, но их меньше беспокоит то, как TRT используются ежедневно.[10] Это несоответствие объясняется тем, что общественность не понимает, как собирается информация о них.[10]
Другой способ получения пользовательского ввода - отслеживание глаз или отслеживание взгляда. Технология отслеживания взгляда особенно полезна для людей с двигательными нарушениями.[11] Системы, использующие отслеживание взгляда, часто пытаются имитировать поведение курсора и клавиатуры.[11] В этом процессе система отслеживания взгляда разделяется на отдельную панель в системном интерфейсе, и пользовательский опыт этой системы ставится под угрозу, поскольку люди должны переключаться между панелью и другими функциями интерфейса. Опыт также сложен, потому что пользователи должны сначала представить, как выполнить задачу, используя функции клавиатуры и курсора, а затем использовать взгляд. Это заставляет задачи занять дополнительное время.[11] Поэтому исследователи создали собственный веб-браузер под названием GazeTheWeb (GTW), и основное внимание в их исследованиях уделялось пользовательскому опыту. Они улучшили интерфейс, чтобы лучше воспринимать взгляд.[11]
Отслеживание движения глаз также применяется в юзабилити-тестирование при создании веб-приложений.[12] Однако для отслеживания движений глаз пользователя часто требуется лаборатория с соответствующим оборудованием. Активность мыши и клавиатуры можно измерить удаленно, так что это качество можно использовать для тестирования удобства использования.[12] Алгоритмы могут использовать движения мыши для прогнозирования и отслеживания движений глаз пользователя. Такое отслеживание в удаленной среде обозначается как метод удаленной регистрации.[12]
Дактилоскопия браузера это еще один способ идентификации пользователей и их отслеживания.[13] В этом процессе информация о пользователе собирается из его веб-браузера для создания отпечаток браузера. Отпечаток браузера содержит информацию об устройстве, его операционной системе, браузере и его конфигурации. Заголовки HTTP, JavaScript и плагины браузера можно использовать для создания отпечатка пальца.[13] Отпечатки браузера могут изменяться со временем из-за автоматических обновлений программного обеспечения или настроек браузера пользователя. Меры по повышению конфиденциальности в этой области могут снизить функциональность из-за блокировки функций.[13]
Методы отслеживания кликов
Поведение пользователей при просмотре часто отслеживается с помощью журналов доступа к серверу, которые содержат шаблоны URL-адресов, запросов и путей, по которым были щелкнуты ссылки.[1] Однако более современное программное обеспечение для отслеживания использует JavaScript для отслеживания поведения курсора. Собранные данные мыши можно использовать для создания видео, позволяя воспроизводить и легко анализировать поведение пользователя. Гипермедиа используется для создания таких визуализаций, которые позволяют отслеживать такие действия, как выделение, колебание и выбор.[1] Технологии, которые используются для записи такого поведения, также могут использоваться для его прогнозирования. Один из этих инструментов мониторинга, SMT2є, собирает пятнадцать функций курсора и использует остальные четырнадцать для прогнозирования результата последней функции.[1] Это программное обеспечение также генерирует анализ журнала, который суммирует действия курсора пользователя.[1]
В сеансе поиска пользователей можно идентифицировать с помощью печенье, идентификатор протокол или их айпи адрес. Затем эту информацию можно сохранить в база данных, и каждый раз, когда пользователь снова посещает веб-страницу, его поведение при нажатии будет добавлено в базу данных. DoubleClick Inc. является примером компании, которая имеет такую базу данных и сотрудничает с другими компаниями, чтобы помочь в их веб-майнинге.[2] Файлы cookie добавляются в HTTP (Протокол передачи гипертекста), и когда пользователь щелкает ссылку, он подключается к соответствующему веб-серверу.[3] Это действие пользователя, нажимающего на ссылку, рассматривается как запрос, и сервер «отвечает», отправляя информацию пользователя, и эта информация представляет собой файл cookie.[3] Файлы cookie служат «закладкой» для сеансов пользователей на веб-сайте и хранят информацию для входа в систему и страницы, которые пользователи посещают на веб-сайте.[3] Это помогает сохранить состояние сеанса. Если таких серверов более одного, информация должна быть согласованной для всех серверов; следовательно, информация передается. Данные, собранные с помощью файлов cookie, могут использоваться для улучшения веб-сайтов для всех пользователей, а также для профилирования пользователей для рекламы.[3]
Когда для понимания данных веб-журнала применяются методы интеллектуального анализа данных и статистические процедуры, процесс обозначается как анализ журнала или же майнинг веб-использования. Это помогает определять закономерности в поведении пользователей при навигации.[2] Некоторые особенности, которые можно наблюдать, включают продолжительность просмотра страниц пользователями, длину пути клика и количество кликов.[2] Анализ использования веб-ресурсов состоит из трех этапов. Во-первых, данные журнала «предварительно обрабатываются» для просмотра содержимого пользователей и поисковых сеансов. Затем для поиска шаблонов применяются такие инструменты, как ассоциация и кластеризация, и, наконец, эти шаблоны сохраняются для дальнейшего анализа.[2] Инструмент интеллектуальный анализ ассоциативных правил помогает находить «закономерности, ассоциации и корреляции» среди страниц, которые пользователи посещают в ходе сеанса поиска. Последовательное обнаружение шаблонов - это анализ ассоциативных правил, но он также учитывает время, такое как просмотры страниц за выделенный период времени.[2] Классификация это инструмент, который позволяет добавлять страницы в группы, представляющие определенные схожие качества.[2]
Некоторые примеры инструментов, которые люди могут использовать при проведении аналитики кликов: Гугл Аналитика инструмент In-Page Analytics, ClickHeat и Crazy Egg.[14] Эти инструменты создают визуализацию из данных о кликах пользователя на веб-странице.[14] ClickHeat и Crazy Egg демонстрируют плотность пользовательских кликов с использованием определенных цветов, и все эти инструменты позволяют разделить посетителей веб-страницы на группы по таким качествам, как использование мобильного устройства или использование определенного браузера. Данные конкретных групп могут быть проанализированы для дальнейшего понимания.[14]
Поведение при нажатии
Один из основных факторов, которые пользователи учитывают при переходе по ссылкам, - это положение ссылки в списке результатов. Чем ближе ссылки к началу, тем больше вероятность того, что пользователи выберут их.[15] Когда пользователи имеют личную связь с темой, они склонны чаще нажимать на эту статью. Изображения, положение и конкретные лица в новостном контенте также в большей степени влияли на решения пользователей. Источник новостей был признан менее важным.[15]
Отношение к щелчку и намерение щелкнуть играют большую роль в поведении пользователя при щелчке.[8] В одном исследовании, когда участникам были представлены положительные и отрицательные фотографии с рекламой страховки, было замечено, что эмоции имеют положительную связь с намерением щелкнуть и отношением к щелчку. Исследователи также заметили, что отношение к клику влияет на намерение клика, и положительные эмоции оказывают большее влияние на отношение к клику, чем отрицательные.[8]
Интернет можно рассматривать как опасную среду из-за большого количества возможных атак кибербезопасности и распространения вредоносного ПО. Следовательно, всякий раз, когда люди пользуются Интернетом, они должны решить, переходить ли по различным ссылкам или нет.[4] Исследование 2018 года показало, что пользователи, как правило, нажимают больше URL-адресов на знакомых им веб-сайтах; эта черта пользователя затем используется киберпреступники, и личная информация может быть скомпрометирована. Следовательно, считается, что доверие также увеличивает намерение перейти по ссылке.[4] Когда дано Гугл Хром предупреждения, в 70% случаев люди переходят по ссылкам. Они также стремятся изменить настройки компьютера по умолчанию в этом процессе.[4] Было также установлено, что пользователи лучше распознают риски, связанные с вредоносным ПО, когда существует больший потенциал раскрытия их личной информации.[4]
Актуальность результатов поиска
Страницы, просматриваемые пользователями во время определенного сеанса поиска, представляют собой данные о кликах.[9] Такие данные можно использовать для улучшения результатов поиска двумя способами: явной и неявной обратной связью. Явная обратная связь - это когда пользователи указывают, какие страницы имеют отношение к их поисковому запросу, а неявная обратная связь - это когда поведение пользователя интерпретируется для определения релевантности результатов. Некоторые действия пользователя на веб-странице, которые могут использоваться как часть процесса интерпретации, включают: закладки, сохранение или печать определенной веб-страницы.[9] Благодаря сбору данных о кликах от нескольких человек можно повысить релевантность результатов для всех пользователей по заданным запросам. В сеансе поиска пользователь указывает, какие документы ему больше всего интересны, с помощью щелчков мышью, и это указывает на то, что имеет отношение к поиску. Наиболее релевантными данными о кликах для определения релевантности результатов часто является последняя просмотренная веб-страница, а не все страницы, на которые нажимали во время сеанса поиска. Данные о кликах вне поисковых сеансов также могут использоваться для повышения точности релевантных результатов для пользователей.[9]
Результаты поиска по заданному запросу обычно подвержены позиционному смещению.[16] Это потому, что пользователи склонны выбирать ссылки, которые находятся в верхней части списков результатов. Однако такая позиция не означает, что результат является наиболее актуальным, поскольку актуальность может меняться со временем. Как часть подхода машинного обучения к улучшению порядка результатов, редакторы-люди начинают с предоставления алгоритму исходного ранга для каждого результата. Затем обратная связь с пользователем в реальном времени в виде отслеживаемых показателей кликабельности (CTR) в поисковых сеансах может использоваться для повторного ранжирования результатов на основе данных.[9] Это улучшает порядок результатов в зависимости от актуальности, указанной пользователями.[16]
Информация о времени задержки и последовательности нажатий также может использоваться для повышения релевантности результатов поиска.[17] Время ожидания клика - это время, которое требуется пользователю, чтобы вернуться в страница результатов поисковой системы (SERP) после нажатия на конкретный результат, и это может указывать на то, насколько пользователь доволен конкретным результатом.[17] Исследование слежения за глазами показывает, что при просмотре результатов поиска пользователи проявляют множество непоследовательных действий при просмотре.[17] Модели кликов, которые придерживаются «нисходящего» поведения пользователя при нажатии, не могут интерпретировать пользовательский процесс повторного посещения страниц.[17]
Расширения
Реклама
Требование поставки Стоимость несоответствия может быть уменьшена за счет отслеживания кликов.[18] Хуанг и другие. определяет стратегических клиентов как «дальновидных» людей, которые знают, что их клики отслеживаются, и ожидают, что компании будут заниматься соответствующей бизнес-деятельностью. В проведенном исследовании исследователи использовали данные о потоках кликов от клиентов, чтобы оценить их предпочтения и желаемое количество товаров. Шумные щелчки - это когда клиенты нажимают, но на самом деле не покупают продукт. Это приводит к несовершенной информации о расширенном спросе или ADI.[18]
Отслеживание кликов можно использовать в сфере рекламы, но существует вероятность негативного использования этого инструмента. Издатели отображают рекламу на своих веб-сайтах, и они получают деньги в зависимости от объема трафика, который измеряется как количество кликов, которые они отправляют на веб-сайт рекламодателя.[7] Мошенничество с кликами это когда издатели подделывают клики для получения дохода. На конференции 2012 года «Обнаружение мошенничества в мобильной рекламе» (FDMA) командам разработчиков была поставлена задача использовать методы интеллектуального анализа данных и машинного обучения для определения «мошенников-издателей» на основе заданного набора данных.[7] Успешный алгоритм может наблюдать и использовать шаблоны трафика кликов утром и вечером. Когда между этими основными шаблонами существует плотность кликов, это часто свидетельствует о мошенничестве издателя.[7]
Контент веб-сайта можно настроить, чтобы сделать его специфичным для пользователей, используя «поведение пользователя при навигации» и интересы пользователей в процессе, называемом веб-персонализацией.[2] Веб-персонализация полезна в сфере электронная коммерция. В процессе веб-персонализации есть уникальные шаги, и первый шаг отмечен как «профилирование пользователей.”[2] На этом этапе пользователь понимается и определяется его поведением, предпочтениями и качествами. После профилирования пользователей следует «анализ журналов и анализ использования Интернета».[2]
Электронное письмо
Фишинг обычно администрируется через электронную почту, и когда пользователь нажимает на сообщение электронной почты с попыткой фишинга, его информация попадает на определенные веб-сайты.[19] Целевой фишинг - это более «нацеленная» форма фишинга, при которой пользовательская информация используется для персонализации электронных писем и побуждения пользователей нажимать на них.[19] Некоторые фишинговые письма также будут содержать другие ссылки и вложения. После того, как они будут нажаты или загружены, конфиденциальность пользователей может быть нарушена. Линь и другие. провели исследование, чтобы выяснить, какие психологические «орудия влияния» и «сферы жизни» больше всего влияют на пользователей при попытках фишинга, и обнаружили, что дефицит был самым влиятельным фактором влияния, а правовая сфера - наиболее влиятельной сферой жизни.[19] Возраст также является важным фактором при определении тех, кто более уязвим для попыток фишинга.[19]
Когда вирус заражает компьютер, находит адреса электронной почты и рассылает по ним свои копии. Эти электронные письма обычно содержат вложения и отправляются нескольким лицам.[20] Это отличается от поведения учетной записи электронной почты пользователя, поскольку пользователи, как правило, имеют определенную сеть, с которой они регулярно общаются.[20] Исследователи изучили, как можно использовать Email Mining Toolkit (EMT) для обнаружения вирусов, изучив такое поведение учетной записи электронной почты пользователя, и обнаружили, что было легче расшифровать быстрое широкое распространение вирусов по сравнению с медленными, постепенными вирусными распространениями.[20]
Чтобы узнать, какие электронные письма открыли пользователи, отправители электронной почты отслеживают электронную почту.[21] Просто открыв электронное письмо, адреса электронной почты пользователей могут быть переданы третьим лицам, а если пользователи нажимают ссылки в сообщениях электронной почты, их адрес электронной почты может быть передан большему количеству третьих лиц.[21] Кроме того, каждый раз, когда пользователь открывает отправленное ему электронное письмо, его информация может быть отправлена новому третьему лицу из числа тех, чей адрес уже просочился. Многие сторонние почтовые трекеры также участвуют в веб-отслеживании, что ведет к дальнейшему профилированию пользователей.[21]
Конфиденциальность
Модели защиты конфиденциальности анонимизировать данные после того, как они отправлены на сервер и сохранены в базе данных.[6] Следовательно, личная идентификационная информация пользователя по-прежнему собирается, и этот процесс сбора основан на том, что пользователи доверяют таким серверам. Исследователи изучают, что дает пользователям возможность контролировать, какая информация отправляется с их мобильных устройств. Они также наблюдают за предоставлением пользователям контроля над тем, как эта информация представлена в базах данных в области данных о траектории, и создают систему, которая допускает такой подход. Такой подход дает пользователям возможность повысить свою конфиденциальность.[6]
Когда нарушается конфиденциальность пользователей, часто распространяются формы согласия. Тип активности пользователя, требуемый в этих формах, может повлиять на объем информации, которую пользователь сохраняет из формы.[5] Карегар и другие. сравнивает простой формат «согласен / не согласен» с формами, в которых есть флажки, функции перетаскивания (DAD) и смахивания. При тестировании того, какую информацию пользователи согласились бы раскрыть в каждом из форматов формы согласия, исследователи отметили, что пользователи, которым были представлены формы DAD, имели большее количество глазков и на данной форме согласия.[5]
Когда третья сторона связан со сторонним веб-сайтом или мобильным приложением, каждый раз, когда пользователь посещает основной веб-сайт или мобильное приложение, его информация будет отправлена третьей стороне.[22] Стороннее отслеживание вызывает больше проблем с конфиденциальностью, чем собственное отслеживание, поскольку оно позволяет объединить многие записи веб-сайтов или приложений о конкретном пользователе, что дает более качественные профили пользователей.[22] Бинны и другие. обнаружили, что из 5000 популярных веб-сайтов только на двух самых популярных веб-сайтах было 2000 трекеров. Из 2000 встроенных трекеров 253 использовались на 25 других веб-сайтах.[22] Исследователи оценивали охват сторонних трекеров на основе их контактов с пользователями, а не с веб-сайтами, поэтому более «популярными» трекерами были те, кто получал информацию о наибольшем количестве людей, а не код, встроенный в большинство первых сторон.[22] Google и Facebook считались первым и вторым по величине веб-трекерами, а Google и Twitter считались первым и вторым по величине мобильными трекерами.[22]
Смотрите также
- Щелкните путь
- Аналитика кликов
- Веб-аналитика
- Фишинг
- ПО для анализа веб-журналов
- Веб-майнинг
- Поисковая сессия
Рекомендации
- ^ а б c d е ж грамм Лейва, Луис (ноябрь 2013 г.). «Анализ поведения при просмотре веб-страниц и интерактивное гипервидео». ACM-транзакции в Интернете. 7 (4): 1–28. Дои:10.1145/2529995.2529996. HDL:10251/39081. S2CID 14720910.
- ^ а б c d е ж грамм час я j k л Эйринаки, Магдалини (2003). «Веб-майнинг для веб-персонализации». ACM-транзакции по интернет-технологиям. 3: 1–27. Дои:10.1145/643477.643478. S2CID 2880491.
- ^ а б c d е Кристол, Дэвид (2001). «Файлы cookie HTTP: стандарты, конфиденциальность и политика». ACM-транзакции по интернет-технологиям. 1: 151–198. arXiv:cs / 0105018. Дои:10.1145/502152.502153. S2CID 1848140.
- ^ а б c d е Огбануфе, Оби (2018). ""Насколько это в любом случае рискованно? «Роль восприятия риска и доверия в намерении перейти по ссылке». Управление информационными системами. 35 (3): 182–200. Дои:10.1080/10580530.2018.1477292. S2CID 49411483.
- ^ а б c Карегар, Фарзане (2020). «Дилемма участия пользователей в уведомлениях о конфиденциальности». Транзакции ACM о конфиденциальности и безопасности. 23: 1–38. Дои:10.1145/3372296. S2CID 211263964.
- ^ а б c Ромеро-Трис, Кристина (2018). «Защита конфиденциальности в траекториях с ориентированным на пользователя подходом». Транзакции ACM при обнаружении знаний из данных. 12 (6): 1–27. Дои:10.1145/3233185. S2CID 52182075.
- ^ а б c d Oentaryo, Ричард (2014). «Обнаружение мошенничества с кликами в онлайн-рекламе: подход к интеллектуальному анализу данных». Журнал исследований в области машинного обучения. 15: 99–140 - через ACM.
- ^ а б c У, Цзяньсин (2018). «Индукция эмоций в намерении щелчка изображения рекламы: полевой экзамен». Журнал интернет-коммерции. 17 (4): 356–382. Дои:10.1080/15332861.2018.1463803. S2CID 158798317.
- ^ а б c d е ж Юнг, Сейкён (2007). «Данные о кликах как неявная обратная связь по релевантности в веб-поиске». Обработка информации и управление. 43 (3): 791–807. Дои:10.1016 / j.ipm.2006.07.021.
- ^ а б c Нгуен, Дэвид (2009). «Конфиденциальность информации в технологиях отслеживания и записи институциональных и конечных пользователей». Персональные и повсеместные вычисления. 14: 53–72. Дои:10.1007 / s00779-009-0229-4. S2CID 8546306.
- ^ а б c d Менгес, Рафаэль (2019). «Улучшение пользовательского опыта взаимодействия на основе отслеживания взгляда». Транзакции ACM о взаимодействии компьютера и человека. 26 (6): 1–46. Дои:10.1145/3338844. S2CID 207834246.
- ^ а б c Бой, Паоло (2016). «Реконструкция внимания пользователей в Интернете с помощью движений мыши и идентификации контента на основе восприятия». Транзакции ACM о прикладном восприятии. 13 (3): 1–21. Дои:10.1145/2912124. S2CID 15346882.
- ^ а б c Лапердрикс, Пьер (2020). «Отпечатки браузера: обзор» (PDF). ACM-транзакции в Интернете. 14: 1–33. Дои:10.1145/3386040. S2CID 145051810.
- ^ а б c Фарни, Табата (2011). «Click Analytics: визуализация данных об использовании веб-сайта». Информационные технологии и библиотеки. 30 (3): 141–148. Дои:10.6017 / ital.v30i3.1771.
- ^ а б Кесслер, Сабрина Хайке (2019). «Почему мы нажимаем? Изучение причин выбора пользователя на сайте агрегатора новостей». Европейский журнал коммуникационных исследований. 44: 225–247.
- ^ а б Луна, Taesup (2012). «Структура онлайн-обучения для уточнения результатов поиска с момента последнего посещения с помощью отзывов пользователей». ACM-транзакции в информационных системах. 30 (4): 1–28. Дои:10.1145/2382438.2382439. S2CID 15825473.
- ^ а б c d Лю, Ицюнь (2016). «Модель кликов с учетом времени». ACM-транзакции в информационных системах. 35 (3): 1–24. Дои:10.1145/2988230. S2CID 207243041.
- ^ а б Хуанг, Тинлян (2011). «Обещание стратегического поведения клиентов: о ценности отслеживания кликов». Управление производством и операциями. 22 (3): 489–502. Дои:10.1111 / j.1937-5956.2012.01386.x.
- ^ а б c d Линь, Тиан (2019). «Восприимчивость к электронным письмам с адресным фишингом: влияние демографических данных пользователей Интернета и содержания электронной почты». Транзакции ACM о взаимодействии компьютера и человека. 26 (5): 1–28. Дои:10.1145/3336141. ЧВК 7274040. PMID 32508486.
- ^ а б c Стольфо, Сальваторе (2006). «Моделирование поведения и его применение в анализе электронной почты». ACM-транзакции по интернет-технологиям. 6 (2): 187–221. Дои:10.1145/1149121.1149125. S2CID 13438014.
- ^ а б c Энглехардт, Стивен (2018). «Я никогда не подписывался на это! Последствия для конфиденциальности отслеживания электронной почты». Труды по технологиям повышения конфиденциальности. 1: 109–126. Дои:10.1515 / попец-2018-0006. S2CID 41532115.
- ^ а б c d е Биннс, Рубен (2018). «Измерение мощности сторонних трекеров в Интернете и на мобильных устройствах». ACM-транзакции по интернет-технологиям. 18 (4): 1–22. Дои:10.1145/3176246. S2CID 3603118.