Облако тегов - Tag cloud

фундамент-л облако слов, созданное с помощью полных архивов списков, сжатых gzip (без дубликатов писем из архивов и всех заголовков и цитируемого текста в теле), с использованием IBM Word Cloud Generator build 32.[1]
Облако тегов с терминами, относящимися к Веб 2.0

А облако тегов (облако слов или же слово или же взвешенный список в визуальном дизайне) представляет собой новизну визуального представления текстовых данных, обычно используемых для изображения метаданные ключевого слова (теги) на веб-сайтах или для визуализации текста в произвольной форме. Теги обычно представляют собой отдельные слова, и важность каждого тега отображается размером шрифта или цветом.[2] Этот формат полезен для быстрого восприятия наиболее важных терминов и определения их относительной значимости. Чем больше термин, тем больше вес.[3] При использовании в качестве средства навигации по веб-сайту термины имеют гиперссылки на элементы, связанные с тегом.

История

Хайди Пэрис: первоначальный вариант обложки немецкого издания "Тысячи плато" Жиля Делёза и Феликса Гваттари от 14 ноября 1991 г.

На языке визуального дизайна облако тегов (или облако слов) - это один из видов «взвешенного списка», который обычно используется на географических картах для представления относительного размера городов с точки зрения относительного размера шрифта. Одним из первых напечатанных примеров взвешенного списка английских ключевых слов были «файлы подсознания» в Дуглас Коупленд с Микросерфы (1995). Немецкое появление произошло в 1992 году.[4]

Специфическая визуальная форма и общее использование термина «облако тегов» приобрели известность в первом десятилетии 21 века как широко распространенная особенность раннего Веб 2.0 веб-сайты и блоги, используемые в основном для визуализации частотного распределения метаданных ключевых слов, описывающих содержимое веб-сайтов, а также в качестве средства навигации.

Первые облака тегов на популярном сайте были на сайте обмена фотографиями. Flickr, созданный соучредителем Flickr и дизайнером взаимодействия Стюарт Баттерфилд в 2004 году. Эта реализация была основана на книге Джима Фланагана Search Referral Zeitgeist,[5] визуализация переходов на веб-сайты. Примерно в то же время облака тегов были популяризированы Очень вкусно и Technorati, среди прочего.

Перенасыщенность метода облака тегов и неоднозначность его полезности в качестве инструмента веб-навигации привели к заметному снижению его использования среди этих первых последователей.[6] (Позднее Flickr «извинится» перед сообществом веб-разработчиков в своей речи, состоящей из пяти слов, за «Лучшие практики» 2006 г. Премия Вебби, где они просто заявили "извините за облака тегов").[7]

Второе поколение разработки программного обеспечения обнаружило более широкое разнообразие применений облаков тегов в качестве основного метода визуализации текстовых данных. В этом контексте было предложено несколько расширений облаков тегов.

Типы

Облако данных, показывающее население каждой из стран мира. Создано в р с wordcloud упаковка. Данные из Население страны. Обратите внимание, что пропорциональные размеры Китая и Индии были разделены пополам.

Существует три основных типа приложений облака тегов в социальное программное обеспечение, отличающиеся по своему значению, а не по внешнему виду. В первом типе есть тег для частоты каждого элемента, тогда как во втором типе есть глобальные облака тегов, в которых частоты агрегируются по всем элементам и пользователям. В третьем типе облако содержит категории, размер которых указывает количество подкатегорий.

Частота

В первом типе размер представляет собой количество раз, которое тег был применен к одному элементу.[8] Это полезно как средство отображения метаданные о предмете, который был демократически «проголосовали» и там, где не нужны точные результаты.

Во втором, наиболее часто используемом типе,[нужна цитата ] размер представляет собой количество элементов, к которым был применен тег, как представление каждого тега популярность.

Значимость

Вместо частоты можно использовать размер для представления значимость слов и слов совпадение, по сравнению с фоном корпус (например, по сравнению со всем текстом в Википедии).[9] Этот подход нельзя использовать отдельно, он основан на сравнении частот документов с ожидаемыми распределениями.

Категоризация

В третьем типе теги используются как метод категоризации для элементов контента. Теги представлены в облаке, где более крупные теги представляют количество элементов контента в этой категории.

Есть несколько подходов к созданию кластеров тегов вместо облаков тегов, например, путем применения одновременных вхождений тегов в документы.[10]

В более общем смысле тот же визуальный прием можно использовать для отображения данных, не являющихся тегами,[11] как в облаке слов или данных.

Период, термин облако ключевых слов иногда используется как поисковый маркетинг (SEM) термин, который относится к группе ключевых слов, имеющих отношение к определенному веб-сайту. В последние годы облака тегов стали популярными благодаря своей роли в поисковая оптимизация веб-страниц, а также помогает пользователю эффективно перемещаться по содержимому информационной системы.[12] Облака тегов как инструмент навигации делают ресурсы веб-сайта более связанными,[13] при сканировании пауком поисковой системы, что может улучшить рейтинг поисковой системы. С точки зрения пользовательского интерфейса они часто используются для обобщения результатов поиска, чтобы помочь пользователю быстрее найти контент в конкретной информационной системе.[14]

Внешний вид

Облака тегов обычно представлены встроенными HTML элементы. Теги могут располагаться в алфавитном порядке, в случайном порядке, их можно сортировать по весу и т. Д. Иногда в дополнение к размеру шрифта манипулируют и другими визуальными свойствами, такими как цвет шрифта, интенсивность или вес.[15] Наиболее популярным является прямоугольное расположение тегов с сортировкой по алфавиту в последовательном построчном макете. Решение об оптимальном макете должно определяться ожидаемыми целями пользователя.[15] Некоторые предпочитают сгруппировать теги семантически, чтобы похожие теги появлялись рядом друг с другом.[16][17][18] или используйте встраивание такие методы, как tSNE позиционировать слова.[9] Края могут быть добавлены, чтобы подчеркнуть совместное появление тегов и визуализировать взаимодействия.[9] Эвристика может использоваться для уменьшения размера облака тегов, независимо от того, является ли цель кластеризацией тегов.[17]

Визуальная таксономия облака тегов определяется рядом атрибутов: правилом упорядочения тегов (например, в алфавитном порядке, по важности, по контексту, случайным образом, в порядке визуального качества), формой всего облака (например, прямоугольник, круг, заданные границы карты), форма границ тега (прямоугольник или тело символа), вращение тега (нет, свободно, ограничено), вертикальное выравнивание тега (придерживаясь типографских базовых линий, бесплатно). Облако тегов в Интернете должно решать проблемы моделирования и управления эстетикой, построения двумерного макета тегов, и все это должно выполняться в короткие сроки на изменчивой платформе браузера. Облака тегов для использования в Интернете должны находиться в HTML, а не графику, чтобы сделать их читаемыми для роботов, они должны быть созданы на стороне клиента с использованием шрифтов, доступных в браузере, и должны помещаться в прямоугольную рамку.[19]

Облака данных

Облако данных, показывающее движение цен акций. Цвет указывает на положительное или отрицательное изменение, размер шрифта указывает на процентное изменение.

А облако данных или же облачные данные представляет собой отображение данных, в котором для указания числовых значений используются размер шрифта и / или цвет.[20] Это похоже на облако тегов[21] но вместо количества слов отображает такие данные, как население или фондовый рынок Цены.

Текстовые облака

Сравнение текстового облака Послание о положении страны в 2002 году президентом США Бушем и Послание о положении страны в 2011 году президента Обамы.[22]
Облако текста малаялам со словами, связанными с наукой

А текстовое облако или же облако слов представляет собой визуализацию частоты слов в заданном тексте в виде взвешенного списка.[23] Техника недавно[когда? ] широко использовались для визуализации актуального содержания политических выступлений.[22][24]

Совместите облака

Расширяя принципы текстового облака, совмещать облако обеспечивает более сфокусированный вид документа или корпус. Вместо того, чтобы резюмировать весь документ, облако словосочетаний исследует использование определенного слова. Получившееся облако содержит слова, которые часто используются вместе с поисковым словом. Эти совмещает отформатированы для отображения частоты (как размер), а также силы словосочетания (как яркости). Это обеспечивает интерактивные способы просмотра и изучения языка.[25]

Восприятие

Облака тегов были предметом исследования в нескольких исследованиях удобства использования. Нижеследующее резюме основано на обзоре результатов исследования, сделанного Ломанн и др .:[15]

  • Размер тега: большие теги привлекают больше внимания пользователя, чем маленькие (на эффект влияют другие свойства, например, количество символов, положение, соседние теги).
  • Сканирование: пользователи сканируют, а не читают облака тегов.
  • Центрирование: теги в середине облака привлекают больше внимания пользователя, чем теги рядом с границами (эффект зависит от макет ).
  • Позиция: левый верхний квадрант привлекает больше внимания пользователей, чем другие (западные привычки чтения).
  • Исследование: облака тегов обеспечивают неоптимальную поддержку при поиске определенных тегов (если они не имеют очень большого размера шрифта).

Феликс и др.[26] сравнили, чем производительность чтения человеком отличается от традиционных облаков тегов, которые сопоставляют числовые значения с размером шрифта, и альтернативных дизайнов, которые используют, например, цвет или дополнительные формы, такие как круг и полосы. Они также сравнили, как различное расположение слов влияет на производительность.

  • Использование дополнительной полосы или круга вместо размера шрифта повышает точность чтения числового значения
  • Однако пользователи могут быстрее находить конкретное слово, если не используется дополнительная метка.
  • Производительность зависит от задачи, простые задачи, такие как поиск слова, сильно зависят от выбора дизайна, однако влияние на такие задачи, как определение темы облака тегов, намного меньше.

Творчество

Wordle составлен из 1000 самых важных статей Википедии, отсортированных по количеству просмотров.[27] Доступно в галерее Wordle.[28]

В принципе, размер шрифта тега в облаке тегов определяется его распространенностью. Для облака слов таких категорий, как веб-журналы, частота, например, соответствует количеству записей веб-журнала, которые назначены категории. Для меньших частот можно напрямую указать размер шрифта, от единицы до любого максимального размера шрифта. Для больших значений следует выполнить масштабирование. При линейной нормализации вес дескриптора отображается в масштабе от 1 до ж, куда и указывают диапазон доступных весов.

за ; еще
  • : display fontsize
  • : Макс. размер шрифта
  • : считать
  • : мин. считать
  • : Макс. считать

Поскольку количество проиндексированных элементов на дескриптор обычно распределяется в соответствии с сила закона,[29] для больших диапазонов значений логарифмический представление имеет смысл.[30]

Реализации облаков тегов также включают синтаксический анализ текста и фильтрацию бесполезных тегов, таких как общие слова, числа и знаки препинания.

Существуют также веб-сайты, создающие облака тегов с искусственным или случайным весом для рекламы или для юмористических результатов.

Смотрите также

Рекомендации

  1. ^ Генератор облака слов (архив)
  2. ^ Мартин Халви и Марк Т. Кин, Оценка методов представления тегов В архиве 2017-05-14 в Wayback Machine, стендовый доклад на WWW 2007, 2007
  3. ^ Гелик, Денис; Траттнер, Кристоф; Штромайер, Маркус; Эндрюс, Кит (2011). «Полезны ли облака тегов для навигации? Теоретико-сетевой анализ». Международный журнал социальных вычислений и киберфизических систем. 1 (1): 33. Дои:10.1504 / IAOCPS.2011.043603. ISSN  2040-0721.
  4. ^ Жиль Делёз, Феликс Гваттари (1992). Плато Таусенд. Капитализм и шизофрения. ISBN  978-3-88396-094-4.
  5. ^ Копия поисков Джима Фланагана Реферальный Zeitgeisэто было доступно на archive.org но с тех пор был заблокирован. В комментариях запись в блоге В архиве 2006-04-26 на Wayback Machine, пользователь по имени Стив Минутилло приписал идею Джиму Фланагану, заявив, что в 2002 году на сайте Фланагана были такие дисплеи.
  6. ^ "Tag Clouds R.I.P.?". Readwriteweb.com. 2011-03-30. Архивировано из оригинал 19 марта 2012 г.
  7. ^ «Добро пожаловать на Webby Awards». Webbyawards.com. 2011-10-28. В архиве из оригинала от 03.07.2006. Получено 2013-07-27.
  8. ^ Биленберг, К. и Захер, М., Группы в социальном ПО: использование тегов для интеграции отдельных контекстов для социальной навигации В архиве 2007-10-08 на Wayback Machine, Магистерская диссертация, представленная в Программе цифровых медиа, Бременский университет (2006)
  9. ^ а б c Шуберт, Эрих; Шпиц, Андреас; Вейлер, Майкл; Гейсс, Йоханна; Герц, Майкл (2017-08-11). «Семантические облака слов с фоновой нормализацией корпуса и t-распределенным стохастическим встраиванием соседей». arXiv:1708.03569 [cs.IR ].
  10. ^ Knautz, K., Soubusta, S., & Stock, W.G. (2010). Кластеры тегов как интерфейсы поиска информации В архиве 2011-07-17 на Wayback Machine. Материалы 43-й ежегодной Гавайской международной конференции по системным наукам (HICSS-43), 5–8 января 2010 г. IEEE Computer Society Press (10 страниц).
  11. ^ Ауиш, Камель; Лемир, Даниэль; Годин, Роберт (2007). «Совместная OLAP с облаками тегов: формализм OLAP Web 2.0 и экспериментальная оценка». arXiv:0710.2156 [cs.DB ].
  12. ^ Helic, D .; Trattner, C .; Strohmaier, M .; Эндрюс, К. (2011). «Полезны ли облака тегов для навигации? Теоретико-сетевой анализ» (PDF). Международный журнал социальных вычислений и киберфизических систем. 1 (1): 33–55. Дои:10.1504 / IAOCPS.2011.043603.
  13. ^ Траттнер, К .:Связывание связанного контента в веб-энциклопедиях с облаками тегов поисковых запросов В архиве 2012-06-15 в Wayback Machine. Международный журнал IADIS в WWW / Интернете, том 9, выпуск 2, 2011 г.
  14. ^ Траттер, К., Лин, Ю., Парра, Д., Юэ, З., Брусиловский, П .: Оценка доступа к информации на основе тегов в коллекциях изображений В архиве 2012-06-15 в Wayback Machine. В материалах 23-й конференции ACM по гипертексту и социальным медиа (HT 2012). ACM, Нью-Йорк, Нью-Йорк, США, 2012 г.
  15. ^ а б c Ломанн, С., Циглер, Дж., Тецлафф, Л. Сравнение макетов облака тегов: производительность, связанная с задачами, и визуальное исследование В архиве 2009-10-07 на Wayback Machine, Т. Гросс и др. (Ред.): INTERACT 2009, Часть I, LNCS 5726, стр. 392–404, 2009.
  16. ^ Хасан-Монтеро, Ю., Эрреро-Солана, В. Улучшение облаков тегов в качестве интерфейсов поиска визуальной информации В архиве 2006-08-13 на Wayback Machine. InSciT 2006: Мерида, Испания. 25–28 октября 2006 г.
  17. ^ а б Касер, Оуэн; Лемир, Даниэль (2007). «Отрисовка облака тегов: алгоритмы облачной визуализации». arXiv:cs / 0703109.
  18. ^ Салонен, Дж. 2007. Самоорганизующиеся облака тегов на основе карт - создание пространственно значимых представлений данных тегов В архиве 2008-12-24 на Wayback Machine. Материалы 1-й конференции OPAALS, 26–27 ноября 2007 г., Рим, Италия.
  19. ^ Маршалковский, Ю., Моква, Д., Дроздовский, М., Русецкий, Л., Нарожный, Х. Быстрые алгоритмы онлайн-построения облаков веб-тегов, Технические приложения искусственного интеллекта 64, стр. 378–390, 2017.
  20. ^ Апель, Уоррен. "Визуализация и комментарии ManyEyes: Облако данных о населении мира.". В архиве из оригинала от 29.10.2007. Получено 2007-08-26.
  21. ^ Ваттенберг, Мартин. «Визуализация ManyEyes: Облако рекламы". В архиве из оригинала от 14 февраля 2008 г.. Получено 2007-03-12.
  22. ^ а б Стейнбок, Даниэль. «Визуализация TagCrowd: состояние Союза». В архиве из оригинала 2011-04-11. Получено 2011-03-05.
  23. ^ Ламантия, Джо. "Текстовые облака: новая форма облака тегов?". [https: 655 /http://www.joelamantia.com/blog/archives/tag_clouds/text_clouds_a_new_form_of_tag_cloud.html Архивировано] Проверять | archiveurl = ценить (помощь) из оригинала от 10.09.2008. Получено 2008-09-11.
  24. ^ Мехта, Чираг. "Облако тегов речей президента США". В архиве из оригинала от 19.10.2007. Получено 2008-09-11.
  25. ^ «Совместное облако». Получено 2008-12-05.
  26. ^ Феликс, Кристиан; Франконери, Стивен; Бертини, Энрико (январь 2018 г.). «Разобрав облака слов: эмпирическое исследование пространства дизайна для сводок ключевых слов». IEEE Transactions по визуализации и компьютерной графике. 24 (1): 657–666. Дои:10.1109 / TVCG.2017.2746018. PMID  28866593. S2CID  6570943.
  27. ^ "Ежемесячные обращения к вики-странице en.wikipedia". Wikistics.falsikon.de. 31 августа 2009 г. Архивировано из оригинал на 2013-04-19. Получено 2013-07-27.
  28. ^ "WikipediaTop1000VitalArticleHits". Wordle. В архиве из оригинала от 27.09.2013. Получено 2013-07-27.
  29. ^ Восс, Якоб (2006). «Совместный тезаурус с тегами в стиле Википедии». arXiv:cs / 0604036.
  30. ^ «Кентбайт: Алгоритм распределения шрифтов облака тегов. Июнь 2005 г. ". Echochamberproject.com. В архиве с оригинала на 2013-10-02. Получено 2013-07-27.

внешняя ссылка