Анализ социальных данных - Social data analysis

Анализ социальных данных это анализ на основе данных того, как люди взаимодействуют в социальном контексте, часто с данными, полученными из социальные сети. Цель может состоять в том, чтобы просто понять человеческое поведение или даже распространить интересную историю для целевой аудитории. Методы могут включать понимание того, как данные передаются в сети, определение влиятельных узлов (людей, сущностей и т. Д.) Или обнаружение актуальных тем.

Анализ социальных данных обычно включает два ключевых этапа: 1) сбор данных, полученных с сайтов социальных сетей (или через социальные приложения), и 2) анализ этих данных, во многих случаях требующий анализа данных в реальном времени (или почти в реальном времени), измерения, которые понимают и соответствующим образом взвешивают такие факторы, как влияние, охват и актуальность, понимание контекста анализируемых данных и включение соображений временного горизонта. Короче говоря, аналитика социальных данных включает в себя анализ социальных сетей, чтобы понять и выявить идеи, встроенные в данные.[1]

Анализ социальных данных может дать новый взгляд на бизнес-аналитика где социальное исследование данных может привести к важным выводам, которые пользователь аналитики не предполагал / не исследовал. Термин был введен Мартин Ваттенберг в 2005 году[2] а в последнее время также рассматривается как анализ больших социальных данных в отношении большое количество данных вычисление.

Доступны системы, помогающие пользователям анализировать социальные данные. Они позволяют пользователям хранить наборы данных и создать соответствующие визуальные представления. В механизмах обсуждения часто используются такие структуры, как блоги и вики для стимулирования этого социального исследования /Коллективный интеллект.

Получение социальных данных

Социальные сети становятся все более популярными с развитием Веб 2.0. Многие из этих услуг предоставляют API которые обеспечивают легкий доступ к своим данным, отвечая на запросы пользователей с запрошенными данными в виде XML или же JSON форматированные строки. В целях защиты конфиденциальности своих пользователей такие услуги, как Facebook требовать, чтобы у лица, запрашивающего данные, были необходимые разрешения на доступ к данным. Сервисы также могут взимать с пользователей плату за доступ к их данным. Источники социальных данных включают Twitter, Facebook, новостные сайты, Википедия и Мы прекрасно себя чувствуем.

Немного API разрешать доступ к данным только в небольших количествах, поэтому массовое индексирование данных может стать проблемой. Six_Apart была первой социальной сетью, которая предоставила (бесплатно) пожарный шланг для всех публикаций в своей сети (предоставляемых через XMPP). Позже появился Twitter и предоставил пожарный шланг, как и такие компании, как Spinn3r, Datasift, и GNIP.

Методы анализа

В большинстве случаев мы хотим выяснить взаимосвязь между социальными данными и другим событием или мы хотим получить интересные результаты анализа социальных данных для прогнозирования некоторых событий. В этой области есть несколько выдающихся статей, в том числе Twitter Mood предсказывает состояние фондового рынка,[3] Предсказание настоящего с помощью Google Trends[4] и т. д. Для достижения этих целей нам нужны соответствующие методы для проведения анализа. Обычно мы используем статистика методы, методы машинное обучение или методы сбор данных делать анализы.

Университеты по всему миру открывают аспирантуру по анализу социальных данных.

Ключевые идеи

Говоря об аналитике социальных данных, важно иметь в виду ряд факторов (которые мы отметили ранее):[1]

  • Сложный анализ данных: что отличает аналитику социальных данных от анализа настроений, так это глубина анализа. Анализ социальных данных принимает во внимание ряд факторов (контекст, содержание, настроение), чтобы получить дополнительную информацию.
  • Время рассмотрения: окна возможностей значительно ограничены в области социальных сетей. То, что актуально в один день (или даже в один час), может не быть в следующем. Уметь быстро обрабатывать и анализировать данные - необходимость.
  • Анализ влияния: понимание потенциального воздействия конкретных людей может быть ключом к пониманию того, как сообщения могут вызывать отклик. Дело не только в количестве, но и в качестве.
  • Сетевой анализ: социальные данные также интересны тем, что они мигрируют, растут (или умирают) в зависимости от того, как данные распространяются по сети. Так начинается и распространяется вирусная активность.

Смотрите также

Рекомендации

  1. ^ а б IBM Emerging Technology - jStart - On the Horizon - Аналитика социальных данных
  2. ^ 2005: Детские имена, визуализация и анализ социальных данных Мартин Ваттенберг. Симпозиум IEEE по визуализации информации.
  3. ^ Боллен, Йохан; Мао, Хуэйнань; Цзэн, Сяоцзюнь (2011). «Твиттер настроения предсказывает фондовый рынок». Журнал вычислительной науки. 2 (1): 1–8. arXiv:1010.3003. Дои:10.1016 / j.jocs.2010.12.007.
  4. ^ Чхве, Хёнён; Вариан, Хэл (2012). «Прогнозирование настоящего с помощью трендов Google» (PDF). Экономический отчет. 88 (s1): 2–9. Дои:10.1111 / j.1475-4932.2012.00809.x.