Конфиденциальность в сетях обмена файлами - Privacy in file sharing networks - Wikipedia

Одноранговый обмен файлами (P2P) системы, такие как Гнутелла, KaZaA, и eDonkey /eMule, стали чрезвычайно популярными в последние годы и оцениваются в миллионы пользователей. В научном исследовании указаны некоторые слабые места двух популярных P2P-сетей в защите конфиденциальности пользователей. В ходе исследования были проанализированы протоколы Gnutella и eMule и обнаружены слабые места в протоколе; Многие из проблем, обнаруженных в этих сетях, являются фундаментальными и, вероятно, обычными для других сетей P2P.[1]Пользователи файлообменных сетей, таких как eMule и Gnutella, подлежат контролю за своей деятельностью. Клиентов можно отслеживать по IP-адресу, DNS-имени, версии программного обеспечения, которое они используют, файлам, которыми они делятся, запросам, которые они инициируют, и запросам, на которые они отвечают.[нужна цитата ]

Многое известно о сетевой структуре, схемах маршрутизации, нагрузке на производительность и отказоустойчивости P2P-систем в целом и Gnutella в частности.[нужна цитата ][2] В этом документе основное внимание уделяется конфиденциальности пользователей, которую раскрывают сети Gnutella и eMule.[нужна цитата ]Это может быть удивительно, но протокол eMule не обеспечивает большой конфиденциальности для пользователей, хотя это протокол P2P, который должен быть децентрализованным.[3]

Протоколы Gnutella и eMule

Протокол eMule

eMule - один из клиентов, реализующий сеть eDonkey. EMule протокол состоит из более чем 75 типов сообщений. Когда клиент eMule подключается к сети, он сначала получает список известных серверов eMule, которые можно получить из Интернета. Несмотря на то, что клиентов eMule миллионы, серверов всего несколько сотен.[нужна цитата ] Клиент подключается к серверу через TCP-соединение. Он остается открытым, пока клиент подключен к сети. После подключения клиент отправляет на сервер список своих общих файлов. Таким образом, сервер создает базу данных из файлов, находящихся на этом клиенте.[нужна цитата ] Сервер также возвращает список других известных серверов. Сервер возвращает клиенту идентификатор, который является уникальным идентификатором клиента в системе. Сервер может генерировать ответы на запросы только тем клиентам, которые напрямую к нему подключены. Загрузка осуществляется путем разделения файла на части и запроса каждой части у каждого клиента.[нужна цитата ]

Протокол Gnutella

Протокол Gnutella v0.4

В протоколе Gnutella V0.4 все узлы идентичны, и каждый узел может подключиться друг к другу.[4] Протокол Gnutella состоит из 5 типов сообщений: запрос для поиска плитки. В сообщениях запроса используется механизм лавинной рассылки, то есть каждый узел, который получает запрос, пересылает его по всем своим ссылкам на соседние узлы графа.[5] Узел, получивший запрос и имеющий соответствующий файл, отвечает сообщением о совпадении запроса. Поле счетчика переходов в заголовке ограничивает время жизни сообщения.[нужна цитата ] Сообщения Ping и Pong используются для обнаружения новых узлов, которые могут быть связаны с фактической загрузкой файла, выполняемой путем открытия TCP подключение и использование HTTP Механизм GET.[6]

Протокол Gnutella v0.6

Протокол Gnutella V0.6 включает несколько модификаций: Узел имеет один из двух режимов работы: «листовой узел» или «ультрапир».[нужна цитата ] Первоначально каждый узел запускается в режиме листового узла, в котором он может подключаться только к ультрапирам. Листовые узлы отправляют запрос ультрапиру, ультрапир пересылает запрос и ожидает ответов. Когда узел имеет достаточную пропускную способность и время безотказной работы, узел может стать ультрапиром.[нужна цитата ] Ультраперы периодически отправляют своим клиентам запросы на отправку списка имеющихся у них общих файлов. Если поступает запрос со строкой поиска, которая соответствует одному из файлов в листьях, ультрапир отвечает и указывает на конкретный лист.[нужна цитата ]

Инициаторы слежения и ответчики

В версии 0.4 протокола Gnutella ультрапир, который получает сообщение от конечного узла (сообщение с нулевым счетчиком переходов), точно знает, что сообщение было отправлено с этого конечного узла.[нужна цитата ]

В версии 0.6 протокола, если ультрапир получает сообщение от ультрапира с нулевым счетчиком переходов, то он знает, что сообщение было отправлено ультрапиром или одним из его узлов (среднее число узловых узлов, подключенных к ультрапиру. составляет 200).[нужна цитата ]

Отслеживание одного узла

Многие клиенты Gnutella имеют функцию мониторинга HTTP. Эта функция позволяет отправлять информацию об узле любому узлу, который поддерживает пустой HTTP-запрос, и получать в ответ.[нужна цитата ]Исследования показывают, что простой поисковый робот, подключенный к сети Gnutella, может получить из начальной точки входа список IP-адресов, подключенных к этой точке входа.[нужна цитата ] Затем поисковый робот может продолжить поиск других IP-адресов. В рамках академического исследования был проведен следующий эксперимент: в Нью-Йоркском университете использовался обычный программный клиент Gnucleus, который был подключен к сети Gnutella как листовой узел, с характерным прослушивающим TCP-портом 44121 на иврите. Университет, Иерусалим, Израиль, поисковый робот запустил поиск клиента, прослушивающего порт 44121. Менее чем за 15 минут краулер обнаружил IP-адрес клиента Gnucleus в Нью-Йоркском университете с уникальным портом.[нужна цитата ]

Сбор IP-адресов

Если пользователь подключен к сети Gnutella, скажем, в течение последних 24 часов, этот пользователь айпи адрес могут быть легко получены хакерами, поскольку функция мониторинга HTTP может собрать около 300 000 уникальных адресов в течение 10 часов.[нужна цитата ]

Отслеживание узлов по созданию GUID

А Глобальный уникальный идентификатор (GUID) - это 16-байтовое поле в заголовке сообщения Gnutella, которое однозначно идентифицирует каждое сообщение Gnutella. В протоколе не указано, как генерировать GUID.[нужна цитата ]

Gnucleus в Windows использует Ethernet MAC-адрес используется в качестве GUID 6 младших байтов. Поэтому клиенты Windows раскрывают свой MAC-адрес при отправке запросов.[7]

В клиентском ПО JTella 0.7 GUID создается с помощью Ява случайный номер без инициализации. Поэтому в каждом сеансе клиент создает последовательность запросов с одинаковыми повторяющимися идентификаторами. Со временем можно найти корреляцию между запросами пользователей.[нужна цитата ]

Сбор разной информации пользователями

Средство мониторинга Gnutella раскрывает множество ценной информации о своих пользователях. Можно собирать информацию о производителе программного обеспечения и версии, которую используют клиенты. Также доступна другая статистическая информация о клиенте: емкость, время безотказной работы, локальные файлы и т. Д.[нужна цитата ]

В Gnutella V0.6 можно собирать информацию о клиентском программном обеспечении (даже если клиент не поддерживает HTTP-мониторинг). Информация содержится в первых двух сообщениях рукопожатия соединения.[нужна цитата ]

Отслеживание пользователей по частичной информации

У некоторых пользователей Gnutella есть небольшой набор похожих друг на друга, что облегчает их отслеживание, зная эту очень частичную информацию.[нужна цитата ]

Отслеживание пользователей по запросам

Группа академических исследователей провела следующий эксперимент: команда запустила пять Gnutella в качестве ультрапира (чтобы слушать запросы других узлов). Команда выявила около 6% запросов.[нужна цитата ]

Использование хеш-функций

Хэши SHA-1 относятся к SHA-1 файлов, а не к строкам поиска.

Половина поисковых запросов - это строки, а половина из них - результат хэш-функция (SHA-1 ) нанесенный на струну. Хотя использование хеш-функции предназначено для повышения конфиденциальности, академические исследования показали, что содержимое запроса может быть легко раскрыто с помощью атаки по словарю: соавторы-ультрасоводы могут постепенно собирать общие строки поиска, вычислять их хеш-значение и сохранять их в словаре. Когда поступает хешированный запрос, каждый совместно работающий ультрапир может проверять совпадения со словарем и соответственно отображать исходную строку.[нужна цитата ][8]

Меры

Обычной мерой противодействия является сокрытие пользователя айпи адрес при загрузке или отправке контента с использованием анонимных сетей, таких как I2P - Анонимная сеть. Существует также шифрование данных и использование косвенных связей (смешивать сети ) для обмена данными между одноранговыми узлами.[нужна цитата ]Таким образом, весь трафик анонимизируется и зашифрован. К сожалению, анонимность и безопасность достигаются ценой гораздо более низких скоростей, и из-за того, что эти сети являются внутренними, в них в настоящее время все еще меньше контента. Однако это изменится, когда число пользователей увеличится.[нужна цитата ]

Смотрите также

Рекомендации

  1. ^ Биксон, Дэнни; Малхи, Далия (2004). «Исследование конфиденциальности в сетях обмена файлами». Архивировано 12 октября 2013 года.. Получено 12 февраля 2013.CS1 maint: BOT: статус исходного URL-адреса неизвестен (связь)
  2. ^ Eng Кеонг Луа Джон Кроукрофт. «Обзор и сравнение схем одноранговых оверлейных сетей». Обзоры и учебные пособия по коммуникациям IEEE 7 (2): 72-93.
  3. ^ Силва, Педро Морейра да (19 июня 2017 г.). «Недоверчивый P2P: детерминированная сохраняющая конфиденциальность модель обмена файлами P2P, позволяющая скрыть интересы пользователей в отношении контента в ненадежных одноранговых сетях». Компьютерная сеть. 120: 87–104. Дои:10.1016 / j.comnet.2017.04.005.
  4. ^ "конфиденциальность при обмене файлами". inba.info. Получено 2020-10-23.
  5. ^ Ингу Чжу; Имин Ху (01.12.2006). «Повышение эффективности поиска в системах P2P, подобных Gnutella». Транзакции IEEE в параллельных и распределенных системах. 17 (12): 1482–1495. Дои:10.1109 / tpds.2006.173. ISSN  1045-9219. S2CID  496918.
  6. ^ «Разработка протокола Gnutella». rfc-gnutella.sourceforge.net. Получено 2020-11-12.
  7. ^ Кортни, Килан. (2012). Справочник по информации и конфиденциальности в Интернете. Мердок, Кеон. (1-е изд.). Дели [Индия]: Издательство колледжа. ISBN  978-81-323-1280-2. OCLC  789644329.
  8. ^ Цинк, Томас (октябрь 2020 г.). «Анализ и эффективная классификация трафика обмена файлами P2P». Universität Konstanz.

дальнейшее чтение

внешняя ссылка