Анализ основного пути - Main path analysis - Wikipedia

Анализ основного пути раскрывает наиболее важные пути или цепочки цитирования в сети цитирования. На рисунке показаны основные пути глобального ключевого маршрута (красным) для образца сети цитирования (на основе количества путей поиска и ключевого маршрута 1).

Анализ основного пути математический инструмент, впервые предложенный Хаммоном и Дорианом в 1989 году,[1] определить основные пути в сеть цитирования, что является одной из форм ориентированный ациклический граф (DAG). Метод начинается с измерения значимости всех ссылок в сети цитирования с помощью концепции «количества обходов», а затем последовательно объединяет наиболее значимые ссылки в «основной путь», который считается наиболее значимым историческим путем в целевой сеть цитирования. Метод применим к любой человеческой деятельности, которая может быть организована в виде сеть цитирования. Этот метод обычно применяется для отслеживания путей потока знаний или траекторий развития в области науки или техники с помощью библиографических ссылок или патентов.[2][3][4] Он также применялся к судебным решениям для отслеживания изменений в юридических заключениях.[5] В последнее время внимание ученых привлекает анализ основных путей. Академические исследования, связанные с анализом основных путей, быстро росли с 2007 года. Список академических статей, которые вводят, объясняют, применяют, изменяют или расширяют этот метод, был создан Хаммоном и Дорианом.[1] можно найти здесь.

История

Анализ основных путей впервые предложен Хаммоном и Дорианом (1989).[1] в котором они предлагают другой подход к анализу сети цитирования, «где соединительные нити в сети сохраняются, и основное внимание уделяется ссылкам в сети, а не узлам».[1] Они называют результирующую цепочку наиболее часто используемых ссылок цитирования «основным путем» и утверждают, что «по нашей интуиции основной путь, выбранный на основе наиболее часто используемого пути, будет определять основной поток литературы». Идея была подтверждена с помощью серии статей о ДНК-исследованиях. Чтобы сделать метод более практичным, Лю и Лу (2012)[6] расширяет метод, включая поиск по ключевому маршруту. Наиболее полезная функция поиска по ключевым маршрутам состоит в том, что можно просматривать различные уровни основных маршрутов, регулируя номера ключевых маршрутов.

Метод

Анализ основного пути выполняется в два этапа. На первом этапе получают счетчики обходов каждой ссылки в сети цитирования. В литературе упоминается несколько типов счетчиков обхода. На втором этапе выполняется поиск основных путей путем связывания значимых ссылок в соответствии с размером счетчика обхода. Прежде чем приступить к анализу основного пути, необходимо подготовить сеть цитирования.

Подготовка сети цитирования

Необходимо подготовить сеть цитирования перед запуском анализа основного пути. В сети цитирования узлы представляют такие документы, как научные статьи, патенты или судебные дела. Эти узлы связаны с использованием информации о цитировании. Сети цитирования по своей природе ориентированы, потому что два узла на противоположном конце ссылки не симметричны по своим ролям. Что касается направления, в этой статье принято соглашение, согласно которому процитированный узел указывает на цитирующий узел, что означает, что знания в цитируемом узле передаются цитирующему узлу. Сеть цитирования также по своей природе ациклична, что означает, что узел никогда не сможет соединиться с самим собой, если он движется по ссылкам в их направлении.

Прежде чем продолжить, здесь определены несколько терминов, относящихся к сети цитирования. Головы - это узлы, к которым ведет стрелка направления. Хвосты - это узлы на других концах стрелки направления. Источники - это узлы, которые цитируются, но не цитируют другие. Приемники ссылаются на другие узлы, но не цитируются. Предки - это узлы, до которых можно проследить от целевого узла. Потомки - это узлы, которых можно достичь от цели, если двигаться по ссылкам в их направлении.

Рисунок 1. Значения SPC для образца сети цитирования.

Количество обходов

Счетчик обходов измеряет значимость ссылки. В литературе обсуждается несколько типов счетчиков обхода, включая счетчик путей поиска (SPC), счетчик ссылок пути поиска (SPLC), пару узлов пути поиска (SPNP) и другие варианты.[7] Все эти пересечения будут отмечены как SPX.

Рисунок 2. Значения SPLC для образца сети цитирования.

Количество путей поиска (SPC)

SPC ссылки - это количество проходов по ссылке, если она проходит через все возможные пути от всех источников ко всем приемникам. SPC впервые предложен Владимир Батагель.[8] Значения SPC для каждой ссылки в примерной сети цитирования показаны на рисунке 1. Значение SPC для ссылки (B, D) равно 5, потому что через нее проходят пять путей (B-D-F-H-K, B-D-F-I-L, B-D-F-I-M-N, B-D-I-L и B-D-I-M-N).

Рисунок 3. Значения SPNP для образца сети цитирования.

Количество ссылок в пути поиска (SPLC)

SPLC канала - это количество проходов по каналу, если он проходит через все возможные пути от всех предков хвостового узла (включая его самого) ко всем приемникам. SPLC впервые был предложен Хаммоном и Дорианом.[1] На рисунке 2 представлены значения SPLC для каждого канала в той же сети цитирования, как показано на рисунке 1. Шесть путей, проходящих через канал (D, F), дают ему значение SPLC 6. Это: BDFHK, BDFIL, BDFIMN, DFHK, DFIL и DFIMN, отмечая, что все пути начинаются либо с предка D, которым является B, либо от самого D.

Пара узлов пути поиска (SPNP)

SPNP ссылки - это количество проходов по ссылке, если она проходит через все возможные пути от всех предков хвостового узла (включая его самого) до всех потомков головного узла (включая его самого). SPNP впервые предложен Хаммоном и Дорианом.[1] Значения SPNP для ссылки (C, H) равны 6, потому что есть 6 путей, которые начинаются с A, B, C (A и B являются предками C) и заканчиваются в H и K (K является потомком H). Это пути A-C-H, A-C-H-K, B-C-H, B-C-H-K, C-H и C-H-K.

Рисунок 4. Основные локальные пути в примерной сети цитирования.

Поиск пути

Затем, основываясь на подсчете обходов, можно искать наиболее значимые пути. Их можно найти несколькими способами, включая локальный, глобальный и поиск по ключевому маршруту.

Рисунок 5. Глобальные основные пути в примерной сети цитирования

Локальный поиск

Местный поиск упоминается в Хаммоне и Дориане.[1] как поиск по принципу "приоритет - прежде всего". Этот процесс поиска всегда выбирает следующую ссылку (и) с самым высоким SPX в качестве исходящей ссылки. Он отслеживает наиболее посещаемые ссылки, таким образом, получает основной поток среди всех цепочек цитирования. На рисунке 4 показаны основные локальные пути, полученные на основе SPC. Заметим, что когда поиск достигает узла I, две исходящие ссылки имеют одинаковые значения SPC, таким образом создавая два пути впоследствии.

Рисунок 6. Основные пути локального ключевого маршрута в примере сети цитирования

Глобальный поиск

Глобальный поиск просто предлагает цепочку цитирования с самым большим общим SPX. Концепция глобального поиска похожа на метод критического пути в календарном планировании проекта. Глобальные основные пути примерной сети цитирования, основанной на SPC, представлены на рисунке 5. Сумма всех значений SPC в пути B-D-F-I-M-N равна 15, что является наибольшим среди всех возможных путей.

Рисунок 7. Основные пути глобального ключевого маршрута в примере сети цитирования.

Поиск по ключевому маршруту

Поиск по ключевому маршруту разработан, чтобы избежать проблемы пропуска важных ссылок как при локальном, так и при глобальном поиске. Проблема заключается в локальных и глобальных основных путях, показанных выше, в которых одно из наиболее важных звеньев (H, K) не включено в основные пути. Как описано у Лю и Лу (2012),[6] подход ищет основные пути из указанных ссылок (ключевые маршруты), таким образом, гарантирует включение ссылок. Также можно указать несколько ссылок для получения нескольких основных путей. Дополнительным преимуществом подхода с использованием ключевых маршрутов является то, что можно контролировать детализацию основных путей, варьируя количество ключевых маршрутов. Чем больше указано количество ключевых маршрутов, тем больше деталей раскрывается. Когда количество ключевых маршрутов увеличивается до определенной точки, поиск возвращает всю сеть цитирования. На рисунках 6 и 7 показаны основные пути локального ключевого маршрута и глобального ключевого маршрута в примере сети цитирования. В обоих основных путях количество ключевых маршрутов установлено на 1, то есть поисковая база выполняется только по верхним ссылкам. Поскольку есть два верхних звена (B, D) и (H, K), итоговые основные пути включают оба из них.

Варианты

В дополнение к подходу поиска по ключевому маршруту, варианты метода включают в себя подход, который является агрегатным и стохастическим,[9] рассматривает распад в распространении знаний,[7] и Т. Д.

Приложения

Этот метод был применен к трем типам систем документации, которые поддерживают традицию ссылок на предыдущие документы. Это академическая статья, патент и система судебной документации.

Академическая статья

Базы данных академического цитирования, такие как Web of Science и Scopus включать исчерпывающую информацию о цитировании в цифровом виде. Эта информация позволяет применять анализ основных путей для изучения структуры знаний или отслеживания потока знаний в любых областях науки. Некоторые ранние приложения исследуют тему центральности-производительности,[10] Решение конфликта,[11] и т.д. Более свежие приложения включают фуллерены,[4] нанотрубки,[4] Анализ охвата данных,[2][12][13] система управления цепями поставок,[14] корпоративная социальная ответственность,[15] ИТ-аутсорсинг,[16] медицинский туризм,[17] и Т. Д.

Патент

Патенты, ссылающиеся на известный уровень техники, являются обычной практикой. Например, каждый патентный документ США включает раздел «Цитированные ссылки», в котором перечислены предшествующие области техники патента. Патентные базы данных, такие как Clarivate Analytics и Webpat предоставляют оцифрованную информацию о цитировании патентов. Verspagen (2007)[3] и Мина (2007)[18] это две ранние работы, которые применяют анализ основных путей к патентным данным.

Судебный документ

В системе общего права документ о решении суда обычно ссылается на ранее опубликованные заключения с целью обоснования текущего решения. Эти судебные ссылки или юридические ссылки также могут быть использованы для построения сетей цитирования и последующего отслеживания изменений юридических заключений. Возможности исследования в этой области широко открыты. Лю и др. (2014)[5] провела предварительное исследование по такому типу приложений.

Программная реализация

Анализ основного пути реализован в Pajek, широко используемый анализ социальных сетей программное обеспечение, написанное Владимир Батагель и Андрей Мрвар из Люблянский университет, Словения. Чтобы запустить анализ основного пути в Pajek, нужно сначала подготовить сеть цитирования и заставить Pajek читать в сети. Затем в главном меню Pajek вычисляет счетчики обходов всех ссылок в сети, применяя одну из следующих последовательностей команд (в зависимости от выбора счетчиков обходов).

Сеть → Ациклическая сеть → Создать взвешенную сеть + Вектор → Веса обхода → Счетчик ссылок в пути поиска (SPC) или

Сеть → Ациклическая сеть → Создать взвешенную сеть + Вектор → Веса обхода → Счетчик ссылок в пути поиска (SPLC) или

Сеть → Ациклическая сеть → Создать взвешенную сеть + вектор → Веса обхода → Пары узлов пути поиска (SPNP)

После подсчета количества обходов следующие последовательности команд находят основные пути.

Для местных магистралей

Сеть → Ациклическая сеть → Создать (под) сеть → Основные пути → Локальный поиск → Переслать

Для глобальных основных путей

Сеть → Ациклическая сеть → Создать (под) сеть → Основные пути → Глобальный поиск → Стандартный

Для локальных основных путей ключевого маршрута

Сеть → Ациклическая сеть → Создать (под) сеть → Основные пути → Локальный поиск → Ключевой маршрут

Для глобальных основных путей ключевого маршрута

Сеть → Ациклическая сеть → Создать (под) сеть → Основные пути → Глобальный поиск → Ключевой маршрут

В дополнение к поиску по ключевому маршруту, начиная с версии 5.03 Pajek (4 января 2018 г.) добавлена ​​более гибкая функция поиска. Новая функция позволяет выполнять локальный и глобальный поиск, проходя через вершины, определенные кластером. Последовательности команд следующие:

Сеть → Ациклическая сеть → Создать (под) сеть → Основные пути → Локальный поиск → Ключевой маршрут → Через вершины в кластере

Сеть → Ациклическая сеть → Создать (под) сеть → Основные пути → Глобальный поиск → Ключевой маршрут → Через вершины в кластере

Рекомендации

  1. ^ а б c d е ж грамм Hummon, Norman P .; Дориан, Патрик (1989). «Связь в сети цитирования: Развитие теории ДНК». Социальные сети. 11 (1): 39–63. Дои:10.1016/0378-8733(89)90017-8.
  2. ^ а б Лю, Джон С .; Лу, Луи Ю.Й .; Лу, Вен-Минь; Лин, Брюс Дж. Я. (2013). «Анализ охвата данных 1978–2010: обзор литературы на основе цитирования». Омега. 41 (1): 3–15. Дои:10.1016 / j.omega.2010.12.006.
  3. ^ а б Верспаген, Барт (2007-03-01). «Отображение технологических траекторий как сети цитирования патентов: исследование истории исследований топливных элементов». Достижения в сложных системах. 10 (1): 93–115. Дои:10.1142 / S0219525907000945. ISSN  0219-5259.
  4. ^ а б c Лучио-Ариас, Диана; Лейдесдорф, Лоэт (2008-10-01). «Анализ основного пути и зависимые от пути переходы в историограммах на основе HistCite ™». Журнал Американского общества информационных наук и технологий. 59 (12): 1948–1962. Дои:10.1002 / asi.20903. ISSN  1532-2890.
  5. ^ а б Лю, Джон С .; Чен, Сяо-Хуэй; Хо, Мэй Сю-Цзин; Ли, Ю-Чен (2014-12-01). «Цитаты с разным уровнем релевантности: отслеживание основных путей юридических заключений». Журнал Ассоциации информационных наук и технологий. 65 (12): 2479–2488. Дои:10.1002 / asi.23135. ISSN  2330-1643.
  6. ^ а б Лю, Джон С .; Лу, Луи Й.Й. (2012-03-01). «Комплексный подход к анализу основных путей: на примере разработки индекса Хирша». Журнал Американского общества информационных наук и технологий. 63 (3): 528–542. Дои:10.1002 / asi.21692. ISSN  1532-2890.
  7. ^ а б Лю, Джон С .; Куан, Чжун-Хуэй (01.02.2016). «Новый подход к анализу основных путей: упадок в распространении знаний». Журнал Ассоциации информационных наук и технологий. 67 (2): 465–476. Дои:10.1002 / asi.23384. ISSN  2330-1643.
  8. ^ Батагель, В. (2003). Эффективные алгоритмы анализа сети цитирования.препринт arXiv cs / 0309023.
  9. ^ Йео, Вундонг; Ким, Сонхо; Ли, Джэ Мин; Кан, Джэу (01.01.2014). «Агрегативная и стохастическая модель идентификации основного пути: пример графена». Наукометрия. 98 (1): 633–655. Дои:10.1007 / s11192-013-1140-3. ISSN  0138-9130.
  10. ^ Hummon, Norman P .; Дориан, Патрик; Фриман, Линтон С. (18.08.2016). «Анализ структуры центрально-продуктивной литературы, созданной между 1948 и 1979 годами». Знание. 11 (4): 459–480. Дои:10.1177/107554709001100405.
  11. ^ Карли, Кэтлин М .; Hummon, Norman P .; Харти, Марта (2016-08-17). «Научное влияние». Знание. 14 (4): 417–447. Дои:10.1177/107554709301400406.
  12. ^ Лю, Джон С .; Лу, Луи Ю.Й .; Лу, Вэнь-Минь (2016). «Исследовательские направления в анализе охвата данных». Омега. 58: 33–45. Дои:10.1016 / j.omega.2015.04.004.
  13. ^ Лю, Джон С .; Лу, Луи Ю.Й .; Лу, Вен-Минь; Лин, Брюс Дж. Я. (2013). «Обзор приложений DEA». Омега. 41 (5): 893–902. Дои:10.1016 / j.omega.2012.11.004.
  14. ^ Клаудиа Коликкья; Фернанда Строцци (15.06.2012). «Управление рисками цепочки поставок: новая методология систематического обзора литературы». Система управления цепями поставок. 17 (4): 403–418. Дои:10.1108/13598541211246558. ISSN  1359-8546.
  15. ^ Лу, Луи Ю.Й .; Лю, Джон С. (2014-03-01). «Пути распространения знаний о корпоративной социальной ответственности - с 1970 по 2011 годы». Корпоративная социальная ответственность и экологический менеджмент. 21 (2): 113–128. Дои:10.1002 / csr.1309. ISSN  1535-3966.
  16. ^ Лян, Хуйган; Ван, Цзянь-Цзюнь; Сюэ, Яцзюн; Цуй, Сяоцун (2016). «Исследование ИТ-аутсорсинга с 1992 по 2013 год: обзор литературы, основанный на анализе основных путей». Информация и управление. 53 (2): 227–251. Дои:10.1016 / j.im.2015.10.001.
  17. ^ Чуанг, Томас С .; Лю, Джон С .; Лу, Луи Ю.Й .; Ли, Ячи (2014). «Основные пути медицинского туризма: от трансплантации к благоустройству». Управление Туризмом. 45: 49–58. Дои:10.1016 / j.tourman.2014.03.016.
  18. ^ Мина, А .; Ramlogan, R .; Tampubolon, G .; Меткалф, Дж. (2007). «Составление карты эволюционных траекторий: приложения к росту и трансформации медицинских знаний». Политика исследования. 36 (5): 789–806. Дои:10.1016 / j.respol.2006.12.007.

внешняя ссылка

  • Pajek, бесплатное программное обеспечение для анализа социальных сетей.
  • Список основных статей пути, эта страница содержит список научных статей, которые вводят, объясняют, применяют, изменяют или расширяют метод, возникший в Хаммоне и Дориане.