Графон - Graphon

Реализация заменяемого случайного графа, заданного графон. Графон отображается в виде пурпурной тепловой карты (справа внизу). Случайный график размера генерируется путем независимого присвоения каждой вершине скрытая случайная величина (значения по вертикальной оси), включая каждый край независимо с вероятностью . Например, край (зеленый, пунктирный) присутствует с вероятностью ; зеленые прямоугольники в правом квадрате представляют значения и . Верхняя левая панель показывает реализацию графа в виде матрицы смежности.

В теория графов и статистика, а графон (также известный как предел графика) это симметричный измеримый функция , что важно при изучении плотные графы. Графоны возникают как естественное понятие предела последовательности плотных графов, так и как фундаментальные определяющие объекты обмениваемый модели случайных графов. Графоны связаны с плотными графами следующей парой наблюдений: модели случайных графов, определенные графонами, порождают плотные графы почти наверняка, и, по лемма о регулярности, графоны фиксируют структуру произвольных больших плотных графов.

Статистическая формулировка

Графон - это симметричная измеримая функция . Обычно графон понимается как определение модели заменяемого случайного графа по следующей схеме:

  1. Каждая вершина графа присваивается независимое случайное значение
  2. Край независимо включается в график с вероятностью .

Модель случайного графа является заменяемой моделью случайного графа тогда и только тогда, когда она может быть определена таким образом в терминах (возможно, случайного) графона. Модель, основанная на фиксированном графоне. иногда обозначается , по аналогии с Эрдеш – Реньи модель случайных графов. граф, сгенерированный из графона. таким образом называется -случайный граф.

Из этого определения и закона больших чисел следует, что если , заменяемые модели случайных графов почти наверняка плотны.[1]

Примеры

Самый простой пример графона: для некоторой постоянной . В этом случае ассоциированной заменяемой моделью случайного графа является Эрдеш – Реньи модель который включает каждое ребро независимо с вероятностью .

Если вместо этого мы начнем с графона, который кусочно постоянен:

  1. разделив единичный квадрат на блоки и
  2. параметр равный на блокировать,

Результирующая модель заменяемого случайного графа является сообщество стохастическая блочная модель, обобщение модели Эрдеша – Реньи. Мы можем интерпретировать ее как модель случайного графа, состоящую из различные графы Эрдеша – Реньи с параметрами соответственно, с биграфами между ними, где каждое возможное ребро между блоками и включается независимо с вероятностью .

Многие другие популярные модели случайных графов могут быть поняты как сменные модели случайных графов, определенные неким графоном, подробный обзор включен в Orbanz and Roy.[1]

Совместно заменяемые матрицы смежности

Случайный график размера можно представить как случайный матрица смежности. Чтобы обеспечить последовательность (в смысле проективность ) между случайными графами разного размера естественно изучить последовательность матриц смежности, возникающую как верхний левый подматрицы некоторого бесконечного массива случайных величин; это позволяет нам генерировать добавив узел в и выборки краев за . С этой точки зрения случайные графы определяются как случайные бесконечные симметричные массивы. .

Следуя фундаментальной важности заменяемые последовательности в классической вероятности естественно искать аналогичное понятие в постановке случайного графа. Одно такое понятие дается совместно заменяемыми матрицами; т.е. случайные матрицы, удовлетворяющие

для всех перестановок натуральных чисел, где средства равное распределение. Интуитивно это условие означает, что распределение случайного графа не меняется из-за перемаркировки его вершин: то есть метки вершин не несут никакой информации.

Существует теорема представления для совместно заменяемых матриц случайной смежности, аналогичная Теорема де Финетти о представлении для сменных последовательностей. Это частный случай Теорема Олдоса – Гувера для совместно заменяемых массивов и в этой настройке утверждает, что случайная матрица генерируется:

  1. Образец независимо
  2. независимо случайно с вероятностью

куда является (возможно, случайным) графоном. То есть модель случайного графа имеет совместно заменяемую матрицу смежности тогда и только тогда, когда она является совместно заменяемой моделью случайного графа, определенной в терминах некоторого графона.

Оценка графона

Из-за проблем идентифицируемости невозможно оценить ни функцию графона. или скрытые позиции узла и есть два основных направления оценки графона. Одно направление направлено на оценку с точностью до класса эквивалентности,[2][3] или оценить матрицу вероятностей, индуцированную .[4][5]

Аналитическая формулировка

Любой график на вершины можно отождествить с его матрица смежности Эта матрица соответствует ступенчатой ​​функции , определяемый разбиением в интервалы такой, что есть интерьер

и для каждого , параметр равно вход .Эта функция это связанный графон графика .

В общем, если у нас есть последовательность графиков где количество вершин уходит в бесконечность, мы можем проанализировать предельное поведение последовательности, рассматривая предельное поведение функций . Если эти графы сходятся (согласно некоторому подходящему определению конвергенция ), то мы ожидаем, что предел этих графиков будет соответствовать пределу этих ассоциированных функций.

Это мотивирует определение графона (сокращение от «функция графика») как симметричной измеримой функции. который захватывает понятие предела последовательности графов. Оказывается, что для последовательностей плотных графов несколько очевидно различных понятий сходимости эквивалентны, и при всех из них естественным предельным объектом является графон.[6]

Примеры

Пример 1: Возьмите случайную последовательность Графы Эрдеша – Реньи с некоторым фиксированным параметром .Интуитивно, как стремится к бесконечности, предел этой последовательности графов определяется исключительно плотностью ребер этих графов.

В пространстве графонов оказывается, что такая последовательность сходится почти наверняка к постоянному , что отражает указанную выше интуицию.


Пример 2: возьмите последовательность из полуграфы, определяемый взятием быть двудольным графом на вершины и такой, что примыкает к именно когда . Если вершины перечислены в указанном порядке, то матрица смежности имеет два угла блочных матриц «полуквадрата», заполненные единицами, а остальные элементы равны нулю. Например, матрица смежности дан кем-то

В качестве становится больше, эти углы «сглаживаются». Соответствуя этой интуиции, последовательность сходится к полуграфону определяется когда и иначе.


Пример 3: возьмите последовательность из полные двудольные графы с частями равного размера.Если мы упорядочим вершины, поместив все вершины в одной части в начале и поместив вершины другой части в конце, матрица смежности выглядит как блочная недиагональная матрица с двумя блоками единиц и двумя блоками нулей. Например, матрица смежности дан кем-то

В качестве становится больше, эта блочная структура матрицы смежности остается постоянной, так что эта последовательность графов сходится к "полному двудольному" графу определяется в любое время и , и установка иначе.


Пример 4: Рассмотрим последовательность снова из предыдущего примера. Если вместо этого мы упорядочиваем вершины путем чередования частей, матрица смежности будет иметь шахматную структуру из нулей и единиц. Например, при таком порядке матрица смежности дан кем-то

В качестве становится больше, матрицы смежности становятся все более и более тонкой шахматной доской. Несмотря на такое поведение, нам все еще нужен предел быть уникальным и приводить к графу из примера 4. Это означает, что когда мы формально определяем сходимость для последовательности графов, определение предела не должно зависеть от переназначения вершин.


Пример 5: Возьмите случайную последовательность из -случайные графы рисованием для некоторого фиксированного графона . Затем, как и в первом примере из этого раздела, оказывается, что сходится к почти наверняка.


Пример 6: Данный график с ассоциированным графоном , мы можем восстановить теоретико-графические свойства и параметры путем интеграции преобразований .

Например, плотность краев (т.е. средняя степень, деленная на количество вершин) дается интеграломЭто потому что является -значен, и каждое ребро в соответствует региону площади куда равно .

Аналогичные рассуждения показывают, что количество треугольников в равно

Понятия конвергенции

Существует много разных способов измерить расстояние между двумя графами. Если нас интересуют метрики, которые «сохраняют» экстремальные свойства графов, то мы должны ограничить наше внимание метриками, которые идентифицируют случайные графы как похожие. Например, если мы случайно нарисуем два графики независимо от модели Эрдеша – Реньи для некоторых фиксированных , расстояние между этими двумя графиками при "разумной" метрике должно быть близко к нулю с большой вероятностью для больших .

В этом смысле есть две естественные метрики, которые хорошо себя ведут на плотных случайных графах: первая - это метрика выборки, которая говорит, что два графа близки, если их распределения подграфов близки; вторая - это ребро. несоответствие метрика, которая говорит, что два графа близки, когда их плотности ребер близки на всех соответствующих им подмножествах вершин.

Чудесным образом последовательность графов сходится относительно одного расстояния именно тогда, когда она сходится относительно другого. Более того, предельные объекты на обоих расстояниях превращаются в графоны. Эквивалентность этих двух понятий сходимости отражает то, как различные понятия квази-случайность графики эквивалентны.[7]

Количество подграфов

Один из способов измерить расстояние между двумя графиками и заключается в сравнении их относительного количества подграфов, то есть для каждого графа мы можем сравнить количество копий в и в .Если эти числа близки для каждого графика , то интуитивно и похожи выглядящие графики.

Плотности гомоморфизма

Вместо того, чтобы иметь дело непосредственно с подграфами, проще работать с гомоморфизмами графов. Это нормально при работе с большими плотными графами, поскольку в этом сценарии количество подграфов и количество гомоморфизмов графов из фиксированного графа асимптотически равны .

Учитывая два графика и , то плотность гомоморфизма из в определяется как количество гомоморфизмы графов из к .Другими словами, - вероятность случайно выбранной карты из вершин в вершины отправляет соседние вершины в в соседние вершины в .

Графоны предлагают простой способ вычислить плотности гомоморфизмов. с ассоциированным графоном и другой , у нас есть

где интеграл многомерный, взятый по единичному гиперкубу Это следует из определения ассоциированного графона, учитывая, когда указанное выше подынтегральное выражение равно Затем мы можем распространить определение плотности гомоморфизмов на произвольные графоны , используя тот же интеграл и определяя

для любого графика .

Пределы плотности гомоморфизма

Учитывая эту схему, мы говорим, что последовательность графиков сходится, если для каждого фиксированного графа , последовательность плотностей гомоморфизмов сходится. Хотя это не очевидно из одного определения, если сходится в этом смысле, то всегда существует графон такой, что для каждого графа , у нас есть

одновременно.

Расстояние среза

Возьмите два графика и на одном и том же наборе вершин. Так как эти графы имеют одни и те же вершины, один из способов измерить расстояние между ними - ограничиться подмножествами множества вершин, и для каждого такого парного подмножества сравните количество ребер из к в к количеству ребер между и в .Если эти числа одинаковы для каждой пары подмножеств (относительно общего числа вершин), то это предполагает и подобные графики.

Чтобы формализовать это, для любой симметричной измеримой функции , определить сократить норму из быть количеством

взяты по всем измеримым подмножествам единичного интервала. [6]Эта норма отражает наше прежнее понятие расстояния, потому что для двух графиков и с таким же набором вершин размера , разрезанная норма с присоединенными графонами

позволяет вычислить максимальное расхождение плотностей кромок между и Обратите внимание, что это определение все еще можно использовать, даже если сравниваемые графы не имеют общего набора вершин.

Эта мера расстояния по-прежнему имеет одно существенное ограничение: она может назначать ненулевое расстояние двум изоморфным графам. Чтобы убедиться, что изоморфные графы имеют нулевое расстояние, мы должны вычислить минимальную норму разреза по всем возможным "перемаркировкам" вершин. Это мотивирует определение то отрезать расстояние между двумя графонами и быть

куда это состав с картой , и инфимум берется по всем сохраняющий меру биекций из единичного интервала в себя.[8]Расстояние разреза между двумя графами определяется как расстояние разреза между их ассоциированными графонами.

Как метрическое пространство

Чтобы превратить разрезанное расстояние в метрику, возьмем множество всех графонов и идентифицировать два графона в любое время Полученное пространство графонов обозначим , и вместе с образует метрическое пространство.

Это пространство оказывается компактный Более того, он содержит множество всех конечных графов в виде плотное подмножество Здесь графики обозначаются как -значные ступенчатые функции на единичном квадрате. Эти наблюдения показывают, что пространство графонов является завершение пространства графов относительно расстояния разреза.

Приложения

Лемма о регулярности

Используя компактность пространства графонов , можно доказать более сильные версии Лемма Семереди о регулярности.

Гипотеза Сидоренко

Аналитическая природа графонов обеспечивает большую гибкость в борьбе с неравенствами, связанными с гомоморфизмами.

Например, гипотеза Сидоренко - большая открытая проблема в экстремальная теория графов, который утверждает, что для любого графа на вершины со средней степенью (для некоторых ) и двудольный граф на вершины и ребер, количество гомоморфизмы из к по крайней мере .[9]Поскольку это количество - это ожидаемое количество помеченных подграфов в случайном графе , гипотезу можно интерпретировать как утверждение, что для любого двудольного графа , случайный граф достигает (в ожидании) минимального количества копий по всем графам с некоторой фиксированной плотностью ребер.

Многие подходы к гипотезе Сидоренко формулируют проблему как интегральное неравенство на графонах, которое затем позволяет атаковать проблему, используя другие аналитические подходы. [10]

Обобщения

Графоны естественным образом связаны с плотными простыми графами. Есть расширения этой модели на плотные ориентированные взвешенные графы, часто называемые декорированными графонами.[11] Существуют также недавние расширения режима разреженного графа с точки зрения моделей случайных графов. [12] и теория пределов графов.[13][14]

Рекомендации

  1. ^ а б Orbanz, P .; Рой, Д. (2015). «Байесовские модели графов, массивов и других взаимозаменяемых случайных структур». IEEE Transactions по анализу шаблонов и машинному анализу. 37 (2): 437–461. arXiv:1312.7857. Дои:10.1109 / тпами.2014.2334607. PMID  26353253.
  2. ^ Вулф, Патрик Дж .; Ольхеде, София К. (23 сентября 2013 г.). «Непараметрическая оценка графона». arXiv:1309.5936 [math.ST ].
  3. ^ Чой, Дэвид; Вулф, Патрик Дж. (Февраль 2014 г.). «Совместная кластеризация раздельно заменяемых сетевых данных». Анналы статистики. 42 (1): 29–63. arXiv:1212.4093. Дои:10.1214 / 13-AOS1173. ISSN  0090-5364.
  4. ^ Гао, Чао; Лу, Ю; Чжоу, Харрисон Х. (декабрь 2015 г.). «Скоростно-оптимальная графическая оценка». Анналы статистики. 43 (6): 2624–2652. arXiv:1410.5837. Дои:10.1214 / 15-AOS1354. ISSN  0090-5364.
  5. ^ Юань, Чжан; Елизавета, Левина; Цзи, Чжу (2017). «Оценка вероятностей границ сети с помощью сглаживания окрестностей». Биометрика. 104 (4): 771–783. Дои:10.1093 / biomet / asx042. ISSN  0006-3444.
  6. ^ а б Ловас, Л. Большие сети и пределы графа. Американское математическое общество.
  7. ^ Чунг, Фан Р. К.; Грэм, Рональд Л.; Уилсон, Р. М. (1989). «Квазислучайные графы». Комбинаторика. 9 (4): 345–362. Дои:10.1007 / BF02125347.CS1 maint: ref = harv (связь)
  8. ^ Гласскок, Д. (2015). «Что такое графон». Уведомления Американского математического общества. 62 (1): 46–48. arXiv:1611.00718.CS1 maint: ref = harv (связь)
  9. ^ Сидоренко, А. (1993). «Корреляционное неравенство для двудольных графов». Графы и комбинаторика. 9 (2–4): 201–204. Дои:10.1007 / BF02988307.CS1 maint: ref = harv (связь)
  10. ^ Хатами, Х. (2010). «Нормы графа и гипотеза Сидоренко». Израильский математический журнал. 175 (1): 125–150. arXiv:0806.0047. Дои:10.1007 / s11856-010-0005-1.CS1 maint: ref = harv (связь)
  11. ^ Вайшампаян, В.А. (2019). «Классификация в большой сети». arXiv:1902.05531 [cs.IT ].CS1 maint: ref = harv (связь)
  12. ^ Veitch, V .; Рой, Д. М. (2015). «Класс случайных графов, возникающих из заменяемых случайных мер». arXiv:1512.03099 [math.ST ].
  13. ^ Borgs, C .; Chayes, J. T .; Cohn, H .; Чжао, Ю. (2019). "An Lп теория сходимости разреженных графов I: пределы, модели разреженных случайных графов и степенные распределения ». Труды Американского математического общества. 372 (5): 3019–3062. arXiv:1401.2906. Дои:10.1090 / tran / 7543.
  14. ^ Borgs, C .; Chayes, J. T .; Cohn, H .; Чжао, Ю. (2018). "An Lп теория сходимости разреженных графов II: LD-сходимость, факторные и правая сходимость ». Анналы вероятности. 46 (2018): 337–396. arXiv:1408.0744. Дои:10.1214 / 17-AOP1187.