Конкурентное сожаление - Competitive regret

В теория принятия решений, конкурентное сожаление относительный сожалеть по сравнению с оракулом с ограниченной или неограниченной властью в процессе оценки распределения.

Соревновательное сожаление оракулу в полную силу

Рассмотрите возможность оценки дискретного распределение вероятностей на дискретном множестве на основе данных , сожаление оценщика[1] определяется как

куда - множество всех возможных распределений вероятностей, а

куда это Дивергенция Кульбака – Лейблера между и .

Конкурентное сожаление оракулу с ограниченной властью

Oracle с частичной информацией

Оракул ограничен доступом к частичной информации об истинном распределении зная местонахождение в пространстве параметров до раздела.[1] Учитывая раздел пространства параметров, и предположим, что оракул знает подмножество где правда . Оракул пожалеет, как

Конкурентное сожаление оракулу будет

Oracle с частичной информацией

Оракул точно знает , но может выбрать оценку только среди естественных оценок. Естественная оценка присваивает равную вероятность символам, которые появляются в выборке одинаковое количество раз.[1] Сожаление оракула

и конкурентное сожаление

Пример

Для оценщика предложено в Acharya et al. (2013),[2]

Здесь обозначает k-мерную единичную симплексную поверхность. Раздел обозначает класс перестановок на , куда и делятся на одно и то же подмножество тогда и только тогда, когда это перестановка .

Рекомендации

  1. ^ а б c Орлицкий, Алон; Суреш, Ананда Тиртха. (2015), Оценка конкурентного распределения, arXiv:1503.07940, Bibcode:2015arXiv150307940O
  2. ^ Ачарья, Джаядев; Джафарпур, Ашкан; Орлицкий, Алон; Суреш, Ананда Тирта (2013), «Оптимальная оценка вероятности с приложениями к прогнозированию и классификации», Материалы 26-й ежегодной конференции по теории обучения (COLT)