Конкурентное сожаление - Competitive regret
Эта статья поднимает множество проблем. Пожалуйста помоги Улучши это или обсудите эти вопросы на страница обсуждения. (Узнайте, как и когда удалить эти сообщения-шаблоны) (Узнайте, как и когда удалить этот шаблон сообщения)
|
В теория принятия решений, конкурентное сожаление относительный сожалеть по сравнению с оракулом с ограниченной или неограниченной властью в процессе оценки распределения.
Соревновательное сожаление оракулу в полную силу
Рассмотрите возможность оценки дискретного распределение вероятностей на дискретном множестве на основе данных , сожаление оценщика[1] определяется как
куда - множество всех возможных распределений вероятностей, а
куда это Дивергенция Кульбака – Лейблера между и .
Конкурентное сожаление оракулу с ограниченной властью
Oracle с частичной информацией
Оракул ограничен доступом к частичной информации об истинном распределении зная местонахождение в пространстве параметров до раздела.[1] Учитывая раздел пространства параметров, и предположим, что оракул знает подмножество где правда . Оракул пожалеет, как
Конкурентное сожаление оракулу будет
Oracle с частичной информацией
Оракул точно знает , но может выбрать оценку только среди естественных оценок. Естественная оценка присваивает равную вероятность символам, которые появляются в выборке одинаковое количество раз.[1] Сожаление оракула
и конкурентное сожаление
Пример
Для оценщика предложено в Acharya et al. (2013),[2]
Здесь обозначает k-мерную единичную симплексную поверхность. Раздел обозначает класс перестановок на , куда и делятся на одно и то же подмножество тогда и только тогда, когда это перестановка .
Рекомендации
- ^ а б c Орлицкий, Алон; Суреш, Ананда Тиртха. (2015), Оценка конкурентного распределения, arXiv:1503.07940, Bibcode:2015arXiv150307940O
- ^ Ачарья, Джаядев; Джафарпур, Ашкан; Орлицкий, Алон; Суреш, Ананда Тирта (2013), «Оптимальная оценка вероятности с приложениями к прогнозированию и классификации», Материалы 26-й ежегодной конференции по теории обучения (COLT)