Клецкас тау - Kleckas tau - Wikipedia

Тау Клецка (τ) - статистика, которая используется для проверки того, классификация Анализ улучшает классификацию по группам по сравнению с случайным распределением по различным рассматриваемым группам.[1] Максимальное значение τ равно 1.0, что указывает на отсутствие ошибок в прогнозе. Нулевое значение указывает на отсутствие улучшений по сравнению со случайным назначением.

Распределение τ в настоящее время неизвестен и используется скорее как описательная, чем как аналитическая статистика.

Обоснование использования

Клецкой τ был разработан для использования с дискриминантный анализ. Необработанная точность дискриминантного анализа - сумма правильных прогнозов, деленная на общее количество наблюдений. Клецка отметил, что, хотя процент точно спрогнозированных случаев является наиболее интуитивным показателем дискриминации, о величине этого процента следует судить относительно ожидаемого процента правильных классификаций, сделанных путем случайного распределения. Пропорциональное уменьшение статистики ошибок (τ) можно рассчитать, дав стандартную меру улучшения по сравнению со случайным назначением, независимо от количества групп.

Математическая формулировка

τ определяется как[нужна цитата ]

куда пкорр правильно ли классифицировано количество случаев, пя количество дел в яth группа, N общее количество дел, Т количество групп и пя вероятность того, что случай будет случайно отнесен к этой группе (пя = 1 / Т ).

Использует

Помимо использования в дискриминантном анализе[2][3][4][5] он был использован в множественная регрессия анализ,[6] пробит регресс,[7] логистическая регрессия[8][9] и анализ изображений.[10]

Рекомендации

  1. ^ Клецка, WR (1980) Дискриминантный анализ. Sage Publications, Беверли-Хиллз
  2. ^ Murphy AMC (2002) Пяточная кость: половая оценка доисторических останков полинезийских скелетов Новой Зеландии. Судебно-медицинская экспертиза 129 (3) 205–208
  3. ^ Murphy AMC (1986) Определение пола с помощью анализа дискриминантной функции новозеландских полинезийских грудных поясов: приложения для судебной медицины. J Анат 149, 249-268
  4. ^ Тейлор Дж. В., Дибеннардо Р. (1984) Анализ дискриминантной функции центральной части безымянного. Am J Phys Anthropol 64 (3) 315–320
  5. ^ Стромберг М.Р. (1986) Систематика и охрана быстрой лисицы, Vulpes velox, в Северной Америке. Биологическое сохранение 35 (2) 97–110
  6. ^ Closea ME & Davies-Colley RJ (1990) Химический состав воды базового стока рек Новой Зеландии 2. Влияние факторов окружающей среды. NZ J Marine Freshwater Res 24 (3) 343-356
  7. ^ Khemani RS, Shapiro DM (1993) Эмпирический анализ канадской политики слияний. J Indust Econ 41 (2) 161-177
  8. ^ Датталоа П. (1995) Сравнение дискриминантного анализа и логистической регрессии. J Social Service Res 19 (3-4): 121-144
  9. ^ Biggerstaff MA (1992) Оценка устного экзамена при лицензировании клинических социальных работников Вирджинией. Res Social Work Practice 2 (2) 184-197 Дои:10.1177/104973159200200205
  10. ^ Jiang S, Liu D (2011) О мерах с поправкой на случайность для оценки точности классификации изображений дистанционного зондирования. Ежегодная конференция ASPRS 2011 г. Милуоки, Висконсин