Кендаллс (Ж) - Kendalls W - Wikipedia
Кендалла W (также известный как Коэффициент соответствия Кендалла) это непараметрическая статистика. Это нормализация статистики Тест Фридмана, и может использоваться для оценки согласия между оценщиками. Кендалла W варьируется от 0 (нет согласия) до 1 (полное согласие).
Предположим, например, что нескольких людей попросили расположить список политических проблем от наиболее важных до наименее важных. Кендалла W можно рассчитать по этим данным. Если тестовая статистика W равно 1, то все респонденты были единодушны, и каждый респондент присвоил один и тот же порядок списку проблем. Если W равно 0, то общая тенденция согласия между респондентами отсутствует, и их ответы можно рассматривать как по существу случайные. Промежуточные значения W указывают на большую или меньшую степень единодушия среди различных ответов.
При тестировании по стандартной Коэффициент корреляции Пирсона предполагать нормально распределенный значения и сравнивать две последовательности результатов за раз, Кендалл W не делает никаких предположений относительно природы распределение вероятностей и может обрабатывать любое количество различных результатов.
Определение
Предположим, что объект я получает звание ря, j по номеру судьи j, где всего п объекты и м судьи. Тогда общий рейтинг, присвоенный объекту я является
и среднее значение этих общих рангов равно
Сумма квадратов отклонений, S, определяется как
а затем Кендалла W определяется как[1]
Если тестовая статистика W равно 1, то все судьи или респонденты были единодушны, и каждый судья или респондент присвоили одинаковый порядок списку объектов или проблем. Если W равно 0, то общая тенденция согласия между респондентами отсутствует, и их ответы можно рассматривать как по существу случайные. Промежуточные значения W указывают на большую или меньшую степень единодушия среди различных судей или респондентов.
Кендалл и Гиббонс (1990) также показывают W линейно связана со средним значением Коэффициенты ранговой корреляции Спирмена между всеми возможные пары ранжирования судей
Неполные блоки
Когда судьи оценивают только некоторую часть п объекты, а когда соответствующая конструкция блока является (n, m, r, p, λ) -конструкция (обратите внимание на другие обозначения). Другими словами, когда
- каждый судья имеет одинаковый номер п объектов для некоторых ,
- каждый объект имеет одинаковое общее количество р раз,
- и каждая пара объектов представлена какому-либо судье вместе ровно λ раз, , постоянная для всех пар.
Затем Кендалл W определяется как [2]
Если и так что каждый судья оценивает все п объектов, приведенная выше формула эквивалентна исходной.
Исправление галстуков
Когда имеют место равные значения, каждому из них дается среднее значение рангов, которое было бы присвоено, если бы не было ничьей. Например, набор данных {80,76,34,80,73,80} имеет значения 80, привязанные к 4-му, 5-му и 6-му месту; поскольку среднее значение {4,5,6} = 5, ранги будут присвоены значениям необработанных данных следующим образом: {5,3,1,5,2,5}.
Эффект от галстуков - снижение стоимости W; однако этот эффект невелик, если нет большого количества связей. Чтобы исправить связи, присвойте ранги связанным значениям, как указано выше, и вычислите поправочные коэффициенты
куда тя количество связанных рангов в я-я группа связанных рангов (где группа - это набор значений, имеющих постоянный (связанный) ранг) и граммj количество групп связей в наборе рангов (от 1 до п) для судьи j. Таким образом, Тj поправочный коэффициент, необходимый для набора рангов судьи j, т.е. j-й набор рангов. Обратите внимание: если у судьи нет равных рангов j, Тj равно 0.
С поправкой на связи формула для W становится
куда ря это сумма рангов объекта я, и это сумма значений Тj общий м наборы рангов.[3]
Тесты на значимость
В случае полных рангов обычно используется критерий значимости для W против нулевой гипотезы о несогласии (то есть случайного ранжирования) приводится Кендаллом и Гиббонсом (1990)[4]
Где тестовая статистика принимает распределение хи-квадрат с степени свободы.
В случае неполного ранжирования (см. Выше) это становится
Где снова есть степени свободы.
Legendre[5] сравнил с помощью моделирования мощность хи-квадрат и перестановочное тестирование подходы к определению значимости для Кендалла W. Результаты показали, что метод хи-квадрат был чрезмерно консервативным по сравнению с тестом перестановки, когда . Мароцци[6] расширил это, также учитывая F тест, предложенный в оригинальной публикации, представляющей W статистика Кендалла и Бабингтона Смита (1939):
Если статистика теста соответствует F-распределению с и степени свободы. Мароцци нашел F test работает примерно так же, как метод проверки перестановки, и может быть предпочтительнее, когда мала, так как в вычислительном отношении проще.
Смотрите также
Примечания
- ^ Dodge (2003): см. «Соответствие, коэффициент»
- ^ Гиббонс и Чакраборти (2003)
- ^ Сигель и Кастеллан (1988, с. 266)
- ^ Кендалл, Морис Г. (Морис Джордж), 1907-1983 гг. (1990). Методы ранговой корреляции. Гиббонс, Жан Дикинсон, 1938- (5-е изд.). Лондон: Э. Арнольд. ISBN 0195208374. OCLC 21195423.CS1 maint: несколько имен: список авторов (связь)
- ^ Легендр (2005)
- ^ Мароцци, Марко (2014). «Проверка соответствия между несколькими критериями». Журнал статистических вычислений и моделирования. 84 (9): 1843–1850. Дои:10.1080/00949655.2013.766189.
Рекомендации
- Kendall, M. G .; Бабингтон Смит, Б. (сентябрь 1939 г.). "Проблема м Рейтинги ». Анналы математической статистики. 10 (3): 275–287. Дои:10.1214 / aoms / 1177732186. JSTOR 2235668.
- Кендалл, М. Г., и Гиббонс, Дж. Д. (1990). Методы ранговой корреляции. Нью-Йорк, Нью-Йорк: Издательство Оксфордского университета.
- Кордер, Г.В., Форман, Д.И. (2009). Непараметрическая статистика для нестатистиков: пошаговый подход Вайли, ISBN 978-0-470-45461-9
- Додж, Ю. (2003). Оксфордский словарь статистических терминов, ОУП. ISBN 0-19-920613-9
- Лежандр, П. (2005) Видовые ассоциации: пересмотр коэффициента соответствия Кендалла. Журнал сельскохозяйственной, биологической и экологической статистики, 10(2), 226–245. [1]
- Сигел, Сидней; Кастеллан, Н. Джон, младший (1988). Непараметрическая статистика для поведенческих наук (2-е изд.). Нью-Йорк: Макгроу-Хилл. п. 266. ISBN 978-0-07-057357-4.
- Гиббонс, Джин Дикинсон; Чакраборти, Субхабрата (2003). Непараметрический статистический вывод (4-е изд.). Нью-Йорк: Марсель Деккер. С. 476–482. ISBN 978-0-8247-4052-8.