Средний блеск - Median polish
В средний полироль простой и надежный разведочный анализ данных процедура, предложенная статистиком Джон Тьюки. Цель средний полироль состоит в том, чтобы найти аддитивно подходящую модель для данных в таблице двустороннего макета (обычно это результат факторный эксперимент ) эффекта строки формы + эффект столбца + общая медиана.
Средний блеск использует медианы, полученные из строк и столбцов двусторонней таблицы, для итеративного расчета эффекта строки и столбца на данные. Предполагается, что результаты не будут чувствительны к выбросам, поскольку итерационная процедура использует медианы, а не средние значения.
Модель для двустороннего стола
Предположим, что эксперимент наблюдает за переменной Y под влиянием двух переменных. Мы можем расположить данные в двухсторонней таблице, в которой одна переменная постоянна по строкам, а другая переменная постоянна по столбцам. Позволять я и j обозначают положение строк и столбцов (например, уij обозначает значение у на яй ряд и j-й столбец). Тогда мы можем получить простое уравнение линейной регрессии:
куда б0, б1, б2 - константы, а Икся и zj - значения, связанные со строками и столбцами соответственно.
Уравнение можно упростить, если нет Икся и zj значения представлены для анализа:
куда cя и dj обозначают эффекты строки и эффекты столбца соответственно.
Процедура
Выполнить средний полироль:
(1) найдите медианы строк для каждой строки, найдите медиану медиан строк, запишите это как общий эффект.
(2) вычтите каждый элемент в строке на его медианное значение, сделайте это для всех строк.
(3) вычесть общий эффект от медианы каждой строки.
(4) сделайте то же самое для каждого столбца и добавьте общий эффект от операций со столбцами до общий эффект генерируется из строковых операций.
(5) повторяйте (1) - (4), пока не произойдет незначительное изменение медианы строки или столбца.
Рекомендации
- Фредерик Мостеллер и Джон Тьюки (1977). «Анализ данных и регрессия». Ридинг, Массачусетс: Эддисон-Уэсли. ISBN 0-201-04854-X.
- Дж. Д. Эмерсон и Д. К. Хоглин (1983). «Анализ двусторонних таблиц по медианам». В «Понимании надежного и исследовательского анализа данных», редакторы Д. К. Хоглин, Ф. Мостеллер и Дж. У. Тьюки. Нью-Йорк: Джон Уайли и сыновья. ISBN 0-471-38491-7. С. 165–210.
- Уильям Н. Венейблс и Брайан Д. Рипли (2002). Статистические дополнения к современной прикладной статистике с помощью S, стр.4–5. ISBN 0-387-95457-0.
- Анвар Фитрианто, Хари Виджаянто, Сохель Рана и Чеонг Йи Вун (2014). «Средний уровень польского для выпускных оценок курсов уровней MTH3000 и MTH4000». Прикладные математические науки, Vol. 8, вып. 126, стр. 6295-6302.