Средний блеск - Median polish

В средний полироль простой и надежный разведочный анализ данных процедура, предложенная статистиком Джон Тьюки. Цель средний полироль состоит в том, чтобы найти аддитивно подходящую модель для данных в таблице двустороннего макета (обычно это результат факторный эксперимент ) эффекта строки формы + эффект столбца + общая медиана.

Средний блеск использует медианы, полученные из строк и столбцов двусторонней таблицы, для итеративного расчета эффекта строки и столбца на данные. Предполагается, что результаты не будут чувствительны к выбросам, поскольку итерационная процедура использует медианы, а не средние значения.

Модель для двустороннего стола

Предположим, что эксперимент наблюдает за переменной Y под влиянием двух переменных. Мы можем расположить данные в двухсторонней таблице, в которой одна переменная постоянна по строкам, а другая переменная постоянна по столбцам. Позволять я и j обозначают положение строк и столбцов (например, уij обозначает значение у на яй ряд и j-й столбец). Тогда мы можем получить простое уравнение линейной регрессии:

куда б0, б1, б2 - константы, а Икся и zj - значения, связанные со строками и столбцами соответственно.

Уравнение можно упростить, если нет Икся и zj значения представлены для анализа:

куда cя и dj обозначают эффекты строки и эффекты столбца соответственно.

Процедура

Выполнить средний полироль:

(1) найдите медианы строк для каждой строки, найдите медиану медиан строк, запишите это как общий эффект.

(2) вычтите каждый элемент в строке на его медианное значение, сделайте это для всех строк.

(3) вычесть общий эффект от медианы каждой строки.

(4) сделайте то же самое для каждого столбца и добавьте общий эффект от операций со столбцами до общий эффект генерируется из строковых операций.

(5) повторяйте (1) - (4), пока не произойдет незначительное изменение медианы строки или столбца.


Рекомендации

  • Фредерик Мостеллер и Джон Тьюки (1977). «Анализ данных и регрессия». Ридинг, Массачусетс: Эддисон-Уэсли. ISBN  0-201-04854-X.
  • Дж. Д. Эмерсон и Д. К. Хоглин (1983). «Анализ двусторонних таблиц по медианам». В «Понимании надежного и исследовательского анализа данных», редакторы Д. К. Хоглин, Ф. Мостеллер и Дж. У. Тьюки. Нью-Йорк: Джон Уайли и сыновья. ISBN  0-471-38491-7. С. 165–210.
  • Уильям Н. Венейблс и Брайан Д. Рипли (2002). Статистические дополнения к современной прикладной статистике с помощью S, стр.4–5. ISBN  0-387-95457-0.
  • Анвар Фитрианто, Хари Виджаянто, Сохель Рана и Чеонг Йи Вун (2014). «Средний уровень польского для выпускных оценок курсов уровней MTH3000 и MTH4000». Прикладные математические науки, Vol. 8, вып. 126, стр. 6295-6302.