Средние польский простой и надежная разведочный анализ данных процедура , предложенный статистик Джон Тьюки . Цель полировки медианы - найти аддитивно подходящую модель для данных в двухсторонней таблице макета (обычно результаты факторного эксперимента ): эффект строки формы + эффект столбца + общая медиана.
Полировка медианы использует медианы, полученные из строк и столбцов двусторонней таблицы, для итеративного вычисления эффекта строки и эффекта столбца на данных. Предполагается, что результаты не чувствительны к выбросам, поскольку итерационная процедура использует медианы, а не средние значения.
Модель двустороннего стола [ править ]
Предположим, что эксперимент наблюдает за переменной Y под влиянием двух переменных. Мы можем расположить данные в двухсторонней таблице, в которой одна переменная постоянна по строкам, а другая переменная постоянна по столбцам. Пусть i и j обозначают положение строк и столбцов (например, y ij обозначает значение y в i- й строке и j- м столбце). Тогда мы можем получить простое уравнение линейной регрессии:
где b 0 , b 1 , b 2 - константы, а x i и z j - значения, связанные со строками и столбцами, соответственно.
Уравнение можно еще больше упростить, если для анализа отсутствуют значения x i и z j :
где c i и d j обозначают эффекты строки и эффекты столбца соответственно.
Процедура [ править ]
Чтобы провести среднюю полировку :
(1) найдите медианы строк для каждой строки, найдите медиану медиан строк, запишите это как общий эффект .
(2) вычтите каждый элемент в строке на его медианное значение, сделайте это для всех строк.
(3) вычтите общий эффект из медианы каждой строки.
(4) сделайте то же самое для каждого столбца и добавьте общий эффект от операций с столбцом к общему эффекту, создаваемому операциями со строками.
(5) повторяйте (1) - (4) до тех пор, пока не произойдет незначительное изменение медианы строки или столбца.
Ссылки [ править ]
- Фредерик Мостеллер и Джон Тьюки (1977). «Анализ данных и регрессия». Ридинг, Массачусетс : Эддисон-Уэсли . ISBN 0-201-04854-X .
- JD Emerson и DC Hoaglin (1983). «Анализ двусторонних таблиц по медианам». В «Понимании надежного и исследовательского анализа данных», редакторы Д.К. Хоаглин, Ф. Мостеллер и Дж. У. Тьюки. Нью-Йорк : Джон Вили и сыновья . ISBN 0-471-38491-7 . С. 165–210.
- Уильям Н. Венейблс и Брайан Д. Рипли (2002). Статистические дополнения к современной прикладной статистике с помощью S , стр.4–5. ISBN 0-387-95457-0 .
- Анвар Фитрианто, Хари Виджаянто, Сохель Рана и Чеонг Йи Вун (2014). «Средний уровень польского для выпускных оценок курсов уровней MTH3000 и MTH4000». Прикладные математические науки, Vol. 8, вып. 126, стр. 6295-6302.