Незаметность


В статистике игнорирование — это особенность плана эксперимента, при котором метод сбора данных (и характер отсутствующих данных) не зависит от отсутствующих данных. Механизм отсутствующих данных, такой как назначение лечения или стратегия выборки обследования, «игнорируется», если матрица отсутствующих данных, которая указывает, какие переменные наблюдаются или отсутствуют, не зависит от отсутствующих данных, зависящих от наблюдаемых данных.

Эта идея является частью модели причинного вывода Рубина , разработанной Дональдом Рубином в сотрудничестве с Полом Розенбаумом в начале 1970-х годов. Точное определение различается между их статьями того периода. В одной из статей Рубина 1978 года Рубин обсуждает игнорируемые механизмы назначения , [1] которые можно понять, поскольку способ распределения людей по лечебным группам не имеет значения для анализа данных, учитывая все, что записано об этом человеке. Позже, в 1983 г. [2] Рубин и Розенбаум скорее определяют строго игнорируемое назначение лечения , которое является более сильным условием, математически формулируемым как , гдепотенциальный результат лечения , некоторые ковариаты и фактическое лечение.

Перл [3] разработал простой графический критерий, называемый « черный ход », который влечет за собой игнорирование и идентифицирует наборы ковариат, которые достигают этого условия.

Игнорирование означает, что мы можем игнорировать то, как человек попал в одну группу по сравнению с другой («леченная» или «контрольная» ), когда дело доходит до потенциального результата (скажем ). Это также называют несмешанностью, отбором по наблюдаемым или отсутствием пропущенной переменной смещения. [4]

Формально это было записано как , или словами, потенциальный исход человека , если бы он лечился или нет, не зависит от того, действительно ли он (наблюдаемый) лечился или нет. Другими словами, мы можем игнорировать то, как люди оказались в одном или другом состоянии, и рассматривать их потенциальные результаты как взаимозаменяемые. Хотя это кажется толстым, становится ясно, если мы добавим нижние индексы для «реализованных» и верхние индексы для «идеальных» (потенциальных) миров ( обозначение , предложенное Дэвидом Фридманом ) . человека лечили (верхний индекс 1 ), тогда как на самом деле он лечился (Y 1 1 , нижний индекс1 ), или нет (*Y 0 1 : сигналы этой величины никогда не могут быть реализованы или наблюдаемы, или полностью противоречат действительности или контрфактичны, CF).