Валидность (статистика)


Валидность — это основная степень, в которой концепция , вывод или измерение являются обоснованными и, вероятно, точно соответствуют реальному миру. [1] [2] Слово «действительный» происходит от латинского «validus», что означает «сильный». Валидность инструмента измерения (например, теста в сфере образования) — это степень, в которой инструмент измеряет то, что, по его утверждению, должен измеряться. [3] Валидность основывается на силе совокупности различных типов доказательств (например, валидность по внешнему виду, валидность по конструкции и т. д.), более подробно описанных ниже.

В психометрии у валидности есть особое применение, известное как валидность теста : «степень, в которой доказательства и теория поддерживают интерпретацию результатов тестов» («что влечет за собой предлагаемое использование тестов»). [4]

Общепризнанно, что концепция научной достоверности обращается к природе реальности с точки зрения статистических измерений и как таковая является эпистемологическим и философским вопросом, а также вопросом измерения . Использование термина в логикеявляется более узким, относящимся к отношениям между посылками и заключением аргумента. В логике валидность относится к свойству аргумента, согласно которому, если посылки верны, истинность вывода следует по необходимости. Вывод аргумента является истинным, если аргумент обоснован, то есть если аргумент действителен и его посылки истинны. Напротив, «научная или статистическая достоверность» - это не дедуктивное утверждение, которое обязательно сохраняет истину, а индуктивное утверждение, которое остается истинным или ложным в неопределенном порядке. Вот почему «научная или статистическая достоверность» — это утверждение, которое квалифицируется либо как сильное, либо как слабое по своей природе, оно никогда не бывает необходимым и безусловно истинным. Это приводит к заявлениям о «научной или статистической достоверности».

Валидность важна, потому что она может помочь определить, какие типы тестов использовать, и помочь убедиться, что исследователи используют методы, которые не только этичны и рентабельны, но также и метод, который действительно измеряет рассматриваемую идею или конструкции.

Валидность [5] оценки – это степень, в которой она измеряет то, что должна измерять. Это не то же самое , что надежность , то есть степень, в которой измерение дает очень стабильные результаты. В пределах достоверности измерение не всегда должно быть одинаковым, как в отношении надежности. Однако только потому, что мера надежна, она не обязательно действительна. Например, весы с погрешностью в 5 фунтов надежны, но недействительны. Тест не может быть действительным, если он не надежен. Валидность также зависит от того, измеряет ли измерение то, для чего оно предназначено, а не что-то другое. [6] Валидность (аналогично надежности) является относительным понятием; достоверность не является идеей «все или ничего». Существует множество различных типов валидности.

Валидность конструкции относится к степени, в которой операционализация конструкции (например, практические тесты, разработанные на основе теории) измеряет конструкцию, определенную теорией. Он включает в себя все другие виды достоверности. Например, степень, в которой тест измеряет интеллект, является вопросом конструктной валидности. Мера интеллекта предполагает, среди прочего, что мера связана с вещами, с которыми она должна быть связана ( конвергентная валидность ), а не связана с вещами, с которыми она не должна быть связана ( дискриминантная валидность ). [7]