Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

« Все модели ошибочны » - распространенный афоризм в статистике ; он часто расширяется как «Все модели неправильные, но некоторые полезны». Обычно считается, что он применим не только к статистическим моделям , но и к научным моделям в целом. Афоризм признает, что статистические или научные модели всегда не соответствуют сложности реальности, но все же могут быть полезны.

Афоризм обычно приписывают статистику Джорджу Боксу , хотя основная концепция возникла еще до его работ.

Цитаты Джорджа Бокса [ править ]

Первое упоминание Бокса о том, что «все модели ошибочны», содержится в статье 1976 года, опубликованной в Журнале Американской статистической ассоциации . [1] В статье 1976 года афоризм содержится дважды. Два раздела статьи, содержащие афоризм, скопированы ниже.

2.3 Экономия
Поскольку все модели ошибочны, ученый не может получить "правильную" путем чрезмерной проработки. Напротив, вслед за Вильгельмом Оккамом он должен искать экономичное описание природных явлений. Подобно тому, как способность создавать простые, но вызывающие воспоминания модели является отличительной чертой великого ученого, чрезмерная работа и чрезмерная параметризация часто являются признаком посредственности.
2.4. Избирательное беспокойство.

Поскольку все модели ошибочны, ученый должен осознавать, что в основном неверно. Неуместно беспокоиться о мышах, когда за границей водятся тигры.

Бокс повторил афоризм в статье, опубликованной в протоколе статистического семинара 1978 года. [2] В статье есть раздел, озаглавленный «Все модели ошибочны, но некоторые полезны». Раздел скопирован ниже.

Было бы очень замечательно, если бы любая система, существующая в реальном мире, могла быть точно представлена ​​какой-либо простой моделью. Однако хитро подобранные экономные модели часто действительно дают очень полезные приближения. Например, закон PV = RT, связывающий давление P, объем V и температуру T «идеального» газа через константу R, не совсем верен для любого реального газа, но он часто дает полезное приближение и, кроме того, его структура информативна, поскольку он проистекает из физического взгляда на поведение молекул газа. Для такой модели не нужно задавать вопрос «Верна ли модель?». Если «правда» должна быть «всей правдой», ответ должен быть «нет». Единственный интересующий вопрос: "Модель наглядна и полезна? ».

Бокс повторил афоризм еще дважды в своей книге 1987 года « Построение эмпирических моделей и поверхности отклика» (написанной в соавторстве с Норманом Дрейпером). [3] Первый повтор на стр. 74: «Помните, что все модели ошибочны; практический вопрос в том, насколько они должны быть неправильными, чтобы быть бесполезными». Второй повтор на стр. 424, выдержка из которой приводится ниже.

... все модели являются приблизительными. По сути, все модели ошибочны, но некоторые полезны. Однако всегда нужно иметь в виду примерный характер модели ....

Второе издание книги было опубликовано в 2007 году под названием « Поверхности отклика, смеси и анализ гребней» . Во втором издании афоризм также повторяется дважды в контексте, идентичном контексту первого издания (на стр. 63 и стр. 414). [4]

Бокс повторил афоризм еще два раза в своей книге 1997 года « Статистический контроль: путем мониторинга и корректировки с обратной связью» (в соавторстве с Альберто Лусеньо). [5] Первый повтор на стр. 6, выдержка из которой приводится ниже.

Было сказано, что «все модели ошибочны, но некоторые модели полезны». Другими словами, любая модель - это в лучшем случае полезная выдумка: никогда не было и никогда не будет точно нормального распределения или точной линейной зависимости. Тем не менее, огромный прогресс был достигнут в том, чтобы развлекать такие выдумки и использовать их как приблизительные.

Второй повтор на стр. 9: «Итак, поскольку все модели ошибочны, очень важно знать, о чем следует беспокоиться; или, говоря другими словами, какие модели могут создавать процедуры, которые работают на практике (где точные предположения никогда не верны)» .

Второе издание книги было опубликовано в 2009 году под названием « Статистический контроль путем мониторинга и корректировки» (в соавторстве с Альберто Лусеньо и Марией дель Кармен Паниагуа-Киньонес). Во втором издании афоризм также повторяется дважды. [6] Первый повтор на стр. 61, выдержка из которой приводится ниже.

Все модели являются приблизительными. Предположения, подразумеваемые или четко сформулированные, никогда не бывают точными. Все модели ошибочны, но некоторые модели полезны. Итак, вопрос, который вам нужно задать, заключается не в том, «Верна ли модель?» (этого никогда не бывает), но "Достаточно ли хороша модель для этого конкретного приложения?"

Второй повтор на стр. 63; его контекст по существу такой же, как и у второго повторения в первом издании.

Широко цитируемая книга Бокса « Статистика для экспериментаторов» (в соавторстве с Уильямом Хантером ) не включает афоризм в свое первое издание (опубликованное в 1978 году). [7] Второе издание (опубликовано в 2005 году; в соавторстве с Уильямом Хантером и Дж. Стюартом Хантером) включает афоризм трижды: на с. 208, стр. 384 и стр. 440. [8] На с. 440 соответствующее предложение звучит так: «Максимум, чего можно ожидать от любой модели, - это то, что она может дать полезное приближение к реальности: все модели ошибочны; некоторые модели полезны».

Помимо дословного изложения афоризма, Бокс иногда излагал суть афоризма разными словами. Один из примеров относится к 1978 году, когда Бокс был президентом Американской статистической ассоциации . На ежегодном собрании Ассоциации Бокс выступил с Посланием к Президенту, в котором заявил следующее: «Модели, конечно, никогда не бывают правдивыми, но, к счастью, необходимо только, чтобы они были полезными». [9]

Обсуждения [ править ]

По поводу афоризма были разные дискуссии. Выборка из этих обсуждений представлена ​​ниже.

В 1983 году статистики Питер МакКаллаг и Джон Нелдер опубликовали свою много цитируемую книгу об обобщенных линейных моделях . Книга включает краткое обсуждение афоризма (правда, без ссылки на бокс). [10] Второе издание книги, опубликованное в 1989 году, содержит очень похожее обсуждение афоризма. [11] Обсуждение из первого издания выглядит следующим образом.

Моделирование в науке остается, по крайней мере отчасти, искусством. Однако существуют некоторые принципы, которыми можно руководствоваться при моделировании. Во-первых, все модели ошибочны ; однако некоторые из них лучше других, и мы можем искать лучшие. В то же время мы должны признать, что вечная истина недоступна.

В 1995 году статистик сэр Дэвид Кокс прокомментировал это следующим образом. [12]

... не кажется полезным просто сказать, что все модели ошибочны. Само слово «модель» подразумевает упрощение и идеализацию. Идея о том, что сложные физические, биологические или социологические системы могут быть точно описаны несколькими формулами, явно абсурдна. Однако построение идеализированных представлений, охватывающих важные стабильные аспекты таких систем, является жизненно важной частью общенаучного анализа, и статистические модели, особенно существенные, не кажутся существенно отличными от других типов моделей.

В 1996 году было предложено «Кредо прикладного статистика». [13] Символ веры включает, в своей основной части, афоризм.

В 2002 г. К. П. Бернхэм и Д. Р. Андерсон опубликовали свою много цитируемую книгу по выбору статистических моделей . В книге говорится следующее. [14]

Модель - это упрощение или приближение реальности и, следовательно, не будет отражать всю реальность. ... Бокс отметил, что «все модели неправильные, но некоторые полезны». Хотя модель никогда не может быть «истиной», модель может быть ранжирована от очень полезной к полезной, от несколько полезной до, наконец, по существу бесполезной.

Статистик Дж. Майкл Стил прокомментировал афоризм следующим образом. [15]

... есть прекрасные модели - например, карты города ....

Если я говорю, что карта неправильная, это означает, что здание неправильно названо или неправильно обозначено направление улицы с односторонним движением. Я никогда не ожидал, что моя карта воссоздает всю физическую реальность, и я чувствую себя сорванным только в том случае, если моя карта неправильно отвечает на вопросы, на которые она претендует.

Мои карты Филадельфии мне пригодятся. Более того, за исключением нескольких устаревших, они не ошибаются .

Итак, вы говорите: «Да, карту можно рассматривать как модель, но, конечно, было бы точнее сказать, что карта - это« визуально улучшенная база данных ». Такие базы данных могут быть правильными. Это не те модели, которые имел в виду Бокс ".

Я согласен. ...

В 2008 году на это ответил статистик Эндрю Гельман , заявив, в частности, следующее. [16]

Я принимаю его общую точку зрения о том, что карта улиц может быть совершенно правильной с учетом разрешения карты.

... Поговорка "все модели ошибочны" полезна, потому что она не совсем очевидна ....

Это простой момент, и я вижу, как Стила могут раздражать люди, придававшие ему большое значение. Но проблема в том, что многие люди не понимают, что все модели ошибочны.

В 2013 году философ науки Питер Труран опубликовал эссе, связанное с афоризмом. [17] В эссе, в частности, отмечается следующее.

... на первый взгляд несовместимые модели могут использоваться для предсказания одного и того же явления. ... Для каждой модели мы можем полагать, что ее предсказательная сила указывает на ее истинность, по крайней мере, приблизительно. Но если обе модели успешно делают прогнозы, но при этом несовместимы друг с другом, как они обе могут быть правдой? Рассмотрим простую иллюстрацию. Два наблюдателя смотрят на физический объект. Один может сообщить о круглом диске, а другой - о прямоугольнике. Оба будут правильными, но один будет смотреть на объект (цилиндрическую банку) сверху, а другой - сбоку. Две модели представляют разные аспекты одной и той же реальности.

В эссе Трурана далее отмечается, что теория гравитации Ньютона была вытеснена теорией относительности Эйнштейна, и все же теория Ньютона остается в целом «эмпирически адекватной». Действительно, теория Ньютона обычно обладает превосходной предсказательной силой. И все же теория Ньютона не является приближением теории Эйнштейна. Для иллюстрации рассмотрим яблоко, падающее с дерева. Согласно теории Ньютона, яблоко падает, потому что Земля оказывает на яблоко силу - то, что называется «силой тяжести». Согласно теории Эйнштейна, Земля не оказывает никакого воздействия на яблоко. [18] Следовательно, теория Ньютона может рассматриваться как в некотором смысле полностьюнеправильно, но чрезвычайно полезно. (Полезность теории Ньютона частично объясняется тем, что она намного проще, как математически, так и вычислительно, чем теория Эйнштейна.)

В 2014 году статистик Дэвид Хэнд сделал следующее заявление. [19]

В общем, при построении статистических моделей мы не должны забывать, что цель состоит в том, чтобы понять что-то о реальном мире. Или предсказать, выбрать действие, принять решение, обобщить свидетельства и т. Д., Но всегда в отношении реального мира, а не абстрактного математического мира: наши модели не являются реальностью - это хорошо подмечено Джорджем Боксом в его часто цитируемой работе. замечание, что «все модели неправильные, но некоторые полезны».

В 2016 году П. Дж. Бикель и К. А. Доксум опубликовали второй том своей книги по математической статистике . Том включает цитату из Послания Президента Бокса, приведенного выше. В нем говорится, что цитата является наилучшей формулировкой «руководящего принципа современной статистики». [20]

Кроме того, в 2011 году в Нидерландах был проведен семинар по выбору модели. Мастерская называлась «Все модели неправильные ...». [21]

Исторические предшественники [ править ]

Хотя кажется, что афоризм возник у Джорджа Бокса, основная концепция восходит к десятилетиям, а может и столетиям. Некоторые примеры этого приведены ниже.

В 1960 году Георг Раш сказал следующее.

… Нет [истинных] моделей - даже законов Ньютона. При построении модели вы упускаете из виду все детали, которые вы, имея в своем распоряжении знания, считаете несущественными…. Модели не должны быть правдивыми, но важно, чтобы они были применимы , и, конечно, необходимо исследовать , применимы ли они для какой-либо конкретной цели. Это также означает, что модель никогда не принимается окончательно, только на пробах.

-  Раш, Г. (1960), Вероятностные модели для некоторых тестов на интеллект и достижения , Копенгаген: Danmarks Paedagogiske Institut, стр. 37–38.; переиздан в 1980 году издательством Чикагского университета.

В 1947 году математик Джон фон Нейман сказал, что «истина ... слишком сложна, чтобы допускать что-либо, кроме приближений». [22]

В 1942 году французский поэт-философ Поль Валери сказал следующее. [23]

В 1939 году основатель статистического управления процессом , Вальтер Шухарт , сказал следующее. [25]

… Никакая модель никогда не может быть теоретически достижимой, которая полностью и однозначно характеризует бесконечно расширяемую концепцию состояния статистического контроля. Что, возможно, даже более важно, на основе конечной части последовательности [ X 1 , X 2 , X 3 ,…] - а у нас никогда не может быть больше, чем конечная часть - мы не можем разумно надеяться построить модель это будет точно отражать любую конкретную характеристику конкретного состояния контроля, даже если такое состояние действительно существует. Здесь ситуация очень похожа на ситуацию в физической науке, где мы находим модель молекулы; любая модель всегда является неполной, но полезной картиной задуманного физического объекта, называемого молекулой.

-  Шухарт, Вашингтон (1939), Статистический метод с точки зрения контроля качества , Министерство сельского хозяйства США , стр. 19

В 1923 году похожую идею высказал художник Пабло Пикассо .

Все мы знаем, что искусство - это не правда. Искусство - это ложь, которая заставляет нас осознать истину, по крайней мере, истину, которую нам дано понять. Художник должен знать, как убедить других в правдивости своей лжи.

-  Пикассо, Пабло (1923), «Пикассо говорит», Искусство , 3 : 315–326.; [26] перепечатано в Barr, Alfred H., Jr. (1939), Picasso: Forty Years of его Art (PDF) , Museum of Modern Art , pp. 9–12

См. Также [ править ]

  • Квартет анскомба
  • Парадокс Бонини
  •  Связь между картой и территорией - связь между объектом и представлением этого объекта.
  • Прагматизм  - философское движение
  • Реификация (заблуждение)  - заблуждение, заключающееся в том, что абстракция рассматривается как реальная вещь.
  • Научное моделирование  - Научная деятельность
  • Статистическая модель
  • Статистическая проверка модели

Заметки [ править ]

  1. ^ Box, ПВС (1976), "Наука и статистика" (PDF) , журнал Американской ассоциации по статистике , 71 (356): 791-799, DOI : 10,1080 / 01621459.1976.10480949 .
  2. ^ Box, GEP (1979), «Устойчивость стратегии построения научных моделей», в Launer, RL; Уилкинсон, GN (ред . ), Грубости в области статистики , Academic Press ., Стр 201-236, DOI : 10.1016 / B978-0-12-438150-6.50018-2 , ISBN 9781483263366.
  3. ^ Коробка, GEP; Дрейпер, Н.Р. (1987), Поверхности для построения эмпирических моделей и отклика , John Wiley & Sons.
  4. ^ Коробка, GEP; Дрейпер, Н.Р. (2007), Поверхности отклика, смеси и анализ гребней , John Wiley & Sons.
  5. ^ Коробка, GEP; Лусеньо, А. (1997), Статистический контроль: путем мониторинга и корректировки обратной связи , John Wiley & Sons.
  6. ^ Коробка, GEP; Luceño, A .; дель Кармен Паниагуа-Киньонес, М. (2009), Статистический контроль путем мониторинга и корректировки , John Wiley & Sons.
  7. ^ Коробка, GEP; Хантер, WG (1978), Статистика для экспериментаторов , John Wiley & Sons.
  8. ^ Коробка, GEP; Хантер, JS; Хантер, WG (2005), Статистика для экспериментаторов (2-е изд.), John Wiley & Sons.
  9. ^ Box, ПВС (1979), "Некоторые вопросы статистики и повседневная жизнь", журнал Американской ассоциации по статистике , 74 (365): 1-4, DOI : 10,2307 / 2286713 , JSTOR 2286713 .
  10. ^ McCullagh, P .; Нелдер, Дж. А. (1983), Обобщенные линейные модели , Чепмен и Холл , §1.1.4.
  11. ^ McCullagh, P .; Нелдер, Дж. А. (1989), Обобщенные линейные модели (второе изд.), Чепмен и Холл , §1.1.4.
  12. ^ Cox, DR (1995), «Комментарий к« Неопределенности модели, интеллектуальному анализу данных и статистическому выводу » », Журнал Королевского статистического общества, серия A , 158 : 455–456.
  13. ^ Нестер, MR (1996), "Прикладная вероучение статистиков" (PDF) , Журнал Королевского статистического общества, серия C , 45 (4): 401-410, DOI : 10,2307 / 2986064 , JSTOR 2986064  .
  14. ^ Бернхэм, КП; Андерсон, Д.Р. (2002), Выбор модели и многомодельный вывод: практический теоретико-информационный подход (2-е изд.), Springer-Verlag , §1.2.5. [По состоянию на октябрь 2019 года объединенные издания этой книги имеют более 48000 цитирований в Google Scholar .]
  15. ^ Стил, JM, « Модели: шедевры и хромые отговорки ».
  16. Гельман, А. (12 июня 2008 г.), « Некоторые мысли по поводу поговорки« Все модели ошибочны, но некоторые полезны » ».
  17. ^ Труран П. (2013), «Модели: полезные, но не верные», « Практическое применение философии науки» , SpringerBriefs in Philosophy, Springer , стр. 61–67, doi : 10.1007 / 978-3-319-00452- 5_10 , ISBN 978-3-319-00451-8.
  18. ^ Согласно теории относительности Эйнштейна , основная причина падения яблока заключается в том, что Земля искажает время, так что часы у основания дерева идут медленнее, чем часы высоко на дереве; есть также вторичная причина, которая заключается в том, что Земля искривляет пространство. Эмпирические доказательства теории Эйнштейна является чрезвычайно сильным, например , GPS основана на теории Эйнштейна, и он не будет работатьесли он опирался на теорию Ньютона ( Эшби 2002 ).
  19. Hand, DJ (2014), «Замечательные примеры, но давайте не закрывать глаза», Statistical Science , 29 : 98–100, arXiv : 1405.4986 , doi : 10.1214 / 13-STS446.
  20. ^ Bickel, PJ; Доксум, К.А. (2016), Математическая статистика , II , Чепмен и Холл , стр. 2.
  21. ^ Остроумие, E .; van den Heuvel, E .; Romeijn, J.-W. (2012), " ' Все модели неправильны ...': введение в модели неопределенности" (PDF) , Statistica Neerlandica , 66 (3): 217-236, DOI : 10.1111 / j.1467-9574.2012.00530.x . [См. Также веб-страницу мастерской: « Все модели неправильные ... ».]
  22. ^ фон Нейман, Дж. (1947), «Математик», в Haywood, RB (ed.), Works of the Mind , University of Chicago Press , стр. 180–196.; переиздано в 1995 году Броди Ф., Вамосом Т. (редакторы), The Neumann Compendium , World Scientific , p. 618–626.
  23. ^ Связь цитаты Валери с афоризмом «все модели ошибочны» отмечали различные авторы, например Ванкат (2013 , §1.7).
  24. ^ Некоторые авторы дали разные английские переводы, например, Валери (1970 , стр. 466), Вольфсон и Мерфи (1998) и Ванкат (2013 , §1.7). Представленный здесь перевод предоставлен Google Translate ; в нем есть только одно слово, отличное от перевода Вольфсона и Мерфи: «Что» вместо «Что угодно» (оба раза).
  25. ^ Связь цитаты Шухарта с афоризмом «все модели ошибочны» отмечают Fricker & Woodall (2016) .
  26. ^ Цитата была первоначально дана на испанском языке (во время интервью Мариуса де Заяса ); цитируемая публикация на английском языке.

Ссылки [ править ]

  • Эшби, Н. (2002), «Относительность и глобальная система позиционирования» (PDF) , Physics Today , 55 (5): 41–47, Bibcode : 2002PhT .... 55e..41A , doi : 10.1063 / 1.1485583.
  • Fricker, RD, Jr .; Woodall, WH (2016), "Play это снова и снова, Сэм", Значение , 13 (4): 46, DOI : 10.1111 / j.1740-9713.2016.00944.x.
  • Валери, Поль (1970), Собрание сочинений Поля Валери, Том 14 - Аналитики , переведенный Стюартом Гилбертом , Princeton University Press.
  • Ванкат, Дж. Л. (2013), Динамика растительности в горах и плато на юго-западе Америки , Springer.
  • Вольфсон, MC; Мерфи, BB (апрель 1998 г.), «Новые взгляды на тенденции неравенства» (PDF) , Monthly Labor Review : 3–23.

Дальнейшее чтение [ править ]

  • Андерсон, К. (23 июня 2008 г.), « Конец теории », Wired
  • Box, GEP (1999), «Статистика как катализатор обучения научным методом, часть II - обсуждение», Journal of Quality Technology , 31 : 16–29, doi : 10.1080 / 00224065.1999.11979890
  • Saltelli, A .; Фунтович, С. (Зима 2014 г.), « Когда все модели ошибочны », Проблемы науки и техники , 30

Внешние ссылки [ править ]

  • «Все модели верны, большинство из них бесполезны» - блог Эндрю Гельмана
  • Все модели ошибочны - блог Питера Коулза
  • Все модели неправильные? —Блог теории, эволюции и игр