Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В математике и статистике , то среднее арифметическое ( / ˌ æ г ɪ & thetas ; м ɛ т ɪ к м я п / , напряжение на первом и третьем слогах «арифметика»), или просто среднее или среднее (когда контекст ясно), представляет собой сумму набора чисел, деленную на количество чисел в коллекции. [1] Коллекция часто представляет собой набор результатов эксперимента или наблюдательного исследования , или часто набор результатов опрос . Термин «среднее арифметическое» является предпочтительным в некоторых контекстах в области математики и статистики, поскольку она помогает отличить его от других средств , таких , как среднее геометрическое и гармоническое среднее .

Помимо математики и статистики, среднее арифметическое часто используется во многих различных областях, таких как экономика , антропология и история , и в той или иной степени оно используется почти во всех академических областях. Например, доход на душу населения - это средний арифметический доход населения страны.

Хотя среднее арифметическое часто используется для определения основных тенденций , это не надежная статистика , а это означает, что на нее сильно влияют выбросы (значения, которые намного больше или меньше, чем большинство значений). Для асимметричных распределений , таких как распределение доходов, при котором доходы нескольких людей значительно превышают доходы большинства людей, среднее арифметическое может не совпадать с понятием «среднего», а надежная статистика, такая как медиана , может дать лучшее описание. центральной тенденции.

Определение [ править ]

Учитывая набор данных , то среднее арифметическое (или среднее или среднее ), обозначаемое [2] (считывание штрих ), представляет собой среднее из значений . [3]

Среднее арифметическое - это наиболее часто используемый и понятный показатель центральной тенденции в наборе данных. В статистике термин « среднее» относится к любому из показателей центральной тенденции. Среднее арифметическое для набора наблюдаемых данных определяется как сумма числовых значений каждого и каждого наблюдения, деленная на общее количество наблюдений. Символически, если у нас есть набор данных, состоящий из значений , то среднее арифметическое определяется формулой:

[4]

(объяснение оператора суммирования см . в разделе « Суммирование» .)

Например, рассмотрим ежемесячную зарплату 10 сотрудников фирмы: 2500, 2700, 2400, 2300, 2550, 2650, 2750, 2450, 2600, 2400. Среднее арифметическое:

Если набор данных является статистической совокупностью (т. Е. Состоит из всех возможных наблюдений, а не только их подмножества), то среднее значение этой совокупности называется средним значением совокупности и обозначается греческой буквой . [2] Если набор данных представляет собой статистическую выборку (подмножество генеральной совокупности), то мы называем статистику, полученную в результате этого вычисления, выборочным средним (которое для набора данных обозначается как [2] ).

Среднеарифметическое значение может быть аналогично определено для векторов в нескольких измерениях, а не только для скалярных значений; это часто называют центроидом . В более общем смысле, поскольку среднее арифметическое представляет собой выпуклую комбинацию (сумма коэффициентов равна 1), его можно определить в выпуклом пространстве , а не только в векторном пространстве.

Мотивирующие свойства [ править ]

Среднее арифметическое имеет несколько свойств, которые делают его полезным, особенно в качестве меры центральной тенденции. К ним относятся:

  • Если числа имеют среднее значение , то . Поскольку это расстояние от данного числа до среднего, один из способов интерпретировать это свойство - сказать, что числа слева от среднего уравновешиваются числами справа от среднего. Среднее значение - это единственное число, для которого сумма остатков (отклонений от оценки) равна нулю.
  • Если требуется использовать одно число в качестве "типичного" значения для набора известных чисел , то лучше всего это делает среднее арифметическое чисел в смысле минимизации суммы квадратов отклонений от типичного значения: суммы оф . (Отсюда следует, что выборочное среднее также является лучшим единственным предиктором в том смысле, что оно имеет наименьшую среднеквадратичную ошибку .) [3] Если требуется среднее арифметическое совокупности чисел, то его несмещенная оценка будет среднее арифметическое значение выборки, взятой из совокупности.

Контраст с медианой [ править ]

Среднее арифметическое может быть сопоставлено с медианой . Медиана определяется таким образом, что не более половины значений больше и не более половины меньше медианы. Если элементы в данных увеличиваются арифметически при размещении в некотором порядке, то медиана и среднее арифметическое равны. Например, рассмотрим образец данных . Среднее значение равно медиане. Однако, когда мы рассматриваем выборку, которая не может быть организована так, чтобы увеличиваться арифметически, например , медиана и среднее арифметическое могут значительно отличаться. В этом случае среднее арифметическое составляет 6,2, а медиана - 4. В общем, среднее значение может значительно отличаться от большинства значений в выборке и может быть больше или меньше, чем большинство из них.

У этого явления есть приложения во многих областях. Например, с 1980-х годов средний доход в США увеличивался медленнее, чем среднее арифметическое дохода. [5]

Обобщения [ править ]

Средневзвешенное значение [ править ]

Средневзвешенное или средневзвешенное значение - это среднее значение, при котором одни точки данных имеют больший вес, чем другие, поскольку им придается больший вес в расчетах. [6] Например, среднее арифметическое и есть , или эквивалентно . Напротив, средневзвешенное значение, при котором первое число получает, например, вдвое больший вес, чем второе (возможно, потому, что предполагается, что оно встречается в два раза чаще в генеральной совокупности, из которой были взяты эти числа), будет рассчитываться как . Здесь веса, которые обязательно равны единице, равны и, причем первое вдвое больше, чем второе. Среднее арифметическое (иногда называемое «невзвешенным средним» или «равновзвешенным средним») можно интерпретировать как частный случай средневзвешенного значения, в котором все веса равны друг другу (равны в приведенном выше примере и равны в ситуации с усреднением чисел).

Непрерывные распределения вероятностей [ править ]

Сравнение двух лог-нормальных распределений с равными медианы , но разные перекос , в результате различных средств и способов

Если числовое свойство и любая выборка данных из него могут принимать любое значение из непрерывного диапазона, а не, например, только целые числа, то вероятность попадания числа в некоторый диапазон возможных значений может быть описана путем интегрирования непрерывное распределение вероятностей по всей этой области, даже если наивная вероятность для образца числа принимает одно определенное значение из бесконечного числа равно нуль. Аналог средневзвешенного значения в этом контексте, в котором существует бесконечное количество возможностей для точного значения переменной в каждом диапазоне, называется средним значением распределения вероятностей . Наиболее распространенное распределение вероятностей называется нормальным распределением.; он обладает тем свойством, что все меры его центральной тенденции, включая не только среднее значение, но также вышеупомянутую медиану и моду (три M [7] ), равны друг другу. Это равенство не выполняется для других распределений вероятностей, как показано здесь для логнормального распределения .

Углы [ править ]

Особую осторожность следует проявлять при использовании циклических данных, таких как фазы или углы . Наивное взятие среднего арифметического 1 ° и 359 ° дает результат 180 °. Это неверно по двум причинам:

  • Во-первых, угловые измерения определяются только до аддитивной постоянной 360 ° (или 2π, если измерения в радианах ). Таким образом, можно было бы легко назвать эти 1 ° и -1 ° или 361 ° и 719 °, поскольку каждый из них дает различное среднее значение.
  • Во-вторых, в этой ситуации 0 ° (эквивалентно 360 °) геометрически является лучшим средним значением: здесь меньшая дисперсия (точки находятся на расстоянии 1 ° от него и 179 ° от 180 °, предполагаемого среднего).

В общем случае такая оплошность приведет к искусственному смещению среднего значения к середине числового диапазона. Решение этой проблемы состоит в том, чтобы использовать формулировку оптимизации ( а именно , определить среднее значение как центральную точку: точку, относительно которой имеет наименьшую дисперсию), и переопределить разницу как модульное расстояние (то есть расстояние на окружности : поэтому модульное расстояние между 1 ° и 359 ° составляет 2 °, а не 358 °).

Доказательство без слов в неравенство арифметических и средних геометрических :
PR - представляет собой диаметр окружности с центром на О; его радиус АО является средним арифметическим из и б . Используя теорему о среднем геометрическом , высота GQ треугольника PGR является средним геометрическим . Для любого коэффициента а : Ь , АО ≥ GQ.

Символы и кодировка [ править ]

Среднее арифметическое часто обозначается полосой, например, в ( полосе чтения ). [2] [3]

Некоторое программное обеспечение ( текстовые процессоры , веб-браузеры ) может неправильно отображать символ x. Например, символ x̄ в HTML на самом деле представляет собой комбинацию двух кодов - базовой буквы x и кода для вышеприведенной строки (& # 772; или ¯). [8]

В некоторых текстах, таких как PDF -файлы, символ x может быть заменен символом цента (¢) ( Unicode & # 162) при копировании в текстовый процессор, такой как Microsoft Word .

См. Также [ править ]

Геометрическое доказательство без слов, что max  ( a , b ) > среднее квадратичное или среднеквадратичное ( QM ) > среднее арифметическое ( AM ) > геометрическое среднее ( GM ) > гармоническое среднее ( HM ) > min  ( a , b ) двух положительных чисел а и б [9]
  • Фреше означает
  • Обобщенное среднее
  • Среднее геометрическое
  • Гармоническое среднее
  • Неравенство средних арифметических и геометрических
  • Режим
  • Среднее значение выборки и ковариация
  • Стандартное отклонение
  • Стандартная ошибка среднего
  • Сводные статистические данные

Ссылки [ править ]

  1. ^ Джейкобс, Гарольд Р. (1994). Математика: человеческие усилия (Третье изд.). WH Freeman . п. 547. ISBN. 0-7167-2426-X.
  2. ^ a b c d «Список вероятностных и статистических символов» . Математическое хранилище . 26 апреля 2020 . Проверено 21 августа 2020 .
  3. ^ a b c Медхи, Джотипрасад (1992). Статистические методы: вводный текст . Нью Эйдж Интернэшнл. С. 53–58. ISBN 9788122404197.
  4. ^ Вайсштейн, Эрик В. «Среднее арифметическое» . mathworld.wolfram.com . Проверено 21 августа 2020 .
  5. Кругман, Пол (4 июня 2014 г.) [осень 1992 г.]. «Богатые, правые и факты: анализ спора о распределении доходов» . Американский проспект .
  6. ^ "Среднее | математика" . Британская энциклопедия . Проверено 21 августа 2020 .
  7. ^ Thinkmap Visual Thesaurus (30 июня 2010 г.). «Три M статистики: мода, медиана, среднее значение на 30 июня 2010 г.» . www.visualthesaurus.com . Проверено 3 декабря 2018 .
  8. ^ «Заметки о Unicode для статических символов» . www.personal.psu.edu . Проверено 14 октября 2018 года .
  9. ^ Если AC = a и BC = b . OC = AM для a и b , а радиус r = QO = OG.
    Используя теорему Пифагора , QC² = QO² + OC² ∴ QC = √ QO² + OC² = QM .
    Используя теорему Пифагора, OC² = OG² + GC² ∴ GC = √ OC² - OG² = GM .
    Используя подобные треугольники ,HC/GC знак равно GC/OC ∴ HC = GC²/OC= HM .

Дальнейшее чтение [ править ]

  • Хафф, Даррелл (1993). Как лгать со статистикой . WW Нортон. ISBN 978-0-393-31072-6.

Внешние ссылки [ править ]

  • Вычисления и сравнения между средним арифметическим и средним геометрическим двух чисел
  • Вычислить среднее арифметическое ряда чисел на fxSolver