В математике и статистике , то среднее арифметическое ( / ˌ æ г ɪ & thetas ; м ɛ т ɪ к м я п / , напряжение на первом и третьем слогах «арифметика»), или просто среднее или среднее (когда контекст ясно), представляет собой сумму набора чисел, деленную на количество чисел в коллекции. [1] Коллекция часто представляет собой набор результатов эксперимента или наблюдательного исследования , или часто набор результатов опрос . Термин «среднее арифметическое» является предпочтительным в некоторых контекстах в области математики и статистики, поскольку она помогает отличить его от других средств , таких , как среднее геометрическое и гармоническое среднее .
Помимо математики и статистики, среднее арифметическое часто используется во многих различных областях, таких как экономика , антропология и история , и в той или иной степени используется почти во всех академических областях. Например, доход на душу населения - это средний арифметический доход населения страны.
Хотя среднее арифметическое часто используется для определения основных тенденций , это не надежная статистика , а это означает, что на нее сильно влияют выбросы (значения, которые намного больше или меньше, чем большинство значений). Для асимметричных распределений , таких как распределение доходов, при котором доходы нескольких людей значительно превышают доходы большинства людей, среднее арифметическое может не совпадать с понятием «среднего», а надежная статистика, такая как медиана , может дать лучшее описание. центральной тенденции.
Определение
Учитывая набор данных , среднее арифметическое (или среднее или среднее ), обозначаемое[2] (читать бар ), это среднее значение значения . [3]
Среднее арифметическое - это наиболее часто используемый и понятный показатель центральной тенденции в наборе данных. В статистике термин « среднее» относится к любому из показателей центральной тенденции. Среднее арифметическое для набора наблюдаемых данных определяется как сумма числовых значений каждого и каждого наблюдения, деленная на общее количество наблюдений. Символически, если у нас есть набор данных, состоящий из значений, то среднее арифметическое определяется формулой:
(объяснение оператора суммирования см . в разделе « Суммирование» .)
Например, рассмотрим ежемесячную зарплату 10 сотрудников фирмы: 2500, 2700, 2400, 2300, 2550, 2650, 2750, 2450, 2600, 2400. Среднее арифметическое:
Если набор данных является статистической совокупностью (т. Е. Состоит из всех возможных наблюдений, а не только их подмножества), то среднее значение этой совокупности называется средним по совокупности и обозначается греческой буквой. . [2] Если набор данных представляет собой статистическую выборку (подмножество генеральной совокупности), то мы называем статистику, полученную в результате этого вычисления, выборочным средним (что для набора данных обозначается как [2] ).
Среднеарифметическое значение может быть аналогично определено для векторов в нескольких измерениях, а не только для скалярных значений; это часто называют центроидом . В более общем смысле, поскольку среднее арифметическое представляет собой выпуклую комбинацию (сумма коэффициентов равна 1), его можно определить в выпуклом пространстве , а не только в векторном пространстве.
Мотивирующие свойства
Среднее арифметическое имеет несколько свойств, которые делают его полезным, особенно в качестве меры центральной тенденции. Это включает:
- Если числа иметь в виду , тогда . С- это расстояние от данного числа до среднего, один из способов интерпретировать это свойство - сказать, что числа слева от среднего уравновешиваются числами справа от среднего. Среднее значение - это единственное число, для которого сумма остатков (отклонений от оценки) равна нулю.
- Если требуется использовать одно число в качестве «типичного» значения для набора известных чисел , то среднее арифметическое чисел делает это лучше всего в смысле минимизации суммы квадратов отклонений от типичного значения: суммы . (Отсюда следует, что выборочное среднее также является лучшим единственным предиктором в том смысле, что оно имеет наименьшую среднеквадратичную ошибку .) [3] Если требуется среднее арифметическое совокупности чисел, то его несмещенная оценка будет среднее арифметическое значение выборки, взятой из совокупности.
Контраст с медианой
Среднее арифметическое может быть сопоставлено с медианой . Медиана определяется таким образом, что не более половины значений больше и не более половины меньше медианы. Если элементы в данных увеличиваются арифметически при размещении в некотором порядке, то медиана и среднее арифметическое равны. Например, рассмотрим образец данных. В среднем, как и медиана. Однако, когда мы рассматриваем выборку, которую нельзя расположить так, чтобы увеличиваться арифметически, например, медиана и среднее арифметическое могут значительно отличаться. В этом случае среднее арифметическое составляет 6,2, а медиана - 4. В общем, среднее значение может значительно отличаться от большинства значений в выборке и может быть больше или меньше, чем большинство из них.
У этого явления есть приложения во многих областях. Например, с 1980-х годов средний доход в США увеличивался медленнее, чем среднее арифметическое дохода. [5]
Обобщения
Средневзвешенное
Средневзвешенное или средневзвешенное значение - это среднее значение, при котором одни точки данных имеют больший вес, чем другие, поскольку им придается больший вес в расчетах. [6] Например, среднее арифметическое а также является , или эквивалентно . Напротив, средневзвешенное значение, при котором первое число получает, например, вдвое больший вес, чем второе (возможно, потому, что предполагается, что оно встречается в два раза чаще в генеральной совокупности, из которой были взяты эти числа), будет рассчитываться как. Здесь веса, сумма которых обязательно равна единице, равны а также , причем первое вдвое больше, чем второе. Среднее арифметическое (иногда называемое «невзвешенным средним» или «равновзвешенным средним») можно интерпретировать как частный случай средневзвешенного значения, в котором все веса равны друг другу (равны в приведенном выше примере и равно в ситуации с числа усредняются).
Непрерывные распределения вероятностей
Если числовое свойство и любая выборка данных из него могут принимать любое значение из непрерывного диапазона, а не, например, только целые числа, то вероятность попадания числа в некоторый диапазон возможных значений может быть описана путем интегрирования непрерывное распределение вероятностей по всей этой области, даже если наивная вероятность для образца числа принимает одно определенное значение из бесконечного числа равно нуль. Аналог средневзвешенного значения в этом контексте, в котором существует бесконечное количество возможностей для точного значения переменной в каждом диапазоне, называется средним значением распределения вероятностей . Наиболее распространенное распределение вероятностей называется нормальным распределением ; он обладает тем свойством, что все меры его центральной тенденции, включая не только среднее значение, но также вышеупомянутую медиану и моду (три M [7] ), равны друг другу. Это равенство не выполняется для других распределений вероятностей, как показано здесь для логнормального распределения .
Углы
Особую осторожность следует проявлять при использовании циклических данных, таких как фазы или углы . Наивное взятие среднего арифметического 1 ° и 359 ° дает результат 180 °. Это неверно по двум причинам:
- Во-первых, угловые измерения определяются только до аддитивной постоянной 360 ° (или 2π, если измерения в радианах ). Таким образом, можно было бы легко назвать эти 1 ° и -1 ° или 361 ° и 719 °, поскольку каждый из них дает различное среднее значение.
- Во-вторых, в этой ситуации 0 ° (эквивалентно 360 °) геометрически является лучшим средним значением: здесь меньшая дисперсия (точки находятся на расстоянии 1 ° от него и 179 ° от 180 °, предполагаемого среднего).
В общем случае такая оплошность приведет к искусственному смещению среднего значения к середине числового диапазона. Решение этой проблемы состоит в том, чтобы использовать формулировку оптимизации ( а именно , определить среднее значение как центральную точку: точку, относительно которой имеет наименьшую дисперсию), и переопределить разницу как модульное расстояние (то есть расстояние на окружности : поэтому модульное расстояние между 1 ° и 359 ° составляет 2 °, а не 358 °).
Символы и кодировка
Среднее арифметическое часто обозначается чертой, например, как в (читать бар ). [2] [3]
Некоторое программное обеспечение ( текстовые процессоры , веб-браузеры ) может неправильно отображать символ x. Например, символ x̄ в HTML на самом деле представляет собой комбинацию двух кодов - базовой буквы x и кода для вышеприведенной строки (& # 772; или ¯). [8]
В некоторых текстах, таких как PDF -файлы, символ x может быть заменен символом цента (¢) ( Unicode & # 162) при копировании в текстовый процессор, такой как Microsoft Word .
Смотрите также
- Фреше означает
- Обобщенное среднее
- Среднее геометрическое
- Гармоническое среднее
- Неравенство средних арифметических и геометрических
- Режим
- Среднее значение выборки и ковариация
- Стандартное отклонение
- Стандартная ошибка среднего
- Сводные статистические данные
Рекомендации
- ^ Джейкобс, Гарольд Р. (1994). Математика: человеческие усилия (третье изд.). WH Freeman . п. 547. ISBN. 0-7167-2426-X.
- ^ а б в г «Список вероятностных и статистических символов» . Математическое хранилище . 26 апреля 2020 . Проверено 21 августа 2020 .
- ^ а б в Медхи, Джйотипрасад (1992). Статистические методы: вводный текст . Нью Эйдж Интернэшнл. С. 53–58. ISBN 9788122404197.
- ^ Вайсштейн, Эрик В. «Среднее арифметическое» . mathworld.wolfram.com . Проверено 21 августа 2020 .
- ^ Кругман, Пол (4 июня 2014 г.) [осень 1992 г.]. «Богатые, правые и факты: анализ спора о распределении доходов» . Американский проспект .
- ^ {{Cite web | title = Mean {{!} Tannica.com/science/mean|access-date=2020-08-21|website=Encyclopedia Britannica | language = en}}
- ^ Визуальный тезаурус Thinkmap (30 июня 2010 г.). «Три M статистики: мода, медиана, среднее значение на 30 июня 2010 г.» . www.visualthesaurus.com . Проверено 3 декабря 2018 .
- ^ «Примечания по Unicode для статических символов» . www.personal.psu.edu . Проверено 14 октября 2018 года .
- ^ Если AC = a и BC = b . OC = AM для a и b , а радиус r = QO = OG.
Используя теорему Пифагора , QC² = QO² + OC² ∴ QC = √ QO² + OC² = QM .
Используя теорему Пифагора, OC² = OG² + GC² ∴ GC = √ OC² - OG² = GM .
Используя подобные треугольники ,HC/GC знак равно GC/OC ∴ HC = GC²/OC= HM .
дальнейшее чтение
- Хафф, Даррелл (1993). Как лгать со статистикой . WW Нортон. ISBN 978-0-393-31072-6.
Внешние ссылки
- Вычисления и сравнения между средним арифметическим и средним геометрическим двух чисел
- Вычислить среднее арифметическое ряда чисел на fxSolver