Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

В статистике и анализу данных прикладного программного обеспечения CumFreq является инструментом для кумулятивного анализа частоты в виде одной переменной и для распределения вероятностей фитинга . [1]

Первоначально метод был разработан для анализа гидрологических измерений пространственно изменяющихся величин (например, гидравлической проводимости почвы) и величин, изменяющихся во времени (например, дождевые осадки, сток реки ), чтобы определить периоды их повторяемости . Однако его можно использовать для многих других типов явлений, в том числе тех, которые содержат отрицательные значения.

Возможности программного обеспечения [ править ]

Отпечаток экрана таблицы ввода

CumFreq использует подход построения графика для оценки совокупной частоты каждой из наблюдаемых величин в серии данных переменной. [2]

Компьютерная программа позволяет определить наиболее подходящее распределение вероятностей . В качестве альтернативы он предоставляет пользователю возможность выбрать подходящее распределение вероятностей. Следующие распределения вероятностей включены: нормальное , логнормальный , логистический , loglogistic , экспоненциальное , Коши , Фреш , Гумбель , Пареты , Вейбулла , Обобщенные распределения экстремальных значений , распределение Лапласа , распределение Барра (Dagum зеркальной), распределение Dagum(Burr зеркальной), распределение Гомпертца , распределение Стьюдента и другое.

Еще одна характеристика CumFreq заключается в том, что он предоставляет возможность использовать два разных распределения вероятностей: одно для нижнего диапазона данных, а другое - для более высокого. Диапазоны разделены точкой останова. Использование таких составных (прерывистых) распределений вероятностей может быть полезно, когда данные изучаемого явления были получены при различных условиях. [3]

Составное (прерывистое) распределение с поясом уверенности [4]

На этапе ввода пользователь может выбрать количество интервалов, необходимых для определения гистограммы . Он также может определить порог для получения усеченного распределения .

В разделе вывода есть калькулятор для облегчения интерполяции и экстраполяции .

Кроме того, это дает возможность увидеть график Q – Q с точки зрения вычисленных и наблюдаемых кумулятивных частот.

ILRI [5] предоставляет примеры применения для таких величин, как урожайность , глубина залегания , засоленность почвы , гидравлическая проводимость , количество осадков и речной сток .

Обобщение распределений [ править ]

Программа может производить обобщения нормального, логистического и других распределений путем преобразования данных с использованием показателя степени, который оптимизирован для получения наилучшего соответствия .

Эта функция не является общей в другом программном обеспечении для подгонки распределения, которое обычно включает только логарифмическое преобразование распределений получения данных, таких как логнормальное и логистическое .

Обобщение симметричных распределений (таких как нормальное и логистическое ) делает их применимыми к данным, подчиняющимся распределению, которое смещено вправо (с использованием показателя степени <1), а также к данным, подчиняющимся распределению, которое смещено влево (с использованием экспонента> 1). Это увеличивает универсальность симметричных распределений.

(A) Распределение вероятностей Гамбеля смещено вправо и (B) Гамбель отражено смещением влево

Инвертирование дистрибутивов [ править ]

Асимметрия распределения может быть отражена путем инверсии распределения (см. Функцию выживания или дополнительную функцию распределения ), чтобы изменить асимметрию с положительного на отрицательное и наоборот. Это увеличивает количество применимых распределений и увеличивает шанс найти лучшее соответствие. CumFreq использует эту возможность.

Сдвиг дистрибутивов [ править ]

Когда присутствуют отрицательные данные, которые не поддерживаются распределением вероятностей, модель выполняет сдвиг распределения в положительную сторону, а после подгонки распределение сдвигается назад.

Девять кривых периодов повторяемости для 50-летних выборок из теоретической 1000-летней записи (базовая линия)

Пояса уверенности [ править ]

Программное обеспечение использует биномиальное распределение для определения доверительного пояса соответствующей кумулятивной функции распределения . [2]

Прогнозирование периода повторяемости , представляющее интерес для временных рядов , также сопровождается поясом уверенности. Построение поясов уверенности не встречается в большинстве других программ.

На рисунке справа показаны вариации, которые могут возникнуть при получении выборок переменной, соответствующей определенному распределению вероятностей. Данные были предоставлены Бенсоном. [6]

Список распределений вероятностей, ранжированных по степени согласия, пример

Полоса уверенности вокруг экспериментальной кривой накопленной частоты или периода повторяемости дает представление о регионе, в котором может быть найдено истинное распределение.

Кроме того, он поясняет, что экспериментально найденное наиболее подходящее распределение вероятностей может отклоняться от истинного распределения.

Гистограмма и плотность вероятности набора данных, соответствующих распределению GEV [7]

Качество соответствия [ править ]

Cumfreq создает список распределений, ранжированных по степени соответствия .

Гистограмма и функция плотности [ править ]

Из кумулятивной функции распределения (CDF) можно получить гистограмму и функцию плотности вероятности (PDF).

Калькулятор [ править ]

Калькулятор распределения вероятностей, используемый в программном обеспечении CumFreq

Программа предлагает возможность использовать калькулятор распределения вероятностей. Совокупная частота и период возврата даны как функция значения данных в качестве входных данных. Кроме того, показаны доверительные интервалы. И наоборот, значение представлено с указанием совокупной частоты или периода возврата.

См. Также [ править ]

  • Распределительная арматура

Ссылки [ править ]

  1. ^ Независимый онлайн-обзор CumFreq: https://www.predictiveanalyticstoday.com/cumfreq/
  2. ^ a b Частотный и регрессионный анализ . Глава 6 в: HPRitzema (изд., 1994), Принципы и применение дренажа , Publ. 16, стр. 175–224, Международный институт мелиорации и улучшения земель (ILRI), Вагенинген, Нидерланды. ISBN  90-70754-33-9 . Скачать бесплатно в формате PDF с: веб-сайта ILRI или с: [1]
  3. ^ Программное обеспечение для обобщенных и составных распределений вероятностей . Международный журнал математических и вычислительных методов, 4, 1-9. В сети: [2]
  4. ^ Введение в составные распределения вероятностей
  5. ^ Исследования дренажа на фермерских полях: анализ данных , 2002. Вклад в проект «Жидкое золото» Международного института мелиорации и улучшения земель (ILRI), Вагенинген, Нидерланды. [3]
  6. ^ Бенсон, Массачусетс, 1960. Характеристики частотных кривых на основе теоретических данных за 1000 лет. В: Т.Далримпл (ред.), Анализ частоты наводнений. Документ Геологической службы США по водоснабжению 1543-A, стр. 51–71
  7. ^ Программное обеспечение для аппроксимации распределения вероятностей