Прогнозная аналитика включает в себя множество статистических методов, от интеллектуального анализа данных , прогнозного моделирования и машинного обучения, которые анализируют текущие и исторические факты, чтобы делать прогнозы о будущих или других неизвестных событиях. [1] [2]
В бизнесе прогнозные модели используют шаблоны, обнаруженные в исторических и транзакционных данных, для выявления рисков и возможностей. Модели фиксируют взаимосвязи между многими факторами, позволяя оценить риск или потенциал, связанный с определенным набором условий, и направлять принятие решений для возможных транзакций. [3]
Определяющий функциональный эффект этих технических подходов заключается в том, что прогнозная аналитика обеспечивает прогнозную оценку (вероятность) для каждого человека (клиента, сотрудника, медицинского пациента, артикула продукта, транспортного средства, компонента, машины или другой организационной единицы) с целью определения, информирования , или влиять на организационные процессы, которые относятся к большому количеству людей, например, в маркетинге, оценке кредитного риска, обнаружении мошенничества, производстве, здравоохранении и государственных операциях, включая правоохранительные органы.
Прогнозная аналитика используются в актуарной науке , [4] маркетинг , [5] управления бизнесом , спорт / фантастике спорт , [6] Страхование [7] , полиция [8] , телекоммуникация , [9] розничное , [10] проезда , [ 11] мобильность , [12] здравоохранение , [13] защита детей , [14] [15] фармацевтические препараты , [16] планирование мощностей , [17] социальные сети [18] и другие области.
Один из самых известных приложений является кредитный скоринг , [1] , который используется на протяжении управления бизнесом . Скоринговые модели обрабатывают кредитную историю клиента , заявку на получение ссуды , данные клиентов и т. Д., Чтобы ранжировать людей по их вероятности своевременно производить платежи по кредиту.
Определение
Прогнозная аналитика - это область статистики, которая занимается извлечением информации из данных и использованием ее для прогнозирования тенденций и моделей поведения. Усовершенствованная прогнозная веб-аналитика позволяет вычислять статистические вероятности будущих событий в Интернете. Статистические методы прогнозной аналитики включают моделирование данных , машинное обучение , искусственный интеллект , алгоритмы глубокого обучения и интеллектуальный анализ данных . [19] Часто интересующее неизвестное событие происходит в будущем, но прогнозная аналитика может применяться к любому типу неизвестного, будь то прошлое, настоящее или будущее. Например, выявление подозреваемых после совершения преступления или мошенничество с кредитными картами по мере его совершения. [20] Ядро прогнозной аналитики основано на выявлении взаимосвязей между независимыми переменными и прогнозируемыми переменными из прошлых событий и их использовании для прогнозирования неизвестного результата. Однако важно отметить, что точность и удобство использования результатов будут во многом зависеть от уровня анализа данных и качества допущений.
Прогнозирующая аналитика часто определяется как прогнозирование на более детальном уровне детализации, т. Е. Создание прогнозных оценок (вероятностей) для каждого отдельного организационного элемента. Это отличает его от прогнозирования . Например, «Предиктивная аналитика - технология, которая учится на опыте (данных), чтобы предсказывать будущее поведение людей с целью принятия более эффективных решений». [21] В будущих промышленных системах значение прогнозной аналитики будет заключаться в прогнозировании и предотвращении потенциальных проблем для достижения почти нулевого сбоя и дальнейшей интеграции в предписывающую аналитику для оптимизации решений. [ необходима цитата ]
Типы
Как правило, термин «прогнозная аналитика» используется для обозначения прогнозного моделирования , «оценки» данных с помощью прогнозных моделей и прогнозирования . Однако люди все чаще используют этот термин для обозначения связанных аналитических дисциплин, таких как описательное моделирование и моделирование решений или оптимизация. Эти дисциплины также включают тщательный анализ данных и широко используются в бизнесе для сегментации и принятия решений, но имеют разные цели и различные статистические методы, лежащие в их основе.
Прогнозные модели
В прогнозном моделировании используются прогнозные модели для анализа взаимосвязи между конкретными характеристиками единицы в выборке и одним или несколькими известными атрибутами или характеристиками этой единицы. Цель модели - оценить вероятность того, что аналогичное устройство в другом образце будет демонстрировать определенные характеристики. В эту категорию входят модели во многих областях, таких как маркетинг, где они ищут тонкие шаблоны данных, чтобы ответить на вопросы о работе клиентов, или модели обнаружения мошенничества. Прогностические модели часто выполняют вычисления во время реальных транзакций, например, для оценки риска или возможности данного клиента или транзакции, чтобы принять решение. С повышением скорости вычислений системы моделирования отдельных агентов стали способны моделировать поведение или реакцию человека на заданные стимулы или сценарии.
Доступные единицы выборки с известными атрибутами и известными характеристиками называются «обучающей выборкой». Единицы в других выборках с известными атрибутами, но неизвестными характеристиками, называются единицами «вне [обучающей] выборки». Единицы вне выборки не обязательно имеют хронологическую связь с единицами обучающей выборки. Например, обучающая выборка может состоять из литературных атрибутов произведений викторианских авторов с известной атрибуцией, а единицей, не входящей в выборку, могут быть недавно обнаруженные сочинения с неизвестным авторством; Прогностическая модель может помочь приписать произведение известному автору. Другой пример дается анализом брызг крови на смоделированных местах преступления, в которых не входящая в образец единица представляет собой фактическую картину брызг крови с места преступления. Единица вне выборки может быть из того же времени, что и обучающие единицы, из предыдущего времени или из будущего времени.
Описательные модели
Описательные модели количественно определяют взаимосвязи в данных способом, который часто используется для классификации клиентов или потенциальных клиентов по группам. В отличие от прогнозных моделей, которые фокусируются на прогнозировании поведения отдельного клиента (например, кредитного риска), описательные модели идентифицируют множество различных отношений между клиентами или продуктами. Описательные модели не ранжируют клиентов по их вероятности совершения определенного действия, как это делают прогнозные модели. Вместо этого можно использовать описательные модели, например, для категоризации клиентов по их предпочтениям в отношении продуктов и стадиям жизни. Инструменты описательного моделирования могут использоваться для разработки дополнительных моделей, которые могут моделировать большое количество индивидуализированных агентов и делать прогнозы.
Модели принятия решений
Модели принятия решений описывают взаимосвязь между всеми элементами решения - известными данными (включая результаты прогнозных моделей), решением и прогнозируемыми результатами решения - для прогнозирования результатов решений, включающих множество переменных. Эти модели можно использовать для оптимизации, максимизируя одни результаты и сводя к минимуму другие. Модели принятия решений обычно используются для разработки логики принятия решений или набора бизнес-правил, которые будут производить желаемое действие для каждого клиента или обстоятельства.
Приложения
Хотя прогнозную аналитику можно использовать во многих приложениях, мы приводим несколько примеров, когда прогнозная аналитика показала положительное влияние в последние годы.
Бизнес
Аналитическое управление взаимоотношениями с клиентами (CRM) - частое коммерческое применение прогнозного анализа. К данным о клиентах применяются методы прогнозного анализа для построения целостного представления о клиенте. CRM использует прогнозный анализ в приложениях для маркетинговых кампаний, продаж и обслуживания клиентов. Аналитический CRM может применяться на протяжении всего жизненного цикла клиентов ( приобретение , рост отношений , сохранение и обоюдного назад).
Часто корпоративные организации собирают и хранят обширные данные, например записи о клиентах или транзакциях продажи. В этих случаях прогнозная аналитика может помочь проанализировать расходы клиентов, их использование и другое поведение, что приведет к эффективным перекрестным продажам или продаже дополнительных продуктов текущим клиентам. [2]
Правильное применение прогнозной аналитики может привести к более активным и эффективным стратегиям удержания. Путем частого изучения использования клиентом услуг в прошлом, эффективности обслуживания, расходов и других моделей поведения, прогнозные модели могут определить вероятность того, что клиент прекратит обслуживание в ближайшее время. [9] Вмешательство с предложениями с высокой воспринимаемой ценностью может увеличить шанс привлечения или удержания клиента. Прогнозирующая аналитика также может предсказать скрытое истощение, то есть поведение клиента по медленному, но неуклонному сокращению использования.
Защита детей
Некоторые агентства по защите детей начали использовать прогнозную аналитику для выявления случаев повышенного риска. [22] Например, в округе Хиллсборо, штат Флорида , использование агентством по охране детства инструмента прогнозного моделирования предотвратило связанную с жестоким обращением детскую смертность среди целевой группы населения. [23]
Системы поддержки принятия клинических решений
Прогностический анализ нашел применение в здравоохранении, прежде всего, для определения пациентов, подверженных риску развития таких состояний, как диабет, астма или сердечные заболевания. Кроме того, сложные системы поддержки клинических решений включают прогностическую аналитику для поддержки принятия медицинских решений.
Исследование нейродегенеративных расстройств, проведенное в 2016 году, представляет собой мощный пример платформы CDS для диагностики, отслеживания, прогнозирования и мониторинга прогрессирования болезни Паркинсона . [24]
Прогнозирование результатов судебных решений
Прогнозирование исхода судебных решений может выполняться программами искусственного интеллекта. Эти программы могут использоваться в качестве вспомогательных средств для специалистов в этой отрасли. [25] [26]
Прогноз на уровне портфеля, продукта или экономики
Часто в центре внимания анализа находится не потребитель, а продукт, портфель, фирма, отрасль или даже экономика. Например, розничный торговец может быть заинтересован в прогнозировании спроса на уровне магазина для целей управления запасами. Или Совет Федеральной резервной системы может быть заинтересован в прогнозировании уровня безработицы на следующий год. Эти типы проблем могут быть решены с помощью прогнозной аналитики с использованием методов временных рядов (см. Ниже). Их также можно решить с помощью подходов машинного обучения, которые преобразуют исходные временные ряды в пространство векторов признаков, где алгоритм обучения находит шаблоны, которые имеют предсказательную силу. [27] [28]
Андеррайтинг
Многие компании должны учитывать подверженность риску из-за различных услуг и определять затраты, необходимые для покрытия риска. Прогнозная аналитика может помочь подтвердить эти количества, предсказывая шансы болезни, дефолта , банкротства и т. Д. Прогнозная аналитика может упростить процесс привлечения клиентов, прогнозируя будущее рискованное поведение клиента с использованием данных на уровне приложений. [4] Прогностическая аналитика в форме кредитных баллов сократила время, необходимое для утверждения ссуд, особенно на ипотечном рынке. Правильная прогнозная аналитика может привести к правильным решениям о ценообразовании, которые могут помочь снизить риск дефолта в будущем.
Технологии и большие данные влияют
Большие данные - это набор наборов данных, которые настолько велики и сложны, что с ними становится неудобно работать с использованием традиционных инструментов управления базами данных . Объем, разнообразие и скорость больших данных создали повсеместные проблемы для сбора, хранения, поиска, совместного использования, анализа и визуализации. Примеры источников больших данных включают в себя веб-журналы , RFID , данные датчиков , социальные сети , индексацию поиска в Интернете, подробные записи вызовов, военное наблюдение и сложные данные в астрономических, биогеохимических, геномных и атмосферных науках. Большие данные - это ядро большинства услуг прогнозной аналитики, предлагаемых ИТ-организациями. [29] Благодаря технологическим достижениям в компьютерном оборудовании - более быстрые процессоры, более дешевая память и архитектуры MPP - и новым технологиям, таким как Hadoop , MapReduce , а также аналитика в базе данных и текста для обработки больших данных, теперь стало возможным собирать, анализировать , а также собирать огромные объемы структурированных и неструктурированных данных для новых идей. [30] Также возможно запускать алгоритмы прогнозирования для потоковых данных. [31] Сегодня изучение больших данных и использование прогнозной аналитики доступно большему количеству организаций, чем когда-либо прежде, и предлагаются новые методы, которые способны обрабатывать такие наборы данных. [32] [33]
Аналитические методы
Подходы и методы, используемые для проведения прогнозной аналитики, можно в целом сгруппировать в методы регрессии и методы машинного обучения.
Техники регрессии
Регрессионные модели - это основа прогнозной аналитики. Основное внимание уделяется созданию математического уравнения в качестве модели для представления взаимодействий между различными рассматриваемыми переменными. В зависимости от ситуации существует широкий спектр моделей, которые можно применять при выполнении прогнозной аналитики. Некоторые из них кратко обсуждаются ниже.
Модель линейной регрессии
Модель линейной регрессии предсказывает переменную отклика как линейную функцию параметров с неизвестными коэффициентами. Эти параметры настраиваются таким образом, чтобы оптимизировать степень соответствия. Большая часть усилий по подгонке модели сосредоточена на минимизации размера остатка, а также на обеспечении его случайного распределения относительно прогнозов модели.
Цель регрессии - выбрать параметры модели так, чтобы минимизировать сумму квадратов остатков. Это называется оценкой методом обычных наименьших квадратов (МНК).
Модели с дискретным выбором
Множественная регрессия (см. Выше) обычно используется, когда переменная ответа является непрерывной и имеет неограниченный диапазон. Часто переменная отклика может быть не непрерывной, а дискретной. Хотя математически возможно применить множественную регрессию к дискретным упорядоченным зависимым переменным, некоторые из предположений, лежащих в основе теории множественной линейной регрессии, больше не выполняются, и есть другие методы, такие как модели дискретного выбора, которые лучше подходят для этого типа анализа. Если зависимая переменная дискретна, некоторые из этих превосходных методов - это логистическая регрессия , полиномиальная логит- модель и пробит- модели. Модели логистической регрессии и пробит используются, когда зависимая переменная является двоичной .
Логистическая регрессия
В настройке классификации присвоение вероятностей результатов наблюдениям может быть достигнуто за счет использования логистической модели (также называемой логической моделью), которая преобразует информацию о двоичной зависимой переменной в неограниченную непрерывную переменную и оценивает регулярную многомерную модель.
Тест Вальда и критерий отношения правдоподобия используются для проверки статистической значимости каждого коэффициента b в модели (аналогично t -тесту , используемому в регрессии OLS; см. Выше). Тест, оценивающий степень согласия модели классификации, - это «правильно предсказанный процент».
Пробит-регрессия
Пробит-модели предлагают альтернативу логистической регрессии для моделирования категориальных зависимых переменных.
Полиномиальная логистическая регрессия
Расширением модели двоичного логита на случаи, когда зависимая переменная имеет более 2 категорий, является полиномиальная модель логита . В таких случаях разделение данных на две категории может не иметь смысла или может привести к потере полноты данных. Модель полиномиального логита является подходящей техникой в этих случаях, особенно когда категории зависимых переменных не упорядочены (например, такие цвета, как красный, синий, зеленый). Некоторые авторы расширили полиномиальную регрессию, включив в нее методы выбора / важности признаков, такие как случайный полиномиальный логит .
Логит против пробит
Эти две регрессии имеют тенденцию вести себя одинаково, за исключением того, что логистическое распределение имеет тенденцию быть немного более плоским. Коэффициенты, полученные по логит-модели и пробит-модели, обычно близки друг к другу. Однако отношение шансов легче интерпретировать в логит-модели.
Практические причины выбора пробит-модели вместо логистической модели могут включать:
- Существует твердое убеждение, что основное распределение является нормальным.
- Фактическое событие - это не двоичный результат ( например , статус банкротства), а пропорция ( например , доля населения с разными уровнями долга).
Модели временных рядов
Модели временных рядов используются для прогнозирования будущего поведения переменных. Эти модели учитывают тот факт, что точки данных, полученные с течением времени, могут иметь внутреннюю структуру (такую как автокорреляция, тренд или сезонное изменение), которую следует учитывать. В результате стандартные методы регрессии не могут применяться к данным временных рядов, и была разработана методология для декомпозиции тренда, сезонной и циклической составляющих ряда.
Модели временных рядов оценивают разностные уравнения, содержащие стохастические компоненты. Двумя обычно используемыми формами этих моделей являются модели авторегрессии (AR) и модели скользящего среднего (MA). В Бокса-Дженкинса методология сочетает в моделях AR и MA для получения ARMA (авторегрессии скользящего среднего) модель, которая является краеугольным камнем стационарного анализа временных рядов. С другой стороны, ARIMA (модели авторегрессионного интегрированного скользящего среднего) используются для описания нестационарных временных рядов.
В последние годы модели временных рядов стали более сложными и пытаются моделировать условную гетероскедастичность. Такие модели включают модель ARCH ( авторегрессионная условная гетероскедастичность ) и модель GARCH (обобщенная авторегрессионная условная гетероскедастичность), которые часто используются для финансовых временных рядов.
Анализ выживаемости или продолжительности
Анализ выживаемости - это еще одно название анализа времени до события. Эти методы были в основном разработаны в медицинских и биологических науках, но они также широко используются в социальных науках, таких как экономика, а также в инженерии.
Цензура и ненормальность, которые характерны для данных о выживаемости, создают трудности при попытке проанализировать данные с использованием обычных статистических моделей, таких как множественная линейная регрессия . Нормальное распределение , будучи симметричным распределением, имеет как положительные, так и отрицательные значения, но продолжительность по самой своей природе не может быть отрицательной , и поэтому нормальность нельзя считать , при работе с данными длительности / выживания.
Модели продолжительности могут быть параметрическими, непараметрическими или полупараметрическими. Некоторые из широко используемых моделей - это модель пропорциональных рисков Каплана-Мейера и Кокса (непараметрическая).
Деревья классификации и регрессии (CART)
Деревья классификации и регрессии (CART) - это непараметрический метод обучения дереву решений , который создает деревья классификации или регрессии, в зависимости от того, является ли зависимая переменная категориальной или числовой, соответственно.
Деревья решений формируются набором правил, основанных на переменных в наборе данных моделирования:
- Правила, основанные на значениях переменных, выбираются для получения наилучшего разделения для дифференциации наблюдений на основе зависимой переменной.
- Как только правило выбрано и разбивает узел на два, тот же процесс применяется к каждому «дочернему» узлу (т.е. это рекурсивная процедура).
- Разделение останавливается, когда CART обнаруживает, что дальнейшее усиление невозможно, или выполняются некоторые предварительно установленные правила остановки. (В качестве альтернативы данные максимально разделяются, а затем дерево позже обрезается .)
Каждая ветвь дерева заканчивается конечным узлом. Каждое наблюдение попадает в один и ровно один конечный узел, и каждый конечный узел однозначно определяется набором правил.
Очень популярный метод прогнозной аналитики - случайные леса .
Многомерные сплайны адаптивной регрессии
Сплайны многомерной адаптивной регрессии (MARS) - это непараметрический метод, позволяющий строить гибкие модели путем подгонки кусочно- линейных регрессий .
Сплайновый подход с многомерной и адаптивной регрессией намеренно переигрывает модель, а затем сокращает ее, чтобы получить оптимальную модель. Алгоритм является очень интенсивным в вычислительном отношении, и на практике указывается верхний предел количества базисных функций.
Методы машинного обучения
Машинное обучение включает в себя ряд передовых статистических методов регрессии и классификации и находит применение в самых разных областях, включая медицинскую диагностику , обнаружение мошенничества с кредитными картами, распознавание лиц и речи и анализ фондового рынка .
Инструменты
Исторически сложилось так, что использование инструментов прогнозной аналитики, а также понимание получаемых ими результатов требовали продвинутых навыков. Однако современные инструменты прогнозной аналитики больше не ограничиваются ИТ-специалистами. [ необходима цитата ] По мере того, как все больше организаций внедряют прогнозную аналитику в процессы принятия решений и интегрируют ее в свои операции, они создают сдвиг на рынке в сторону бизнес-пользователей как основных потребителей информации. Бизнес-пользователям нужны инструменты, которые они могут использовать самостоятельно. Поставщики отвечают, создавая новое программное обеспечение, которое устраняет математическую сложность, предоставляет удобный графический интерфейс и / или создает короткие пути, которые могут, например, распознавать типы доступных данных и предлагать подходящую модель прогнозирования. [34] Инструменты прогнозной аналитики стали достаточно сложными, чтобы адекватно представлять и анализировать проблемы с данными [ необходима цитата ], чтобы любой информационный работник, разбирающийся в данных, мог использовать их для анализа данных и получения значимых и полезных результатов. [2] Например, современные инструменты представляют результаты с использованием простых диаграмм, графиков и оценок, которые показывают вероятность возможных результатов. [35]
На рынке доступно множество инструментов, которые помогают в выполнении прогнозной аналитики. Они варьируются от тех, которые требуют очень небольшого опыта пользователя, до тех, которые предназначены для опытных практиков. Разница между этими инструментами часто заключается в уровне настройки и разрешенном подъеме больших объемов данных.
PMML
Язык разметки прогнозных моделей (PMML) был предложен в качестве стандартного языка для выражения прогнозных моделей. Такой язык, основанный на XML, позволяет различным инструментам определять прогнозные модели и обмениваться ими. PMML 4.0 был выпущен в июне 2009 года.
Критика
Когда дело доходит до способности компьютеров и алгоритмов предсказывать будущее, есть множество скептиков, в том числе Гэри Кинг , профессор Гарвардского университета и директор Института количественных социальных наук. [36] Окружающая среда влияет на людей бесчисленными способами. Чтобы точно предсказать, что люди будут делать дальше, необходимо, чтобы все влияющие переменные были известны и точно измерялись. «Окружающая среда людей меняется даже быстрее, чем они сами. Все, от погоды до их отношений с матерью, может изменить то, как люди думают и действуют. Все эти переменные непредсказуемы. Их влияние на человека еще менее предсказуемо. Если если завтра оказаться в такой же ситуации, они могут принять совершенно другое решение. Это означает, что статистический прогноз действителен только в стерильных лабораторных условиях, что внезапно оказывается не таким полезным, как казалось раньше ». [37]
В исследовании 1072 статей, опубликованных в журналах Information Systems Research и MIS Quarterly в период с 1990 по 2006 год, только 52 эмпирических статьи делали попытки прогнозирования, из которых только 7 выполняли правильное прогнозное моделирование или тестирование. [38]
Смотрите также
- Актуарная наука
- Искусственный интеллект в здравоохранении
- Аналитические процедуры (финансовый аудит)
- Вычислительная социология
- Уголовное сокращение с использованием статистической истории
- Наблюдение за заболеваниями
- Обучающая аналитика
- Алгоритм коэффициентов
- Распознавание образов
- Прогнозный вывод
- Предиктивная полиция
- Аналитика социальных сетей
Рекомендации
- ^ a b Найс, Чарльз (2007), Белая книга прогнозной аналитики (PDF) , Американский институт страховщиков от несчастных случаев / Страховой институт Америки, стр. 1
- ^ а б в Экерсон, Уэйн (10 мая 2007 г.), Повышение эффективности инвестиций в хранилище данных, Институт хранилищ данных
- ^ Кокер, Франк (2014). Пульс: понимание жизненно важных признаков вашего бизнеса (1-е изд.). Белвью, Вашингтон: Издательство Ambient Light. С. 30, 39, 42 и др. ISBN 978-0-9893086-0-1.
- ^ а б Конз, Натан (2 сентября 2008 г.), «Страховщики переходят на технологии прогнозной аналитики, ориентированные на клиента» , « Страхование и технологии» , заархивировано из оригинала 22 июля 2012 г. , получено 2 июля 2012 г.
- ^ Флетчер, Хизер (2 марта 2011 г.), «7 лучших способов использования прогнозной аналитики в многоканальном маркетинге» , Целевой маркетинг
- ^ Корн, Сью (21 апреля 2011 г.), «Возможности прогнозной аналитики в финансах» , HPC Wire
- ^ Чеволини, Альберто; Эспозито, Елена (2020-07-01). «От пула к профилю: социальные последствия алгоритмического прогнозирования в страховании» . Большие данные и общество . 7 (2): 2053951720939228. DOI : 10,1177 / 2053951720939228 . ISSN 2053-9517 .
- ^ Хаймштадт, Максимилиан; Эгберт, Саймон; Эспозито, Елена (2020). «Прогнозирующая пандемия: распространение моделей заражения между общественным здравоохранением и общественной безопасностью» . Sociologica . 14 (3): 1–24. DOI : 10.6092 / issn.1971-8853 / 11470 . ISSN 1971-8853 .
- ^ а б Баркин, Эрик (май 2011 г.), «CRM + Predictive Analytics: Почему все складывается» , Destination CRM
- ^ Дас, Крантик; Видьяшанкар, GS (1 июля 2006 г.), «Конкурентные преимущества в розничной торговле с помощью аналитики: анализ, создание ценности» , Управление информацией.
- ^ Макдональд, Мишель (2 сентября 2010 г.), «Новые технологии используют« прогнозирующую аналитику »для определения рекомендаций по путешествиям» , Отчет о туристическом рынке , архивировано с оригинала 10 сентября 2015 г.
- ^ Морейра-Матиас, Луис; Гама, Жоао; Феррейра, Мишель; Мендес-Морейра, Жуан; Дамас, Луис (01.02.2016). «Оценка изменяющейся во времени матрицы OD с использованием высокоскоростных потоков данных GPS» . Экспертные системы с приложениями . 44 : 275–288. DOI : 10.1016 / j.eswa.2015.08.048 .
- ^ Стивенсон, Эрин (16 декабря 2011 г.), «Tech Beat: Можете ли вы произнести прогнозную аналитику здравоохранения?» , Times-Standard , заархивировано из оригинала 4 августа 2014 г. , получено 2 июля 2012 г.
- ^ Линдерт, Брайан (октябрь 2014 г.). "Eckerd Rapid Safety Feedback: бизнес-аналитика для защиты детей" (PDF) . Политика и практика . Проверено 3 марта 2016 года .
- ^ «Флорида использует прогностическую аналитику для предотвращения детских смертельных случаев - следуют другие штаты» . The Huffington Post . 2015-12-21 . Проверено 25 марта 2016 .
- ^ Маккей, Лорен (август 2009 г.), «Новый рецепт для фармацевтики» , Целевая CRM , заархивировано из оригинала 10 июля 2015 г. , получено 2 июля 2012 г.
- ^ Гаэт, Андрэ. «Оценка прогнозной аналитики для планирования мощностей» (PDF) . www.hisa.org.au . Проверено 22 ноября 2018 .
- ^ Де, Шаунак; Мэйти, Абхишек; Гоэль, Вритти; Шитоле, Санджай; Бхаттачарья, Авик (2017). «Прогнозирование популярности постов в instagram для журнала о стиле жизни с помощью глубокого обучения» . 2017 2-я Международная конференция по системам связи, вычислениям и ИТ-приложениям (CSCITA) . С. 174–177. DOI : 10,1109 / CSCITA.2017.8066548 . ISBN 978-1-5090-4381-1. S2CID 35350962 .
- ^ Personali (11.10.2018). «Глоссарий по оптимизации UX> Наука о данных> Веб-аналитика> Прогнозная аналитика» . www.personali.com . Проверено 22 октября 2018 .
- ^ Финли, Стивен (2014). Прогнозная аналитика, интеллектуальный анализ данных и большие данные. Мифы, заблуждения и методы (1-е изд.). Бейзингстоук: Пэлгрейв Макмиллан. п. 237. ISBN. 978-1137379276.
- ^ Сигел, Эрик (2013). Предиктивная аналитика: способность предсказывать, кто нажмет, купит, солгает или умрет (1-е изд.). Вайли. ISBN 978-1-1183-5685-2.
- ^ «Давно назревшие новые стратегии измерения риска для благосостояния детей - хроника социальных изменений» . Хроника социальных изменений . 2016-02-03 . Проверено 4 апреля 2016 .
- ^ «Национальная стратегия по искоренению жестокого обращения с детьми и пренебрежительного отношения к детям со смертельным исходом» (PDF) . Комиссия по искоренению жестокого обращения с детьми и пренебрежения со смертельным исходом. (2016) . Проверено 14 апреля 2018 года .
- ^ Динов, Иво Д .; Хевнер, Бен; Тан, Мин; Глусман, Густаво; Чард, Кайл; Дарси, Майк; Маддури, Рави; Па, Джуди; Спино, Кэти; Кессельман, Карл; Фостер, Ян; Deutsch, Eric W .; Прайс, Натан Д.; Ван Хорн, Джон Д .; Эймс, Джозеф; Кларк, Кристи; Худ, Лерой; Хэмпстед, Бенджамин М .; Дауэр, Уильям; Тога, Артур В. (2016). «Прогнозирующая аналитика больших данных: исследование болезни Паркинсона с использованием больших, сложных, гетерогенных, неконгруэнтных, множественных и неполных наблюдений» . PLOS ONE . 11 (8): e0157077. Bibcode : 2016PLoSO..1157077D . DOI : 10.1371 / journal.pone.0157077 . PMC 4975403 . PMID 27494614 .
- ^ Прогнозирование судебных решений Европейского суда по правам человека: перспектива обработки естественного языка
- ^ AI предсказывает результаты судебных процессов по правам человека
- ^ Дхар, Васант (апрель 2011 г.). «Прогнозирование на финансовых рынках: случай небольших разрывов». ACM-транзакции по интеллектуальным системам и технологиям . 2 (3). DOI : 10.1145 / 1961189.1961191 . S2CID 11213278 .
- ^ Дхар, Васант; Чжоу, Дашин; Провост Фостер (октябрь 2000 г.). «Обнаружение интересных паттернов в принятии инвестиционных решений с GLOWER - генетическим алгоритмом обучения, наложенным на уменьшение энтропии» . Интеллектуальный анализ данных и обнаружение знаний . 4 (4): 251–280. DOI : 10,1023 / A: 1009848126475 . S2CID 1982544 .
- ^ http://www.hcltech.com/sites/default/files/key_to_monetizing_big_data_via_predictive_analytics.pdf
- ^ Шифф, Майк (6 марта 2012 г.), Эксперты по бизнес-аналитике: почему прогнозная аналитика будет продолжать расти , Институт хранилищ данных
- ^ «Прогнозная аналитика развивающихся потоков данных» (PDF) .
- ^ Бен-Гал И. Дана А .; Школьник Н. и Зингер (2014). «Эффективное построение деревьев решений методом двойного информационного расстояния» (PDF) . Технология качества и количественный менеджмент (QTQM), 11 (1), 133-147. Цитировать журнал требует
|journal=
( помощь ) - ^ Бен-Гал I .; Shavitt Y .; Weinsberg E .; Вайнсберг У. (2014). «Одноранговый поиск информации с использованием кластеризации общего содержимого» (PDF) . Knowl Inf Syst . 39 (2): 383–408. DOI : 10.1007 / s10115-013-0619-9 . S2CID 16437786 .
- ^ Халпер, Ферн (1 ноября 2011 г.), «5 основных тенденций в области прогнозной аналитики» , Управление информацией
- ^ Макленнан, Джейми (1 мая 2012 г.), 5 мифов о предиктивной аналитике , Институт хранилищ данных
- ^ Темпл-Растон, Дина (8 октября 2012 г.), Предсказание будущего: фантазия или хороший алгоритм? , ЭНЕРГЕТИЧЕСКИЙ ЯДЕРНЫЙ РЕАКТОР
- ^ Алверсон, Кэмерон (сентябрь 2012 г.), Опросы и статистические модели не могут предсказать будущее , Кэмерон Алверсон
- ^ Шмуэли, Галит ( 01.08.2010 ). «Объяснить или предсказать?». Статистическая наука . 25 (3): 289–310. arXiv : 1101.0891 . DOI : 10.1214 / 10-STS330 . ISSN 0883-4237 . S2CID 15900983 .
дальнейшее чтение
- Агрести, Алан (2002). Категориальный анализ данных . Хобокен: Джон Уайли и сыновья. ISBN 0-471-36093-7.
- Коггесхолл, Стивен, Дэвис, Джон, Джонс, Роджер. , и Шутцер, Даниэль, «Интеллектуальные системы безопасности», в Фридман, Рой С., Флейн, Роберт А. и Ледерман, Джесс, редакторы (1995). Искусственный интеллект на рынках капитала . Чикаго: Ирвин. ISBN 1-55738-811-3.CS1 maint: несколько имен: список авторов ( ссылка )
- Л. Деврое; Л. Дьерфи; Дж. Лугоши (1996). Вероятностная теория распознавания образов . Нью-Йорк: Springer-Verlag. ISBN 9781461207115.
- Эндерс, Уолтер (2004). Прикладная эконометрика временных рядов . Хобокен: Джон Уайли и сыновья. ISBN 0-521-83919-X.
- Грин, Уильям (2012). Эконометрический анализ, 7-е изд . Лондон: Прентис-Холл. ISBN 978-0-13-139538-1.
- Гвидер, Матье; Говард Н, Ш. Аргамон (2009). Богатый языковой анализ для борьбы с терроризмом . Берлин, Лондон, Нью-Йорк: Springer-Verlag. ISBN 978-3-642-01140-5.
- Митчелл, Том (1997). Машинное обучение . Нью-Йорк: Макгроу-Хилл. ISBN 0-07-042807-7.
- Сигел, Эрик (2016). Прогностическая аналитика: возможность предсказать, кто нажмет, купит, солгает или умрет . Джон Вили. ISBN 978-1119145677.
- Тьюки, Джон (1977). Исследовательский анализ данных . Нью-Йорк: Аддисон-Уэсли. ISBN 0-201-07616-0.
- Финли, Стивен (2014). Прогнозная аналитика, интеллектуальный анализ данных и большие данные. Мифы, заблуждения и методы . Бейзингстоук: Пэлгрейв Макмиллан. ISBN 978-1-137-37927-6.
- Кокер, Франк (2014). Пульс: основные признаки вашего бизнеса . Белвью, Вашингтон: Издательство Ambient Light. ISBN 978-0-9893086-0-1.