Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Feature Selection Toolbox (FST) это программное обеспечение в первую очередь для выбора функции в машинном обучении области [1] написана на C ++ , разработанный в Институте теории информации и автоматизации (UTIA), в Академии наук Чехии .

Версия 1 [ править ]

Первое поколение Feature Selection Toolbox (FST1) было приложением Windows с пользовательским интерфейсом, позволяющим пользователям применять несколько неоптимальных, оптимальных и основанных на смеси методов выбора функций к данным, хранящимся в тривиальном частном текстовом формате плоских файлов. [2]

Версия 3 [ править ]

Третье поколение Feature Selection Toolbox (FST3) представляло собой библиотеку без пользовательского интерфейса, написанную так, чтобы быть более эффективной и универсальной, чем исходный FST1. [3]

FST3 поддерживает несколько стандартных задач интеллектуального анализа данных , в частности предварительную обработку и классификацию данных , но основное внимание уделяется выбору функций . В контексте выбора функций он реализует несколько общих, а также менее обычных методов, с особым акцентом на многопоточную реализацию различных методов последовательного поиска (форма восхождения на холм ). Реализованные методы включают ранжирование отдельных признаков, плавающий поиск, осциллирующий поиск (подходит для задач очень большой размерности) в рандомизированной или детерминированной форме, оптимальные методы ветвей и границ.тип, вероятностные критерии классового расстояния, различные оценщики точности классификатора, оптимизация размера подмножества признаков, выбор признаков с заранее заданными весами признаков, ансамбли критериев, гибридные методы, обнаружение всех эквивалентных решений или двухкритериальная оптимизация. FST3 более узкоспециализирован, чем популярное программное обеспечение, такое как Waikato Environment for Knowledge Analysis Weka , RapidMiner или PRTools. [4]

По умолчанию методы, реализованные в наборе инструментов, основаны на предположении, что данные доступны в виде одного плоского файла в простом частном формате или в формате ARFF Weka, где каждая точка данных описывается фиксированным числом числовых атрибутов. FST3 предоставляется без пользовательского интерфейса и предназначен для использования пользователями, знакомыми как с машинным обучением, так и с программированием на C ++ . Старое программное обеспечение FST1 больше подходит для простых экспериментальных или образовательных целей, поскольку его можно использовать без необходимости кодировать на C ++.

История [ править ]

  • В 1999 году разработка первой версии Feature Selection Toolbox началась в UTIA как часть кандидатской диссертации. Первоначально он был разработан в среде RAD C ++ Optima ++ (позже переименованной в Power ++).
  • В 2002 году разработка первого поколения FST была приостановлена, в основном из-за прекращения поддержки Sybase используемой тогда среды разработки.
  • В 2002–2008 годах ядро ​​FST было перекодировано и использовалось только для исследовательских экспериментов в UTIA.
  • В 2009 году началось перекодирование третьего ядра FST с нуля.
  • В 2010 году FST3 стал общедоступным в виде библиотеки C ++ без графического интерфейса. На прилагаемой веб-странице собраны ссылки, относящиеся к выбору функций, справочные материалы, документация и исходный FST1, доступный для загрузки.
  • В 2011 году обновление FST3 до версии 3.1 включало новые методы (в частности, новое ранжирование функций с учетом зависимостей, подходящее для задач распознавания очень больших размеров) и улучшения основного кода.

См. Также [ править ]

  • Выбор функции
  • Распознавание образов
  • Машинное обучение
  • Сбор данных
  • OpenNN , открытая библиотека нейронных сетей для прогнозной аналитики
  • Weka , всеобъемлющее и популярное программное обеспечение с открытым исходным кодом Java от Университета Вайкато
  • RapidMiner , ранее еще одна учебная среда (YALE), коммерческий фреймворк машинного обучения.
  • PRTools Технологического университета Делфта
  • Infosel ++ специализируется на выборе функций на основе теории информации
  • Tooldiag набор инструментов для распознавания образов C ++
  • Список программного обеспечения для численного анализа

Ссылки [ править ]

  1. ^ Петр Сомол; Яна Нововичова; Павел Пудил (2010). «Эффективный выбор подмножества функций и оптимизация размера подмножества» (PDF) . Последние достижения в области распознавания образов, INTECH . С. 75–97. ISBN 978-953-7619-90-9.
  2. ^ Петр Сомол; Павел Пудил (2002). «Набор инструментов для выбора функций» (PDF) . Распознавание образов, том 35, № 12, Elsevier . С. 2749–2759.
  3. ^ Петр Сомол; Павел Вача; Станислав Микеш; Ян Гора; Павел Пудил; Павел Жид (2010). «Введение в Feature Selection Toolbox 3 - Библиотека C ++ для поиска подмножеств, моделирования и классификации данных» (PDF) . UTIA Tech. Отчет № 2287 . С. 1–12 . Проверено 2 ноября 2010 года . CS1 maint: discouraged parameter (link)
  4. ^ PRTools

Внешние ссылки [ править ]

Официальный веб-сайт