This article is an orphan, as no other articles link to it. Please introduce links to this page from related articles; try the Find link tool for suggestions. (March 2015) |
Разработчики) | UTIA , Чешская академия наук |
---|---|
Стабильный выпуск | 3.1.1 / 9 сентября 2012 г . |
Написано в | C ++ |
Операционная система | Кроссплатформенность (v3) |
Тип | Машинное обучение , распознавание образов |
Лицензия | Бесплатно для некоммерческого использования |
Веб-сайт | FST |
Feature Selection Toolbox (FST) это программное обеспечение в первую очередь для выбора функции в машинном обучении области [1] написана на C ++ , разработанный в Институте теории информации и автоматизации (UTIA), в Академии наук Чехии .
Версия 1 [ править ]
Первое поколение Feature Selection Toolbox (FST1) было приложением Windows с пользовательским интерфейсом, позволяющим пользователям применять несколько неоптимальных, оптимальных и основанных на смеси методов выбора функций к данным, хранящимся в тривиальном частном текстовом формате плоских файлов. [2]
Версия 3 [ править ]
Третье поколение Feature Selection Toolbox (FST3) представляло собой библиотеку без пользовательского интерфейса, написанную так, чтобы быть более эффективной и универсальной, чем исходный FST1. [3]
FST3 поддерживает несколько стандартных задач интеллектуального анализа данных , в частности предварительную обработку и классификацию данных , но основное внимание уделяется выбору функций . В контексте выбора функций он реализует несколько общих, а также менее обычных методов, с особым акцентом на многопоточную реализацию различных методов последовательного поиска (форма восхождения на холм ). Реализованные методы включают ранжирование отдельных признаков, плавающий поиск, осциллирующий поиск (подходит для задач очень большой размерности) в рандомизированной или детерминированной форме, оптимальные методы ветвей и границ.тип, вероятностные критерии классового расстояния, различные оценщики точности классификатора, оптимизация размера подмножества признаков, выбор признаков с заранее заданными весами признаков, ансамбли критериев, гибридные методы, обнаружение всех эквивалентных решений или двухкритериальная оптимизация. FST3 более узкоспециализирован, чем популярное программное обеспечение, такое как Waikato Environment for Knowledge Analysis Weka , RapidMiner или PRTools. [4]
По умолчанию методы, реализованные в наборе инструментов, основаны на предположении, что данные доступны в виде одного плоского файла в простом частном формате или в формате ARFF Weka, где каждая точка данных описывается фиксированным числом числовых атрибутов. FST3 предоставляется без пользовательского интерфейса и предназначен для использования пользователями, знакомыми как с машинным обучением, так и с программированием на C ++ . Старое программное обеспечение FST1 больше подходит для простых экспериментальных или образовательных целей, поскольку его можно использовать без необходимости кодировать на C ++.
История [ править ]
- В 1999 году разработка первой версии Feature Selection Toolbox началась в UTIA как часть кандидатской диссертации. Первоначально он был разработан в среде RAD C ++ Optima ++ (позже переименованной в Power ++).
- В 2002 году разработка первого поколения FST была приостановлена, в основном из-за прекращения поддержки Sybase используемой тогда среды разработки.
- В 2002–2008 годах ядро FST было перекодировано и использовалось только для исследовательских экспериментов в UTIA.
- В 2009 году началось перекодирование третьего ядра FST с нуля.
- В 2010 году FST3 стал общедоступным в виде библиотеки C ++ без графического интерфейса. На прилагаемой веб-странице собраны ссылки, относящиеся к выбору функций, справочные материалы, документация и исходный FST1, доступный для загрузки.
- В 2011 году обновление FST3 до версии 3.1 включало новые методы (в частности, новое ранжирование функций с учетом зависимостей, подходящее для задач распознавания очень больших размеров) и улучшения основного кода.
См. Также [ править ]
- Выбор функции
- Распознавание образов
- Машинное обучение
- Сбор данных
- OpenNN , открытая библиотека нейронных сетей для прогнозной аналитики
- Weka , всеобъемлющее и популярное программное обеспечение с открытым исходным кодом Java от Университета Вайкато
- RapidMiner , ранее еще одна учебная среда (YALE), коммерческий фреймворк машинного обучения.
- PRTools Технологического университета Делфта
- Infosel ++ специализируется на выборе функций на основе теории информации
- Tooldiag набор инструментов для распознавания образов C ++
- Список программного обеспечения для численного анализа
Ссылки [ править ]
- ^ Петр Сомол; Яна Нововичова; Павел Пудил (2010). «Эффективный выбор подмножества функций и оптимизация размера подмножества» (PDF) . Последние достижения в области распознавания образов, INTECH . С. 75–97. ISBN 978-953-7619-90-9.
- ^ Петр Сомол; Павел Пудил (2002). «Набор инструментов для выбора функций» (PDF) . Распознавание образов, том 35, № 12, Elsevier . С. 2749–2759.
- ^ Петр Сомол; Павел Вача; Станислав Микеш; Ян Гора; Павел Пудил; Павел Жид (2010). «Введение в Feature Selection Toolbox 3 - Библиотека C ++ для поиска подмножеств, моделирования и классификации данных» (PDF) . UTIA Tech. Отчет № 2287 . С. 1–12 . Проверено 2 ноября 2010 года . CS1 maint: discouraged parameter (link)
- ^ PRTools
Внешние ссылки [ править ]
Официальный веб-сайт