Автор (ы) оригинала | Гуолинь Кэ [1] / Microsoft Research |
---|---|
Разработчики) | Участники Microsoft и LightGBM [2] |
Начальная версия | 2016 |
Стабильный выпуск | v3.2.0 [3] / 22 марта 2021 г . |
Репозиторий | github |
Написано в | C ++ , Python , R , C |
Операционная система | Windows , macOS , Linux |
Тип | Машинное обучение , фреймворк для повышения градиента |
Лицензия | Лицензия MIT |
Веб-сайт | lightgbm |
LightGBM , сокращение от Light Gradient Boosting Machine, представляет собой бесплатную распределенную структуру повышения градиента с открытым исходным кодом для машинного обучения, первоначально разработанную Microsoft . [4] [5] Он основан на алгоритмах дерева решений и используется для ранжирования , классификации и других задач машинного обучения. Основное внимание при разработке уделяется производительности и масштабируемости.
Обзор [ править ]
Платформа LightGBM поддерживает различные алгоритмы, включая GBT, GBDT , GBRT , GBM , MART [6] [7] и RF . [8] LightGBM обладает многими преимуществами XGBoost , включая разреженную оптимизацию, параллельное обучение, множественные функции потерь, регуляризацию, пакетирование и раннюю остановку. Основное различие между ними заключается в построении деревьев. LightGBM не вырастает дерево поэтапно - строка за строкой - в отличие от большинства других реализаций. [9] Вместо этого он выращивает деревья, покрытые листьями. Он выбирает лист, который, по его мнению, принесет наибольшее снижение потерь. [10]Кроме того, LightGBM не использует широко используемый алгоритм обучения на основе сортированного дерева решений, который ищет лучшую точку разделения на отсортированных значениях признаков [11], как это делают XGBoost или другие реализации. Вместо этого LightGBM реализует высокооптимизированный алгоритм обучения дерева решений на основе гистограмм, который дает большие преимущества как с точки зрения эффективности, так и с точки зрения потребления памяти. [12]
LightGBM работает в Linux , Windows и macOS и поддерживает C ++ , Python , [13] R и C # . [14] Исходный код находится под лицензией MIT License и доступен на GitHub . [15]
См. Также [ править ]
- Машинное обучение
- ML.NET
- Биннинг данных
- Повышение градиента
- XGBoost
- scikit-learn
Ссылки [ править ]
- ^ "Гуолинь Кэ" .
- ^ "Microsoft / LightGBM" . GitHub .
- ^ «Релизы · microsoft / LightGBM» . GitHub .
- ↑ Браунли, Джейсон (31 марта 2020 г.). «Повышение градиента с помощью Scikit-Learn, XGBoost, LightGBM и CatBoost» .
- ^ Копитар, Леон; Кочбек, Примоз; Цилар, Леона; Шейх, Азиз; Стиглик, Грегор (20 июля 2020 г.). «Раннее выявление сахарного диабета 2 типа с использованием моделей прогнозирования на основе машинного обучения» . Научные отчеты . 10 (1): 11981. Bibcode : 2020NatSR..1011981K . DOI : 10.1038 / s41598-020-68771-Z . PMC 7371679 . PMID 32686721 - через www.nature.com.
- ^ «Понимание параметров LightGBM (и как их настраивать)» . neptune.ai . 6 мая 2020.
- ^ "Обзор LightGBM" . аванвик . 16 мая 2018.
- ^ "Параметры - документация LightGBM 3.0.0.99" . lightgbm.readthedocs.io .
- ^ The Gradient Boosters IV: LightGBM - Глубокий и неглубокий
- ^ XGBoost, LightGBM и другие фавориты конкурса Kaggle | Андре Йе | Сен, 2020 | К науке о данных
- ^ Маниш, Мехта; Ракеш, Агравал; Йорма, Риссанен (24 ноября 2020 г.). «SLIQ: быстрый масштабируемый классификатор для интеллектуального анализа данных» . Международная конференция по расширению технологии баз данных . CiteSeerX 10.1.1.89.7734 .
- ^ "Возможности - Документация LightGBM 3.1.0.99" . lightgbm.readthedocs.io .
- ^ "lightgbm: LightGBM Python Package" - через PyPI.
- ^ "Пространство имен Microsoft.ML.Trainers.LightGbm" . docs.microsoft.com .
- ^ "Microsoft / LightGBM" . 6 октября 2020 г. - через GitHub.
Дальнейшее чтение [ править ]
- Гуолинь Кэ, Ци Мэн, Томас Файнли, Тайфэн Ван, Вэй Чен, Вэйдун Ма, Цивэй Е, Тие-Ян Лю (2017). «LightGBM: высокоэффективное дерево решений для повышения градиента» (PDF) . Цитировать журнал требует
|journal=
( помощь )CS1 maint: использует параметр авторов ( ссылка ) - Куинто, Бутч (2020). Машинное обучение нового поколения с помощью Spark - охватывает XGBoost, LightGBM, Spark NLP, распределенное глубокое обучение с помощью Keras и многое другое . Апресс. ISBN 978-1-4842-5668-8.
Внешние ссылки [ править ]
- GitHub - Microsoft / LightGBM
- LightGBM - Исследования Майкрософт