Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

LightGBM , сокращение от Light Gradient Boosting Machine, представляет собой бесплатную распределенную структуру повышения градиента с открытым исходным кодом для машинного обучения, первоначально разработанную Microsoft . [4] [5] Он основан на алгоритмах дерева решений и используется для ранжирования , классификации и других задач машинного обучения. Основное внимание при разработке уделяется производительности и масштабируемости.

Обзор [ править ]

Платформа LightGBM поддерживает различные алгоритмы, включая GBT, GBDT , GBRT , GBM , MART [6] [7] и RF . [8] LightGBM обладает многими преимуществами XGBoost , включая разреженную оптимизацию, параллельное обучение, множественные функции потерь, регуляризацию, пакетирование и раннюю остановку. Основное различие между ними заключается в построении деревьев. LightGBM не вырастает дерево поэтапно - строка за строкой - в отличие от большинства других реализаций. [9] Вместо этого он выращивает деревья, покрытые листьями. Он выбирает лист, который, по его мнению, принесет наибольшее снижение потерь. [10]Кроме того, LightGBM не использует широко используемый алгоритм обучения на основе сортированного дерева решений, который ищет лучшую точку разделения на отсортированных значениях признаков [11], как это делают XGBoost или другие реализации. Вместо этого LightGBM реализует высокооптимизированный алгоритм обучения дерева решений на основе гистограмм, который дает большие преимущества как с точки зрения эффективности, так и с точки зрения потребления памяти. [12]

LightGBM работает в Linux , Windows и macOS и поддерживает C ++ , Python , [13] R и C # . [14] Исходный код находится под лицензией MIT License и доступен на GitHub . [15]

См. Также [ править ]

  • Машинное обучение
  • ML.NET
  • Биннинг данных
  • Повышение градиента
  • XGBoost
  • scikit-learn

Ссылки [ править ]

  1. ^ "Гуолинь Кэ" .
  2. ^ "Microsoft / LightGBM" . GitHub .
  3. ^ «Релизы · microsoft / LightGBM» . GitHub .
  4. Браунли, Джейсон (31 марта 2020 г.). «Повышение градиента с помощью Scikit-Learn, XGBoost, LightGBM и CatBoost» .
  5. ^ Копитар, Леон; Кочбек, Примоз; Цилар, Леона; Шейх, Азиз; Стиглик, Грегор (20 июля 2020 г.). «Раннее выявление сахарного диабета 2 типа с использованием моделей прогнозирования на основе машинного обучения» . Научные отчеты . 10 (1): 11981. Bibcode : 2020NatSR..1011981K . DOI : 10.1038 / s41598-020-68771-Z . PMC 7371679 . PMID 32686721 - через www.nature.com.  
  6. ^ «Понимание параметров LightGBM (и как их настраивать)» . neptune.ai . 6 мая 2020.
  7. ^ "Обзор LightGBM" . аванвик . 16 мая 2018.
  8. ^ "Параметры - документация LightGBM 3.0.0.99" . lightgbm.readthedocs.io .
  9. ^ The Gradient Boosters IV: LightGBM - Глубокий и неглубокий
  10. ^ XGBoost, LightGBM и другие фавориты конкурса Kaggle | Андре Йе | Сен, 2020 | К науке о данных
  11. ^ Маниш, Мехта; Ракеш, Агравал; Йорма, Риссанен (24 ноября 2020 г.). «SLIQ: быстрый масштабируемый классификатор для интеллектуального анализа данных» . Международная конференция по расширению технологии баз данных . CiteSeerX 10.1.1.89.7734 . 
  12. ^ "Возможности - Документация LightGBM 3.1.0.99" . lightgbm.readthedocs.io .
  13. ^ "lightgbm: LightGBM Python Package" - через PyPI.
  14. ^ "Пространство имен Microsoft.ML.Trainers.LightGbm" . docs.microsoft.com .
  15. ^ "Microsoft / LightGBM" . 6 октября 2020 г. - через GitHub.

Дальнейшее чтение [ править ]

  • Гуолинь Кэ, Ци Мэн, Томас Файнли, Тайфэн Ван, Вэй Чен, Вэйдун Ма, Цивэй Е, Тие-Ян Лю (2017). «LightGBM: высокоэффективное дерево решений для повышения градиента» (PDF) . Цитировать журнал требует |journal=( помощь )CS1 maint: использует параметр авторов ( ссылка )
  • Куинто, Бутч (2020). Машинное обучение нового поколения с помощью Spark - охватывает XGBoost, LightGBM, Spark NLP, распределенное глубокое обучение с помощью Keras и многое другое . Апресс. ISBN 978-1-4842-5668-8.

Внешние ссылки [ править ]

  • GitHub - Microsoft / LightGBM
  • LightGBM - Исследования Майкрософт