Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Kaggle , дочерняя компания Google LLC , представляет собой онлайн-сообщество специалистов по обработке данных и специалистов по машинному обучению . Kaggle позволяет пользователям находить и публиковать наборы данных, исследовать и строить модели в сетевой среде анализа данных, работать с другими учеными и инженерами по машинному обучению, а также участвовать в соревнованиях по решению задач в области науки о данных.

Kaggle начал свою деятельность в 2010 году, предлагая конкурсы по машинному обучению, а теперь также предлагает платформу общедоступных данных, облачную рабочую среду для науки о данных и образование в области искусственного интеллекта. Его ключевыми сотрудниками были Энтони Голдблум и Джереми Ховард . Николас Груэн был основателем кафедры, его сменил Макс Левчин . Капитал был увеличен в 2011 году, и компания оценивалась в 25 миллионов долларов. 8 марта 2017 года Google объявил о приобретении Kaggle. [1] [2]

Сообщество Kaggle [ править ]

В июне 2017 года Kaggle объявил, что прошел 1 миллион зарегистрированных пользователей, или Kagglers. [3] Сообщество проживает в 194 странах. Это разнообразное сообщество, от новичков до многих самых известных в мире исследователей. [4]

Соревнования Kaggle регулярно привлекают более тысячи команд и отдельных лиц. Сообщество Kaggle имеет тысячи общедоступных наборов данных и фрагментов кода (называемых «ядрами» на Kaggle). Многие из этих исследователей публикуют статьи в рецензируемых журналах на основе их результатов в соревнованиях Kaggle. [5]

К марту 2017 года фонд Two Sigma Investments проводил на Kaggle конкурс на создание торгового алгоритма. [6]

Услуги Kaggle [ править ]

  • Соревнования по машинному обучению : это был первый продукт Kaggle. Компании публикуют задачи, а машинные обучающиеся соревнуются, чтобы построить лучший алгоритм, обычно с денежными призами.
  • Kaggle Kernels : облачная рабочая среда для обработки данных и машинного обучения. Позволяет специалистам по обработке данных обмениваться кодом и анализом в Python, R и R Markdown. На Kaggle опубликовано более 150 тысяч «ядер» (фрагментов кода), охватывающих все, от анализа настроений до обнаружения объектов.
  • Платформа общедоступных наборов данных : члены сообщества обмениваются наборами данных друг с другом. Имеет наборы данных по всему, от рентгеновских снимков костей до результатов боксерских поединков.
  • Kaggle Learn : платформа для обучения искусственному интеллекту в виде управляемых фрагментов.

Как работают соревнования Kaggle [ править ]

  1. Организатор конкурса готовит данные и описание проблемы.
  2. Участники экспериментируют с разными техниками и соревнуются друг с другом, чтобы создать лучшие модели. Работа публикуется через ядра Kaggle для достижения лучших результатов и вдохновения для новых идей. Отправка может осуществляться через ядра Kaggle, путем ручной загрузки или с помощью Kaggle API . Для большинства соревнований заявки оцениваются немедленно (на основе их точности прогнозов относительно скрытого файла решения) и суммируются в таблице лидеров.
  3. По истечении крайнего срока организатор конкурса выплачивает призовые деньги в обмен на «всемирную, бессрочную, безотзывную и бесплатную лицензию [...] на использование выигравшей заявки», то есть разработанный алгоритм, программное обеспечение и соответствующая интеллектуальная собственность , который является «неисключительным, если не указано иное». [7]

Помимо публичных соревнований, Kaggle также предлагает частные соревнования, ограниченные лучшими участниками Kaggle. Kaggle предлагает учителям по науке о данных бесплатный инструмент для проведения академических соревнований по машинному обучению - Kaggle In Class . [8] Kaggle также проводит соревнования по набору персонала, в которых специалисты по обработке данных соревнуются за возможность пройти собеседование в ведущих компаниях по обработке данных, таких как Facebook , Winton Capital и Walmart .

Влияние соревнований Kaggle [ править ]

С момента основания Kaggle провела сотни соревнований по машинному обучению. Соревнования варьировались от улучшения распознавания жестов для Microsoft Kinect [9] до создания футбольного ИИ для Манчестер Сити и улучшения поиска бозона Хиггса в ЦЕРН . [10]

Соревнования привели ко многим успешным проектам, включая продвижение новейших достижений в исследованиях ВИЧ, [11] шахматные рейтинги [12] и прогнозирование трафика. [13] Известно, что Джеффри Хинтон и Джордж Даль использовали глубокие нейронные сети, чтобы выиграть конкурс, организованный Merck . А Влад Мних (один из учеников Хинтона) использовал глубокие нейронные сети, чтобы выиграть конкурс, организованный Адзуной. Это помогло продемонстрировать силу глубоких нейронных сетей и привело к тому, что эту технику переняли другие участники сообщества Kaggle. Тяньци Чен из Вашингтонского университета также использовал Kaggle, чтобы продемонстрировать мощь XGBoost , которая с тех пор пришла на смену Random Forest. как один из основных способов выиграть соревнования Kaggle.

По результатам соревнований Kaggle было опубликовано несколько научных статей. [14] Ключ к этому - эффект живого списка лидеров, который побуждает участников продолжать вводить новшества, выходящие за рамки существующей передовой практики. [15] Выигрышные методы часто описываются в блоге Kaggle, блоге Kaggle Winner .

Финансы [ править ]

В марте 2017 года главный научный сотрудник Google Фей-Фей Ли объявила, что Google приобретает Kaggle, во время своего выступления на Google Next. [16]

См. Также [ править ]

  • Платформа для конкурса Data Science
  • Энтони Голдблум

Ссылки [ править ]

  1. ^ Лардинуа, Фредерик; Маннес, Джон; Линли, Мэтью (8 марта 2017 г.). «Google приобретает сообщество специалистов по анализу данных Kaggle» . Techcrunch . Архивировано 9 марта 2017 года . Проверено 9 марта 2017 года . Источники сообщают, что Google приобретает Kaggle, [...] официальное объявление может появиться уже завтра.
  2. ^ "Google покупает Kaggle и его стайку фанатов искусственного интеллекта" . CNET . 2017-03-08 . Проверено 1 июня 2018 .
  3. ^ «Мы прошли 1 миллион участников» . Блог победителя Kaggle . 2017-06-06 . Проверено 19 августа 2018 .
  4. ^ Марков, Джон. «Ученые видят достижения в области глубокого обучения как части искусственного интеллекта» . Проверено 19 августа 2018 .
  5. ^ "Google Scholar" . scholar.google.com . Проверено 19 августа 2018 .
  6. ^ Wigglesworth, Робин (8 марта 2017). «Хедж-фонды применяют новые методы для поиска новых технических талантов» . The Financial Times . Соединенное Королевство . Проверено 29 октября 2017 года .
  7. ^ Kaggle. «Положения и условия - Kaggle» .
  8. ^ Kaggle. «Kaggle в классе» . Архивировано из оригинала на 2011-06-16 . Проверено 12 августа 2011 .
  9. Бирн, Сиара (12 декабря 2011 г.). «Kaggle запускает конкурс, чтобы помочь Microsoft Kinect изучить новые жесты» . VentureBeat . Проверено 13 декабря 2011 года .
  10. ^ «Сообщество машинного обучения берет на себя Хиггса» . Журнал Симметрия . 15 июля 2014 . Проверено 14 января 2015 года .
  11. Карпентер, Дженнифер (февраль 2011 г.). «Пусть победит лучший аналитик» . Научный журнал . Проверено 1 апреля 2011 года .
  12. ^ Sonas, Джефф (20 февраля 2011). "Шахматный рейтинг Делойта / ФИДЕ" . Шахматная база . Проверено 3 мая 2011 года .
  13. Фу, Фрэн (6 апреля 2011 г.). «Смартфоны для прогнозирования времени в пути в Новом Южном Уэльсе? . Австралийский . Проверено 3 мая 2011 года .
  14. ^ "Семинар NIPS 2014 по физике высоких энергий и машинному обучению" . JMLR W&CP . 42 .
  15. ^ Athanasopoulos, Джордж; Гайндман, Роб (2011). «Значение обратной связи в прогнозировании конкуренции» (PDF) . Международный журнал прогнозирования . 27 . С. 845–849.
  16. ^ "Добро пожаловать, Kaggle в Google Cloud" . Блог Google Cloud Platform . Проверено 19 августа 2018 .

Дальнейшее чтение [ править ]

  • «Конкуренция проливает свет на темную материю», Управление по политике в области науки и технологий, веб-сайт Белого дома, июнь 2011 г.
  • «Пусть победит лучший алгоритм ...», The Wall Street Journal , март 2011 г.
  • «Конкурс Kaggle нацелен на поддержку редакторов Википедии», New Scientist , июль 2011 г.
  • «Верификация исследований системной биологии в эпоху совместной конкуренции», Nature Nanotechnology , сентябрь 2011 г.

Внешние ссылки [ править ]

  • Официальный веб-сайт
  • Блог победителя Kaggle, блог Kaggle