Из Википедии, бесплатной энциклопедии
  (Перенаправлено с CRAN (язык программирования R) )
Перейти к навигации Перейти к поиску

Пакеты R являются расширениями к R статистического языка программирования . Пакеты R содержат код, данные и документацию в стандартизированном формате сбора, который может быть установлен пользователями R, как правило, через централизованный репозиторий программного обеспечения, такой как CRAN (комплексная сеть архивов R). [1] [2] Большое количество пакетов, доступных для R, а также простота их установки и использования были названы основным фактором, способствовавшим широкому распространению языка в науке о данных . [3] [4] [5] [6]

По сравнению с библиотеками на других языках программирования, пакеты R должны соответствовать относительно строгой спецификации. [3] Запись R Extensions руководство [7] определяет стандартную структура каталогов для исходного кода R, данных, документации и метаданных пакета, что позволяет устанавливать их и загрузить с помощью встроенного АиРа управления пакетов инструментов. [3] Пакеты, распространяемые через CRAN, должны соответствовать дополнительным стандартам. [3] [8] По словам Джона Чемберса , хотя эти требования «предъявляют значительные требования» к разработчикам пакетов, они улучшают удобство использования.и долгосрочную стабильность пакетов для конечных пользователей. [3]

Хранилища [ править ]

Комплексная сеть архивов R (CRAN) [ править ]

Comprehensive R Archive Network (CRAN) - это центральный репозиторий программного обеспечения R , поддерживаемый R Foundation. [9] Он содержит архив последней и предыдущей версий дистрибутива R, документации и добавленных пакетов R. [10] Он включает как исходные пакеты, так и предварительно скомпилированные двоичные файлы для Windows и macOS . [11] По состоянию на ноябрь 2020 года доступно более 16 000 пакетов. [12] CRAN был создан Куртом Хорником и Фридрихом Лейшем в 1997 году [13] [14]и в настоящее время поддерживается Хорником и командой волонтеров. [9] Главный сайт расположен в Венском университете экономики и бизнеса и зеркалируется на серверах по всему миру. [10]

Количество пакетов CRAN росло в геометрической прогрессии на протяжении многих лет [15], и по состоянию на 2018 год в среднем каждый день производилась 21 отправка новых или обновленных пакетов. [6] Поскольку каждая заявка вручную проверяется небольшой группой специалистов по обслуживанию CRAN, многие из которых, по словам основного разработчика R Питера Далгаарда , «приближаются к пенсионному возрасту», есть опасения, что эта система не является устойчивой в долгосрочной перспективе. . [6] Рост CRAN выявил ограничения его инфраструктуры управления зависимостями , в частности тот факт, что он предполагает, что зависимости всегда относятся к последней версии пакета, а это означает, что новые выпуски пакетов CRAN всегда должны бытьобратная совместимость , [16] и что пакеты CRAN не могут иметь зависимости, не относящиеся к CRAN. [17] Это также привело к опасениям по поводу снижения качества упаковки. [18]

Базовые и рекомендуемые пакеты [ править ]

R распространяется с четырнадцатью «базовыми пакетами»: base, compiler, datasets, grDevices, graphics, grid, methods, parallel, splines, stats, stats4, tcltk, tools и utils. [19]

Кроме того, есть пятнадцать «рекомендуемых пакетов» от CRAN, которые включены в бинарные дистрибутивы R: KernSmooth, MASS, Matrix, boot, class, cluster, codetools, foreign, lattice, mgcv, nlme, nnet, rpart, пространственный и выживание. [19]

datasets.load [ редактировать ]

datasets.load - это пакет R и плагин RStudio , который предоставляет как графический интерфейс пользователя (GUI), так и интерфейс командной строки для загрузки наборов данных. [20] Обычно R делает видимыми только наборы данных загруженных пакетов, datasets.load показывает список всех установленных наборов данных в локальной библиотеке, включая наборы данных, включенные в незагруженные пакеты. Это один из 10% самых загружаемых пакетов R.

Основная функциональность datasets.load - предоставить пользователю все установленные наборы данных, включая наборы данных в незагруженных пакетах. Существует интерфейс командной строки (CLI), который можно использовать с любого терминала R.

В дополнение к CLI существует также графический интерфейс пользователя для RStudio с использованием надстроек RStudio .

Первоначальный выпуск CRAN версии 0.1.0 состоялся в декабре 2016 года, и средняя скорость загрузки составляла 1000 раз в месяц только с серверов RStudio. С выпуском версии 0.3.0 в 2018 году скорость загрузки увеличилась до 2000 раз в месяц, что поставило пакет на 9-й процентиль самых популярных пакетов R. [21] Пакет был рассмотрен в статье «Пакеты R, которые стоит посмотреть» на сайте Data Analytics & R за 2017 год [22], что еще больше увеличило его использование.

Версия 1.0.0 была выпущена 12 декабря 2019 года, а версия 1.4.0 была создана на основе R 4.0.0, выпущенной 27 апреля 2020 года. [23]

Журналы зеркальных загрузок RStudio CRAN [24] показывают, что пакет загружается с этих серверов более 2000 раз в месяц, [25] в общей сложности более 65000 загрузок с момента первого выпуска [26], согласно RDocumentation.org, это помещает пакет в 9-й процентиль самых популярных пакетов R. [27] На Rdocumentation.org он указан как второй наиболее загружаемый пакет по ключевому слову «наборы данных» [28] (после базовых наборов данных пакета R), причем «наборы данных» являются самым популярным ключевым словом на Rdocumentation.org. [29]

См. Также [ править ]

  • Tidyverse
  • ggplot2
  • вязальщица

Ссылки [ править ]

  1. ^ Хорник, Курт (2020-02-20). «Часто задаваемые вопросы по R» . Комплексная R архивной сети . 7.29: В чем разница между пакетом и библиотекой? . Дата обращения 2 ноября 2020 .CS1 maint: location (link)
  2. ^ Уикхэм, Хэдли; Брайан, Дженнифер. "Вступление". Пакеты R (2-е изд.).
  3. ^ а б в г д Чемберс, Джон М. (2020). «S, R и Data Science» . R Journal . 12 (1): 462–476. ISSN 2073-4859 . 
  4. ^ Вэнс, Эшли (2009-01-06). «Аналитики данных, увлеченные силой R» . Нью-Йорк Таймс .
  5. ^ Tippmann, Sylvia (2014-12-29). «Инструменты программирования: Приключения с R» . Новости природы . 517 (7532): 109. DOI : 10.1038 / 517109a .
  6. ^ a b c Тим, Ник (2018). «Поколение R» . Значение . 15 (4): 14–19. DOI : 10.1111 / j.1740-9713.2018.01169.x . ISSN 1740-9713 . 
  7. ^ R Основная команда. «Написание расширений R» . Комплексная R архивной сети . Проверено 2 ноября 2020 .CS1 maint: uses authors parameter (link)
  8. ^ Сопровождение репозитория CRAN. «Политика репозитория CRAN» . Комплексная R архивной сети . Проверено 2 ноября 2020 .CS1 maint: uses authors parameter (link)
  9. ^ a b Специалисты по обслуживанию репозитория CRAN. «Политика репозитория CRAN» . Комплексная R архивной сети . R проект . Проверено 20 ноября 2020 года .
  10. ^ a b Хорник, Курт (20.02.2020). «Часто задаваемые вопросы по R» . Комплексная R архивной сети . 2.1: Что такое CRAN ?: R Project . Проверено 20 ноября 2020 года .CS1 maint: location (link)
  11. ^ Сопровождение репозитория CRAN. «Комплексная сеть архивов R» . R проект . Проверено 20 ноября 2020 года .
  12. ^ Сопровождение репозитория CRAN. «CRAN - Дополнительные пакеты» . Комплексная R архивной сети . КРАН . Проверено 20 ноября 2020 года .
  13. ^ Хорник, Курт (1997-04-23). «ОБЪЯВЛЕНИЕ: КРАН» . r-announce (Список рассылки) . Проверено 20 ноября 2020 года .
  14. ^ Тим, Ник (2018). «Поколение R» . Значение . 15 (4): 14–19. DOI : 10.1111 / j.1740-9713.2018.01169.x . ISSN 1740-9713 . 
  15. 21 апреля, Мэтт Эсэй в Open Source on; 2016; Пст, 12:32. «Экспоненциальный рост сообщества R с открытым исходным кодом угрожает коммерческим конкурентам» . TechRepublic . Проверено 2 ноября 2020 .CS1 maint: numeric names: authors list (link)
  16. ^ Оомс Йерун (2013). «Возможные направления улучшения управления версиями зависимостей в R» . R Journal . 5 (1): 197–206. ISSN 2073-4859 . 
  17. ^ Decan, A .; Mens, T .; Клаас, М .; Грожан, П. (2016). «Когда GitHub встречает CRAN: анализ проблем зависимости пакетов между репозиториями» . 23-я Международная конференция IEEE по анализу, развитию и реинжинирингу программного обеспечения, 2016 г. (SANER) . 1 : 493–504. DOI : 10,1109 / SANER.2016.12 .
  18. ^ Хорник, Курт (2012). "Слишком много пакетов R?" . Австрийский статистический журнал . 41 (1): 59–66–59–66. DOI : 10,17713 / ajs.v41i1.188 . ISSN 1026-597X . 
  19. ^ a b Хорник, Курт (20.02.2020). «Часто задаваемые вопросы по R» . Комплексная R архивной сети . 5.1: Какие дополнительные пакеты существуют для R? . Дата обращения 2 ноября 2020 .CS1 maint: location (link)
  20. ^ Quast, Bastiaan (12.12.2019), datasets.load: Интерфейсы для загрузки наборов данных , заархивировано из оригинала 30.04.2020 , получено 30.04.2020
  21. ^ Quast, Bastiaan (2020-04-30), Визуальный интерфейс для загрузки наборов данных в RStudio , заархивировано из оригинала 2020-05-01 , получено 2020-05-01
  22. ^ Ло, Майкл (2017-01-05). «Пакеты R, которые стоит посмотреть» . Аналитика данных & R . Архивировано 03 января 2020 года . Проверено 1 мая 2020 .
  23. ^ "Установленные пакеты R - ITS - Карлпедия - Вики Карлтонского колледжа" . wiki.carleton.edu . Архивировано 03 января 2020 года . Проверено 3 января 2020 .
  24. ^ "Журналы RStudio CRAN" .
  25. ^ "CRANlogs datasets.load пакет" .
  26. ^ "CRANlogs datasets.load пакет" .
  27. ^ "datasets.load пакет R Documentation" . www.rdocumentation.org . Архивировано 03 января 2020 года . Проверено 30 апреля 2020 .
  28. ^ "RDocumentation: Результаты для" наборов данных " " . www.rdocumentation.org . Архивировано 03 января 2020 года . Проверено 30 апреля 2020 .
  29. ^ «Тенденции в документации RD» . www.rdocumentation.org . Архивировано 03 января 2020 года . Проверено 30 апреля 2020 .

Дальнейшее чтение [ править ]

  • Клаас, М .; Mens, T .; Грожан, П. (2014). «О ремонтопригодности пакетов CRAN» . Неделя развития программного обеспечения 2014 г. - Конференция IEEE по сопровождению, реинжинирингу и обратному проектированию программного обеспечения (CSMR-WCRE) : 308–312. DOI : 10,1109 / CSMR-WCRE.2014.6747183 .
  • Декан, Александр; Мужские, Том; Клаас, Мелик; Грожан, Филипп (07.09.2015). «О разработке и распространении R-пакетов: эмпирический анализ экосистемы R» . Труды 2015 Европейской конференции по архитектуре программного обеспечения Мастерских . ECSAW '15. Дубровник, Цавтат, Хорватия: Ассоциация вычислительной техники: 1–6. DOI : 10.1145 / 2797433.2797476 . ISBN 978-1-4503-3393-1.
  • Фокс, Джон (2009). «Аспекты социальной организации и траектории проекта R» . R Journal . 1 (2): 5–13. ISSN  2073-4859 .
  • Фокс, Джон; Leanage, Allison (12 сентября 2016 г.). "R и журнал статистического программного обеспечения" . Журнал статистического программного обеспечения . 73 (1): 1–13. DOI : 10,18637 / jss.v073.i02 . ISSN  1548-7660 .
  • Плакидас, Константинос; Шалл, Дэниел; Здун, Уве (2017). «Эволюция программной экосистемы R: метрики, отношения и их влияние на качества» . Журнал систем и программного обеспечения . 132 : 119–146. DOI : 10.1016 / j.jss.2017.06.095 . ISSN  0164-1212 .

Внешние ссылки [ править ]

  • Комплексная сеть архивов R (CRAN)
  • METACRAN , каталог пакетов R
  • CRAN Task Views , список пакетов CRAN по темам