Пакеты R являются расширениями к R статистического языка программирования . Пакеты R содержат код, данные и документацию в стандартизированном формате сбора, который может быть установлен пользователями R, как правило, через централизованный репозиторий программного обеспечения, такой как CRAN (комплексная сеть архивов R). [1] [2] Большое количество пакетов, доступных для R, а также простота их установки и использования были названы основным фактором, способствовавшим широкому распространению языка в науке о данных . [3] [4] [5] [6]
По сравнению с библиотеками на других языках программирования, пакеты R должны соответствовать относительно строгой спецификации. [3] Запись R Extensions руководство [7] определяет стандартную структура каталогов для исходного кода R, данных, документации и метаданных пакета, что позволяет устанавливать их и загрузить с помощью встроенного АиРа управления пакетов инструментов. [3] Пакеты, распространяемые через CRAN, должны соответствовать дополнительным стандартам. [3] [8] По словам Джона Чемберса , хотя эти требования «предъявляют значительные требования» к разработчикам пакетов, они улучшают удобство использования.и долгосрочную стабильность пакетов для конечных пользователей. [3]
Хранилища [ править ]
Комплексная сеть архивов R (CRAN) [ править ]
Comprehensive R Archive Network (CRAN) - это центральный репозиторий программного обеспечения R , поддерживаемый R Foundation. [9] Он содержит архив последней и предыдущей версий дистрибутива R, документации и добавленных пакетов R. [10] Он включает как исходные пакеты, так и предварительно скомпилированные двоичные файлы для Windows и macOS . [11] По состоянию на ноябрь 2020 [Обновить]года доступно более 16 000 пакетов. [12] CRAN был создан Куртом Хорником и Фридрихом Лейшем в 1997 году [13] [14]и в настоящее время поддерживается Хорником и командой волонтеров. [9] Главный сайт расположен в Венском университете экономики и бизнеса и зеркалируется на серверах по всему миру. [10]
Количество пакетов CRAN росло в геометрической прогрессии на протяжении многих лет [15], и по состоянию на 2018 год [Обновить]в среднем каждый день производилась 21 отправка новых или обновленных пакетов. [6] Поскольку каждая заявка вручную проверяется небольшой группой специалистов по обслуживанию CRAN, многие из которых, по словам основного разработчика R Питера Далгаарда , «приближаются к пенсионному возрасту», есть опасения, что эта система не является устойчивой в долгосрочной перспективе. . [6] Рост CRAN выявил ограничения его инфраструктуры управления зависимостями , в частности тот факт, что он предполагает, что зависимости всегда относятся к последней версии пакета, а это означает, что новые выпуски пакетов CRAN всегда должны бытьобратная совместимость , [16] и что пакеты CRAN не могут иметь зависимости, не относящиеся к CRAN. [17] Это также привело к опасениям по поводу снижения качества упаковки. [18]
Базовые и рекомендуемые пакеты [ править ]
R распространяется с четырнадцатью «базовыми пакетами»: base, compiler, datasets, grDevices, graphics, grid, methods, parallel, splines, stats, stats4, tcltk, tools и utils. [19]
Кроме того, есть пятнадцать «рекомендуемых пакетов» от CRAN, которые включены в бинарные дистрибутивы R: KernSmooth, MASS, Matrix, boot, class, cluster, codetools, foreign, lattice, mgcv, nlme, nnet, rpart, пространственный и выживание. [19]
datasets.load [ редактировать ]
datasets.load GUI поиск и загрузка наборов данных | |
Оригинальный автор (ы) | Bastiaan Quast |
---|---|
изначальный выпуск | 14 декабря 2016 г. |
Стабильный выпуск | 1.4.0 / 27 апреля 2020 г . |
Предварительный выпуск | 1.4.0.9000 / 1 мая 2020 г . |
Репозиторий | https://github.com/bquast/datasets.load |
Написано в | р |
Операционная система | Windows, MacOS, Linux |
Размер | 520.6 кБ (версия 1.2.0) |
Доступно в | р |
Лицензия | GPL v3 |
Интернет сайт | cran.r-project.org |
datasets.load - это пакет R и плагин RStudio , который предоставляет как графический интерфейс пользователя (GUI), так и интерфейс командной строки для загрузки наборов данных. [20] Обычно R делает видимыми только наборы данных загруженных пакетов, datasets.load показывает список всех установленных наборов данных в локальной библиотеке, включая наборы данных, включенные в незагруженные пакеты. Это один из 10% самых загружаемых пакетов R.
Основная функциональность datasets.load - предоставить пользователю все установленные наборы данных, включая наборы данных в незагруженных пакетах. Существует интерфейс командной строки (CLI), который можно использовать с любого терминала R.
В дополнение к CLI существует также графический интерфейс пользователя для RStudio с использованием надстроек RStudio .
Первоначальный выпуск CRAN версии 0.1.0 состоялся в декабре 2016 года, и средняя скорость загрузки составляла 1000 раз в месяц только с серверов RStudio. С выпуском версии 0.3.0 в 2018 году скорость загрузки увеличилась до 2000 раз в месяц, что поставило пакет на 9-й процентиль самых популярных пакетов R. [21] Пакет был рассмотрен в статье «Пакеты R, которые стоит посмотреть» на сайте Data Analytics & R за 2017 год [22], что еще больше увеличило его использование.
Версия 1.0.0 была выпущена 12 декабря 2019 года, а версия 1.4.0 была создана на основе R 4.0.0, выпущенной 27 апреля 2020 года. [23]
Журналы зеркальных загрузок RStudio CRAN [24] показывают, что пакет загружается с этих серверов более 2000 раз в месяц, [25] в общей сложности более 65000 загрузок с момента первого выпуска [26], согласно RDocumentation.org, это помещает пакет в 9-й процентиль самых популярных пакетов R. [27] На Rdocumentation.org он указан как второй наиболее загружаемый пакет по ключевому слову «наборы данных» [28] (после базовых наборов данных пакета R), причем «наборы данных» являются самым популярным ключевым словом на Rdocumentation.org. [29]
См. Также [ править ]
- Tidyverse
- ggplot2
- вязальщица
Ссылки [ править ]
- ^ Хорник, Курт (2020-02-20). «Часто задаваемые вопросы по R» . Комплексная R архивной сети . 7.29: В чем разница между пакетом и библиотекой? . Дата обращения 2 ноября 2020 .CS1 maint: location (link)
- ^ Уикхэм, Хэдли; Брайан, Дженнифер. "Вступление". Пакеты R (2-е изд.).
- ^ а б в г д Чемберс, Джон М. (2020). «S, R и Data Science» . R Journal . 12 (1): 462–476. ISSN 2073-4859 .
- ^ Вэнс, Эшли (2009-01-06). «Аналитики данных, увлеченные силой R» . Нью-Йорк Таймс .
- ^ Tippmann, Sylvia (2014-12-29). «Инструменты программирования: Приключения с R» . Новости природы . 517 (7532): 109. DOI : 10.1038 / 517109a .
- ^ a b c Тим, Ник (2018). «Поколение R» . Значение . 15 (4): 14–19. DOI : 10.1111 / j.1740-9713.2018.01169.x . ISSN 1740-9713 .
- ^ R Основная команда. «Написание расширений R» . Комплексная R архивной сети . Проверено 2 ноября 2020 .CS1 maint: uses authors parameter (link)
- ^ Сопровождение репозитория CRAN. «Политика репозитория CRAN» . Комплексная R архивной сети . Проверено 2 ноября 2020 .CS1 maint: uses authors parameter (link)
- ^ a b Специалисты по обслуживанию репозитория CRAN. «Политика репозитория CRAN» . Комплексная R архивной сети . R проект . Проверено 20 ноября 2020 года .
- ^ a b Хорник, Курт (20.02.2020). «Часто задаваемые вопросы по R» . Комплексная R архивной сети . 2.1: Что такое CRAN ?: R Project . Проверено 20 ноября 2020 года .CS1 maint: location (link)
- ^ Сопровождение репозитория CRAN. «Комплексная сеть архивов R» . R проект . Проверено 20 ноября 2020 года .
- ^ Сопровождение репозитория CRAN. «CRAN - Дополнительные пакеты» . Комплексная R архивной сети . КРАН . Проверено 20 ноября 2020 года .
- ^ Хорник, Курт (1997-04-23). «ОБЪЯВЛЕНИЕ: КРАН» . r-announce (Список рассылки) . Проверено 20 ноября 2020 года .
- ^ Тим, Ник (2018). «Поколение R» . Значение . 15 (4): 14–19. DOI : 10.1111 / j.1740-9713.2018.01169.x . ISSN 1740-9713 .
- ↑ 21 апреля, Мэтт Эсэй в Open Source on; 2016; Пст, 12:32. «Экспоненциальный рост сообщества R с открытым исходным кодом угрожает коммерческим конкурентам» . TechRepublic . Проверено 2 ноября 2020 .CS1 maint: numeric names: authors list (link)
- ^ Оомс Йерун (2013). «Возможные направления улучшения управления версиями зависимостей в R» . R Journal . 5 (1): 197–206. ISSN 2073-4859 .
- ^ Decan, A .; Mens, T .; Клаас, М .; Грожан, П. (2016). «Когда GitHub встречает CRAN: анализ проблем зависимости пакетов между репозиториями» . 23-я Международная конференция IEEE по анализу, развитию и реинжинирингу программного обеспечения, 2016 г. (SANER) . 1 : 493–504. DOI : 10,1109 / SANER.2016.12 .
- ^ Хорник, Курт (2012). "Слишком много пакетов R?" . Австрийский статистический журнал . 41 (1): 59–66–59–66. DOI : 10,17713 / ajs.v41i1.188 . ISSN 1026-597X .
- ^ a b Хорник, Курт (20.02.2020). «Часто задаваемые вопросы по R» . Комплексная R архивной сети . 5.1: Какие дополнительные пакеты существуют для R? . Дата обращения 2 ноября 2020 .CS1 maint: location (link)
- ^ Quast, Bastiaan (12.12.2019), datasets.load: Интерфейсы для загрузки наборов данных , заархивировано из оригинала 30.04.2020 , получено 30.04.2020
- ^ Quast, Bastiaan (2020-04-30), Визуальный интерфейс для загрузки наборов данных в RStudio , заархивировано из оригинала 2020-05-01 , получено 2020-05-01
- ^ Ло, Майкл (2017-01-05). «Пакеты R, которые стоит посмотреть» . Аналитика данных & R . Архивировано 03 января 2020 года . Проверено 1 мая 2020 .
- ^ "Установленные пакеты R - ITS - Карлпедия - Вики Карлтонского колледжа" . wiki.carleton.edu . Архивировано 03 января 2020 года . Проверено 3 января 2020 .
- ^ "Журналы RStudio CRAN" .
- ^ "CRANlogs datasets.load пакет" .
- ^ "CRANlogs datasets.load пакет" .
- ^ "datasets.load пакет R Documentation" . www.rdocumentation.org . Архивировано 03 января 2020 года . Проверено 30 апреля 2020 .
- ^ "RDocumentation: Результаты для" наборов данных " " . www.rdocumentation.org . Архивировано 03 января 2020 года . Проверено 30 апреля 2020 .
- ^ «Тенденции в документации RD» . www.rdocumentation.org . Архивировано 03 января 2020 года . Проверено 30 апреля 2020 .
Дальнейшее чтение [ править ]
- Клаас, М .; Mens, T .; Грожан, П. (2014). «О ремонтопригодности пакетов CRAN» . Неделя развития программного обеспечения 2014 г. - Конференция IEEE по сопровождению, реинжинирингу и обратному проектированию программного обеспечения (CSMR-WCRE) : 308–312. DOI : 10,1109 / CSMR-WCRE.2014.6747183 .
- Декан, Александр; Мужские, Том; Клаас, Мелик; Грожан, Филипп (07.09.2015). «О разработке и распространении R-пакетов: эмпирический анализ экосистемы R» . Труды 2015 Европейской конференции по архитектуре программного обеспечения Мастерских . ECSAW '15. Дубровник, Цавтат, Хорватия: Ассоциация вычислительной техники: 1–6. DOI : 10.1145 / 2797433.2797476 . ISBN 978-1-4503-3393-1.
- Фокс, Джон (2009). «Аспекты социальной организации и траектории проекта R» . R Journal . 1 (2): 5–13. ISSN 2073-4859 .
- Фокс, Джон; Leanage, Allison (12 сентября 2016 г.). "R и журнал статистического программного обеспечения" . Журнал статистического программного обеспечения . 73 (1): 1–13. DOI : 10,18637 / jss.v073.i02 . ISSN 1548-7660 .
- Плакидас, Константинос; Шалл, Дэниел; Здун, Уве (2017). «Эволюция программной экосистемы R: метрики, отношения и их влияние на качества» . Журнал систем и программного обеспечения . 132 : 119–146. DOI : 10.1016 / j.jss.2017.06.095 . ISSN 0164-1212 .
Внешние ссылки [ править ]
- Комплексная сеть архивов R (CRAN)
- METACRAN , каталог пакетов R
- CRAN Task Views , список пакетов CRAN по темам