Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В компьютерном программировании , панды являются программным обеспечением библиотека написана на языке программирования Python для манипулирования и анализа данных. В частности, он предлагает структуры данных и операции для управления числовыми таблицами и временными рядами . Это бесплатное программное обеспечение, выпущенное под лицензией BSD с тремя пунктами . [2] Название происходит от термина « панельные данные », эконометрического термина для наборов данных, которые включают наблюдения за несколько периодов времени для одних и тех же людей. [3] Его название - игра от фразы «анализ данных Python». [4] Уэс МакКинни начал создавать то, что впоследствии стало пандами, в AQR Capital, когда он был там исследователем с 2007 по 2010 год [5].

Функции библиотеки [ править ]

  • Объект DataFrame для манипулирования данными со встроенной индексацией.
  • Инструменты для чтения и записи данных между структурами данных в памяти и различными форматами файлов.
  • Согласование данных и интегрированная обработка недостающих данных.
  • Изменение формы и изменение наборов данных.
  • Нарезка на основе меток, необычное индексирование и разбиение больших наборов данных на подмножества.
  • Вставка и удаление столбца структуры данных.
  • Группировка по механизму, позволяющая выполнять операции разделения-применения-объединения с наборами данных.
  • Объединение и объединение наборов данных.
  • Индексирование по иерархической оси для работы с данными большой размерности в структуре данных меньшей размерности.
  • Функциональность временных рядов: создание диапазона дат [6] и преобразование частоты, статистика движущегося окна, линейная регрессия движущегося окна, сдвиг даты и запаздывание.
  • Обеспечивает фильтрацию данных.

Библиотека оптимизирована для работы, с критическими кодовых дорожек , записанных в Cython или C . [7]

Dataframes [ править ]

Pandas в основном используется для анализа данных . Pandas позволяет импортировать данные из файлов различных форматов, таких как значения , разделенные запятыми , JSON , SQL , Microsoft Excel . [8] Pandas позволяет выполнять различные операции манипулирования данными, такие как слияние, [9] изменение формы, [10] выбор, [11], а также очистку данных и функции обработки данных .

История [ править ]

Разработчик Уэс МакКинни начал работать над пандами в 2008 году, когда он работал в AQR Capital Management , из-за необходимости в высокопроизводительном и гибком инструменте для выполнения количественного анализа финансовых данных. Перед тем, как покинуть AQR, он смог убедить руководство разрешить ему открыть исходный код библиотеки.

Другой сотрудник AQR, Чанг Ше, присоединился к работе в 2012 году в качестве второго крупного сотрудника библиотеки.

В 2015 году панды подписались на финансово спонсируемый проект NumFOCUS , некоммерческой благотворительной организации 501 (c) (3) в Соединенных Штатах. [12]

См. Также [ править ]

  • matplotlib
  • NumPy
  • SciPy
  • R (язык программирования)
  • Scikit-Learn
  • statsmodels
  • Список программного обеспечения для численного анализа

Ссылки [ править ]

  1. ^ "Выпуск 1.2.3" . 2 марта 2021 . Проверено 16 марта 2021 года .
  2. ^ «Лицензия - Обзор пакета - документация pandas 1.0.0» . панды . 28 января 2020 . Проверено 30 января 2020 года .
  3. ^ Уэс МакКинни (2011). «pandas: основополагающая библиотека Python для анализа данных и статистики» (PDF) . Проверено 2 августа 2018 .
  4. Перейти ↑ McKinney, Wes (2017). Python для анализа данных, второе издание . O'Reilly Media. п. 5. ISBN 9781491957660.
  5. ^ Копф, Дэн. «Познакомьтесь с человеком, который стоит за самым важным инструментом в области науки о данных» . Кварц . Дата обращения 17 ноября 2020 .
  6. ^ "pandas.date_range - документация pandas 1.0.0" . панды . 29 января 2020 . Проверено 30 января 2020 года .
  7. ^ «Библиотека анализа данных Python - pandas: Библиотека анализа данных Python» . панды . Проверено 13 ноября 2017 года .
  8. ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html
  9. ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/merging.html
  10. ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/reshaping.html
  11. ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html
  12. ^ «NumFOCUS - pandas: финансируемый финансами проект» . NumFOCUS . Проверено 3 апреля 2018 .

Дальнейшее чтение [ править ]

  • Чен, Дэниел Ю. (2018). Панды для всех: анализ данных Python . Бостон: Эддисон-Уэсли. ISBN 978-0-13-454693-3.
  • Маккинни, Уэс (2017). Python для анализа данных: обработка данных с помощью Pandas, NumPy и IPython (2-е изд.). Севастополь: О'Рейли. ISBN 978-1-4919-5766-0.
  • Вандерплас, Джейк (2016). «Манипуляции с данными с помощью Pandas». Справочник Python по науке о данных: основные инструменты для работы с данными . О'Рейли. С. 97–216. ISBN 978-1-4919-1205-8.
  • Патхак, Чанки (2018). "Поваренная книга панд". Поваренная книга панд . С. 1–8.

Внешние ссылки [ править ]

  • Официальный веб-сайт