мета-данные страницы
  •  
Загрузка не удалась. Возможно, проблемы с правами доступа?

Это старая версия документа!


Что такое pandas?

Практически с момента появления Питон активно используется для предобработки данных (например, прочитать текстовый файл и выделить из него нужные куски, очистить текст от лишних символов и т.д.) Очищенные данные можно позже направить, например, в табличный процессор, СУБД или статистическую систему для последующего анализа.

Библиотека pandas добавляет в Питон значительную часть аналитической функциональности больших пакетов.

Что pandas умеет?

  • Эффективный и быстрый тип DataFrame с встроенной индексацией, предназначенный для обработки данных;
  • Утилиты для чтения и записи данных между оперативной памятю и разными файловыми форматами или СУБД: CSV, текстовые файлы, Microsoft Excel, SQL базы данных и быстрый HDF5;
  • Автоматизированное упорядочивание данных с встроенной обработкой отсутствующих частей дает возможность эффективно автоматически размечать данные и работать с плохо упорядоченными данными;
  • Гибкое преобразование наборов данных;
  • Умное разделение по меткам, красивое индексирование и выделение подмножеств из больших наборов данных;
  • Для изменения размера можно добавлять и удалять колонки в структурах данных;
  • Объединение и преобразование данных с мощными средствами группировки в режиме раздели-примени-объедини;
  • Высокопроизводительное слияние и объединение наборов данных;
  • Работа с временными рядами: создание временных диапазонов, преобразование отсчетов, обработка со скользящим окном, линейная регрессия с скользящим окном, смещение и т.д.