мета-данные страницы
Это старая версия документа!
Операции с датафреймами/сериями
Математические функции и статистика
В панде уже реализовано множество математических функций для работы с данными, уже сохраненными в соответствующей структуре данных. Весь их список стоит посмотреть по ссылкам на общей странице (раздел «Внешняя документация») Рассмотрим некоторые из них.
Функция mean() без параметра (0 или столбцы подразумевается по-умолчанию) вычисляет среднее значение для каждого столбца датафрейма
df.mean()
Если указать параметр 1, то вычислено будет среднее значение по строке
df.mean(1)
- abs() - берет модуль от каждого элемента
- count() - считает количество существующих (которые не равны NaN) элементов
- max()/min() - находят максимум и минимум
- sum()/prod() - сумма или произведение
Применение функции к элементам структуры
С помощью функции apply() можно применить заданную функцию ко всей структуре сразу.
Например, создадим следующий датафрейм
df = pd.DataFrame([[4, 9],] * 3, columns=['A', 'B'])
A B 0 4 9 1 4 9 2 4 9
Извлечем корень из каждого элемента таблицы
df.apply(np.sqrt) # здесь мы пользуемся функцией квадратного корня из библиотеки numpy, обратите внимание, что в этом контексте скобки не нужны
A B 0 2.0 3.0 1 2.0 3.0 2 2.0 3.0