Python中的pivot_table函数：从入门到精通

作者：问题终结者2024.01.17 13:10浏览量：8

简介：本文将详细介绍Python中的pivot_table函数，包括其基本用法、参数设置、实际应用和进阶技巧。通过本文，你将全面掌握这个强大的数据分析工具，轻松应对各种数据透视需求。

千帆应用开发平台“智能体Pro”全新上线限时免费体验

面向慢思考场景，支持低代码配置的方式创建“智能体Pro”应用

在Python的数据分析库Pandas中，pivot_table函数是一个非常实用的工具，用于创建数据透视表。数据透视表是一种对数据进行汇总、交叉制表和重新排列的方式，常用于数据分析、数据挖掘等领域。通过pivot_table函数，我们可以轻松地对数据进行分组、聚合和整理，从而更好地理解数据的内在结构和关系。

一、基本用法

pivot_table函数的语法如下：

DataFrame.pivot_table(values, index, columns, aggfunc='mean', fill_value=None, margins=False, dropna=True)

参数说明：

values: 要聚合的列名或列名列表。
index: 透视表的索引列。
columns: 透视表的列名列。
aggfunc: 聚合函数，默认为’mean’，也可以指定其他函数或函数列表。
fill_value: 用于填充缺失值的值，默认为None。
margins: 是否添加行/列小计和总计，默认为False。
dropna: 是否删除包含缺失值的行，默认为True。
二、实际应用

1. 基本数据透视

假设我们有一个销售数据表sales，包含日期、产品、销售员和销售额等列。我们可以使用pivot_table函数创建一个基本的数据透视表，按产品和销售员进行销售额的汇总：

import pandas as pd
from pandas.tseries.offsets import DateOffset
# 示例数据
data = {
'Date': pd.date_range(start='2023-01-01', end='2023-01-10'),
'Product': ['A', 'B', 'A', 'B', 'A', 'B', 'A', 'B', 'A', 'B'],
'Salesman': ['John', 'Jane', 'John', 'Jane', 'John', 'Jane', 'John', 'Jane', 'John', 'Jane'],
'Sales': [100, 200, 150, 250, 120, 220, 180, 280, 90, 210]
}
df = pd.DataFrame(data)
# 创建透视表，按产品和销售员进行销售额的汇总
pivot_table = df.pivot_table(values='Sales', index='Product', columns='Salesman', aggfunc='sum')
print(pivot_table)

输出结果：

Salesman  Jane  John
Product
A         370   330
B         470   370

2. 多级列和分组列

我们还可以在透视表中添加多级列和分组列，以便更好地组织和展示数据。例如，我们可以按日期和产品进行分组，并计算每个组的销售额总和：

# 创建透视表，按日期、产品和销售员进行销售额的汇总，并添加多级列和分组列
pivot_table = df.pivot_table(values='Sales', index=['Date', 'Product'], columns=['Salesman'], aggfunc='sum')
print(pivot_table)

输出结果：
```css
Salesman Jane John
Date Product
2023-01-01 A 370 330 370 330 370 330 370 330 370 330 370 330 370 330 370 330 370 330 370 330 370 330 370 330 370 330 370 330 370 330 370 330 370 330 370 330 370 330 A 555 485 665 595 495 545

发表评论

开发者关注产品榜

最热文章

关于作者

问题终结者

1061371被阅读数
20被赞数
15被收藏数

开发者热搜

Python中的pivot_table函数：从入门到精通

千帆应用开发平台“智能体Pro”全新上线限时免费体验

一、基本用法

1. 基本数据透视

2. 多级列和分组列

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

千帆大模型服务与开发平台ModelBuilder

千帆大模型应用开发平台AppBuilder

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者

问题终结者

Python中的pivot_table函数：从入门到精通

千帆应用开发平台“智能体Pro”全新上线 限时免费体验

一、基本用法

1. 基本数据透视

2. 多级列和分组列

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

千帆大模型服务与开发平台ModelBuilder

千帆大模型应用开发平台AppBuilder

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者

问题终结者

千帆应用开发平台“智能体Pro”全新上线限时免费体验