Python Pandas数据统计函数全解

作者：demo2024.01.17 21:14浏览量：28

简介：Pandas是Python中用于数据分析和处理的强大库，提供了丰富的数据统计函数来帮助用户对数据进行各种统计分析。本文将全面解析Pandas中的数据统计函数，包括其用法、参数、示例和注意事项，帮助读者更好地理解和应用这些函数。

Pandas是Python中用于数据分析和处理的强大库，它提供了许多数据统计函数，用于对数据进行各种统计分析。这些函数可以帮助用户快速地了解数据的基本情况、识别数据的异常值、计算数据的汇总信息等。下面我们将详细介绍Pandas中的一些常用数据统计函数。

head()和tail()
head()和tail()函数用于获取数据的前几行或后几行。head()默认返回前5行，tail()默认返回后5行。可以通过参数来指定返回的行数。

import pandas as pd
# 创建一个DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50]})
# 获取前3行
print(df.head(3))
# 获取后3行
print(df.tail(3))

describe()
describe()函数用于计算DataFrame中数值型列的描述性统计信息，包括计数、平均值、标准差、最小值、25%、50%、75%分位数和最大值。
```
import pandas as pd
# 创建一个DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50]})
# 计算描述性统计信息
print(df.describe())
```

sum()和mean()
sum()函数用于计算数值型列的和，mean()函数用于计算数值型列的平均值。

import pandas as pd
# 创建一个DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50]})
# 计算列的和和平均值
print(df['A'].sum())  # 计算列A的和
print(df['A'].mean())  # 计算列A的平均值

median()和mode()
median()函数用于计算数值型列的中位数，mode()函数用于计算数值型列的众数。

import pandas as pd
# 创建一个DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50]})
# 计算列的中位数和众数
print(df['A'].median())  # 计算列A的中位数
print(df['A'].mode())  # 计算列A的众数，如果存在多个众数，则返回一个包含多个众数的Series对象

min()和max()
min()函数用于计算数值型列的最小值，max()函数用于计算数值型列的最大值。
```python
import pandas as pd
创建一个DataFrame
df = pd.DataFrame({‘A’: [1, 2, 3, 4, 5], ‘B’: [10, 20, 30, 40, 50]})
计算列的最小值和最大值
print(df[‘A’].min()) # 计算列A的最小值
print(df[‘A’].max()) # 计算列A的最大值

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询

开发者热搜

Python Pandas数据统计函数全解

创建一个DataFrame

计算列的最小值和最大值

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者