Pandas 读取 CSV 文件示例及常用方法（入门）

作者：demo2024.01.17 20:51浏览量：60

简介：本文将介绍如何使用 Pandas 库读取 CSV 文件，以及一些常用的数据处理方法。通过实际操作和代码示例，帮助读者快速掌握 Pandas 的基本用法。

Pandas 是 Python 中用于数据处理和分析的强大库，而 CSV 文件是一种常见的数据存储格式。下面我们将通过示例和代码来演示如何使用 Pandas 读取 CSV 文件，以及一些常用的数据处理方法。
安装 Pandas
首先，确保已经安装了 Pandas。如果还没有安装，可以通过 pip 安装：

pip install pandas

读取 CSV 文件
要读取 CSV 文件，我们可以使用 Pandas 的 read_csv() 函数。下面是一个简单的示例：

import pandas as pd
# 读取 CSV 文件
data = pd.read_csv('data.csv')
# 显示前几行数据
print(data.head())

在上面的代码中，我们首先导入了 Pandas 库并简称为 pd。然后，使用 read_csv() 函数读取名为 ‘data.csv’ 的文件，并将结果存储在 data 变量中。最后，使用 head() 方法显示数据的前几行。
常用方法
Pandas 提供了一系列常用的数据处理方法。下面列举几个常用的方法：

选择列：使用列名选择某一列的数据。例如，选择 ‘Name’ 列：
```
names = data['Name']
```
筛选数据：使用布尔索引筛选符合条件的数据。例如，选择 ‘Age’ 大于等于 18 的行：
```
adults = data[data['Age'] >= 18]
```
数据排序：使用 sort_values() 方法对数据进行排序。例如，按 ‘Age’ 列升序排序：
```
sorted_data = data.sort_values('Age')
```
数据分组与聚合：使用 groupby() 方法对数据进行分组，并结合聚合函数进行计算。例如，按 ‘Gender’ 分组计算每组的平均年龄：
```
average_age = data.groupby('Gender').mean()['Age']
```
缺失值处理：使用 dropna() 方法删除含有缺失值的行或列。例如，删除含有缺失值的行：
```
data_no_na = data.dropna()
```
数据转换：使用 apply() 方法对数据进行转换。例如，将 ‘Age’ 列中的字符串类型转换为整数类型：
python data['Age'] = data['Age'].apply(lambda x: int(x) if x.isdigit() else x)在上面的代码中，我们使用了 apply() 方法将 ‘Age’ 列中的字符串类型转换为整数类型。如果某个值不是数字字符串，则保持原样。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询

开发者热搜

Pandas 读取 CSV 文件示例及常用方法（入门）

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者