Pandas 读取 CSV 文件示例及常用方法(入门)
2024.01.17 20:51浏览量:60简介:本文将介绍如何使用 Pandas 库读取 CSV 文件,以及一些常用的数据处理方法。通过实际操作和代码示例,帮助读者快速掌握 Pandas 的基本用法。
Pandas 是 Python 中用于数据处理和分析的强大库,而 CSV 文件是一种常见的数据存储格式。下面我们将通过示例和代码来演示如何使用 Pandas 读取 CSV 文件,以及一些常用的数据处理方法。
安装 Pandas
首先,确保已经安装了 Pandas。如果还没有安装,可以通过 pip 安装:
pip install pandas
读取 CSV 文件
要读取 CSV 文件,我们可以使用 Pandas 的 read_csv() 函数。下面是一个简单的示例:
import pandas as pd# 读取 CSV 文件data = pd.read_csv('data.csv')# 显示前几行数据print(data.head())
在上面的代码中,我们首先导入了 Pandas 库并简称为 pd。然后,使用 read_csv() 函数读取名为 ‘data.csv’ 的文件,并将结果存储在 data 变量中。最后,使用 head() 方法显示数据的前几行。
常用方法
Pandas 提供了一系列常用的数据处理方法。下面列举几个常用的方法:
- 选择列:使用列名选择某一列的数据。例如,选择 ‘Name’ 列:
names = data['Name']
- 筛选数据:使用布尔索引筛选符合条件的数据。例如,选择 ‘Age’ 大于等于 18 的行:
adults = data[data['Age'] >= 18]
- 数据排序:使用
sort_values()方法对数据进行排序。例如,按 ‘Age’ 列升序排序:sorted_data = data.sort_values('Age')
- 数据分组与聚合:使用
groupby()方法对数据进行分组,并结合聚合函数进行计算。例如,按 ‘Gender’ 分组计算每组的平均年龄:average_age = data.groupby('Gender').mean()['Age']
- 缺失值处理:使用
dropna()方法删除含有缺失值的行或列。例如,删除含有缺失值的行:data_no_na = data.dropna()
- 数据转换:使用
apply()方法对数据进行转换。例如,将 ‘Age’ 列中的字符串类型转换为整数类型:python data['Age'] = data['Age'].apply(lambda x: int(x) if x.isdigit() else x)在上面的代码中,我们使用了apply()方法将 ‘Age’ 列中的字符串类型转换为整数类型。如果某个值不是数字字符串,则保持原样。

发表评论
登录后可评论,请前往 登录 或 注册