logo

Pandas 读取 CSV 文件示例及常用方法(入门)

作者:demo2024.01.17 20:51浏览量:60

简介:本文将介绍如何使用 Pandas 库读取 CSV 文件,以及一些常用的数据处理方法。通过实际操作和代码示例,帮助读者快速掌握 Pandas 的基本用法。

Pandas 是 Python 中用于数据处理和分析的强大库,而 CSV 文件是一种常见的数据存储格式。下面我们将通过示例和代码来演示如何使用 Pandas 读取 CSV 文件,以及一些常用的数据处理方法。
安装 Pandas
首先,确保已经安装了 Pandas。如果还没有安装,可以通过 pip 安装:

  1. pip install pandas

读取 CSV 文件
要读取 CSV 文件,我们可以使用 Pandas 的 read_csv() 函数。下面是一个简单的示例:

  1. import pandas as pd
  2. # 读取 CSV 文件
  3. data = pd.read_csv('data.csv')
  4. # 显示前几行数据
  5. print(data.head())

在上面的代码中,我们首先导入了 Pandas 库并简称为 pd。然后,使用 read_csv() 函数读取名为 ‘data.csv’ 的文件,并将结果存储在 data 变量中。最后,使用 head() 方法显示数据的前几行。
常用方法
Pandas 提供了一系列常用的数据处理方法。下面列举几个常用的方法:

  1. 选择列:使用列名选择某一列的数据。例如,选择 ‘Name’ 列:
    1. names = data['Name']
  2. 筛选数据:使用布尔索引筛选符合条件的数据。例如,选择 ‘Age’ 大于等于 18 的行:
    1. adults = data[data['Age'] >= 18]
  3. 数据排序:使用 sort_values() 方法对数据进行排序。例如,按 ‘Age’ 列升序排序:
    1. sorted_data = data.sort_values('Age')
  4. 数据分组与聚合:使用 groupby() 方法对数据进行分组,并结合聚合函数进行计算。例如,按 ‘Gender’ 分组计算每组的平均年龄:
    1. average_age = data.groupby('Gender').mean()['Age']
  5. 缺失值处理:使用 dropna() 方法删除含有缺失值的行或列。例如,删除含有缺失值的行:
    1. data_no_na = data.dropna()
  6. 数据转换:使用 apply() 方法对数据进行转换。例如,将 ‘Age’ 列中的字符串类型转换为整数类型:
    python data['Age'] = data['Age'].apply(lambda x: int(x) if x.isdigit() else x)在上面的代码中,我们使用了 apply() 方法将 ‘Age’ 列中的字符串类型转换为整数类型。如果某个值不是数字字符串,则保持原样。

相关文章推荐

发表评论

活动