迹忆客 专注技术分享

当前位置:主页 > 学无止境 > 编程语言 > Python >

在 Pandas 中读取 Excel 多张工作表

作者:迹忆客 最近更新:2024/04/24 浏览次数:

Pandas 是用于数据科学和机器学习的著名 Python 库。这个库提供了许多关于数据分析、预测和操作的功能。

我们可以对提供的数据集执行许多操作。大多数时候,我们对包含数据集的 Excel 文件(也称为 xls 文件)或 CSV 文件(单个电子表格)执行分析。

我们可以从该文件加载单个工作表或多个 Excel 工作表。


在 Python 中使用 Pandas 从工作簿中读取多个 Excel 工作表

要使用 Pandas,我们应该首先使用以下命令安装它。

#Python 3.x
pip install pandas

此外,我们将在此处读取一个 Excel 文件(扩展名为 xls)。为此,我们还必须使用以下命令安装 xlrd 模块。

#Python 3.x
pip install xlrd

有时我们在同一个工作簿中有一个由多个电子表格组成的大型数据集。但我们只对该文件的某些特定电子表格感兴趣。

为此,我们必须从工作簿中打开特定的电子表格。我们可以在 Python 中使用 Pandas 轻松完成这项任务。


使用 read_Excel() 从 Pandas 工作簿中打开电子表格

首先,我们将使用 pd.ExcelFile('path_to_file.xls') 读取整个 Excel 文件。这里,pd 指的是 Pandas,我们将把 Excel 文件的路径作为参数传递给 ExcelFile() 的方法调用。

在下面的代码中,我们导入了 Pandas 包。然后我们读取一个 Excel 文件 dataset.xls,其中包含两个电子表格 iriscustomer_churn

我们正在使用 Jupyter 笔记本,因此我们已将此数据集上传到我们的主目录。xls 对象现在可以访问电子表格。

如果我们只想读取 iris 电子表格,我们将再次调用 read_excel() 方法。在第一个参数中,我们将传递 xls,在第二个参数中,我们将写入要从该 xls 文件中读取的特定电子表格的名称。

然后我们使用 df.head() 显示了该电子表格的前五行。我们可以通过在 read_excel() 中指定该电子表格的名称,以相同的方式从工作簿加载多个电子表格。

# Python 3.x
import pandas as pd

xls = pd.ExcelFile("dataset.xls")
df = pd.read_excel(xls, "iris")
df.head()
print(df)

输出:


在 Pandas 中使用 parse() 方法从工作簿中打开电子表格

从工作簿中读取单个电子表格的另一种方法是加载 xls 文件,然后使用 xls 对象调用 parse() 方法。作为 parse() 方法的参数,我们将指定电子表格的索引号。

整数是指该 xls 文件中的电子表格。0 代表第一个电子表格,1 代表第二个,依此类推,就像数组索引一样。

在这里,我们加载了 iris 电子表格,这是我们工作簿的第二个电子表格,因此我们将传递 1 作为索引。此代码的输出与上述相同。

# Python 3.x
import pandas as pd

xls = pd.ExcelFile("dataset.xls")
df = xls.parse(1)
df.head()
print(df)

输出:

转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处

本文地址:

相关文章

Pandas read_csv()函数

发布时间:2024/04/24 浏览次数:181 分类:Python

Pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 DataFrame 中。

Pandas 追加数据到 CSV 中

发布时间:2024/04/24 浏览次数:70 分类:Python

本教程演示了如何在追加模式下使用 to_csv()向现有的 CSV 文件添加数据。

Pandas 多列合并

发布时间:2024/04/24 浏览次数:190 分类:Python

本教程介绍了如何在 Pandas 中使用 DataFrame.merge()方法合并两个 DataFrames。

Pandas loc vs iloc

发布时间:2024/04/24 浏览次数:140 分类:Python

本教程介绍了如何使用 Python 中的 loc 和 iloc 从 Pandas DataFrame 中过滤数据。

扫一扫阅读全部技术教程

社交账号
  • https://www.github.com/onmpw
  • qq:1244347461

最新推荐

教程更新

热门标签

扫码一下
查看教程更方便