迹忆客 专注技术分享

当前位置:主页 > 学无止境 > 编程语言 > Python >

Pandas DataFrame DataFrame.boxplot() 函数

作者:迹忆客 最近更新:2024/04/22 浏览次数:

pandas.DataFrame.boxplot() 从 DataFrame 列中绘制箱线图。箱线图总结了数据的最小值、第一四分位数、中位数、第三四分位数和最大值。


pandas.DataFrame.boxplot() 语法

DataFrame.boxplot(
    column=None,
    by=None,
    ax=None,
    fontsize=None,
    rot=0,
    grid=True,
    figsize=None,
    layout=None,
    return_type=None,
    backend=None,
    **kwargs
)

参数

column 用于生成箱线图的列名
by 通过不同组中的列来绘制不同的箱形图分组
ax 箱线图将使用的 Matplotlib 轴
grid 布尔型。打开(True)和关闭(False)网格。
rot 整数:标签沿 X 轴的旋转角度。标签沿 X 轴的旋转角度。
fontsize Boxplot 中标签的字体大小
layout 用于控制或设置 Boxplot 布局的参数
return_type 返回的对象类型
backend 要使用的后端,而不是在选项 plotting.backend 中指定的后端。
**kwargs 方法的关键字参数

示例代码:用 pandas.DataFrame.boxplot() 生成箱线图

import pandas as pd
import matplotlib.pyplot as plt

fruits=['Apple', 'Papaya', 'Banana', 'Mango','Litchi','Avocado']
prices=[3, 1, 2, 4,4,5]

df = pd.DataFrame({'Fruit':fruits ,
                   'Price': prices})
print(df)

boxplot = df.boxplot(column=['Price'])
boxplot.plot()

plt.show()

输出:

它从 DataFramePrice 列生成一个箱线图。我们使用 matplotlib.pyplot 来显示生成的图。


示例代码:使用 pandas.DataFrame.boxplot() 生成基于列值的分组数据的箱线图

import pandas as pd
import numpy as np
import sklearn

dates=['April-10', 'April-10', 'April-11', 'April-11','April-11']
prices=[3, 1, 2, 4,5]

df = pd.DataFrame({'Date':dates ,
                   'Price': prices})
print(df)

boxplot = df.boxplot(column=['Price'],by="Date")
boxplot.plot()

plt.show()

输出:

首先,它将给定的 DataFrame 根据它们的 Date 列的值分成不同的组,然后为每个 DataFrame 生成一个箱线图。

我们可以使用 fontsizerotgrid 参数自定义我们的图。

import pandas as pd
import matplotlib.pyplot as plt

dates=['April-10', 'April-10', 'April-11', 'April-11','April-11']
prices=[3, 1, 2, 4,5]

df = pd.DataFrame({'Date':dates ,
                   'Price': prices})
print(df)

boxplot = df.boxplot(column=['Price'],by="Date",grid=False, rot=45, fontsize=15)
boxplot.plot()

plt.show()

输出:

这里,grid=False 关闭网格,rot=45 将 X 轴标签旋转 45 度,fontsize=15 将字体大小改为 15。


设置 layout 参数来改变箱线图的布局

import pandas as pd

dates=['April-10', 'April-10', 'April-11', 'April-11','April-11']
prices=[3, 1, 2, 4,5]


df = pd.DataFrame({'Date':dates ,

boxplot = df.boxplot(column=['Price'],by="Date",layout=(2,1),grid=False,fontsize=15)

输出:

这里,layout 参数改变了生成的箱线图的布局。layout=(2,1) 将箱线图排列成两行一列。

转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处

本文地址:

相关文章

DataFrame 获取给定列的第一行

发布时间:2024/04/22 浏览次数:51 分类:Python

本教程介绍了如何在 Pandas DataFrame 中使用 Series.loc()和 Series.iloc()方法获取给定列的第一行。

Pandas 重命名多个列

发布时间:2024/04/22 浏览次数:186 分类:Python

本教程演示了如何使用 Pandas 重命名数据框中的多个列。

扫一扫阅读全部技术教程

社交账号
  • https://www.github.com/onmpw
  • qq:1244347461

最新推荐

教程更新

热门标签

扫码一下
查看教程更方便