Python Pandas Panel 面板

Pandas Panel 是数据的3D容器。Panel 数据源自计量经济学。

Panels 数据容器有3 个轴,轴的名称可以很好的描述涉及面板数据的操作。

  • items - 轴 0,每个 item 对应于包含在其中的 DataFrame。
  • Major_axis - 轴 1,它是每个 DataFrame 的索引(行)。
  • minor_axis - 轴 2,它是每个 DataFrame 的列。

Pandas.Panel()

可以使用下面的函数创建Panel 数据

pandas.Panel(data, items, major_axis, minor_axis, dtype, copy)

参数说明如下

  • data - 数据采用各种形式,如 ndarray、系列、地图、列表、字典、常量以及 DataFrame
  • items - 轴=0
  • major_axis - 轴=1
  • minor_axis - 轴=2
  • dtype - 每列的数据类型
  • copy - 复制数据。默认,False

说明: 因为本站的Python扩展库 Pandas 使用的是新版本的,已经弃用了Panel方法。因此本章节的示例不提供在线执行


创建 Panel

可以使用多种方式创建 Panel,例如 -

  • 使用 ndarrays
  • 使用 DataFrames 的字典

使用 ndarray

import pandas as pd
import numpy as np

data = np.random.rand(2,4,5)
p = pd.Panel(data)
print p

运行结果如下

<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)
Items axis: 0 to 1
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 4

注意- 空Panel和上面Panel的大小不同。

使用 DataFrame 对象的字典

import pandas as pd
import numpy as np

data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p

运行结果如下

Dimensions: 2 (items) x 4 (major_axis) x 3 (minor_axis)
Items axis: Item1 to Item2
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 2

创建一个空Panel

可以使用 Panel 构造函数创建一个空Panel,如下所示

import pandas as pd
p = pd.Panel()
print p

运行结果如下

<class 'pandas.core.panel.Panel'>
Dimensions: 0 (items) x 0 (major_axis) x 0 (minor_axis)
Items axis: None
Major_axis axis: None
Minor_axis axis: None

访问 Panel 中的数据

可以从不同的轴访问数据

使用 items

import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p['Item1']

运行结果如下

            0          1          2
0    0.488224  -0.128637   0.930817
1    0.417497   0.896681   0.576657
2   -2.775266   0.571668   0.290082
3   -0.400538  -0.144234   1.110535

我们有两个item,我们检索了 item1。结果是一个 4 行 3 列的DataFrame,分别是Major_axis和Minor_axis维度。

使用major_axis

可以使用方法panel.major_axis(index)访问数据。

import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.major_xs(1)

运行结果如下

      Item1       Item2
0   0.417497    0.748412
1   0.896681   -0.557322
2   0.576657       NaN

使用 minor_axis

可以使用方法panel.minor_axis(index)访问数据。

import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.minor_xs(1)

运行结果如下

       Item1       Item2
0   -0.128637   -1.047032
1    0.896681   -0.557322
2    0.571668    0.431953
3   -0.144234    1.302466

注意- 观察大小的变化。

查看笔记

扫码一下
查看教程更方便