版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
從上面這篇文章學習而來, 附上出處~
零.基本知識
(1)Pandas有兩種數據結構, 一維的Series和二維的DataFrame.
(2)Series和DataFrame都有"標籤"(又可以叫索引index)對應不同"數據"的特性
一.Series
1.Series本質上是一個Numpy數組, 有數據標籤index和保存值value兩方面
2.創建
import pandas as pd
基本創建法 :
xx = pd.Series(X)
也可以這樣~~
那如果我創建一個Series, 想叫出A的數值
二.DataFrame
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
import pandas as pd
import numpy as np
df = pd.DataFrame([[2,2],[1,3]], columns=['A','B'], index=['a','b'])
如果我們單看A這一column~
那這一行的型態是?
所以我們可以看得出來, DataFrame就是Series的合併, 共用index而已
如果要增加一個Column也很容易, 直接寫就好~
假設我們要刪掉一個column呢? 來看一下pandas文本的網址
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop.html
意思是如果你只寫df.drop(X), 他的預設是axis=0, 也就是刪掉index
試看看 df.drop('A')
但是如果 df.drop('a')
所以我們要這樣
有種不太聰明的感覺~OK的~
但我們可以發現
其實他沒有被刪掉~如果我們要硬刪他要這樣