Q:什麼是Pandas Series?
在隨手可得的數據時代,資料分析逐漸成為顯學,利用視覺化軟體或是分析處理工具,將蒐集的資料轉變為有用的資訊,來協助使用者進行決策。
Pandas套件則是其中一種常用的資料分析處理工具,它是基於Python程式語言來建立的,非常容易使用且強大,主要應用於單維度(Series)與二維度(DataFrame)的資料處理。
大家可以把Pandas套件想像成是Excel一樣,能夠將儲存的資料進行統計、搜尋或修改等操作,主要有兩種資料結構,分別是Series及DataFrame,本文就先帶大家來認識Series的基本觀念。
Pandas Series適用於處理單維度或單一欄位的資料,就像是Excel中的某一欄,左側為資料索引,右側為資料內容,不過Pandas Series自動產生的資料索引是從0開始計算,另外也有提供方法(Method),讓使用者可以自行定義。
Q:如何建立Pandas Series物件?
想要利Pandas Series來儲存單維度的資料,就需要先建立Pandas Series物件,語法如下:
my_series = pandas.Series(資料串列)
範例:
import pandas as pd
phone = pd.Series(["Apple", "Samsung", "Mi", "Sony"])
如果想要自訂資料索引,可以利用index關鍵字參數(Keyword Argument)來進行設定,如下範例:
import pandas as pd
phone = pd.Series(["Apple", "Samsung", "Mi", "Sony"], index=["p1", "p2", "p3", "p4"])
Q:如何取得Pandas Series資料?
可以利用資料順序或資料索引值來取得Pandas Series物件中的特定資料,如下範例:
import pandas as pd
phone = pd.Series(["Apple", "Samsung", "Mi", "Sony"], index=["p1", "p2", "p3", "p4"])
print(phone[1]) # 依據資料順序取值(從0開始計算)
print(phone["p3"]) # 依據資料索引值取值
Q:新增Pandas Series資料方法?
想要在既有的Pandas Series物件中新增資料,可以利用append()方法(Method)來達成,這邊要特別注意的是,append()方法(Method)需傳入Pandas Series物件,並且會額外產生一個新的Pandas Series物件,如下範例:
import pandas as pd
phone = pd.Series(["Apple", "Samsung", "Mi", "Sony"])
data = pd.Series(["Htc", "Oppo"]) # 新增的資料
combined = phone.append(data)
print(combined)
由於Pandas Series物件都會自動產生資料索引,所以從上面的執行結果可以看到,將兩個Pandas Series物件合併後,會發現資料索引沒有連續的問題,這時候可以在append()方法(Method)中加上「ignore_index = True」設定,來忽略資料索引,如下範例:
import pandas as pd
phone = pd.Series(["Apple", "Samsung", "Mi", "Sony"])
data = pd.Series(["Htc", "Oppo"]) # 新增的資料
combined = phone.append(data, ignore_index=True)
print(combined)