Tableau/RPA 系統工程師|零壹科技股份有限公司_Zero One Tech

台北市內湖區 1年以上 專科 電腦系統整合服務業
我要應徵
學歷: 資訊管理相關、資訊工程相關,專科、大學、碩士、博士
需加強技能-企業要求 點擊標籤,查看學習內容
PythonETLMS SQLJavaScriptTableauPower BI英文
需加強技能-相關
流程整合客戶專案系統開發溝通能力系統整合數據分析教育訓練SQLRPA
符合度
?

履歷符合度:登入計算

適合度
?

性格適合度:登入計算

Python
Python是一種物件導向、直譯式電腦程式語言,也是一種功能強大而完善的通用型語言,已經具有十多年的發展歷史,成熟且穩定。這種語言具有非常簡捷而清晰的語法特點,適合完成各種高層任務,幾乎可以在所有的作業系統中執行。 雖然 Python 可能被粗略地分類為「指令碼語言」(script language),但實際上一些大規模軟體開發計劃例如 Zope、Mnet 及 BitTorrent,Google 也廣泛地使用它。 Python 的支援者較喜歡稱它為一種高階動態編程語言,原因是「指令碼語言」泛指僅作簡單編程任務的語言,如 shell script、JavaScript 等只能處理簡單任務的編程語言,並不能與 Python 相提並論。 此外,由於 Python 對於 C 和其他語言的良好支援,很多人還把 Python 作為一種「膠水語言」(glue language)使用。 使用 Python 將其他語言編寫的程式進行整合和封裝。 在 Google 內部的很多專案使用 C++ 編寫性能要求極高的部分,然後用Python呼叫相應的模組。
Hi~ 分享你的學習心得來幫助後輩或向前輩提問吧!
我要分享
我要提問

學習推薦

全部
影片
文章

不知如何開始嗎? 先進行技能挑戰吧~

技能挑戰:初級
目前等級:未達初級
2776 人已通過「初級」測驗,通過率82%,和求職精靈一起探索知識、增強能力!
我要挑戰

Learn Code With Mike品牌創辦人

11/25 23:58

客製化Pandas DataFrame樣式的實用方法(下)
本文以Kaggle網站的「Netflix data with IMDB scores added( https://www.kaggle.com/sarahjeeeze/imdbfile
)」資料集為例,分享Pandas套件如何依據特定的條件,客製化顯示Pandas DataFrame的資料結果樣式。
Q:Pandas DataFrame如何設定文字樣式?
Pandas DataFrame有了資料後,假設type(影片型態)欄位的資料,Movie的文字想要顯示黃色,而其餘的則顯示紅色,這時候就需要依據這樣的條件,自訂一個函式,如下範例:
#影片型態欄位的文字顏色
def type_color(val):
color = 'yellow' if val == 'Movie' else 'red'
return f'color:{color}'
df = pd.read_csv('mycsvfile.csv')
接下來,就可以使用Pandas套件的style模組,呼叫applymap()方法(Method),將函式中所定義的樣式套用到Pandas DataFrame中,如下範例:
#影片型態欄位的文字顏色
def type_color(val):
color = 'yellow' if val == 'Movie' else 'red'
return f'color:{color}'
df = pd.read_csv('mycsvfile.csv')
new_df = df.head(10).style.applymap(type_color, subset=pd.IndexSlice[:,['type']])
範例中由於我們僅針對type(影片類型)欄位設計文字樣式,所以在applymap()方法(Method)的subset關鍵字參數中,使用Pandas套件的索引切片語法,選擇type(影片類型)欄位的所有資料,套用自訂的文字顏色樣式。
Q:Pandas DataFrame如何設定長條圖樣式?
Pandas DataFrame可以依據資料的值顯示漸層的背景顏色外,也能夠利用Pandas套件style模組的bar()方法(Method),顯示長條圖的形狀,如下範例:
def type_color(val):
color = 'yellow' if val == 'Movie' else 'red'
return f'color:{color}'
def rating_highlight(val):
color = 'grey' if int(val) > 5 else ''
return f'background-color: {color}'
df = pd.read_csv('mycsvfile.csv')
new_df = df.head(10).style.bar(subset=['rating'],color='#5fba8d')
當然,如果想要同時顯示多個Pandas DataFrame樣式,只要往後串接方法(Method)即可。舉例來說,在Pandas DataFrame中,標記遺漏值與rating(評價)欄位最大、最小值的背景顏色,就可以如下範例作法:
def type_color(val):
color = 'yellow' if val == 'Movie' else 'red'
return f'color:{color}'
def rating_highlight(val):
color = 'grey' if int(val) > 5 else ''
return f'background-color: {color}'
df = pd.read_csv('mycsvfile.csv')
new_df = df.head(10).style.highlight_null(null_color='red')\
.highlight_max(color='orange', subset='rating')\
.highlight_min(color='green', subset='rating')
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/05/pandas-dataframe-styling.html )網站觀看更多精彩內容。
  • Python
  • PYTHON資料分析
  • 資料分析
  • Pandas
拍手 2 留言 0 觀看 191 收藏 2

Learn Code With Mike品牌創辦人

11/25 23:52

客製化Pandas DataFrame樣式的實用方法(上)
本文以Kaggle網站的「Netflix data with IMDB scores added( https://www.kaggle.com/sarahjeeeze/imdbfile
)」資料集為例,分享Pandas套件如何依據特定的條件,客製化顯示Pandas DataFrame的資料結果樣式。
Q:Pandas DataFrame如何設定背景樣式?
想要使用背景顏色來強調資料的重點,同樣可以透過自訂函式來客製化顯示Pandas DataFrame的背景顏色條件:
#影片型態欄位的文字顏色
def type_color(val):
color = 'yellow' if val == 'Movie' else 'red'
return f'color:{color}'
#評價欄位的背景顏色
def rating_highlight(val):
color = 'grey' if int(val) > 5 else ''
return f'background-color: {color}'
df = pd.read_csv('mycsvfile.csv')
new_df = df.head(10).style.applymap(rating_highlight, subset=pd.IndexSlice[:, ['rating']])
範例中的自訂函式中,將傳入的評價轉型為整數後,只要大於5就顯示灰色背景,否則維持原樣。接著,利用Pandas套件的索引切片語法,選擇rating(評價)欄位資料,並且套用Pandas DataFrame的背景顏色樣式。
當然Pandas套件的style模組也內建了幾個常用的背景樣式方法(Method),包含:
1.background_gradient()-依據資料的值顯示漸層的背景顏色,可利用subset關鍵字參數設定所要套用的欄位:
def type_color(val):
color = 'yellow' if val == 'Movie' else 'red'
return f'color:{color}'
def rating_highlight(val):
color = 'grey' if int(val) > 5 else ''
return f'background-color: {color}'
df = pd.read_csv('mycsvfile.csv')
new_df = df.head(10).style.background_gradient(subset='rating')
2.highlight_null()-有遺漏值的地方,顯示背景顏色,幫助資料分析人員快速識別:
def type_color(val):
color = 'yellow' if val == 'Movie' else 'red'
return f'color:{color}'
def rating_highlight(val):
color = 'grey' if int(val) > 5 else ''
return f'background-color: {color}'
df = pd.read_csv('mycsvfile.csv')
new_df = df.head(10).style.highlight_null(null_color='red')
3.highlight_max()-將最大值顯示背景顏色,可利用subset關鍵字參數設定所要套用的欄位:
def type_color(val):
color = 'yellow' if val == 'Movie' else 'red'
return f'color:{color}'
def rating_highlight(val):
color = 'grey' if int(val) > 5 else ''
return f'background-color: {color}'
df = pd.read_csv('mycsvfile.csv')
new_df = df.head(10).style.highlight_max(color='orange', subset='rating')
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/05/pandas-dataframe-styling.html )網站觀看更多精彩內容。
  • PYTHON資料分析
  • 資料分析
  • Pandas
  • Python
拍手 2 留言 0 觀看 71 收藏 2

Learn Code With Mike品牌創辦人

11/24 22:35

3個優化Pandas套件讀取大型CSV檔案資料的技巧
本文以Kaggle網站的「Netflix data with IMDB scores added( https://www.kaggle.com/sarahjeeeze/imdbfile )」資料集為例,來和大家分享3個技巧,減少Pandas套件在處理大型資料時的記憶體耗用,以及提升讀取效率。
Q:Pandas如何去除不需要的資料?
在資料分析的過程中,有時並不是所有的CSV檔案欄位都是會使用到的,所以在呼叫Pandas套件的read_csv()方法(Method)時,相對於讀取所有欄位的大量資料,可以設定usecols關鍵字參數,僅讀取會使用到欄位,如下範例:
#所需的欄位
usecols = ['type', 'title', 'director', 'date_added', 'rating']
df = pd.read_csv('mycsvfile.csv', usecols=usecols)
讀取所要的資料欄位後,其中具有遺漏值的資料如果不需要,可以透過Pandas套件的dropna()方法(Method)進行去除,節省後續記憶體處理的資料量,如下範例:
new_df = df.dropna()
當然,dropna()方法(Method)還有以下3個關鍵字參數能夠依據需求來設定去除遺漏值的條件:
1.how:any(只要任一欄位有遺漏值就去除)、all(所有欄位皆有遺漏值就去除)
2.thresh:設定一筆資料有幾個遺漏值就移除
3.subset:設定檢查遺漏值的欄位
Q:Pandas如何精確設定欄位資料型態?
使用Pandas套件的read_csv()方法(Method)讀取CSV檔案資料時,也需要對所讀取的欄位設定精確的資料型態,尤其是數值類型的資料,避免耗用多餘的記憶體資源。
舉例來說,同樣是浮點數的資料,如果能夠視需求設定讀取float32型態,將會比float64型態佔用較少的記憶體資源,這時後就可以搭配Numpy套件來進行設定,安裝指令如下:
$ pip install numpy
而設定Pandas套件的讀取資料型態如下範例:
import pandas as pd
import numpy as np
usecols = ['type', 'title', 'director', 'date_added', 'rating']
df = pd.read_csv('mycsvfile.csv',
usecols=usecols,
dtype={'type':str,
'title':str,
'director':str,
'date_added':str,
'rating':np.float32})
new_df = df.dropna()
Q:Pandas如何切分資料?
相較於一次讀取大量的資料,我們可以將資料依需求或記憶體資源切分為多個區塊(chunk),最後再把處理好的各區塊(chunk)進行合併,如下範例:
#清理區塊中的遺漏值函式
def chunk_cleaning(data_chunk):
cleaned_chunk = data_chunk.dropna()
return cleaned_chunk
#將CSV檔案以1000筆資料切分為一區塊
data_chunks = pd.read_csv('mycsvfile.csv', chunksize=1000)
chunk_list = [] #暫存各區塊的處理結果
for data_chunk in data_chunks:
cleaned_chunk = chunk_cleaning(data_chunk) #清理區塊中的遺漏值
chunk_list.append(cleaned_chunk)
combined_chunk = pd.concat(chunk_list) #將各區塊的結果進行合併
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/06/optimize-pandas-speed-and-memory.html )網站觀看更多精彩內容。
  • Pandas
  • Python
  • 資料分析
  • PYTHON資料分析
拍手 2 留言 0 觀看 47 收藏 2

Learn Code With Mike品牌創辦人

11/24 22:18

4個必學的Pandas套件處理遺漏值資料方法
本文以Kaggle網站的「Netflix data with IMDB scores added( https://www.kaggle.com/sarahjeeeze/imdbfile )」資料集為例,來和大家分享筆者在處理遺漏值(Missing Value)時,常用的Pandas套件方法(Method)。
Q:Pandas如何探索遺漏值(Missing Value)?
如果想要探索每一個欄位資料是否有遺漏值(Missing Value),通常會使用Pandas套件的isnull()方法(Method)來查看,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.isnull())
Pandas套件的isnull()方法(Method)會將所有欄位資料內容顯示為布林值(Boolean),只要是遺漏值(Missing Value)就會顯示為True。
但是這樣並沒有辦法讓我們快速瞭解每個欄位的遺漏值(Missing Value)狀況,這時候就可以搭配使用Pandas套件的sum()方法(Method),將每個欄位進行加總,瞭解每個欄位的遺漏值(Missing Value)個數,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.isnull().sum())
由於在Python中,True代表1,False代表0,所以利用Pandas套件的isnull()與sum()方法(Method),就能夠知道資料集的每個欄位遺漏值(Missing Value)個數。
Q:Pandas如何檢視遺漏值(Missing Value)?
探索了每個欄位的遺漏值(Missing Value)個數後,如果想要特別檢視特定欄位的遺漏值(Missing Value)資料內容,就可以利用以下的Pandas套件篩選語法:
df = pd.read_csv('mycsvfile.csv')
print(df[df.date_added.isnull()])
以上範例,就是檢視date_added(新增日期)欄位的11筆遺漏值(Missing Value)資料內容。
Q:Pandas dropna()方法(Method)如何使用?
Pandas套件提供了dropna()方法(Method)來因應不同的需求,包含:
1.dropna(how='any'):任一欄位有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(how='any'))
2.dropna(how='all'):所有欄位皆有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(how='all'))
3.dropna(subset=['欄位名稱', ...], how='any'):任一個指定的欄位有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(subset=['director', 'date_added'], how='any'))
4.dropna(subset=['欄位名稱', ...], how='all'):指定的欄位皆有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(subset=['director', 'date_added'], how='all'))
Q:Pandas fillna()方法(Method)如何使用?
另一個遺漏值(Missing Value)資料的處理方式,就是填入自訂的值,這時候就能利用Pandas套件的fillna()方法(Method),指定value關鍵字參數(Keyword Argument)為想要填入的值即可,如下範例:
df = pd.read_csv('mycsvfile.csv')
df['director'].fillna(value='Not Found', inplace=True)
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/07/pandas-handle-missing-value.html )網站觀看更多精彩內容。
  • Python
  • PYTHON資料分析
  • Pandas
  • 資料分析
拍手 2 留言 0 觀看 31 收藏 2

Learn Code With Mike品牌創辦人

11/24 22:06

使用Pandas套件將資料集拆分成多個CSV檔案資料應用
本文就以Kaggle網站的「Coursera Course Dataset( https://www.kaggle.com/siddharthm1698/coursera-course-dataset )」資料集為例,基於其中的課程難易度等級欄位(course_difficulty),來分別拆分多個CSV檔案。實作步驟包含:
一、Pandas unique()方法(Method)
由於本文想要基於課程難易度等級欄位(course_difficulty),將不同等級的課程資料分別匯出到多個CSV檔案,這時後就可以利用Pandas套件的unique()方法(Method),來取得課程難易度等級欄位(course_difficulty)的獨立值有哪些,如下範例:
df = pd.read_csv('coursea_data.csv')
levels = df['course_difficulty'].unique()
print(levels)
執行結果:
array(['Beginner', 'Intermediate', 'Mixed', 'Advanced'], dtype=object)
從以上結果就可以知道課程難易度等級欄位(course_difficulty)共有四個等級的資料。
二、Pandas基於欄位值拆分資料集
而要使用Pandas套件依據條件選擇資料,像是選擇課程難易度等級欄位(course_difficulty)為「Advanced」的課程資料,如下範例:
df = pd.read_csv('coursea_data.csv')
levels = df['course_difficulty'].unique()
new_df = df[df['course_difficulty'] == 'Advanced']
接下來,要分別選擇課程難易度等級欄位(course_difficulty)的四個等級資料,大家應該猜到該怎麼做了吧?沒錯,就是透過迴圈來分別利用Pandas套件進行選擇,如下範例:
df = pd.read_csv('coursea_data.csv')
levels = df['course_difficulty'].unique()
for level in levels:
new_df = df[df['course_difficulty'] == level]
三、Pandas基於欄位值匯出多個CSV檔案
在執行迴圈的過程中,Pandas套件選擇了課程難易度等級的資料後,就可以進行匯出CSV檔案的動作,本文以課程難易度等級來作為檔案名稱,如下範例:
df = pd.read_csv('coursea_data.csv')
levels = df['course_difficulty'].unique()
for level in levels:
new_df = df[df['course_difficulty'] == level]
new_df.to_csv(f'coursera_{level}.csv', index=False) #索引值不匯出到CSV檔案中
這時候就可以看到,我們成功從原來的「Coursera Course Dataset(coursea_data.csv)」資料集,基於課程難易度等級欄位(course_difficulty),分別匯出了各個等級的課程資料CSV檔案。
最後,利用Pandas套件讀取拆分後的CSV檔案,來檢視資料內容是否正確,以「coursera_Intermediate.csv」為例,如下:
df = pd.read_csv('coursea_data.csv')
levels = df['course_difficulty'].unique()
for level in levels:
new_df = df[df['course_difficulty'] == level]
new_df.to_csv(f'coursera_{level}.csv', index=False) #索引值不匯出到CSV檔案中
mediate_df = pd.read_csv('coursera_Intermediate.csv')
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/10/pandas-split-csv-into-multiple-files.html )網站觀看更多精彩內容。
  • 資料分析
  • Python
  • PYTHON資料分析
  • Pandas
拍手 2 留言 0 觀看 21 收藏 2

Learn Code With Mike品牌創辦人

11/23 22:44

輕鬆入門3個常見的Pandas套件排序資料方式
面對現實生活中所蒐集來的各式各樣資料,想要能夠快速的進行初步整理,並且有效觀察其中的內容,資料排序可以說是最常使用的方法之一。
而Pandas套件對於資料排序的功能,也提供了非常好支援,本文就以Kaggle網站的2009-2019年Amazon前50名暢銷書資料集bestsellers with categories.csv( https://www.kaggle.com/sootersaalu/amazon-top-50-bestselling-books-2009-2019 )為例,帶大家來瞭解如何在資料集中應用Pandas套件的排序方法(Method)。
Q:Pandas DataFrame如何單欄位排序資料?
如果想要針對讀者評價(User Rating)來進行由小到大的升冪排序,就可以呼叫Pandas套件的sort_values()方法(Method),並且透過by關鍵字參數,指定所要排序的欄位名稱,如下範例:
df = pd.read_csv('bestsellers with categories.csv')
df.sort_values(by='User Rating')
事實上,Pandas套件的sort_values()方法(Method)會知道要升冪排序,是因為還有一個ascending關鍵字參數,預設為True,所以如果想要進行升冪排序,可以省略ascending關鍵字參數。
相反的,Pandas套件的sort_values()方法(Method)要執行由大到小的降冪排序,就需要設定ascending關鍵字參數為False,如下範例:
df = pd.read_csv('bestsellers with categories.csv')
df.sort_values(by='User Rating', ascending=False)
Q:Pandas DataFrame如何多欄位排序資料?
實務上,除了單欄位的排序外,很多時候會使用多欄位來進行排序,讓單欄位中擁有相同值的資料再透過額外的欄位排序,增加資料的識別度。
而Pandas套件的sort_values()方法(Method)也提供了多欄位的排序方式,利用串列(List)來指定多個欄位名稱即可,如下範例:
df = pd.read_csv('bestsellers with categories.csv')
df.sort_values(by=['Genre', 'User Rating'])
以上的範例,就是先依照書籍類型(Genre)排序,再按讀者評價(User Rating)排序,並且都是升冪排序。
同樣的,如果想要降冪排序,就需設定ascending關鍵字參數為False,如下範例:
df = pd.read_csv('bestsellers with categories.csv')
df.sort_values(by=['Genre', 'User Rating'], ascending=False)
Q:Pandas DataFrame如何多欄位升降冪排序資料?
既然Pandas套件的sort_values()方法(Method)可以多欄位來進行排序,那能不能夠指定各自的升降冪排序呢?
答案是可以的,sort_values()方法(Method)的ascending關鍵字參數同樣可以利用串列(List)的方式,來分別將對應的欄位做升降冪排序,如下範例:
df = pd.read_csv('bestsellers with categories.csv')
df.sort_values(by=['Author', 'Reviews'], ascending=[False, True]).head(25) #取前25筆資料
從執行結果可以看到,書籍作者(Author)為降冪排序,而書籍評論數(Reviews)則為升冪排序。
本文分享了三個使用Pandas套件來排序資料的常見情境,利用sort_values()方法(Method)的by與ascending關鍵字參數,即可對單欄位或多欄位的資料來進行升降冪排序,同時也要特別注意在多欄位排序時,是有順序性的,也就是會按照串列(List)中的欄位名稱先後順序來排序。希望本文的實作能夠幫助大家學會使用Pandas套件的排序資料方法(Method)。
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/04/pandas-data-sorting.html )網站觀看更多精彩內容。
  • 資料分析
  • Python
  • Pandas
  • PYTHON資料分析
拍手 2 留言 0 觀看 33 收藏 2

104求職精靈x聯成

聯成

10/07 00:00

觀看 819 收藏 0

104求職精靈x電腦技能基金會

電腦技能基金會 精選線上課程

02/01 00:00

觀看 452 收藏 2

104求職精靈xHahow好學校

Hahow好學校 精選線上課程

09/29 11:56

觀看 547 收藏 23

104求職精靈xCupoy

10/21 10:40

觀看 361 收藏 5

104求職精靈x商業發展研究院

商業發展研究院 精選線上課程

08/13 00:00

觀看 89 收藏 7

Learn Code With Mike品牌創辦人

11/23 22:33

有效利用Pandas套件篩選資料的應用技巧
本文利用Kaggle網站的星巴克滿意度調查資料集Starbucks satisfactory survey.csv( https://www.kaggle.com/mahirahmzh/starbucks-customer-retention-malaysia-survey ),來和大家分享Pandas套件篩選資料的常見語法應用。
Q:Pandas如何單一條件篩選資料?
假設,我們想要篩選出職業為學生的資料集,就可以像邏輯判斷式一樣,存取Job(職業)欄位,並且指定條件,接著,放入Pandas套件的loc[]語法中來進行篩選,如下範例:
df = pd.read_csv('Starbucks satisfactory survey.csv')
filt = (df['Job'] == 'Student')
print(df.loc[filt])
在篩選出所需的資料後,有時並不會想要看到那麼多欄位,而是少部分的特定欄位資料,就可以在Pandas套件的loc[]語法第二個參數,加上想要檢視的欄位標題串列(List),如下範例:
df = pd.read_csv('Starbucks satisfactory survey.csv')
filt = (df['Job'] == 'Student')
print(df.loc[filt, ['Job', 'VisitFrequency', 'EnjoyType']])
如此就能夠看出學生的星巴克拜訪頻率(VisitFrequency)與享用方式(EnjoyType)。
Q:Pandas如何多條件篩選資料?
除此之外,當有一個篩選條件以上的情況時,就可以使用Pandas套件的邏輯運算子,包含「 & (And)」與「 | (Or)」,來串接多個條件。
舉例來說,我們想要篩選出學生擁有星巴克會員的資料,也就是Job(職業)欄位為Student且(And) MembershipCard(會員卡)欄位為Yes,兩個條件皆符合的資料集,如下範例:
df = pd.read_csv('Starbucks satisfactory survey.csv')
filt = (df['Job'] == 'Student') & (df['MembershipCard'] == 'Yes')
print(df.loc[filt])
從執行結果可以看到,每一筆資料都符合指定的兩個條件。同樣的,想要針對特定欄位來檢視資料,在Pandas套件的loc[]語法第二個參數加上欄位標題串列(List)即可,如下範例:
df = pd.read_csv('Starbucks satisfactory survey.csv')
filt = (df['Job'] == 'Student') & (df['MembershipCard'] == 'Yes')
print(df.loc[filt, ['Job', 'MembershipCard', 'VisitFrequency']])
以上的執行結果就可以瞭解學生擁有星巴克會員的拜訪頻率(VisitFrequency)。另一方面,如果將以上Pandas套件的 & (And)邏輯運算子換成 | (Or),意思就會變成只要是學生或(Or)擁有星巴克會員,符合一個條件的資料就篩選出來,如下範例:
df = pd.read_csv('Starbucks satisfactory survey.csv')
filt = (df['Job'] == 'Student') | (df['MembershipCard'] == 'Yes')
print(df.loc[filt, ['Job', 'MembershipCard', 'VisitFrequency']])
Q:Pandas如何篩選字串資料?
針對資料內容較多的情況下,想要以關鍵字的方式來篩選資料,則可以利用Pandas套件的字串方法(Method),如下範例:
df = pd.read_csv('Starbucks satisfactory survey.csv')
filt = df['PromotionsChannel'].str.contains('Social Media', na=False)
print(df.loc[filt, ['Job', 'PromotionsChannel']])
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/04/pandas-data-filtering.html )網站觀看更多精彩內容。
  • Pandas
  • PYTHON資料分析
  • 資料分析
  • Python
拍手 2 留言 0 觀看 16 收藏 2
工作機會

Python Engineer

億力資訊股份有限公司

台北市內湖區 經歷不拘 高中

待遇面議

python工程師

英特拉金融科技股份有限公司

台北市大安區 3年以上 大學

待遇面議
我要應徵