R語言和文字探勘 - 洞悉巨量文字的商業價值

課程資訊 適合對象 開課單位 相關課程
Loading...

R語言和文字探勘 - 洞悉巨量文字的商業價值

1551次瀏覽
$2,790
課程資訊
上課時間 不限時間次數,隨時可觀看查看更多
課程時長 9 小時 6 分
課程內容
- 利用 stringr、tm、jiebaR 斷詞等套件,進行文字資料的清理與轉換 - 利用 R 中的各項套件,繪製文字雲、詞彙網絡圖與文字統計圖表 - 學習詞頻分析、關鍵字萃取(tf-idf, RAKE 等)、詞嵌入模型(n-gram、Glove)、主題模型(非負矩陣分解、LDA)、向量空間模型、文件分群與分類等 - 運用上述的文字探勘演算法解決實際的商業問題
開課單位
Hahow好學校
【學那些學校不會教的事】 Hahow 「ㄏㄚˇㄏㄠ」,取自台語「學校」(ha̍k-hāu) 的發音,是最有趣的線上課程平台,亞洲領先的跨領域募資學習網站。 2015 年 01 月由 4 個 7 年級生創立,期望從自身經歷,散播我們的學習哲學。不管你在自己的學校中學到了什麼,都會渴望認識新的事物,學那些學校不會教的事,就是豐富人生的秘密!
最新動態 看所有動態

玩遊戲學程式,讓想像力成為你的原始碼!

程式教育在近幾年成為熱議話題,甚至程式設計即將納入國高中課綱規劃;然而如何不讓玩家(學生)在學程式的過程中,限制了想像力的施展?這確實是一門學問。 自從美國國家科學基金會( NSF )在 2016 年開始推廣跨領域科學教育後,STEM 學習就變成一個很熱門的名詞。STEM 四個字母分別代表了科學( Science )、技術( Technology )、工程( Engineering )和數學( Mathematics )。現代個人電腦和手機如此普及,隨著時代潮流「程式教育」好像逐漸變成一個「外文學習」一樣的熱門名詞。 Apple 在 2016 年推出的《Swift Playgrounds》就是一款充滿教育意義的「寫程式遊戲」。遊戲中有個可愛的生物,玩家必須透過簡單的程式編寫方法來解開謎題,引導這個可愛的生物往目標前進。 因為這種解謎類型的遊戲通常都是目標導向,往往玩家們學到的是解決某些固定的問題。例如「走兩步、向右轉、重複四次」這樣的指令來達到目標,雖然能夠讓玩家理解一些基本的程式邏輯(例如 If, loop, fuction, paramter 等)、也讓玩家體會了「寫程式」的過程,但往往因為太目標導向,反而限制了玩家的想像力發揮空間。 如果用畫圖來比喻,就像是美術老師教我們畫一顆蘋果,教會我們光影、色彩、比例,然後要求讓我們用同樣的方法畫出一顆一樣的蘋果。雖然學到了技巧,卻限制了想像力。 詳見原文> https://hahow.in/cafeteria/articles/6092319889d06d180f4e478c

謠言止於智者,談談用區塊鏈打擊假新聞可能嗎?

《紐約時報》在 2019 年啟動一項名為新聞溯源( News Provenance )的專案,目的是想運用區塊鏈打擊假新聞。聽到的人不免會想,假新聞的問題錯綜複雜,《紐約時報》打算如何解決? 假新聞哪來的? 打擊假新聞之前,我們不妨回頭看看假新聞的根源。現在人人都有手機,不僅可以隨時閱讀新聞,也可以隨時創造新聞。資訊量大幅增加的情況下,難免就會出現假資訊魚目混珠。假新聞的形式五花八門,我簡單分為兩大類: 類型一:有待澄清的假資訊 氾濫的假消息偽裝成真新聞,就連總統都會成為受害者。根據聯合新聞網報導: 蔡英文總統出訪加勒比海友邦期間,臉書流傳「蔡英文到海地才四小時,就送了四十五億。高雄滅登革熱要五千萬才給二千多萬!」貼文。 刑事局接獲總統府告發是不實訊息,查獲貼文的三名男子,依社會秩序維護法函送。 在「總統金援」的謠言之前,還有「行政院長丟筆」的假消息在網路上流傳。總統和行政院長都可以透過媒體主動澄清並戳破謠言,甚至法辦造謠者。但如果是像「芒果出現黑點代表有毒」、「多喝水可以治療癌症」或「抽煙可以抵擋霧霾」這類關於健康的假資訊,通常不會有明確的當事人跳出來闢謠。再加上這是群組中常被分享的主題,因此更難以根除。 詳見原文> https://hahow.in/cafeteria/articles/61c2e1db7629ab000764bbd7
相關課程