top of page
其他學習
Weddings
寒訓
推
噓
Python+文字雲
爬取ptt Stock版上的文章及留言,將其資訊存入資料庫。再將留言最常出現的關鍵字做排序,並將其作為文字雲,方便看出該版通常在討論什麼。
QlikView
QlikView是相對比較好上手的。使用QlikView將資料視覺化,將學長提供的股市數據,製作成價量走勢圖,方便大家觀看目前市面上的股價走勢情況。
Private Parties
學期間
TextRank
-
TextRank 是一種基於圖的用於關鍵詞抽取和文檔摘要的排序演算法,能夠從一個給定的文本中抽取出該文本的關鍵詞、關鍵詞組及其權重,並使用抽取式的自動文摘方法抽取出該文本的關鍵句。
-
實作
使用Textrank提取各個長照文章中出現次數最多的前10個關鍵字。
分三群
分七群
K-Means
-
K-Means 屬於非監督式學習,透過分群分類演算法我們能夠將多種維度的資料進行分類。
-
實作
TextRank 實作完後,我使用K-Means將各個文章做分群分類(以關鍵字重疊次數及權重做分群分群),看有哪些文章的關聯性較緊密。
bottom of page