「我沒事」是什麼情緒？AI分析社交平台揪出霸凌

2019/11/12 研之有物

有學者研發，以機器學習分析社群發文情緒的經驗，希望有助偵測網路發文者的心理狀態。圖／Pexels

大數據情緒分析

在2017台灣人工智慧年會演講中，清華大學資工系的陳宜欣副教授，分享團隊以機器學習分析社群發文情緒的經驗。希望有助偵測網路發文者的心理狀態，或協助醫師理解病人無法清楚陳述的情緒。

「我沒事」到底是什麼情緒

情緒，是許多疾病和社會問題的表徵。例如有躁鬱傾向的人們，說話用詞有很大的情緒起伏；又如網路霸凌，會反映於社群留言的用字情緒。若能及早偵測到這些情緒，就有機會及時避免憾事發生，而這個任務可透過人工智慧 (Artificial Intelligence, AI) 協助。

但是，情緒不是那麼容易透過詞語理解。

例如，朋友在 Facebook 發文「我沒事」，究竟代表心平氣和的「我沒事」，還是絕望至極的「我沒事」；還有當鄉民留言「看吧！」，想表達的是讚賞意味的「看吧！」，或是嘲諷語氣的「看吧！」？

如同《來自星星的傻瓜》電影主角(一名外星人)所言，人類的語言非常難理解，在不同情境脈絡有不同意思，甚至會隱藏真實情感說謊。這些都增加人工智慧從語意分析情緒的難度。

清華大學資工系的陳宜欣副教授，是三個小孩的媽媽。她發現從小孩學習如何說話表達情緒的過程，可以梳理出一條路徑訓練機器學習。雖然小孩說話常常毫無邏輯，但許多小細節累積起來，就能讓大人判斷小孩的情緒。

例如當小孩對媽媽說「妳總是叫我收玩具」，其中用了「總是」這個詞，可以判斷小孩不太高興。或是小孩說「我永遠不能電視看了」，乍聽滿頭問號，但用了「永遠不能」這組詞，可以判斷其中的負面情緒。

不懂語法、沒背過辭典，還是可以表達情緒，反之也能分析情緒。

網路爬文借用群眾智慧

陳宜欣團隊運用網路爬蟲技術，將社群網站公開發文 ( PTT、Facebook、Twitter 等) ，跟情緒有關的內容都蒐集建立至「情緒資料庫」。或許有些人會認為：「這不就是一堆人在發廢文？」，但以群眾外包 (crowdsourcing) 的角度，這些社群發言集結起來，就是群眾智慧，可做為訓練機器學習的資料。

「情緒，是社群網站上的一種特性，也是可供機器學習的資料」陳宜欣強調。圖／台灣人工智慧年會 X 台灣資料科學年會

團隊將社群發文者原先在發文加上的情緒 Hashtag (例如 #anger) 作為參考答案，但一開始先把這些「答案」遮起來，訓練機器透過演算法學習發文中「出現哪些字」代表「什麼樣的情緒」，最後再與原本的答案 (例如 #anger) 對照，一次次地優化機器判斷情緒的準確率。

「用大數據做情緒分析有個重點，就是刪資料不要心痛！」陳宜欣笑中有股失敗無數次的堅毅，「太多 Hashtag 的發文、重複發文、太短沒有情緒特徵的發文……等等，都要從訓練資料中拿掉」。

團隊也參考新聞標題，找出哪些字是較中性的「非情緒資料」，並從機器學習的訓練資料中排除、優化準確率。值得注意的是，選舉時期的新聞標題不能參考，因為用字遣詞太過激昂。

找出情緒用詞的邏輯

經過機器學習分析，陳宜欣團隊發現一些跨語系的情緒邏輯。例如 “finally *** my” 這組字詞多表達快樂，而中文「我終於***」也多用來傳達正面的消息。又如 “my *** always” 這組字詞多含有生氣意味，就像小朋友說「爸爸/媽媽總是***」藉以表達不快。

中文贅字的處理，也是情緒分析很有趣的一環。「學生建議這很重要，一定要列入分析！」陳宜欣說。

例如：「喔，我來做」其實是不太想做，「喔喔，我來做」較為中性，「喔喔喔，我來做」帶有積極感。凡是超過三個以上的贅字，可視同為三個贅字。這個規則用在「哈」、「哈哈」、「哈哈哈」、「哈哈哈哈」也有同工之妙。

然而陳宜欣團隊發現，社群平台上「開心」的發文特別多，不能否認社群平台很多人發文以炫耀為主、或是報喜不報憂。

另外，網路霸凌其實有很多「暗語」。

例如，團隊看過一則發文是「那些外國動物不應該被出口」，其實這句暗地裡帶有種族歧視。其中一種解決方案是運用 Hatebase 仇恨發言資料庫，並藉由機器學習比對非仇恨的文字資料，找出這類「暗語」的關聯性(通常哪幾個字會一起被使用)、以及相似性(字詞會在句子中哪些類似地方出現)。

許多人會在憾事發生後，回過頭從當事者社群發文的字裡行間尋找跡象，但未來能否更早偵測？當局者迷，旁觀者清。讓人工智慧成為一名不帶情緒的旁觀者，分析社群大數據找出被情緒糾葛的人們，甚至是預防犯罪、偵測自殺傾向，在來不及之前。

執行編輯｜林婷嫻美術編輯｜張語辰

本文經「研之有物」授權轉載（原文標題：AI 可以幫助躁鬱、被霸凌的人嗎？）。

Take action！加入《倡議+》

「一個人為社會付出很辛苦，但一群人就不會寂寞。」每個人都可以用自己的方式成為倡議家：

立即加入【倡議+】社團：http://bit.ly/2JtBxB6

📌 倡議精選文章

💡 追新聞》在 Google News 按下追蹤，倡議家好文不漏接！

2°C目標已死...科學家宣布：全球暖化無可挽回人類何時會滅亡？超級電腦預測地球將會再度發生「大滅絕」

人工智慧平台霸凌 Facebook 選舉

作者文章

從發寶到發寶家族：興富發與滷沙沙共築品牌角色宇宙

從發寶到發寶家族：興富發與滷沙沙共築品牌角色宇宙

聯合報防詐論壇破解詐騙陷阱

聯合報防詐論壇破解詐騙陷阱

颱風也有好處？研究：颱風抑制海洋升溫 99%海洋熱浪在颱風過後消失

颱風也有好處？研究：颱風抑制海洋升溫 99%海洋熱浪在颱風過後消失

遭遊客、豪雨夾擊！塔塔加步道破損加劇玉管處試辦營隊以手作修復步道

遭遊客、豪雨夾擊！塔塔加步道破損加劇玉管處試辦營隊以手作修復步道

最新文章

南韓人口結構驟變！步入「超高齡」與「獨居社會」雙重危機

南韓人口結構驟變！步入「超高齡」與「獨居社會」雙重危機

失業率10.3%仍快樂！芬蘭經濟逆風幸福指數還是世界之冠

失業率10.3%仍快樂！芬蘭經濟逆風幸福指數還是世界之冠

這樣太危險！PFAS讓罹癌、不孕風險增加全球1/3化工廠默默開始停用

這樣太危險！PFAS讓罹癌、不孕風險增加全球1/3化工廠默默開始停用

應對網路危害！馬來西亞將跟進澳洲等國研議禁止16歲以下使用社群媒體

應對網路危害！馬來西亞將跟進澳洲等國研議禁止16歲以下使用社群媒體

綠能也有價格戰？中國製風機成本僅歐洲同業的1/3 大廠也難敵

綠能也有價格戰？中國製風機成本僅歐洲同業的1/3 大廠也難敵

川普重整能源部！優先石油核能取代再生能源與能源效率

川普重整能源部！優先石油核能取代再生能源與能源效率