親愛的網友:
為確保您享有最佳的瀏覽體驗,建議您提升您的 IE 瀏覽器至最新版本,感謝您的配合。

「我沒事」是什麼情緒?AI分析社交平台 揪出霸凌

2019/11/12 研之有物

大數據情緒分析

在2017台灣人工智慧年會演講中,清華大學資工系的陳宜欣副教授,分享團隊以機器學習分析社群發文情緒的經驗。希望有助偵測網路發文者的心理狀態,或協助醫師理解病人無法清楚陳述的情緒。

有學者研發,以機器學習分析社群發文情緒的經驗,希望有助偵測網路發文者的心理狀態。...
有學者研發,以機器學習分析社群發文情緒的經驗,希望有助偵測網路發文者的心理狀態。 圖/Pexels

「我沒事」到底是什麼情緒

情緒,是許多疾病和社會問題的表徵。例如有躁鬱傾向的人們,說話用詞有很大的情緒起伏;又如網路霸凌,會反映於社群留言的用字情緒。若能及早偵測到這些情緒,就有機會及時避免憾事發生,而這個任務可透過人工智慧 (Artificial Intelligence, AI) 協助。

但是,情緒不是那麼容易透過詞語理解。

例如,朋友在 Facebook 發文「我沒事」,究竟代表心平氣和的「我沒事」,還是絕望至極的「我沒事」;還有當鄉民留言「看吧!」,想表達的是讚賞意味的「看吧!」,或是嘲諷語氣的「看吧!」?

如同《來自星星的傻瓜》電影主角(一名外星人)所言,人類的語言非常難理解,在不同情境脈絡有不同意思,甚至會隱藏真實情感說謊。這些都增加人工智慧從語意分析情緒的難度。

清華大學資工系的陳宜欣副教授,是三個小孩的媽媽。她發現從小孩學習如何說話表達情緒的過程,可以梳理出一條路徑訓練機器學習。雖然小孩說話常常毫無邏輯,但許多小細節累積起來,就能讓大人判斷小孩的情緒。

例如當小孩對媽媽說「妳總是叫我收玩具」,其中用了「總是」這個詞,可以判斷小孩不太高興。或是小孩說「我永遠不能電視看了」,乍聽滿頭問號,但用了「永遠不能」這組詞,可以判斷其中的負面情緒。

不懂語法、沒背過辭典,還是可以表達情緒,反之也能分析情緒。

網路爬文 借用群眾智慧

陳宜欣團隊運用網路爬蟲技術,將社群網站公開發文 ( PTT、Facebook、Twitter 等) ,跟情緒有關的內容都蒐集建立至「情緒資料庫」。或許有些人會認為:「這不就是一堆人在發廢文?」,但以群眾外包 (crowdsourcing) 的角度,這些社群發言集結起來,就是群眾智慧,可做為訓練機器學習的資料。

「情緒,是社群網站上的一種特性,也是可供機器學習的資料」陳宜欣強調。 圖/台灣人...
「情緒,是社群網站上的一種特性,也是可供機器學習的資料」陳宜欣強調。 圖/台灣人工智慧年會 X 台灣資料科學年會

團隊將社群發文者原先在發文加上的情緒 Hashtag (例如 #anger) 作為參考答案 ,但一開始先把這些「答案」遮起來,訓練機器透過演算法學習發文中「出現哪些字」代表「什麼樣的情緒」,最後再與原本的答案 (例如 #anger) 對照,一次次地優化機器判斷情緒的準確率。

「用大數據做情緒分析有個重點,就是刪資料不要心痛!」陳宜欣笑中有股失敗無數次的堅毅,「太多 Hashtag 的發文、重複發文、太短沒有情緒特徵的發文……等等,都要從訓練資料中拿掉」。

團隊也參考新聞標題,找出哪些字是較中性的「非情緒資料」,並從機器學習的訓練資料中排除、優化準確率。值得注意的是,選舉時期的新聞標題不能參考,因為用字遣詞太過激昂。

找出情緒用詞的邏輯

經過機器學習分析,陳宜欣團隊發現一些跨語系的情緒邏輯。例如 “finally *** my” 這組字詞多表達快樂,而中文 「我終於***」也多用來傳達正面的消息。又如 “my *** always” 這組字詞多含有生氣意味,就像小朋友說「爸爸/媽媽總是***」藉以表達不快。

中文贅字的處理,也是情緒分析很有趣的一環。「學生建議這很重要,一定要列入分析!」陳宜欣說。

例如:「喔,我來做」其實是不太想做,「喔喔,我來做」較為中性,「喔喔喔,我來做」帶有積極感。凡是超過三個以上的贅字,可視同為三個贅字。這個規則用在「哈」、「哈哈」、「哈哈哈」、「哈哈哈哈」也有同工之妙。

然而陳宜欣團隊發現,社群平台上「開心」的發文特別多,不能否認社群平台很多人發文以炫耀為主、或是報喜不報憂。

另外,網路霸凌其實有很多「暗語」。

例如,團隊看過一則發文是「那些外國動物不應該被出口」,其實這句暗地裡帶有種族歧視。其中一種解決方案是運用 Hatebase 仇恨發言資料庫,並藉由機器學習比對非仇恨的文字資料,找出這類「暗語」的關聯性(通常哪幾個字會一起被使用)、以及相似性(字詞會在句子中哪些類似地方出現)。

許多人會在憾事發生後,回過頭從當事者社群發文的字裡行間尋找跡象,但未來能否更早偵測?當局者迷,旁觀者清。讓人工智慧成為一名不帶情緒的旁觀者,分析社群大數據找出被情緒糾葛的人們,甚至是預防犯罪、偵測自殺傾向,在來不及之前。

執行編輯|林婷嫻 美術編輯|張語辰

本文經「研之有物」授權轉載(原文標題:AI 可以幫助躁鬱、被霸凌的人嗎?)。


「一個人為社會付出很辛苦,但一群人就不會寂寞。」每個人都可以用自己的方式成為倡議家:

立即加入【倡議+】社團:http://bit.ly/2JtBxB6

推薦閱讀

非營利組織找出路 靠「人味」 AI 科技三支箭

聲音也能捐 漸凍人協會推語音銀行為病友發聲

「智在家鄉」競賽: 讓科技成為非營利組織創新助力!

作者文章

阿力曼親手打造森林博物館,在裡面的建築都沒有電力,完全依照舊部落型態生活。 圖/...

他為後代定存「大自然」-無牆博物館,不賺觀光財

2020/08/14
比爾蓋茲在知名Youtuber馬克羅伯(Mark Robar)的頻道中試吃植物肉...

當吃素變簡單-比爾蓋茲:沒必要再吃牛肉漢堡了

2020/08/14
Nespresso與國立臺灣大學園藝暨景觀學系攜手研究咖啡渣在有機農業上之應用,...

Nespresso攜手台大-化咖啡渣成金,養胖有機蔬果

2020/08/13
氣候變遷之下,我們生存的環境越來越高溫 圖/pexels

宅設計「斷熱」-抗2020破表高溫,不能只靠冷氣

2020/08/12
歐盟承諾2030年前殺蟲劑使用量減少50% 圖/pixabay

保護蜜蜂生存!歐盟:2030年前,殺蟲劑用量減半

2020/08/11
阿根廷盲人劇團演員圍繞著觀眾,製造各種聲音、氣味,以嗅覺、聽覺、觸覺激發觀眾對故...

阿根廷「盲人劇團」暗中登場-沉境演出激發想像力

2020/08/10

最新文章

阿根廷盲人劇團演員圍繞著觀眾,製造各種聲音、氣味,以嗅覺、聽覺、觸覺激發觀眾對故...

阿根廷「盲人劇團」暗中登場-沉境演出激發想像力

2020/08/10
伍連德是近代第一個改良、宣導配戴口罩防疫的公衛專家,「伍式口罩」成為滿州鼠疫的防...

以前亞洲人也拒戴口罩-「衛生」如何滲入文化裡?

2020/08/10
2017年的アクロス福岡。它被CNN.com選為世界十大最美麗的空中花園之一。 ...

每層天井都種樹-25年過去了,建築發芽長成森林

2020/08/05
金融機構為社會、投資大眾管錢,不是間接融資和直接投資,都要善盡管理之責。 圖/p...

ESG時代-金融業該如何落實責任投資?

2020/08/05
José Andrés霸氣登上⟪時代週刊⟫特別號封面人物  圖/英語島編輯室

哪兒有需被餵飽的人,米其林大廚的「廚房」就去哪

2020/08/03
富邦員工一日農夫體驗活動,透過親身感受農作耕耘,瞭解到每一份食材得來不易與珍貴。

種植關懷力 從食材看見與土地的連結價值

2020/07/31

回應

Top