“情感+”讓智能人機(jī)交互未來可期-
發(fā)布時間:2021-05-20
瀏覽次數(shù):1548
“情感+”讓智能人機(jī)交互未來可期-

?

■李洪均 孫曉虎

隨著人工智能的迅速發(fā)展,情感計算方面的移動應(yīng)用程序和初創(chuàng)企業(yè)大量增長,其中移動應(yīng)用程序目前主要用于商務(wù)談判、健康醫(yī)療、遠(yuǎn)程教育、安全駕駛以及公共服務(wù)等行業(yè)。例如,百度研發(fā)的對話情緒識別平臺可自動檢測用戶日常對話文本中蘊(yùn)含的情緒特征,曠視科技研發(fā)的人工智能平臺已可以通過輸入圖片得到憤怒、厭惡、驚恐等七類情緒,深圳安視寶科技公司生產(chǎn)的動態(tài)情緒識別系統(tǒng)可用于情緒預(yù)警……

情感識別作為智能人機(jī)交互的基石,其主要任務(wù)就是建立一種可以從語音、文本、視頻等多種模態(tài)中分析和識別人類情感的計算系統(tǒng),實(shí)現(xiàn)人與機(jī)器的人性化交流,具有十分重要的理論意義和實(shí)際應(yīng)用價值。

相關(guān)技術(shù)仍不成熟

為提高人機(jī)交互的智能性,需要先正確理解用戶的需求。目前,針對交互行為而產(chǎn)生的情感分析及意圖理解的研究正逐步發(fā)展,并已有不少應(yīng)用型產(chǎn)品問世。例如,在國外,Brain Power公司設(shè)計的Empower Me可以幫助自閉癥患者解讀情緒、教授他們社交技能和認(rèn)知技能,并及時反饋其自身的緊張或焦慮狀態(tài);蘋果公司的EmoWatch可幫助用戶追蹤到自己的情緒狀態(tài),被應(yīng)用于機(jī)器人理解和監(jiān)測客戶的情緒上;南加州大學(xué)創(chuàng)新技術(shù)研究院開發(fā)的“Ellie虛擬治療師”,負(fù)責(zé)治療創(chuàng)傷后應(yīng)激障礙和抑郁癥患者。

不過,雖然情感識別相關(guān)產(chǎn)品在一定程度上提升了人們的生活體驗(yàn)感、緩解了社會資源的短缺問題,并成為特殊群體情感交流的有力工具,但目前其相關(guān)技術(shù)仍不成熟,只能分辨出少量的特定情緒,加之涉及到用戶的隱私問題且相關(guān)產(chǎn)品的費(fèi)用較高,很難進(jìn)行大范圍的推廣。

實(shí)際上,情感隸屬人類的高級屬性,而情感識別是一門生理學(xué)、心理學(xué)、認(rèn)知科學(xué)等領(lǐng)域相交叉的學(xué)科,即便是進(jìn)化了超過萬年的人類有時也無法清晰地識別出彼此的情感,這給當(dāng)前情感分析領(lǐng)域帶來了巨大機(jī)遇與挑戰(zhàn)。具體表現(xiàn)在:

(1)情感的稀疏性。語音、視頻等模態(tài)中的情感信息具有稀疏性,并非語音中所有的時刻或視頻中所有幀都包含情感信息,如何利用這種稀疏性并按照信號不同位置與情感的相關(guān)性自適應(yīng)地分配不同的權(quán)重是一個巨大的挑戰(zhàn)。

(2)情感的模態(tài)性。與單模態(tài)數(shù)據(jù)相比,多模態(tài)數(shù)據(jù)包含了更多的信息且多個模態(tài)之間可以相互補(bǔ)充,幫助機(jī)器更好地理解情感。但如何處理和分析多模態(tài)信息、如何融合不同模態(tài)的信息、利用不同模態(tài)數(shù)據(jù)之間的對齊信息、建模不同模態(tài)數(shù)據(jù)之間的關(guān)聯(lián)以及多源信息的實(shí)時獲取仍是目前所需要面對的主要難題。

(3)情感的類別化。科研工作者直接將情感定位為若干種類別,把其當(dāng)成一個分類任務(wù)來進(jìn)行。然而,一段情感信息中不同時段的情感狀態(tài)隨時間的變化而變化,因此應(yīng)該把情感識別作為一個檢測任務(wù)來分析每個時刻情感狀態(tài)的變化,但這種方案目前難以實(shí)現(xiàn)。

(4)情感的個性化。研究人員對情感的劃分具有一定的主觀性且并不適用于每一種應(yīng)用場景。人的情感具有寬泛的主觀性,不同人對同一情感的反應(yīng)程度是不同的,而且同一個人在不同時刻對同一場景下的情感反應(yīng)也有可能不同。因此,如何偏向于自然條件下的更多應(yīng)用場景、更個性化背景下的情感研究仍是目前尚未解決的難點(diǎn)問題。

除上述特性外,目前情感識別研究還面臨著模型的泛化能力和實(shí)時性問題,而且現(xiàn)有的情感數(shù)據(jù)庫不盡相同且規(guī)模較小,存在著語言、情感種類等差異,缺乏統(tǒng)一的標(biāo)準(zhǔn)。

應(yīng)用前景可觀

情感識別是一個跨領(lǐng)域的學(xué)科,有著廣闊的應(yīng)用前景,但目前尚未達(dá)到成熟階段,還需要進(jìn)行語料庫的豐富、理論的加強(qiáng)以及方法的創(chuàng)新。

一是情感+大數(shù)據(jù)。情感本身是非常抽象的,且情感分析不單單是對特定的人物情感進(jìn)行分析,同時還要結(jié)合特定相關(guān)事件一起來分析從而得出更科學(xué)、全面的結(jié)果。在大數(shù)據(jù)時代,應(yīng)用大數(shù)據(jù)技術(shù)聯(lián)系社會實(shí)際的客觀現(xiàn)象和行為,通過大數(shù)據(jù)分析技術(shù)分析特定人物的情感變化及與情感相關(guān)的屬性,準(zhǔn)確地分析情感的真實(shí)內(nèi)容,是下一步研究的方向之一。

二是情感+仿生學(xué)?;谏硇畔⒌那楦凶R別技術(shù)是切實(shí)可行的。其中,腦電信號不僅含有豐富的有用信息,還能直接反映大腦的活動情況,不同的情緒變化在不同的大腦皮層位置反映出不同的腦電信號。所以,將多生理信號(如腦電信號、心電信號、肌電信號等)和特征(如面部表情、語音等特征)結(jié)合使用,實(shí)現(xiàn)機(jī)器仿生對于情感識別的研究具有重要意義。

三是情感+多模態(tài)。隨著多媒體信息方式的快速發(fā)展,人們傾向于從各種模式中獲取信息,以解決更為復(fù)雜的問題。人們可以通過控制自己的面部表情來隱藏自己的情緒,基于單一視覺模態(tài)很難對情感進(jìn)行有效識別,而多模態(tài)情感分析技術(shù)的發(fā)展更加符合實(shí)際生活的需求。因此,將識別模型由簡單算法向組合模型發(fā)展,將特征級與決策級進(jìn)行融合,搭建一個擅長提升情感識別收斂性與準(zhǔn)確性的專用多模態(tài)網(wǎng)絡(luò)已成為新的研究熱點(diǎn)。

四是情感+跨媒體。人類的情感不僅僅包含于語音變化之中,在表情、文字、肢體語言中也包含豐富的情感??煽紤]采用跨語料庫的方法擴(kuò)充語料,構(gòu)建一個跨語音、圖片、視頻、文本以及腦電信號等的情感語料庫。同時考慮跨性別、文化差異等來優(yōu)化識別效果,進(jìn)一步集結(jié)科研力量,推動情感識別的進(jìn)一步發(fā)展。

綜上所述,人工智能時代引領(lǐng)著新一波的技術(shù)進(jìn)步,而情感識別作為人工智能領(lǐng)域的一個重要課題,它可以幫助計算機(jī)智能識別人類情感,使人機(jī)交互更加友好。相信在不久的將來,情感識別技術(shù)的研究會取得更大的進(jìn)展,并更好地應(yīng)用于實(shí)際產(chǎn)品中。

(作者單位:南通大學(xué))

《中國科學(xué)報》 (2021-05-20 第3版 信息技術(shù))


關(guān)注【深圳科普】微信公眾號,在對話框:
回復(fù)【最新活動】,了解近期科普活動
回復(fù)【科普行】,了解最新深圳科普行活動
回復(fù)【研學(xué)營】,了解最新科普研學(xué)營
回復(fù)【科普課堂】,了解最新科普課堂
回復(fù)【科普書籍】,了解最新科普書籍
回復(fù)【團(tuán)體定制】,了解最新團(tuán)體定制活動
回復(fù)【科普基地】,了解深圳科普基地詳情
回復(fù)【觀鳥知識】,學(xué)習(xí)觀鳥相關(guān)科普知識
回復(fù)【博物學(xué)院】,了解更多博物學(xué)院活動詳情

聽說,打賞我的人最后都找到了真愛。