▲ 衛生局提醒民眾亂傳假訊息,將開罰最重300萬元。(圖/記者唐詠絮翻攝)
● 賴祥蔚/台灣藝術大學廣播電視學系教授
假訊息與假新聞是2016年川普參選及當選美國總統以來,全世界都關心的議題。轉眼四年多過去,川普已經連任失利而卸任,但是假訊息與假新聞的解決至今仍未有理想方案。
處理假訊息的方式,目前主要是靠人工處理。近年來,不少人試圖以及Al大數據辨別假訊息。Al以及大數據能辨別假訊息嗎?或許可以從原理及最新發展來分析。
假訊息 vs 錯誤訊息 傻傻分不清?
首先,很多人常常混淆假訊息與假新聞,一般來說,假新聞的製造者必須是新聞媒體,範圍有限,假訊息的範圍則泛指所有訊息。
假訊息(Disinformation)主要針對經過刻意編造,用以傷害特定對象的訊息,意圖謀取特定利益。相較來看,有一個類似但不同的概念是「錯誤訊息」(Misinformation),亦即內容雖有錯誤,但並非意圖傷害而刻意製造的訊息。
▲ 機器人可製造假訊息,也可辨識詐騙資訊。(圖/翻攝自趨勢科技防詐騙達人網站)
辨識假訊息 人工+AI+大數據
其次,假訊息可以從兩個向度來分類:製造者、內容;製造者,可概分為人工、機器人;內容,則可以概分為文字、影像。
人工假訊息,人人皆可做到,只是有人敢做、有人不願做而已。至於Al人工智慧,基礎原理之一是「機器學習」(Machine Learning),透過資料庫來讓機器學習,可以學習如何製造假訊息,當然也可以辨別假訊息。因為透過資料庫,所以也是大數據分析。
當前機器人已經成為假訊息操作的主要手法,透由機器人帳號(BOTs)在網路社群散佈訊息方式,並巧妙利用演算法提高訊息曝光率。
▲美玉姨使用g0v的「Cofacts真的假的」開放式資料庫,分析line群組的假消息。(圖/實習記者魏雅芬攝)
目前海內外辨別假訊息的方式,都是結合人工與AI及大數據,例如「Fake News Net」主要分析推特上面的假訊息,加入訊息時間與擴散性的維度,能夠了解訊息傳播路徑與軌跡。「美玉姨」是使用g0v的「Cofacts真的假的」開放式資料庫,人工協助查證訊息真偽後寫入資料庫,以便後續的比對。
有專家指出,可以從文章語彙、用字的語言特徵、標點符號去辨別是否是假訊息,更認定假訊息通常會使用較低層級、較簡單的文字。對此,汪志堅教授的研究很值得一提,剛好可以看出人工與機器人製造的假訊息,在辨別的不同挑戰。汪教授使用兩個資料庫:「Cofacts真的假的」與「新聞小幫手」,後者準確率達到88%;但前者因為不乏來自Line的內容,變化性太大,不像新聞有固定撰寫格式,準確率只有67%。
▲ 學者分析, 人工製造的假訊息,仍不容易用Al和大數據辨識(圖/Pexels)
影像&人工假訊息辨識 待克服難題
綜上而言,Al以及大數據如果想要從「形式」去辨別假訊息,主要只能應付由Al以及大數據製造的假訊息。至於人工製造的假訊息,目前還不容易以Al以及大數據直接進行辨別。舉例來說,如果人工撰寫出某名人生病或是有弊案的訊息,Al以及大數據難以辨別真假,仍然要靠人工查證。
現在Al以及大數據辨別假訊息,仍以文字為主,對於影像的探索很少,例如最新的「深偽(Deep Fake)」技術,現在已經開始普及的REFACE 、Doublicat: Face Swap Pictures等App都可以在影像換臉,真假難辨,這是Al以及大數據辨別真假的一大挑戰。
熱門點閱》
►「晶片外交」可能嗎?財經網美:車用晶片將擴產 台灣要把握機會
► 台灣少子化》以色列產房爆滿不夠用!猶太家庭給台灣人的啟示(蘇育平)
● 以上言論不代表本網立場。歡迎投書《雲論》讓優質好文被更多人看見,請寄editor88@ettoday.net或點此投稿,本網保有文字刪修權。
我們想讓你知道…Al以及大數據如果想要從「形式」去辨別假訊息,主要只能應付由Al以及大數據製造的假訊息。至於人工製造的假訊息,目前還不容易以Al以及大數據直接進行辨別。