有網紅因為利用換臉技術製作名人色情片而遭逮捕。這種人工智能技術的原理是甚麼?為什麼能造出幾可亂真的影片?
影片連結:Deepfake解密! 人工智能換臉的原理是甚麼? 如何分辨演算法深度偽造的影片?
Deepfake人工智能換臉技術
答案是deepfake,中文稱為「深偽」或「深假」。以往的相片造假,只是把靜態照片的人頭換掉。Deepfake的特別之處,是讓電腦抓住影片裡的人臉表情,配上另一個面孔的特徵,覆蓋在原本的臉上。加上人工合成的聲音,就可以任意創造栩栩如生的影片,叫任何人說出任何說話。
這都拜機器學習技術所致。把兩個人臉的影像丟進一組編碼器 (encoder) ,搜集並且分析這兩張面容的特徵,便能找出兩者類似的地方。這個流程不止做一次,編碼器要反覆練習。而且越多這兩個人的相片,電腦便越能精準地學習。
下一步是把這兩組數據,放進解碼器 (decoder) 裡,讓系統學習利用這些數據,重塑這兩張面容。例如一號人臉的解碼器,會不停利用從這張臉的表情特徵,繪畫出一號人臉,就像美術學生練習人像素描一樣。而二號人臉的工作亦一樣,只是專門練習二號面孔。經過千百次的練習,這兩台機器都變成「畫臉大師」。

然後把一號人臉丟進編碼器。久經訓練的編碼器早已熟悉這張面孔,很容易便能辨認出它的特點。再下一步,我們會玩個小把戲,把搜隻到的一號人臉表情特點,放入二號人臉的解碼器。一如以往,這台解碼器會畫出二號臉孔,但因為收到的是一號人臉的表情特徵,所以畫出來的會是二號面容但配上一號表情,並放在一號人頭之上。換臉至此大功告成!

一個美術學生要懂得以上做法,可能要經過長久的練習。但電腦不怕沉悶的訓練,而且運算速度很快,一般桌面電腦都做得到。
更恐怖的是,人工智能系統還能自行進化,持續提升準確度。利用生成對抗網絡 (Generative Adversarial Network) ,反覆找出作品的缺點再改善。方法是由一套生成器偽造臉容,交給另一套鑑別器檢查。由於鑑別器之前已經學習過這張臉容,懂得找出錯漏再反饋給生成器。就像一個畫家不斷繪畫,旁邊有個品質管制員監察。一次又一次的操練,令畫家內力大進,更能畫出騙過品質管制員的作品。同時品質管制員也更懂得識破偽造面容,畫作必需更精準才能過關。

道高一尺,魔高一丈?
一般家用電腦的運算能力都能夠深度換臉,網絡上還有軟體和網站直接幫你做。難怪近年越來越多偽造影片,受害者包括政商名人。除了無傷大雅的玩笑,甚至還有偽造女明星的色情影片,例如黑寡婦史嘉蕾・喬韓森和神力女超人蓋兒・加朵。有甚麼方法阻止這種數位性騷擾呢?怎樣分辨影片真偽呢?
早年的deepfake影片水準不高,經常出現邊緣模糊、陰影不均勻、影像閃動和頭髮跟背景交界穿幫等情況。也有人發現,偽造的人臉較少眨眼,或者眨眼不自然。可能因為訓練素材大多是人像照片,相中人都張開眼睛,所以智能系統缺乏參考數據。另外,電腦生成的影片,兩隻眼睛裡的倒影也可能不一致。
近年多了學術團隊研究deepfake技術,更有科技企業舉辦偽造影像識別大賽,提升抓包能力。一些基於生理元素的檢驗方法亦逐漸面世。例如真實的臉孔會因為血液流動而呈現區域性顏色變化,以及微弱的跳動。但偽造影像未能還原這些細微特徵。
不過,人工智能深度學習系統每天都在進步,誰知道何時電腦會連這些小細節都騙得到。這就像官兵捉賊的遊戲,雙方每天都在進步。未來會是道高一尺魔高一丈,還是魔高一尺,道再高一丈呢?
希望你喜歡以上有關Deepfake的介紹。
想了解更多科技知識嗎?請訂閱我的《思維漫步》YouTube頻道,點讚與分享給你的朋友。
讓我們一起學習,一起成長吧!
發佈留言