展會信息港展會大全

“AI深度合成”迎商業化元年,技術應用與治理路徑該如何展開?
來源:互聯網   發布日期:2020-07-02 08:33   瀏覽:7309次  值班編輯QQ:點擊這里給我發消息

來源|騰訊研究院 作者:張欽坤

6月22日晚,由騰訊研究院、騰訊優圖實驗室、騰訊科協聯合主辦的“深度合成技術應用與治理研討會”在線上召開。此次研討會聚焦“深度合成”技術,邀請人工智能領域的專家、學者以及行業大咖,圍繞“深度合成”的技術趨勢、應用前景、挑戰應對以及倫理治理等議題進行了深度研討。會上,騰訊研究院秘書長張欽坤,以“深度合成的技術發展、應用趨勢與治理路徑”為主題,進行了主題演講。

今年5月,騰訊研究院和騰訊優圖實驗室一起發布了業內首份深度合成技術報告《AI生成內容發展報告2020“深度合成”(deep synthesis)商業化元年》,在業內獲得了不錯的反響。騰訊研究院秘書長張欽坤基于這份報告給大家做一個匯報。

深度合成的技術發展狀況;

目前的主要應用及發展趨勢;

對深度合成技術及其應用的治理;

這種新興的、基于人工智能的技術在發展中可能帶來一些全球性的問題,全球范圍包括我們國家是如何應對的。

“深度合成”具有多元化應用形式,“數字人”是其重要發展方向

首先談一下技術的發展。深度合成作為一種AI合成/生成內容的技術,是人工智能發展到一定階段的產物。“深度合成”的概念,并不是指“深度偽造”(deepfake)。實際上,深度偽造是一種特定的AI換臉的方法,特別是在色情性的AI換臉視頻中得到應用。如果用“深度偽造”來涵蓋“深度合成”,這存在明顯的以偏概全,是很不科學的。而且“深度偽造”這個詞也容易給技術發展帶來污名化影響,它強調這個技術的潛在欺騙性,使得社會公眾可能認為這個技術是一個負面的技術,不符合科技向善的特點,這樣就不利于這個技術的發展應用。

第二點,深度合成這類AI技術應用之所以能夠在這兩年迅速興起,很大程度上得益于生成對抗網絡(GAN)這一AI算法的出現和發展,這種算法可以用于生產高度逼真的合成數據。第三,深度合成的實現一般分為數據的提娶數據的訓練、數據的轉換三個步驟,這個過程中還需要用到圖像融合等技術。

目前,深度合成主要有四種形式:

第一,人臉替換,就是將圖像或視頻中的人臉替換為另一個人的臉,俗稱AI換臉;

第二,人臉再現,對目標人物的臉部特征進行修改,從而改變其面部表情,通過這樣一種方式可以讓目標人物表達他們在現實當中沒有說過的話或者做沒有做過的事情;

第三,語音合成,它是通過創建一種特定的聲音模型,把文字轉化成逼真的人聲,這個目前應用得比較廣泛。最近幾年一些語音播報類應用中會出現名人的語音播報,其實就是這種技術的一種應用;

第四,人臉合成,也就是說,通過深度合成技術,可以生成一些虛擬的、現實中完全不存在的人臉,這也是生成對抗網絡的典型應用,像thispersondoesnotexist.com網站上的非常逼真的人臉,我們乍一看好像覺得就是現實中的人物,但實際上這些人臉在現實中是不存在對應的真實人物的。

就深度合成的發展趨勢來講,特別是從互聯網行業的應用來看,目前“數字人”是它的一個重要發展方向,應該說“數字人”是多個人工智能技術的集大成者,它需要綜合運用各種AI技術和方法,如計算機視覺、視頻合成、語音合成、自然語言處理等等。目前,“數字人”已經成為 AI領域的新風口,國內外的主流互聯網公司都在加強布局,未來這個技術會應用在非常廣泛的領域。例如,騰訊AI實驗室已將“數字人”列為兩大攻堅方向之一,基于深度神經網絡的3D人臉和人體重建、文本/語音/口型驅動和神經網絡渲染等技術,使所生成的“數字人”看起來真實自然。“深度合成”在多個領域落地應用,同時發揮出“科技向善”的潛力。

深度合成技術的應用多元化,為科技向善助力

經過這幾年的發展,深度合成已經從傳統的“deepfake”發展出了更多元化的應用,駛入商業化發展的快車道,在影視、娛樂、社交、藝術、醫療、科研、教育、電商、虛擬現實等等領域都有深度合成技術的應用。所以在深度合成的研究報告中,我們提出,2020年是深度合成的商業化元年,預計未來深度合成將在越來越多的場景中走近我們的生活。目前來看,主要有三個方面的應用趨勢值得關注。

第一,娛樂和數字內容會是深度合成的一個主要應用場景。這里又分為四個類型:

一是影視創作,現在深度合成技術已經可以對已去世的演員進行數字化的復活,比如在《速度和激情7》里面,沃克不幸逝世,片方為了解決這個問題,讓他的弟弟先拍攝了這個場景,再通過深度合成技術進行人臉的替換。此外,深度合成技術還可以自動執行各種語言的逼真配音,讓影視配音變得更加便利真實。

二是社交娛樂,圖像融合和AI換臉也可以讓用戶在娛樂、游戲里面有更多的新奇體驗。

三是電子商務,深度合成技術驅動的AI虛擬模特可以代替真人模特,也可以實現數字試穿,它最大的一個特點是可以讓用戶根據自己的特點來在線試穿相關的衣服和鞋帽,讓用戶的體驗更加接近于線下購物。所以,深度合成技術可以進一步增加電子商務的個性化體驗,F在已經有國外公司在做這方面的嘗試。

四是虛擬現實,美國的《時代》周刊和數字王國公司打造了一款VR視頻叫“大游行”(The March),通過數字化的方式復活了馬丁路德金,虛擬地再現了美國1963年的大游行。此外,在遠程交流和會議中,還可以使用人臉數據創建3D網絡模型,并實時更新眼神、表情及肢體語言,實現逼真的虛擬交互。未來這個技術成熟了,未在線的會議上,大家可以不以自己的真面目來呈現,而打造一種自己喜愛的形象來進行表達,和大家交流,實現一種虛擬的、但是又不失真實的交互。

第二,我們認為“數字人”這樣一個人工智能的集大成者,也會在數字內容領域不斷拓展應用空間。在今年的兩會期間,新華社已經推出了全球第一個3D版的虛擬主播;今年的六一兒童節之際,騰訊AI實驗室也推出了虛擬歌手AI艾靈,它是基于人工智能模型實現的,可以基于AI模型實現作詞和演唱,從而為小朋友帶來快樂。此外,還可以基于AI合成相應的虛擬教師,讓數字教學更加有互動性?傊,“數字人”技術在不斷拓展應用的空間和領域,未來的發展令人期待。

第三,深度合成技術也開始在一些真正向善的領域得到應用,發揮科技向善的作用。除了泛娛樂、數字內容、教育等領域,在一些涉及社會性問題的領域,深度合成也有很大的應用空間,可以發揮出科技向善的力量。比如說深度合成可以廣泛應用于醫療健康,國外的語音合成公司Lyrebird就為漸凍癥患者設計了一套新的語音合成系統,以往患者只能用機器的聲音進行交流,但新系統可以基于患者的真實聲音來合成語音,從而讓患者重新使用自己的聲音和別人進行交流。此外,“深度合成”技術可實現人臉重現,可以幫助老年癡呆癥患者與他們可能記得的年輕面孔或者逝去的親人進行互動。

另外,在醫療領域還可以用合成數據訓練AI系統。因為醫療AI系的訓練和開發需要大量的數據,可能現實中的數據滿足不了醫療AI的數據使用需求,或者用真實的病人數據可能帶來隱私保護問題,而深度合成技術生成的數據已經非常接近于真實,可以為醫療AI提供必須的訓練數據,解決隱私保護、數據不足等問題?梢哉f,不斷發展的創新科技,和我們人類不斷提出的創新需求,確實在推動整個經濟社會的快速發展。這樣一個現代文明時代,給我們帶來了無窮無盡的想象空間。

構建良好治理框架,促進“深度合成”技術妥善應用和向上向善發展

關于深度合成帶來的風險和如何治理的問題。深度合成技術不僅降低創作門檻,激發新形式的創造,還能以多種方式造福社會。但另一方面,深度合成技術也可能帶來新的風險挑戰。“deepfake”這個概念在一開始之所以“名噪一時”,某種程度上是因為不法分子通過深度合成技術,偽造了虛假的或是真假難辨的圖片、音視頻等來進行一些非法活動,包括色情報復、商業詆毀、假冒身份、個人信息非法獲取等等。就像去年有人利用英國某能源公司在德國母公司的CEO的聲音,通過電話詐騙騙走了大概22萬歐元,這是典型的利用AI假冒別人身份的行為。

目前全球都在探索能夠通過一種什么樣的方式,既能夠保障這樣一個技術的穩步發展,同時又能夠規避它所可能帶來的一些負面問題。所以我們看到,國外在積極探索相關立法,采取了較為包容審慎的立法,沒有一刀切地禁止該技術的應用,避免阻礙“深度合成”技術的正向應用與創新。在深度合成的研究報告里面對美國、歐盟等國外的一些立法舉措進行了梳理,主要有五個方面的措施:

第一,要求深度合成和人工智能技術的使用不得誤導大眾。例如,當AI機器人以商業或政治目的與人交流或互動時,必須披露其人工智能身份。

第二,為深度合成的應用劃定紅線。不能將深度合成技術應用于政治干擾、淫穢色情、假冒身份等非法行為和活動。

第三,要求深度合成的內容制作者承擔披露的義務。采取嵌入數字水英文字、語音標識等方式披露、標記合成信息后,才可將深度合成內容放置于網絡上傳播。

第四,呼吁研究開發包括深度合成在內的圖像、音視頻操縱技術的檢測識別和反制技術。

第五,從隱私和個人信息保護的角度規范深度合成技術,要求遵守相關要求。例如,GDPR將可以適用于那些可能被用于制作深度合成內容的公民圖片和聲音,或是網絡平臺發布的換臉軟件產品中潛在的個人隱私泄露問題。

我們國家在過去一兩年里也在積極回應深度合成技術帶來的問題,我在這里簡要梳理了相關立法的時間軸。

2019年5月,《數據安全管理辦法(征求意見稿)》要求對自動合成的新聞、博文、帖子、評論等信息都要標明“合成”字樣。

同年11月,由網信辦、文旅部、廣電總局出臺的《網絡音視頻信息服務管理規定》也明確要求開展安全評估,對于非真實的音視頻信息進行標識,禁止基于深度學習的虛假新聞信息,同時要求平臺部署鑒別技術,建立辟謠機制。

同年12月,網信辦發布的《網絡信息內容生態治理規定》也明確規定,禁止利用深度學習技術從事法律、行政法規禁止的活動。

特別值得一提的是,今年5月份通過的《民法典》在人格權編也規定,禁止利用信息技術手段偽造等方式侵害他人的肖像權和聲音。

這也意味著未來在“數字人”、語音合成等相關應用上,使用明星的肖像和聲音需要先獲得授權。這些規定能夠有效防范深度合成技術的濫用風險,并給受害人提供必要的救濟。以上是我們國家立法的基本情況,應該說是比較包容審慎的,這和今年政府工作報告提出的思路比較吻合,本著鼓勵創新,包容審慎的原則,制定新興產業的監管規則,引導和促進新興技術和產業健康發展。

在全球化的今天,我們面臨人工智能、區塊鏈等通用型新技術所帶來的通用型問題,需要構建一個良好的治理框架,為新技術全球治理貢獻中國智慧。而深度合成是一種能夠給個人和社會帶來多方面福祉的人工智能應用,為了促進其妥善應用和向上向善發展,我們需要構建多層次的治理體系。

法律方面

立法和監管應該是鼓勵創新、包容審慎的,避免一刀切的管理模式,應該采取細分場景、細分類型來進行分類監管,避免矯枉過正,挫傷技術發展應用,扼殺技術的潛在社會福祉。

技術方面

技術帶來的問題往往還要通過技術的方式解決,目前國內外的互聯網企業已在積極開發部署鑒別技術和溯源技術,比如對網絡信息是否屬于深度合成進行自動的檢測識別,對深度合成的信息進行溯源標記,等等。通過這些技術方式也能確保技術安全應用。

行業自律方面

可以通過行業公約的制定,標準的制定,以及倫理指南的制定來營造比較好的行業發展氛圍。同時,各科技公司也可以去探索一種自發的倫理審查機制,比如成立倫理審查委員會,對深度合成以及其他人工智能技術應用所可能帶來的新的社會倫理風險進行把控。

公眾教育方面

就新技術治理而言,公眾教育是必不可少的一環,需要加強社會公眾的數字素養和媒體素養教育,提高網絡用戶的信息分辨能力和警惕防范意識。當然,對于人工智能技術人員和從業者,也需要加強科技倫理教育,使其更加注重人工智能產品的社會倫理影響并采取防范措施,能夠更加主動、自覺防范深度合成等人工智能技術可能帶來的負面問題發生。

來源:騰訊研究院

關于騰訊AI加速器

騰訊AI加速器是騰訊產業加速器的重要組成部分。其背靠騰訊產業生態投資,依托騰訊AI實驗室矩陣的核心技術,騰訊云的平臺、計算能力以及合作伙伴豐富的應用場景,為入選項目提供課程、技術、資本、生態、品牌等層面的扶持;并與入選項目共同打造行業解決方案,推動AI技術在產業中的應用落地。

在前兩期AI加速器中,從全球2000+項目中甄選出的65個項目,整體估值662億+,融資總額高達70億+,70%的項目完成新一輪融資;其中騰訊投資樂聚機器人、工匠社機器人、Versa馬卡龍玩圖,并形成行業解決方案50+。

2019年8月16日,騰訊AI加速器三期名單出爐。TOP30項目從1500個報名者中脫穎而出,錄取率僅2%,三期項目總估值超200億。項目聚焦于金融、教育、安全、工業、機器人、IoT、云計算、5G等。入選騰訊AI加速器三期,意味著正式成為騰訊智慧產業生態的合作伙伴,將與騰訊各智慧產業業務深度結合。

贊助本站

人工智能實驗室
AiLab云推薦
展開
Copyright © 2010-2020 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯系我們 | 廣告服務 | 公司動態 | 免責聲明 | 隱私條款 | 工作機會 | 展會港
加拿大28一般怎么玩