1.來(lái)自人工智能的挑戰(zhàn)
自AlphaGo戰(zhàn)勝人類(lèi)頂尖圍棋手之后,人工智能這一概念真正成為了社會(huì)各界關(guān)注的焦點(diǎn),也為各國(guó)政府所重視。一方面可以給我們帶來(lái)諸多便利,比如可能為我們提供醫(yī)療、法律、金融等方面的建議或決策,也可能直接操控汽車(chē)、無(wú)人機(jī),甚至大規(guī)模殺傷性武器。但另一方面,它也被用來(lái)“做壞事”甚至危害人類(lèi)。如某些網(wǎng)站利用人工智能算法進(jìn)行“大數(shù)據(jù)殺熟”,2017年也發(fā)生了全國(guó)首例利用人工智能技術(shù)進(jìn)行網(wǎng)絡(luò)詐騙的案件。2015年德國(guó)大眾公司甚至發(fā)生了機(jī)器人“殺人事件”。歐盟已經(jīng)要求所有算法解釋其輸出原理[3],這意味著不可解釋的算法模型將成為非法使用。
2.可解釋是人工智能發(fā)展選擇
在時(shí)下熱議的人工智能相關(guān)倫理、算法歧視、算法正確性、安全性等問(wèn)題中,有一個(gè)問(wèn)題被時(shí)常提起,即以深度學(xué)習(xí)算法為代表的人工智能算法的可解釋性問(wèn)題。人類(lèi)理性的發(fā)展歷程使我們相信,如果一個(gè)判斷或決策是可以被解釋的,我們將更容易了解其優(yōu)點(diǎn)與不足,更容易評(píng)估其風(fēng)險(xiǎn),知道其在多大程度上、在怎樣的場(chǎng)合中可以被信賴(lài),以及我們可以從哪些方面對(duì)其進(jìn)行不斷改善,以盡量增進(jìn)共識(shí)、減少風(fēng)險(xiǎn),推動(dòng)相應(yīng)領(lǐng)域的不斷發(fā)展。這樣的思維范式或許是誕生在人工智能時(shí)代之前的稍顯過(guò)時(shí)的思維模式;蛟S隨著科技和社會(huì)的發(fā)展,未來(lái)會(huì)演化出新的思維范式,但目前這仍然是我們最成熟、最具共識(shí)、最可信賴(lài)的思維模式 。
二、可解釋性方法概述
17年ICML會(huì)議上來(lái)自谷歌的科學(xué)家給出一個(gè)關(guān)于可解釋性的定義是“Interpretation is the process of giving explanations to Human”。許多模型及應(yīng)用不可解釋性的原因主要來(lái)源于對(duì)問(wèn)題和任務(wù)了解得還不夠充分。那么只要在使用模型的過(guò)程中,只要是能夠提供給我們關(guān)于數(shù)據(jù)或模型的可以理解的信息,有助于我們更充分的發(fā)現(xiàn)知識(shí)、理解和解決問(wèn)題的方法,那么都可以歸類(lèi)為可解釋性方法。同時(shí),這篇文章將可解釋性方法按進(jìn)行的過(guò)程劃分為如下三類(lèi):在建模之前的可解釋性方法、建立本身具備可解釋性的模型和建模后使用可解釋性方法對(duì)模型作出解釋?zhuān)旅鎸?duì)這三大類(lèi)方法分別作介紹。
三、建模前:在建模之前的可解釋性方法
在建模之前的可解釋性方法主要涉及一些數(shù)據(jù)預(yù)處理或數(shù)據(jù)展示的方法機(jī)器學(xué)習(xí)解決的是從數(shù)據(jù)中發(fā)現(xiàn)知識(shí)和規(guī)律的問(wèn)題,如果我們對(duì)想要處理的數(shù)據(jù)特征所知甚少,指望對(duì)所要解決的問(wèn)題本身有很好的理解是不現(xiàn)實(shí)的,在建模之前的可解釋性方法的關(guān)鍵在于幫助我們迅速而全面地了解數(shù)據(jù)分布的特征,從而幫助我們考慮在建模過(guò)程中可能面臨的問(wèn)題并選擇一種最合理的模型來(lái)逼近問(wèn)題所能達(dá)到的最優(yōu)解。
數(shù)據(jù)可視化就是一類(lèi)非常重要的建模前可解釋性方法。很多對(duì)數(shù)據(jù)挖掘稍微有些了解的人可能會(huì)認(rèn)為數(shù)據(jù)可視化是數(shù)據(jù)挖掘工作的最后一步,大概就是通過(guò)設(shè)計(jì)一些好看又唬人的圖表或來(lái)展示你的分析挖掘成果。但實(shí)際上真正要研究一個(gè)數(shù)據(jù)問(wèn)題之前,通過(guò)建立一系列方方面面的可視化方法來(lái)建立我們對(duì)數(shù)據(jù)的直觀理解是非常必須的,特別是當(dāng)數(shù)據(jù)量非常大或者數(shù)據(jù)維度非常高的時(shí)候,比如一些時(shí)空高維數(shù)據(jù),如果可以建立一些一些交互式的可視化方法將會(huì)極大地幫助我們從各個(gè)層次角度理解數(shù)據(jù)的分布。
四、建模中:建立本身具備可解釋性的模型
建立本身具備可解釋性的模型是最關(guān)鍵的一類(lèi)可解釋性方法,同樣也是一類(lèi)要求和限定很高的方法,具備可解釋性的模型大概可以分為以下幾種模型。
基于規(guī)則的模型,比如我們提到的非常經(jīng)典的決策樹(shù)模型。這類(lèi)模型中任何的一個(gè)決策都可以對(duì)應(yīng)到一個(gè)邏輯規(guī)則表示。但當(dāng)規(guī)則表示過(guò)多或者原始的特征本身就不是特別好解釋的時(shí)候,基于規(guī)則的方法有時(shí)候也不太適用。
基于單個(gè)特征的方法主要是一些非常經(jīng)典的回歸模型,比如線(xiàn)性回歸、邏輯回歸、廣義線(xiàn)性回歸、廣義加性模型等。這類(lèi)模型除了結(jié)構(gòu)比較簡(jiǎn)單之外,更重要的是回歸模型及其一些變種擁有非常堅(jiān)實(shí)的統(tǒng)計(jì)學(xué)基礎(chǔ),上百年來(lái)無(wú)數(shù)統(tǒng)計(jì)學(xué)家探討了在各種不同情況下的模型參數(shù)估計(jì)與修正、假設(shè)檢驗(yàn)、邊界條件等等問(wèn)題,使得他們?cè)诟鞣N不同情況下都能使具有有非常好的可解釋性。
基于實(shí)例的方法主要是通過(guò)一些代表性的樣本來(lái)解釋聚類(lèi)/分類(lèi)結(jié)果的方法。比如可以為每一個(gè)聚類(lèi)簇中選出代表性樣例和重要的子空間。
基于稀疏性的方法主要是利用信息的稀疏性特質(zhì),將模型盡可能地簡(jiǎn)化表示。比如LDA方法,根據(jù)層次性的單詞信息形成了層次性的主題表達(dá),這樣一些小的主題就可以被更泛化的主題所概括,從而可以使我們更容易理解特定主題所代表的含義。
基于單調(diào)性的方法在很多機(jī)器學(xué)習(xí)問(wèn)題中,有一些輸入和輸出之間存在正相關(guān)/負(fù)相關(guān)關(guān)系,如果在模型訓(xùn)練中我們可以找出這種單調(diào)性的關(guān)系就可以讓模型具有更高的可解釋性。比如醫(yī)生對(duì)患特定疾病的概率的估計(jì)主要由一些跟該疾病相關(guān)聯(lián)的高風(fēng)險(xiǎn)因素決定,找出單調(diào)性關(guān)系就可以幫助我們識(shí)別這些高風(fēng)險(xiǎn)因素。
五、建模后:使用可解釋性方法對(duì)模型作出解釋
建模后的可解釋性方法主要是針對(duì)具有黑箱性質(zhì)的深度學(xué)習(xí)模型而言的, 深度學(xué)習(xí)的黑箱性主要來(lái)源于其高度非線(xiàn)性性質(zhì),每個(gè)神經(jīng)元都是由上一層的線(xiàn)性組合再加上一個(gè)非線(xiàn)性函數(shù)的得到,人們無(wú)法像理解線(xiàn)性回歸的參數(shù)那樣通過(guò)統(tǒng)計(jì)學(xué)基礎(chǔ)假設(shè)來(lái)理解神經(jīng)網(wǎng)絡(luò)中的參數(shù)含義及其重要程度、波動(dòng)范圍。但實(shí)際上我們是知道這些參數(shù)的具體值以及整個(gè)訓(xùn)練過(guò)程的,所以神經(jīng)網(wǎng)絡(luò)模型本身其實(shí)并不是一個(gè)黑箱,其黑箱性在于我們沒(méi)辦法用人類(lèi)可以理解的方式理解模型的具體含義和行為,而神經(jīng)網(wǎng)絡(luò)的一個(gè)非常好的性質(zhì)在于神經(jīng)元的分層組合形式,這讓我們可以用物質(zhì)組成的視角來(lái)理解神經(jīng)網(wǎng)絡(luò)的運(yùn)作方式。主要分為以下幾類(lèi)的工作:隱層分析方法、模擬/代理模型、敏感性分析方法。
隱層分析方法:該方法通過(guò)對(duì)隱層運(yùn)用一些可視化方法來(lái)將其轉(zhuǎn)化成人類(lèi)可以理解的有實(shí)際含義的圖像以展示神經(jīng)網(wǎng)絡(luò)中每層都學(xué)到的概念。我們都知道典型的CNN模型的一個(gè)完整卷積過(guò)程是由卷積-激活-池化(pooling)三個(gè)步驟組成的,也可以通過(guò)反池化-反激活-反卷積這樣的一個(gè)逆過(guò)程,并借助特征可視化幫助我們理解CNN的每一層究竟學(xué)到了什么東西。此外,文獻(xiàn)[]提出了一種網(wǎng)絡(luò)切割的方法以提取CNN的語(yǔ)義概念。
模擬/代理模型:該類(lèi)方法是針對(duì)黑箱模型,使用蒸餾(Model distillation)技術(shù)得到新的可解釋模型,訓(xùn)練這兩個(gè)模型使他們的結(jié)果近似。但這類(lèi)算法也存在很大的局限性,比如模型本身并不能被“蒸餾”,或者原始模型與蒸餾后的模型差異很大導(dǎo)致可解釋性模型的意義不再存在。
敏感性分析方法:用于定量描述模型輸入變量對(duì)輸出變量的重要性程度的方法。是令每個(gè)屬性在可能的范圍變動(dòng),研究和預(yù)測(cè)這些屬性的變化對(duì)模型輸出值的影響程度。我們將影響程度的大小稱(chēng)為該屬性的敏感性系數(shù),敏感性系數(shù)越大,就說(shuō)明屬性對(duì)模型輸出的影響越大。一般來(lái)講對(duì)于神經(jīng)網(wǎng)絡(luò)的敏感性分析方法可以分為變量敏感性分析、樣本敏感性分析兩種,變量敏感性分析用來(lái)檢驗(yàn)輸入屬性變量對(duì)模型的影響程度,樣本敏感性分析用來(lái)研究具體樣本對(duì)模型的重要程度,也是敏感性分析研究的一個(gè)新方向。在金融領(lǐng)域,將敏感性分析與局部特征探索方法(主要是樹(shù)類(lèi)模型),能夠有效解決金融領(lǐng)域普遍存在先驗(yàn)知識(shí)不足問(wèn)題。
整體來(lái)看,國(guó)內(nèi)人工智能完整產(chǎn)業(yè)鏈已初步形成,但仍存在結(jié)構(gòu)性問(wèn)題。從產(chǎn)業(yè)生態(tài)來(lái)看, 我國(guó)偏重于技術(shù)層和應(yīng)用層,尤其是終端產(chǎn)品落地應(yīng)用豐富,技術(shù)商業(yè)化程度比肩歐美
美國(guó)信息技術(shù)與創(chuàng)新基金會(huì)發(fā)布報(bào)告《誰(shuí)會(huì)在人工智能角逐中獲勝:中國(guó)、歐盟或美國(guó)》對(duì)中國(guó)、歐盟和美國(guó)人工智能發(fā)展的現(xiàn)狀進(jìn)行測(cè)算,分析半導(dǎo)體銷(xiāo)售量、半導(dǎo)體研發(fā)支出、設(shè)計(jì)AI芯片的公司數(shù)量、超級(jí)計(jì)算機(jī)數(shù)量及該系統(tǒng)的綜合性能情況
人工智能技術(shù)發(fā)展首先需要一個(gè)務(wù)實(shí)的環(huán)境,人工智能學(xué)習(xí)能力的基礎(chǔ)科學(xué)問(wèn)題需要長(zhǎng)期探索,需要堅(jiān)持把應(yīng)用場(chǎng)景落地作為推動(dòng)新一代人工智能發(fā)展的抓手
人工智能對(duì)聯(lián)合國(guó)所有17 個(gè)可持續(xù)發(fā)展目標(biāo)均具有適用性,但只能幫助解決169 個(gè)細(xì)分目標(biāo)中約一半的目標(biāo),因此需要克服一些瓶頸以便更好地發(fā)揮AI 的作用
AI產(chǎn)業(yè)鏈的三個(gè)核心環(huán)節(jié):上游是基礎(chǔ)能力提供商,中游是服務(wù)及技術(shù)提供商,下游是應(yīng)用提供商。但AI產(chǎn)業(yè)鏈的發(fā)展遠(yuǎn)遠(yuǎn)落后于發(fā)達(dá)國(guó)家
人工智能(AI)技術(shù)開(kāi)始進(jìn)入后深度學(xué)習(xí)時(shí)代,AI研究持續(xù)火熱態(tài)勢(shì),新技術(shù)和新算法百花齊放
2022年迎賓機(jī)器人企業(yè):優(yōu)必選、穿山甲、創(chuàng)澤智能、慧聞科技、杭州艾米、廣州卡伊瓦、勇藝達(dá)、睿博天米、銳曼智能、康力優(yōu)藍(lán)、云跡科技、南大電子、獵戶(hù)星空、瞳步智能
寧波錨定四個(gè)行動(dòng)目標(biāo):信息基礎(chǔ)設(shè)施建,融合基礎(chǔ)設(shè)施建設(shè),創(chuàng)新基礎(chǔ)設(shè)施建,創(chuàng)新基礎(chǔ)設(shè)施建
寧波將通過(guò)實(shí)施100個(gè)重大新型基礎(chǔ)設(shè)施項(xiàng)目,釋放2000億元投資,將寧波打造成為全國(guó)新型基礎(chǔ)設(shè)施建設(shè)標(biāo)桿城市
排行榜企業(yè):華為,字節(jié)跳動(dòng),京東,比亞迪,OPPO,格力,海爾,美團(tuán)點(diǎn)評(píng),?低,拼多多,蘇寧,京東方,順豐
2020年6月4日,日照工信發(fā)布專(zhuān)家?guī)烀麊危和跖?石秀芳 孟輝 蘇冠群 王洪海 張凱麗 宋春鵬 胡衛(wèi)清 侯冬冬 朱運(yùn)海 劉廣衛(wèi) 肖培室 王一夫 董淑恩 喬玉安 劉杰 王曉玲 王辰光 王濤
上海市依托上汽集團(tuán)、上海大眾、上海吉利以及 Momenta、Waymo 等國(guó)內(nèi)外知名汽車(chē)生產(chǎn)廠(chǎng)商以及車(chē)聯(lián)網(wǎng)、自動(dòng)駕駛技術(shù)企業(yè)聯(lián)合推進(jìn)相關(guān)試點(diǎn)工作
深圳市 5G 應(yīng)用場(chǎng)景較多,涉及交通、醫(yī)療、城市管理等多個(gè)方面。在交通領(lǐng)域,深圳地鐵部署“5G+AI”體驗(yàn)區(qū),將 5G 技術(shù)與人工智能相結(jié)合,利用無(wú)感乘車(chē)、智能機(jī)器人等方式打造智慧交通樞紐
北京市已實(shí)現(xiàn)智慧交通、智慧醫(yī)療、工業(yè)互聯(lián)網(wǎng)、智慧城市、超高清視頻等場(chǎng)景的應(yīng)用,智慧醫(yī)療是北京市落地較早的應(yīng)用場(chǎng)景
“5G+金融”應(yīng)用場(chǎng)景:智慧網(wǎng)點(diǎn) 遠(yuǎn)程虛擬銀行 移動(dòng)支付 開(kāi)放銀行 智能資管 智慧風(fēng)控 智慧營(yíng)業(yè)部 數(shù)字化運(yùn)營(yíng) 智慧營(yíng)銷(xiāo) 遠(yuǎn)程核保 智能定損
5G+醫(yī)療案例:遠(yuǎn)程會(huì)診、遠(yuǎn)程超聲、遠(yuǎn)程手術(shù)、遠(yuǎn)程示教、遠(yuǎn)程監(jiān)護(hù) 智慧急救云平臺(tái)、車(chē)載急救管理系統(tǒng)、遠(yuǎn)程急救會(huì)診指導(dǎo)系 統(tǒng)、急救輔助系統(tǒng) 智能分診、報(bào)告單查詢(xún)、線(xiàn)路 指引、身份識(shí)別
5G射頻器件公司: 麥捷科技 大富科技 信維通信 碩貝德 長(zhǎng)盈精密 武漢凡谷 順絡(luò)電子 唯捷創(chuàng)芯
廠(chǎng)商:華為 深圳廣和通 上海移遠(yuǎn)通信 中國(guó)移動(dòng) 聞泰科技 深圳美格智能 上海龍尚科技 上海芯訊通 四川愛(ài)聯(lián) 重慶中移物聯(lián) 深圳高新興物聯(lián)
2022年迎賓機(jī)器人企業(yè):優(yōu)必選、穿山甲、創(chuàng)澤智能、慧聞科技、杭州艾米、廣州卡伊瓦、勇藝達(dá)、睿博天米、銳曼智能、康力優(yōu)藍(lán)、云跡科技、南大電子、獵戶(hù)星空、瞳步智能
山東機(jī)器人公司,創(chuàng)澤機(jī)器人榮獲山東省工信廳人工智能領(lǐng)域的準(zhǔn)獨(dú)角獸的稱(chēng)號(hào),是中國(guó)工信部人工智能產(chǎn)業(yè)創(chuàng)新重點(diǎn)任務(wù)揭榜優(yōu)勝單位
消毒機(jī)器人有哪些優(yōu)勢(shì),未來(lái)發(fā)展趨勢(shì)
家庭陪護(hù)機(jī)器人能在家中起到監(jiān)控安全陪護(hù)具有人機(jī)互動(dòng)交互服務(wù)多媒體娛樂(lè)價(jià)格查詢(xún)等
兒童陪護(hù)機(jī)器人與孩子互動(dòng)陪伴玩耍學(xué)習(xí)價(jià)格問(wèn)詢(xún)等功能說(shuō)明使用指南介紹
展館智能機(jī)器人可講解自主行走語(yǔ)音交互咨詢(xún)互動(dòng)價(jià)格咨詢(xún)等功能介紹以及表情展現(xiàn)能力
智能講解機(jī)器人正在劍橋講解演示咨詢(xún)互動(dòng)移動(dòng)宣傳價(jià)格問(wèn)詢(xún)等功能說(shuō)明介紹
智能接待機(jī)器人迎賓服務(wù)來(lái)賓問(wèn)詢(xún)答疑價(jià)格查詢(xún)
智能主持機(jī)器人參與主持了寧夏的云天大會(huì)并完成了大會(huì)的接待任務(wù)多才多藝載很受歡迎
超市智能機(jī)器人能幫助商家吸引客戶(hù)道路指引導(dǎo)購(gòu)價(jià)格查詢(xún)
4s店智能機(jī)器人迎賓銷(xiāo)售導(dǎo)購(gòu)數(shù)據(jù)收集分析價(jià)格問(wèn)詢(xún)等
展廳智能機(jī)器人可用于接待講解咨詢(xún)互動(dòng)價(jià)格查詢(xún)等功能