顧 問
潘云鶴 中國工程院院士
指導(dǎo)單位
工業(yè)和信息化部信息化和軟件服務(wù)業(yè)司
指導(dǎo)委員會
謝少鋒 工信部信軟司司長
李冠宇 工信部信軟司副司長
徐曉蘭 中國電子學(xué)會副理事長兼秘書長
張宏圖 中國電子學(xué)會總部黨委書記兼副秘書長
商 超 工信部信軟司軟件處處長
傅永寶 工信部信軟司軟件處調(diào)研員
專家委員會(排名不分先后,按姓氏筆畫排序)
王士進(jìn) 科大訊飛研究院副院長
韋 青 微軟中國公司首席技術(shù)官
宋 波 國安瑞(北京)科技有限公司總經(jīng)理
劉志堅 京東金融總法律顧問
吳甘沙 馭勢科技聯(lián)合創(chuàng)始人兼CEO
季向陽 清華大學(xué)自動化系教授
陳麗娟 阿里巴巴人工智能實驗室負(fù)責(zé)人
梁家恩 云知聲信息技術(shù)有限公司董事長兼CTO
崔 巖 中德人工智能研究院院長
蔡雄山 騰訊研究院法律研究中心副主任
編寫單位
中國電子學(xué)會
編寫人員
李 颋 周岷峰 馬 良 凌 霞
李 巖 張雅妮 許華磊 張 嬋
張 力 陳濛萌 樊江洋 朱 毅
李俊平 閻德利 謝中業(yè) 陳 巖
1、編制背景
自1956年概念得以確立以來,人工智能發(fā)展至今已逾60年,隨著所處信息環(huán)境和數(shù)據(jù)基礎(chǔ)的深刻變革,開始邁進(jìn)新一輪發(fā)展階段,呈現(xiàn)出大數(shù)據(jù)、跨媒體、群體性、自主化、人機(jī)融合的發(fā)展新特征,從學(xué)術(shù)牽引式發(fā)展迅速轉(zhuǎn)變?yōu)樾枨鬆恳桨l(fā)展,相比歷史上的任何時刻,都要更加接近于人類智能,既能為進(jìn)一步掌握城市發(fā)展、生態(tài)保護(hù)、經(jīng)濟(jì)管理、金融風(fēng)險等宏觀系統(tǒng)提供指導(dǎo),也能為設(shè)計制造、健康醫(yī)療、交通管理、能源節(jié)約等微觀領(lǐng)域提供解決方案。我國正值工業(yè)化、城鎮(zhèn)化、信息化、農(nóng)業(yè)現(xiàn)代化的攻堅階段,迫切需要加快推動人工智能在國民經(jīng)濟(jì)社會各行業(yè)、各領(lǐng)域的創(chuàng)新應(yīng)用,促進(jìn)產(chǎn)業(yè)提質(zhì)增效,改善人民生活水平,切實解決經(jīng)濟(jì)運行的重大結(jié)構(gòu)性失衡。針對于此,有必要研究編制新一代人工智能發(fā)展白皮書,明確人工智能在新時期、新形勢下的技術(shù)框架、關(guān)鍵環(huán)節(jié)、應(yīng)用前景,為推動人工智能關(guān)鍵技術(shù)進(jìn)步和產(chǎn)業(yè)化應(yīng)用推廣提供措施建議,進(jìn)一步推動我國智能相關(guān)的前沿新興產(chǎn)業(yè)持續(xù)健康快速發(fā)展,有力支撐我國信息化和工業(yè)化深度融合邁上新臺階。
2、編制目標(biāo)
(1)明確新一代人工智能的主要發(fā)展方向,系統(tǒng)歸納其主要驅(qū)動因素及最具典型意義的特征。
(2)研究新一代人工智能的技術(shù)框架,梳理技術(shù)演進(jìn)軌跡,提出基礎(chǔ)性、通用性技術(shù)體系。
(3)探索新一代人工智能的產(chǎn)業(yè)邊界,劃分產(chǎn)業(yè)類別和應(yīng)用場景,研判相關(guān)的投融資特征及趨勢。
(4)提出促進(jìn)新一代人工智能及相關(guān)技術(shù)及產(chǎn)業(yè)發(fā)展的可行性措施建議,為相關(guān)行業(yè)主管部門提供決策參考,為行業(yè)健康有序發(fā)展提供指導(dǎo)依據(jù)。
3、編制方法
(1)研究學(xué)習(xí)國內(nèi)外相關(guān)戰(zhàn)略政策文件,充分借鑒參考國內(nèi)外主要研究動態(tài)和成果。主要包括:美國白宮發(fā)布的《為人工智能的未來做好準(zhǔn)備》、《國家人工智能研究與發(fā)展戰(zhàn)略規(guī)劃》;英國下議院科學(xué)和技術(shù)委員會發(fā)布的《機(jī)器人和人工智能》、英國政府科學(xué)辦公室發(fā)布的《人工智能對未來決策的機(jī)會和影響》,以及英國政府在2017年1月宣布的《現(xiàn)代工業(yè)戰(zhàn)略》和3月公布的《數(shù)字戰(zhàn)略》;日本政府制定的《人工智能產(chǎn)業(yè)化路線圖》;我國出臺的《國務(wù)院關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》和《“十三五”國家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃》中關(guān)于人工智能的部分。同時,針對歐盟的“人腦項目”、德國的“智慧數(shù)據(jù)項目”、日本的“超智能社會”和“高級綜合智能平臺計劃”進(jìn)行了學(xué)習(xí)了解。
(2)訪談國內(nèi)知名專家學(xué)者,圍繞新一代人工智能的內(nèi)涵、外延及特征趨勢展開充分研討。新一代人工智能既有創(chuàng)新性又有繼承性,與過往所談?wù)摰娜斯ぶ悄芗扔新?lián)系又有區(qū)別,在研究內(nèi)容上既要有突破又要有充分吸收和借鑒。通過與國內(nèi)人工智能相關(guān)領(lǐng)域的知名院士、高校學(xué)者、行業(yè)專家的座談交流,尤其是圍繞中國工程院潘云鶴院士《人工智能邁向2.0》一文進(jìn)行的深入學(xué)習(xí)研討,為白皮書的編制奠定了系統(tǒng)的理論基礎(chǔ)。
(3)調(diào)研國內(nèi)外知名人工智能企業(yè),匯集整理和分析來自實踐應(yīng)用的典型案例。高度重視人工智能領(lǐng)域的具體產(chǎn)品、服務(wù)及解決方案提供方式,走進(jìn)國內(nèi)外一批在技術(shù)或產(chǎn)業(yè)方面具備領(lǐng)先水平和特色優(yōu)勢的人工智能企業(yè)展開深度調(diào)研,并邀請部分企業(yè)的技術(shù)或戰(zhàn)略負(fù)責(zé)人共同參與了白皮書的編制工作。
4、特別聲明
(1)研究主題充分考慮了與國家規(guī)劃的互動和呼應(yīng)
人工智能的概念從誕生之日開始計算,已經(jīng)超過60年,并非橫空出世的新興事物。只不過受近年來算法模式持續(xù)優(yōu)化、數(shù)據(jù)信息海量增長、運算力大幅提升的影響和帶動,表現(xiàn)出了不同以往的發(fā)展水平和特征。本白皮書一開始研究主題名為“人工智能2.0”,目前已更改為“新一代人工智能”,是為了呼應(yīng)院士研究文章、部委領(lǐng)導(dǎo)講話,以及即將出臺的國家級規(guī)劃,重點針對人工智能的新趨勢、新特征、新模式展開研究,并非是要提出一個全新的研究對象。
(2)研究范圍聚焦技術(shù)和產(chǎn)業(yè)發(fā)展
在人工智能領(lǐng)域,正孕育著堪與相對論、量子理論、計算機(jī)、互聯(lián)網(wǎng)相提并論的重大創(chuàng)新、變革及突破。人工智能歷史性地站在了時代的風(fēng)口,將對人類經(jīng)濟(jì)社會發(fā)展帶來智能化浪潮的顛覆性猛烈沖擊。研究人工智能,就要研究其在人類生產(chǎn)生活中的詳細(xì)地位和作用,涉及到方方面面,包括了道德、法律、倫理、文化等領(lǐng)域。本白皮書的編制,主要是為了給相關(guān)行業(yè)主管部門和企業(yè)提供決策參考依據(jù),集中在技術(shù)和產(chǎn)業(yè)兩大層面展開研究,暫未涉及其他方面。
(3)研究內(nèi)容仍有待進(jìn)一步豐富完善
當(dāng)前,各類研究咨詢機(jī)構(gòu)紛紛推出圍繞人工智能主題的相關(guān)報告,各自觀點既有一致性,也存在部分不同意見。本白皮書的主要觀點和內(nèi)容僅代表編制組在目前對人工智能的研判和思考,歡迎各方專家學(xué)者和企業(yè)代表提出寶貴意見,共同推動白皮書的及時更新和糾偏。同時,隨著人工智能技術(shù)的進(jìn)步、產(chǎn)業(yè)的發(fā)展、模式的變革,白皮書的內(nèi)容將得到進(jìn)一步豐富完善。
第二章 新一代人工智能技術(shù)框架
與早期人工智能相比,新一代人工智能正在全新信息環(huán)境、海量數(shù)據(jù)基礎(chǔ)和持續(xù)演進(jìn)、不斷豐富的戰(zhàn)略目標(biāo)的引領(lǐng)下,依托于云計算、大數(shù)據(jù)兩大基礎(chǔ)平臺和機(jī)器學(xué)習(xí)、模式識別和人機(jī)交互三大通用技術(shù),以新型計算架構(gòu)、通用人工智能和開源生態(tài)系統(tǒng)為主要導(dǎo)向,持續(xù)搭建和完善技術(shù)框架體系,不斷逼近技術(shù)奇點,深刻變革人類生產(chǎn)生活。
(一)新一代人工智能的技術(shù)演進(jìn)
1、從原有的CPU架構(gòu),轉(zhuǎn)變?yōu)?/span>GPU并行運算架構(gòu)
深度學(xué)習(xí)算法運行于CPU架構(gòu)的指令需求過于復(fù)雜。機(jī)器學(xué)習(xí)領(lǐng)域的泰斗杰弗里·辛頓開啟了深度學(xué)習(xí)在人工智能領(lǐng)域研究的浪潮,大數(shù)據(jù)技術(shù)帶來的數(shù)據(jù)洪流滿足了深度學(xué)習(xí)算法對于訓(xùn)練數(shù)據(jù)量的要求,但是算法的實現(xiàn)還需要更快更強(qiáng)大的處理器予以支撐。傳統(tǒng)的主流CPU架構(gòu)如X86、ARM等往往需要數(shù)百甚至上千條指令才能完成一個神經(jīng)元的處理,對于并不需要太多的程序指令,卻需要海量數(shù)據(jù)運算的深度學(xué)習(xí)的計算需求,并不能很好地匹配與適應(yīng)。
GPU架構(gòu)具備與深度學(xué)習(xí)相匹配的并行運算能力。GPU(圖形處理器)最初是個人電腦、工作站、游戲機(jī)和一些移動設(shè)備上運行繪圖運算工作的微處理器,可以快速處理圖像上的每一個像素點,其海量數(shù)據(jù)并行運算的能力與深度學(xué)習(xí)需求非常符合。當(dāng)前主流的CPU只有4核或者8核,可以模擬出12個處理線程來進(jìn)行運算,但是普通級別的GPU就包含了成百上千個處理單元,高端的甚至更多,這對于多媒體計算中大量的重復(fù)處理過程有著天生的優(yōu)勢。吳恩達(dá)教授領(lǐng)導(dǎo)的谷歌大腦研究工作結(jié)果表明,12顆英偉達(dá)(Nvidia)公司的GPU可以提供相當(dāng)于2000顆CPU的深度學(xué)習(xí)性能,為技術(shù)的發(fā)展帶來了實質(zhì)性飛躍,被廣泛應(yīng)用于全球各大主流深度學(xué)習(xí)開發(fā)機(jī)構(gòu)與研究院所。
2、從單一算法驅(qū)動,轉(zhuǎn)變?yōu)閿?shù)據(jù)、運算力、算法復(fù)合驅(qū)動
缺少數(shù)據(jù)支撐與運算力保證的算法驅(qū)動模式難以持續(xù)發(fā)展。人工智能發(fā)展以實現(xiàn)計算智能為重要研究方向,充分利用現(xiàn)代高性能計算機(jī)的快速計算和記憶存儲能力,設(shè)計出神經(jīng)計算、模糊計算和進(jìn)化計算等求解算法,解決優(yōu)化篩選、單點搜索、邏輯推理等實際應(yīng)用問題。盡管深度學(xué)習(xí)概念和淺層學(xué)習(xí)算法已經(jīng)被提出多年,但是一直進(jìn)展緩慢,究其原因是缺乏海量的數(shù)據(jù)積累和與之相匹配的高水平計算能力,無法對算法模型進(jìn)行持續(xù)的改進(jìn)與優(yōu)化,只停留在理論研究階段,距離實際應(yīng)用存在不小的差距。
數(shù)據(jù)、運算力和算法復(fù)合驅(qū)動模式引發(fā)人工智能爆發(fā)式增長。與早期人工智能相比,新一代人工智能體現(xiàn)出數(shù)據(jù)、運算力和算法相互融合、優(yōu)勢互補(bǔ)的良好特點。數(shù)據(jù)方面,人類進(jìn)入互聯(lián)網(wǎng)時代后,數(shù)據(jù)技術(shù)高速發(fā)展,各類數(shù)據(jù)資源不斷積累,為人工智能的訓(xùn)練學(xué)習(xí)過程奠定了良好的基礎(chǔ)。運算力方面,摩爾定律仍在持續(xù)發(fā)揮效用,計算系統(tǒng)的硬件性能逐年提升,云計算、并行計算、網(wǎng)格計算等新型計算方式的出現(xiàn)拓展了現(xiàn)代計算機(jī)性能,獲得更快的計算速度。算法方面,伴隨著深度學(xué)習(xí)技術(shù)的不斷成熟,運算模型日益優(yōu)化,智能算法不斷更新,提升了模型辨識解析的準(zhǔn)確度。
3、從封閉的單機(jī)系統(tǒng),轉(zhuǎn)變?yōu)榭旖蒽`活的開源框架
專家系統(tǒng)本地化特性限制了人工智能發(fā)展步伐。以往的人工智能專家系統(tǒng)是基于本地化專業(yè)知識進(jìn)行設(shè)計開發(fā),以知識庫和推理機(jī)為中心而展開,推理機(jī)設(shè)計內(nèi)容由不同的專家系統(tǒng)應(yīng)用環(huán)境決定,單獨設(shè)定模型函數(shù)與運算機(jī)制,一般不具備通用性。同時,知識庫是開發(fā)者收集錄入的專家分析模型與案例的資源集合,只能夠在單機(jī)系統(tǒng)環(huán)境下使用且無法連接網(wǎng)絡(luò),升級更新較為不便。
開源框架推動構(gòu)建人工智能行業(yè)解決方案。人工智能系統(tǒng)的開發(fā)工具日益成熟,通用性較強(qiáng)且各具特色的開源框架不斷涌現(xiàn),如谷歌的TensorFlow、Facebook的Torchnet、百度的PaddlePaddle等,其共同特點均是基于Linux生態(tài)系統(tǒng),具備分布式深度學(xué)習(xí)數(shù)據(jù)庫和商業(yè)級即插即用功能,能夠在GPU上較好地繼承Hadoop和Spark架構(gòu),廣泛支持Python、Java、Scala、R等流行開發(fā)語言,與硬件結(jié)合生成各種應(yīng)用場景下的人工智能系統(tǒng)與解決方案。
4、從學(xué)術(shù)研究探索導(dǎo)向,轉(zhuǎn)變?yōu)榭焖俚膶嵺`應(yīng)用導(dǎo)向
學(xué)術(shù)導(dǎo)向難以滿足復(fù)雜數(shù)據(jù)信息背景下的創(chuàng)新需求。隨著人工智能的不斷發(fā)展,分化產(chǎn)生了不同的學(xué)術(shù)流派,以符號主義、聯(lián)結(jié)主義、進(jìn)化主義、貝葉斯學(xué)派、類推學(xué)派等為典型。不同學(xué)派按照各自對人工智能領(lǐng)域基本理論、研究方法和技術(shù)路線的理解,以學(xué)術(shù)研究為目的進(jìn)行探索實踐,一定程度上推動了人工智能理論與技術(shù)的發(fā)展。在如今數(shù)據(jù)環(huán)境改變和信息環(huán)境變化的背景下,現(xiàn)實世界結(jié)構(gòu)趨向復(fù)雜,單純依靠課題立項和學(xué)術(shù)研究無法持續(xù)推動人工智能滿足當(dāng)前現(xiàn)實世界的模擬與互動需求,快速變化的應(yīng)用環(huán)境也容易導(dǎo)致理論研究與實際應(yīng)用相脫節(jié),影響人工智能技術(shù)對經(jīng)濟(jì)發(fā)展和社會進(jìn)步的積極拉動作用。
快速迭代的實踐應(yīng)用導(dǎo)向加速形成技術(shù)發(fā)展正循環(huán)。目前,人工智能圍繞醫(yī)療、金融、交通、教育、零售等數(shù)據(jù)較集中且質(zhì)量較高的行業(yè)的實踐需求,在算法模型、圖像識別、自然語言處理等方面將持續(xù)出現(xiàn)迭代式的技術(shù)突破,在深度應(yīng)用中支撐人工智能實現(xiàn)“數(shù)據(jù)-技術(shù)-產(chǎn)品-用戶”的往復(fù)正循環(huán),由學(xué)術(shù)驅(qū)動向應(yīng)用拉動轉(zhuǎn)化。在人工智能技術(shù)準(zhǔn)備期,由于提供數(shù)據(jù)支撐較少,技術(shù)提升度慢,一旦進(jìn)入應(yīng)用期,大量的優(yōu)質(zhì)數(shù)據(jù)有助于分析技術(shù)弊端,通過對相關(guān)技術(shù)進(jìn)行改進(jìn)升級,提升了產(chǎn)品的應(yīng)用水平,用戶在得到更好的產(chǎn)品體驗后,繼續(xù)為應(yīng)用平臺創(chuàng)造了更大規(guī)模的后臺數(shù)據(jù),用來進(jìn)行下一步的技術(shù)升級與產(chǎn)品改良,由此進(jìn)入了大規(guī)模應(yīng)用階段。在技術(shù)快速迭代發(fā)展的過程中,數(shù)據(jù)累積和大規(guī)模應(yīng)用起到了至關(guān)重要的作用,能夠持續(xù)推動人工智能技術(shù)實現(xiàn)自我超越。
(二)新一代人工智能技術(shù)體系
新一代人工智能技術(shù)體系由基礎(chǔ)技術(shù)平臺和通用技術(shù)體系構(gòu)成,其中基礎(chǔ)技術(shù)平臺包括云計算平臺與大數(shù)據(jù)平臺,通用技術(shù)體系包括機(jī)器學(xué)習(xí)、模式識別與人機(jī)交互。在此技術(shù)體系的基礎(chǔ)上,人工智能技術(shù)不斷創(chuàng)新發(fā)展,應(yīng)用場景和典型產(chǎn)品不斷涌現(xiàn)。
1、云計算:基礎(chǔ)的資源整合交互平臺
云計算主要共性技術(shù)包括虛擬化技術(shù)、分布式技術(shù)、計算管理技術(shù)、云平臺技術(shù)和云安全技術(shù),具備實現(xiàn)資源快速部署和服務(wù)獲取、進(jìn)行動態(tài)可伸縮擴(kuò)展及供給、面向海量信息快速有序化處理、可靠性高、容錯能力強(qiáng)等特點,為人工智能的發(fā)展提供了資源整合交互的基礎(chǔ)平臺。尤其與大數(shù)據(jù)技術(shù)結(jié)合,為當(dāng)前受到最多關(guān)注的深度學(xué)習(xí)技術(shù)搭建了強(qiáng)大的存儲和運算體系架構(gòu),促進(jìn)了神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練優(yōu)化過程,顯著提高語音、圖片、文本等辨識對象的識別率。
表1 云計算主要共性技術(shù)
資料來源:中國電子學(xué)會整理
2、大數(shù)據(jù):提供豐富的分析、訓(xùn)練與應(yīng)用資源
大數(shù)據(jù)主要共性技術(shù)包括采集與預(yù)處理、存儲與管理、計算模式與系統(tǒng)、分析與挖掘、可視化計算及隱私及安全等,具備數(shù)據(jù)規(guī)模不斷擴(kuò)大、種類繁多、產(chǎn)生速度快、處理能力要求高、時效性強(qiáng)、可靠性要求嚴(yán)格、價值大但密度較低等特點,為人工智能提供豐富的數(shù)據(jù)積累和價值規(guī)律,引發(fā)分析需求。同時,從跟蹤靜態(tài)數(shù)據(jù)到結(jié)合動態(tài)數(shù)據(jù),可以推動人工智能根據(jù)客觀環(huán)境變化進(jìn)行相應(yīng)的改變和適應(yīng),持續(xù)提高算法的準(zhǔn)確性與可靠性。
表2 大數(shù)據(jù)主要共性技術(shù)
資料來源:中國電子學(xué)會整理
3、機(jī)器學(xué)習(xí):持續(xù)引導(dǎo)機(jī)器智能水平提升
機(jī)器學(xué)習(xí)指通過數(shù)據(jù)和算法在機(jī)器上訓(xùn)練模型,并利用模型進(jìn)行分析決策與行為預(yù)測的過程。機(jī)器學(xué)習(xí)技術(shù)體系主要包括監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí),目前廣泛應(yīng)用在專家系統(tǒng)、認(rèn)知模擬、數(shù)據(jù)挖掘、圖像識別、故障診斷、自然語言理解、機(jī)器人和博弈等領(lǐng)域。機(jī)器學(xué)習(xí)作為人工智能最為重要的通用技術(shù),未來將持續(xù)引導(dǎo)機(jī)器獲取新的知識與技能,重新組織整合已有知識結(jié)構(gòu),有效提升機(jī)器智能化水平,不斷完善機(jī)器服務(wù)決策能力。
表3 機(jī)器學(xué)習(xí)主要共性技術(shù)
資料來源:中國電子學(xué)會整理
4、模式識別:從感知環(huán)境和行為到基于認(rèn)知的決策
模式識別是對各類目標(biāo)信息進(jìn)行處理分析,進(jìn)而完成描述、辨認(rèn)、分類和解釋的過程。模式識別技術(shù)體系包括決策理論、句法分析和統(tǒng)計模式等,目前廣泛應(yīng)用在語音識別、指紋識別、人臉識別、手勢識別、文字識別、遙感和醫(yī)學(xué)診斷等領(lǐng)域。隨著理論基礎(chǔ)和實際應(yīng)用研究范圍的不斷擴(kuò)大,模式識別技術(shù)將與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合,由目前單純的環(huán)境感知進(jìn)化為認(rèn)知決策,同時量子計算技術(shù)也將用于未來模式識別研究工作,助力模式識別技術(shù)突破與應(yīng)用領(lǐng)域拓展。
表4 模式識別主要共性技術(shù)
資料來源:中國電子學(xué)會整理
5、人機(jī)交互:支撐實現(xiàn)人機(jī)物交叉融合與協(xié)同互動
人機(jī)交互技術(shù)賦予機(jī)器通過輸出或顯示設(shè)備對外提供有關(guān)信息的能力,同時可以讓用戶通過輸入設(shè)備向機(jī)器傳輸反饋信息達(dá)到交互目的。人機(jī)交互技術(shù)體系包括交互設(shè)計、可用性分析評估、多通道交互、群件、移動計算等,目前廣泛應(yīng)用在地理空間跟蹤、動作識別、觸覺交互、眼動跟蹤、腦電波識別等領(lǐng)域。隨著交互方式的不斷豐富以及物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,未來肢體識別和生物識別技術(shù)將逐漸取代現(xiàn)有的觸控和密碼系統(tǒng),人機(jī)融合將向人機(jī)物交叉融合進(jìn)化發(fā)展,帶來信息技術(shù)領(lǐng)域的深刻變革。
表5 人機(jī)交互主要共性技術(shù)
資料來源:中國電子學(xué)會整理
(三)國內(nèi)外技術(shù)對比分析
1、發(fā)達(dá)國家基礎(chǔ)平臺布局完善,國內(nèi)仍缺乏自主核心技術(shù)
國外企業(yè)技術(shù)領(lǐng)先且大量布局公有云業(yè)務(wù)領(lǐng)域,大數(shù)據(jù)業(yè)務(wù)經(jīng)驗成熟、分工明確且數(shù)據(jù)開放程度較高。云計算方面,國外云計算企業(yè)基礎(chǔ)技術(shù)相對領(lǐng)先,服務(wù)器虛擬化、網(wǎng)絡(luò)技術(shù)(SDN)、存儲技術(shù)、分布式計算、OS、開發(fā)語言和平臺等核心技術(shù)基本上都掌握在少數(shù)國外公司手中,憑借著強(qiáng)大的創(chuàng)新和資本轉(zhuǎn)化能力,有能力支持技術(shù)不斷推陳出新。同時,國外企業(yè)在細(xì)分領(lǐng)域都有所布局,形成了完善的產(chǎn)業(yè)鏈配合,提供各種解決方案的集成,可以滿足多場景使用要求。大數(shù)據(jù)方面,國外公司在大數(shù)據(jù)技術(shù)各個領(lǐng)域方面分工明確,有的專注于數(shù)據(jù)挖掘,有的專注于數(shù)據(jù)清洗,也有的專注于數(shù)據(jù)存儲與管理。同時,國外從事大數(shù)據(jù)技術(shù)研發(fā)的企業(yè)有很大一部分是由傳統(tǒng)的數(shù)據(jù)公司轉(zhuǎn)型而來,如IBM、甲骨文(Oracle)、易安信(EMC,2015年10月被戴爾公司收購)等,這類公司在大數(shù)據(jù)概念興起之前就早已充分接觸數(shù)據(jù)領(lǐng)域業(yè)務(wù),在數(shù)據(jù)科學(xué)領(lǐng)域有較強(qiáng)的研發(fā)能力。國外數(shù)據(jù)保護(hù)制度相對完善,數(shù)據(jù)開放標(biāo)準(zhǔn)成熟,為大數(shù)據(jù)技術(shù)研發(fā)提供了良好的外部環(huán)境。
國內(nèi)企業(yè)自主核心技術(shù)有待提高,數(shù)據(jù)開放程度偏低且缺乏必要的保護(hù)。云計算方面,國內(nèi)雖然有阿里、華為、新華三、易華錄等一批科技公司大力投入研發(fā)資源,但核心技術(shù)積累依然不足,難以主導(dǎo)產(chǎn)業(yè)鏈發(fā)展。大數(shù)據(jù)方面,國內(nèi)企業(yè)仍處于“跟風(fēng)”國外企業(yè)的發(fā)展階段,在數(shù)據(jù)服務(wù)內(nèi)核等方面缺乏積淀與經(jīng)驗,未能完全實現(xiàn)從IT領(lǐng)域向DT(數(shù)據(jù)技術(shù))領(lǐng)域的轉(zhuǎn)型。同時,國內(nèi)數(shù)據(jù)應(yīng)用環(huán)境相對封閉,政府公共數(shù)據(jù)開放程度較低,數(shù)據(jù)安全保護(hù)等級有待提高,數(shù)據(jù)安全風(fēng)險評估制度與保障體系有待完善,對大數(shù)據(jù)技術(shù)的升級發(fā)展形成了一定的限制因素。
2、發(fā)達(dá)國家在機(jī)器學(xué)習(xí)和人機(jī)交互領(lǐng)域具備先發(fā)優(yōu)勢,國內(nèi)企業(yè)存在技術(shù)差距與人才短板
國外機(jī)構(gòu)發(fā)力機(jī)器學(xué)習(xí)主流開源框架,積極開發(fā)人機(jī)交互下一代新型技術(shù)。機(jī)器學(xué)習(xí)方面,目前較為流行的開源框架基本都為國外公司或機(jī)構(gòu)所開發(fā),例如TensorFlow、Torchnet、Caffe、DMTK、SystemML等,同時注重大數(shù)據(jù)、云計算等基礎(chǔ)支撐信息技術(shù)對機(jī)器學(xué)習(xí)研究的促進(jìn)作用,以及機(jī)器學(xué)習(xí)的應(yīng)用實踐,已進(jìn)入研發(fā)穩(wěn)定階段。人機(jī)交互方面,國外技術(shù)企業(yè)基于觸控技術(shù)、可穿戴設(shè)備、物聯(lián)網(wǎng)和車聯(lián)網(wǎng)的發(fā)展基礎(chǔ),正在積極開發(fā)性價比更高的下一代人機(jī)交互新型技術(shù),以對現(xiàn)有產(chǎn)品進(jìn)行升級并降低成本。
國內(nèi)機(jī)器學(xué)習(xí)基礎(chǔ)理論體系尚不成熟,缺乏人機(jī)交互專業(yè)領(lǐng)域人才培養(yǎng)環(huán)境。機(jī)器學(xué)習(xí)方面,盡管國內(nèi)學(xué)者在數(shù)據(jù)挖掘?qū)用嫒〉昧艘欢ǖ难芯砍煽儯珜τ跈C(jī)器學(xué)習(xí)的底層技術(shù)、實現(xiàn)原理及應(yīng)用方法缺乏足夠的重視,導(dǎo)致關(guān)鍵技術(shù)環(huán)節(jié)缺失與重要領(lǐng)域邊緣化,不利于在國際主流機(jī)器學(xué)習(xí)技術(shù)角逐中展開有效競爭。人機(jī)交互方面,研究者需要具備數(shù)學(xué)、計算機(jī)學(xué)和心理學(xué)等相關(guān)背景,復(fù)合型較強(qiáng),相比于國外高校都設(shè)立單獨的人機(jī)交互專業(yè),國內(nèi)高校開設(shè)的專業(yè)相對傳統(tǒng),缺乏交叉復(fù)合型人才的培養(yǎng)機(jī)制,亟需建立人機(jī)交互領(lǐng)域技術(shù)人才培養(yǎng)的良好環(huán)境。
3、國內(nèi)外模式識別研究水平基本處于同一起跑線,重點聚焦于語音識別與圖像識別
國內(nèi)外研究領(lǐng)域基本一致,圍繞前沿技術(shù)領(lǐng)域開展持續(xù)創(chuàng)新。目前,國內(nèi)外企業(yè)均在圍繞模式識別領(lǐng)域的基礎(chǔ)理論、圖像處理、計算機(jī)視覺以及語音信息處理展開集中研究,探索模式識別機(jī)理以及有效計算方法,為解決應(yīng)用實踐問題提供關(guān)鍵技術(shù)。國外科技公司在模式識別各領(lǐng)域擁有多年的技術(shù)積累,深入語音合成、生物認(rèn)證分析、計算機(jī)視覺等前沿技術(shù)領(lǐng)域,具備原創(chuàng)性技術(shù)突破能力;國內(nèi)企業(yè)在模式識別前沿技術(shù)研發(fā)方面與國外同行處于并跑狀態(tài),除百度、訊飛等行業(yè)龍頭外,眾多初創(chuàng)公司也加入了模式識別研究的技術(shù)與應(yīng)用創(chuàng)新,催生了一批有創(chuàng)意的新型產(chǎn)品。
語音識別和圖像識別準(zhǔn)確率明顯提升,國內(nèi)企業(yè)中文語音識別技術(shù)相對領(lǐng)先。國內(nèi)外企業(yè)均致力于提高語音識別和圖像識別準(zhǔn)確率,谷歌和微軟分別表示旗下的語音識別產(chǎn)品技術(shù)出錯率已降至8%和6.3%,微軟研究院開發(fā)的圖像識別系統(tǒng)在世界著名的圖片識別競賽ImageNet中獲得多個類別評比的第一名,為下一步的商業(yè)化應(yīng)用奠定了良好基礎(chǔ)。同時,國內(nèi)企業(yè)重點突破中文語音識別技術(shù),搜狗、百度和科大訊飛三家公司各自宣布旗下的中文語音產(chǎn)品識別準(zhǔn)確率達(dá)到了97%,處于業(yè)內(nèi)領(lǐng)先水平。
(審核編輯: 智匯張瑜)
分享