智汇工业-智慧工业、智能制造及工业智能、工业互联门户网站,专业的工业“互联网+”传媒

當(dāng)AI遇上AR:從微軟HoloLens HPU說起

來源:網(wǎng)絡(luò)

點擊:1131

A+ A-

所屬頻道:新聞中心

關(guān)鍵詞: AI,AR,微軟HoloLens,HPU,處理器架構(gòu)

    AI+AR

    人工智能(AI)與增強現(xiàn)實(AR)的概念在最近乃是當(dāng)紅炸子雞,火遍大江南北。AI 與 AR 的概念區(qū)別不小,但是也有不少交集。目前,AI 最熱門的應(yīng)用就是在計算機視覺(Computer Vision,CV)領(lǐng)域,而 AR 的實現(xiàn)(圖像渲染)自然也離不開 CV 。舉個例子吧!《龍珠》想必大家都看過(如果你沒看過說明你很年輕!大叔很羨慕你!),里面的戰(zhàn)斗力探測眼鏡就是 AI + AR 的一個極好例子:戰(zhàn)斗力探測眼鏡用基于 CV 的 AI 首先做物體識別,把眼鏡視野里面的戰(zhàn)斗對象與背景區(qū)分開,然后用一套AI算法去評估該對象的戰(zhàn)斗力,最后把戰(zhàn)斗力標(biāo)注到眼鏡視野里的目標(biāo)周圍(什么?戰(zhàn)斗力只有5?),從而實現(xiàn) AR 。

    當(dāng)AI遇上AR:從微軟HoloLens Processing Unit (HPU)說起

    《龍珠》里的戰(zhàn)斗力探測眼鏡是AI+AR應(yīng)用的一個極好例子

    HoloLens 與 HPU

    如今,實現(xiàn)戰(zhàn)斗力探測的 AI + AR 技術(shù)已經(jīng)不再為賽亞人所獨有,地球人也擁有了這項技術(shù)!例如,微軟的 HoloLens 在已公布的 AI + AR 設(shè)備中可謂佼佼者,憑借微軟的金字招牌以及酷炫的演示動畫吸引了無數(shù)科技愛好者的眼球。

    目前,用于 AI/AR 的處理器架構(gòu)該如何設(shè)計仍然處于探索階段,Intel 想借機推自己基于 CPU 的方案,Nvidia 想利用 GPU 彎道超車,而 Qualcomm 也拼接 Snapdragon 平臺在一邊虎視眈眈。在今年的商用芯片峰會 HotChips 上,微軟公布了應(yīng)用在 HoloLens 中的處理器芯片(HoloLens ProCESsing Unit, HPU)。HPU 的架構(gòu)和 CPU 以及 GPU 都不相同,可謂是開創(chuàng)了 AI/AR 領(lǐng)域芯片的新范式.接下來將詳細(xì)分析 HPU 芯片架構(gòu)并展望未來 AI/AR 芯片設(shè)計中的范式轉(zhuǎn)換。

    當(dāng)AI遇上AR:從微軟HoloLens Processing Unit (HPU)說起

    HoloLens可以實現(xiàn)眾多AI/AR應(yīng)用

    微軟公布的 HoloLens 系統(tǒng)架構(gòu)如下圖所示。就在絕大多數(shù)移動設(shè)備的處理器都基于 ARM 結(jié)構(gòu)的今天,HoloLens 的主處理器使用的仍然是 Intel 的 Cherry Trail SoC(包括CPU與集成的GPU),讓人感嘆維持了二十余年的 Wintel 聯(lián)盟堅不可破。微軟最新公布的 HPU 也可以在圖上看到,HPU 嚴(yán)格來說是一款協(xié)處理器,其作用是協(xié)助主處理器加速運算一些專門的運算(如用于 CV 的矩陣運算,用于 CNN 的卷積運算等)。

    由于 CPU 必須要考慮通用性而無法對一些 AR/VR 運算進行優(yōu)化,因此在應(yīng)用場景中會大量遇到的專門運算如果都交給 CPU 做會使系統(tǒng)的整體性能變得很差,于是我們需要設(shè)計一款專用的加速器來協(xié)助加速這些運算,微軟在這里的加速器就是 HPU 。HPU 通過 PCIe 高速接口與主處理器所在的 SoC 通信,不過 PCIe 的功耗其實是比較大的,未來可望會用上更先進的互聯(lián)技術(shù)。

    微軟公布的 HPU 處理能力達(dá)到每秒 1T(10^12)次像素運算,功耗則小于 4W。HPU 能夠融合來自 5 個攝像頭、一個深度傳感器以及運動傳感器的輸入信息,將信息壓縮并傳送到主處理器。此外 HPU 還能實現(xiàn) AI 手勢識別。據(jù)說微軟曾評估了來自于各大廠商的商用芯片,卻沒有找到任何一款產(chǎn)品能滿足系統(tǒng)算法對性能的要求。這款微軟自己開發(fā)的 HPU 是采用臺積電 28nm 工藝,內(nèi)含 24 顆可重配置的 Tensilica 數(shù)字信號處理器(DSP)核心以及高達(dá) 8MB 的 Cache。除此以外,還有專用加速器用于給各類專門任務(wù)加速。

    當(dāng)AI遇上AR:從微軟HoloLens Processing Unit (HPU)說起

    HoloLens 系統(tǒng)架構(gòu),HPU 與顯示設(shè)備緊密耦合并且和主處理器 Intel Cherry Trail SoC 由高速 PCIe 接口互聯(lián)

    HPU 有何不同

    如果仔細(xì)觀察 HPU 架構(gòu),會發(fā)現(xiàn)它與目前借著 AI/AR 及人工智能風(fēng)口飛地很高的 GPU 有點像,但并不相同。說它們“有點像”是因為 HPU 和 GPU 都有不少計算核心,這樣可以實現(xiàn)數(shù)據(jù)的并行處理。HPU 和 GPU 要處理的都是畫面中的一個個像素,而像素之間其實并沒有關(guān)聯(lián)性,因此可以由并行處理來提高執(zhí)行效率。與之相對的是 CPU,為了照顧通用性 CPU 無法放置大量的計算核心來實現(xiàn)大規(guī)模并行運算,因此完全用 CPU 來處理 AI/AR 操作會導(dǎo)致速度很慢。另一方面,HPU 與 GPU 之間也有很大的不同。首先,HPU 上的計算核心是可配置 DSP 而非類似 Nvidia GPU 里面的 CUDA core。另外,HPU 的片上Cache(用于快速存取數(shù)據(jù))高達(dá) 8MB,遠(yuǎn)大于 GPU 的片上 Cache 容量(Tegra X1 上Cache 僅有 2 MB)。這是為什么呢?

    歸根到底,這些都是因為應(yīng)用的區(qū)別。GPU 就像一艘巨輪,設(shè)施豪華(運算精度高),耗油巨大(功耗巨大),在處理海量的數(shù)據(jù)時可以實現(xiàn)非常高的吞吐率,但是實時性并不好:你可以想象巨輪在行駛前需要做許多準(zhǔn)備工作,并不是指令一下說走就走(延遲較大)。當(dāng)然在需要處理的數(shù)據(jù)量足夠大時,這些準(zhǔn)備時間相對于計算時間來說可以忽略不計。HPU 就像一艘小船,輕便而省油(功耗較小),而且指令一下可以說走就走(延遲較小),雖然運算的吞吐量不能和 GPU 相比但是實時性很好。

    在 HoloLens 中,實時性非常重要:例如,在你的頭部移動時,你顯示的內(nèi)容也要相應(yīng)改變,如果在你頭部移動和現(xiàn)實內(nèi)容改變之間存在明顯延遲則使用者會感到暈眩(這也是為什么很多人在玩 3D 游戲時會頭暈的原因)。另外,由于 HoloLens 是移動設(shè)備,因此芯片的功耗需要嚴(yán)格控制,功耗巨大的 GPU 架構(gòu)并不適合。

    當(dāng)AI遇上AR:從微軟HoloLens Processing Unit (HPU)說起

    HPU 芯片結(jié)構(gòu),可見 DSP 計算核心以及大容量片上 Cache(SRAM)

    讓我們來看看 HPU 和 GPU 的幾點不同是如何對應(yīng)應(yīng)用場合的要求的。首先,HPU 選擇了可重配置的 DSP。使用可重配置的 DSP 可以根據(jù)應(yīng)用場合切換配置來實現(xiàn)性能-功耗的最優(yōu)折衷,可以說 HPU 使用可配置 DSP 是為了實現(xiàn)在給定功耗下的最佳性能。其次,HPU 使用很大的片上 Cache。使用片上 Cache 可以實現(xiàn)低延遲數(shù)據(jù)存取,從而滿足HoloLens 對于實時性的要求。HPU 與顯示設(shè)備緊密耦和也能幫助降低延遲。與之相反,通常 GPU 的片上 Cache 都較小,而絕大部分?jǐn)?shù)據(jù)都存在片外 DRAM 中并使用高速 GDDR 接口實現(xiàn)數(shù)據(jù)傳送。這樣做既增大了數(shù)據(jù)存取延時又消耗了很大的功耗,并不適合 HoloLens 這樣的應(yīng)用。

    最后,值得注意的是,HPU 還集成了許多專用加速器。這些專用加速器可以幫助 HPU 快速執(zhí)行一些算法(單靠 DSP 往往無法滿足這些算法的性能需求)。這使得 HPU 又有點像 Qualcomm 的 Snapdragon SoC,因為 Snapdragon 也是在芯片上會集成許多特定算法(如視頻編解碼,AES 加密)的加速器。這些加速器的功耗往往很低,但是使用這些加速器也是要付出代價的:專用加速器在不需要使用的時候會處于閑置狀態(tài)無法用做其他用途,這部分用于專用加速器的芯片面積在加速器閑置的時候相當(dāng)于是浪費了。因此,專用加速器就能量而言效率非常高(即完成運算需要的能量很小),但是就芯片面積而言效率很差(即增加了芯片成本)。因此集成哪些專用加速器需要經(jīng)過性能-功耗-成本三方面的仔細(xì)折衷。HPU 集成的這些專用加速器相信會在一些關(guān)鍵的應(yīng)用中起很大的加速作用,從而保證 HoloLens 能以很高的性能實現(xiàn)算法同時消耗很低的功耗。

    根據(jù)微軟的數(shù)據(jù),使用專用加速器配合 DSP 可以實現(xiàn) 200 倍以上的性能改善,效果可謂驚人。

    芯片 IP 隨著 AI/AR 概念變得更重要

    近來 AI/AR 技術(shù)發(fā)展非常快。為了實現(xiàn)新的算法以及滿足新的應(yīng)用需求,往往要速度更快功耗更低的硬件,這就需要相應(yīng)的芯片也能快速迭代以滿足算法和應(yīng)用的需求。另一方面,許多傳統(tǒng)只在軟件領(lǐng)域活動的巨頭(如 Google,F(xiàn)acebook)在這波風(fēng)潮里也在向著硬件領(lǐng)域蠢蠢欲動,為了使自己的 AI/AR 硬件性能達(dá)標(biāo),使用通用的 CPU/GPU 很困難,必須有定制芯片。以往的先三年技術(shù)積累再開始量產(chǎn)芯片的做法根本無法跟上現(xiàn)在的高速節(jié)奏,必須有能從頭開始在一年內(nèi)就交付的快速芯片設(shè)計方法。為了滿足這兩個需求,使用芯片 IP 幾乎是必須的。當(dāng)使用購買的芯片 IP 時,設(shè)計者只需把精力集中在整體架構(gòu)設(shè)計上,所有沒有時間或者資源做具體設(shè)計的芯片模塊都可以向第三方購買。相比從頭設(shè)計所有模塊,基于 IP 的芯片設(shè)計方法大大加快了設(shè)計速度,而整個芯片中第三方 IP 所占的比例也會越來越多。

    在之前的芯片巨頭靠出售芯片盈利,而芯片中每一個第三方 IP 都要付出權(quán)利金,因此高通這類公司不到萬不得已不會使用第三方 IP,而是會傾向于自己做模塊。舉例來說,高通芯片面積中使用第三方 IP(不包括ARM的架構(gòu)授權(quán))的比例通常小于 5%。然而,這些從軟件領(lǐng)域過來做硬件的巨頭制造芯片并不指望靠芯片盈利,而是要用在自家硬件里。對于它們來說,硬件是否能盈利甚至都不重要,它們需要的是營造自己的生態(tài)圈搶占市場。因此,對它們來說芯片最關(guān)鍵的是性能要強,而且上市速度要快,所以它們完全不介意買許多第三方 IP。

    前面討論的微軟 HPU 就是一個極好的例子。微軟的芯片設(shè)計團隊相對于 Intel 和高通等半導(dǎo)體業(yè)界巨頭來說非常小,但是借助于從 Cadence 購買的 Tensillica DSP IP,微軟仍然能夠在短時間內(nèi)快速完成高性能大型芯片的設(shè)計,而且第三方 IP 占的芯片面積高達(dá) 60% 以上。可以說,隨著 AI/AR 概念越來越普及,相應(yīng)的芯片 IP 也會越來越熱門。

    除了 Tensillica 之外,也有其他公司在提供 AI/AR 方面的芯片 IP。老牌 DSP 和通訊 IP 供應(yīng)商最近發(fā)布了針對 AI 和 CV 的 XM6 DSP 平臺。該 DSP 平臺為深度學(xué)習(xí)優(yōu)化,從而可以較高效地完成 AI/AR 運算。在各大高校和科研機構(gòu),AI IP 的開發(fā)也是一個熱點,例如 MIT 由 Yu-Hsin Chen 開發(fā)的 Eyeriss 深度學(xué)習(xí)加速器 IP 可以以很低的功耗完成高速卷積運算,自從在 2015 年的 ISSCC(國際固態(tài)半導(dǎo)體電路會議)上發(fā)表后收到了巨大的關(guān)注。我們預(yù)期在不久的將來,AI/AR IP 領(lǐng)域會越來越紅火。

    結(jié)語

    作為 AI/AR 處理器芯片的先鋒,HPU 的架構(gòu)與 GPU 相似(多核并行運算)但又有很大不同(使用定點 DSP 和大容量片上 Cache),另一方面它又從用于手機的多媒體 SoC(如 Snapdragon)借鑒了集成專用加速器的方法,可謂是博采眾長又不拘泥于一家之說。另外,為了追上算法和應(yīng)用的發(fā)展,AI/AR 芯片可能會大量使用第三方芯片 IP。我們預(yù)期在未來的 AI/AR 處理器芯片架構(gòu)中看到如下的設(shè)計范式轉(zhuǎn)移:GPU 追求高吞吐量-> AI/AR 芯片追求低延時;CPU/GPU 追求通用性-> AI/AR 處理器為特定應(yīng)用集成大量專用加速器;CPU/GPU 模塊多為自己設(shè)計-> AI/AR 處理器大量使用第三方 IP。

    (審核編輯: 林靜)

    聲明:除特別說明之外,新聞內(nèi)容及圖片均來自網(wǎng)絡(luò)及各大主流媒體。版權(quán)歸原作者所有。如認(rèn)為內(nèi)容侵權(quán),請聯(lián)系我們刪除。

    主站蜘蛛池模板: 砂金设备-淘金机械-金矿选矿设备厂家-青州冠诚重工机械有限公司 砂浆生产线_干混砂浆设备_干混砂浆生产线-苏州一工机械有限公司 | 饮料瓶-白酒瓶-绿色玻璃瓶-山东玻璃瓶厂家-枣庄市金泰玻璃有限公司 | 江西蔬菜配送,南昌蔬菜配送,南昌食堂承包,江西饭堂承包-江西菜篮子农产品发展有限公司 | 湖南净声源环保科技有限公司是一家专业从事噪声治理和建筑声学设计生态环境综合治理服务的企业,专业从事株洲电梯隔音治理,湘潭中央空调降噪处理,衡阳邵阳冷却塔噪音治理,岳阳常德大型风机噪声隔音降噪,张家界空压机噪声治理,益阳配电房变压器噪声治理,专业郴州永州工厂企业车间噪声治理,怀化娄底专业机械设备减振降治理,武汉噪音治理隔音降噪公司,孝感噪音治理,立式球磨机的噪声控制,专业隔音降噪公司,、以及各类机械动力设备减振降噪噪声治理的公司,同时为客户提供咨询与解决方案 | 河北太尚园林-太尚雕塑厂家_石雕_不锈钢雕塑厂家_铸铜雕塑_雕塑设计定制 | 深圳市泰美乐纸制品有限公司-纸杯厂,一次性纸杯,广告纸杯,奶茶纸杯,试饮纸杯定做 | 和远智能-和远智能科技股份有限公司 | 深圳注册公司-工商注册代理-深圳注册公司流程及费用-记帐报税-公司注销-[深圳市悟空企业管理(深圳)有限公司] | 山东正奇塑料机械有限公司,山东塑料机械,水带机组,塑料管材机,山东吹膜机组厂家,山东农膜机厂家 山东长青石油液压机械有限公司-致力于石油机械设备的研发制造,提供定制服务 | 内蒙古燕雕机械设备有限公司 | 易众拍卖行-事故车拍卖,残值车拍卖,水淹车拍卖,全损车拍卖,修复车拍卖,碰橦车拍卖,瑕疵车拍卖,报废车拍卖,泡水车拍卖,拆车件拍卖,配件拍卖,火烧车拍卖,二手车拍卖专业线上平台 | 水溶肥料-大量元素水溶肥-含氨基酸水溶肥料-高塔复合肥-水溶肥生产厂家-河南中黄特肥科技有限责任公司 | 金坛区成辉仪器厂-精密増力电动搅拌器,石英亚沸蒸馏水器- | 仪器校准,校验,校正,检定选值得托付的第三方法定计量检测机构! 铱金供应-上海钌合金-氯铱酸厂家-上海庞势新材料科技有限公司 | 上饶建盛建设,建盛建设,上饶市建盛建设工程质量检测有限公司-房屋鉴定 | 什木坊全屋定制官网_木门|护墙|衣柜|橱柜等全品类定制家具 | 送料机-冲床送料机-伺服送料机 - 常州市佳王精密机械有限公司 | 龙淼环保-旋流-喷淋塔,高温布袋,脉冲布袋-单机-滤筒除尘器,活性炭吸附箱,催化燃烧设备,除尘器配件-沧州龙淼环保设备制造有限公司 | 全自动烫金机-全自动移印机-全自动丝印机-全自动平面机-东莞联昌实业供应各种丝印机和移印机 | 深圳诚暄软板首页-fpc软板,fpc软性线路板打样生产厂家 | 威学一百-专注国际学校择校备考-DSE-A-level-雅思-托福-OSSD-港澳台联考-AP-IGCSE-IB-AMC-多邻国-PTE-SAT-SSAT-小语种(如日语,韩语,德语,法语,西班牙语,意大利语,俄语,泰语)等考试培训,为出国留学学生提供个性化定制性学习方案,线下实体面授+线上网络课程, 提供一对一,小班课等多种班型 | 辉煌食品,辉煌罐头-山东辉煌食品有限公司| 全自动码垛机械手,码垛机器人,拆包机,缠绕机,开箱封箱装箱机厂家-山东昊宇自动化设备有限公司 | 浙江德威不锈钢管业股份有限公司| 全自动码垛机械手,码垛机器人,拆包机,缠绕机,开箱封箱装箱机厂家-山东昊宇自动化设备有限公司 | 庭院大门,铝艺大门厂家,别墅庭院大门「免费设计」汉兰达庭院门厂家 | 喷涂流水线,喷漆流水线-山东天意设备科技 | 中江网-中国江苏网·新江苏, 全国重点新闻网站 | 精品中文字幕在线观看,粉嫩av一区二区三区,最近中文字幕在线看免费视频,亚洲高清在线观看,日本一区二区视频手机免费看,国产黄色小视频,亚洲高清免费视频,国产精品一区二区欧美视频,亚洲人免费视频,亚洲视频在线观看免费,国产免费高清综合视频,中文字幕永久在线 | 人仁康集团 -- 10A抗菌舱研发生产厂家| 乌鲁木齐万疆通管道设备有限公司 销售热线;13565955557-新疆 乌鲁木齐 万疆通 管道设备 波纹补偿器 膨胀节 金属软管 伸缩器 管件 阀门 维修 | 王者荣耀/和平精英扫码上号登录器_微信安卓苹果扫码上号登录软件 - 上号宝扫码登录器 | 排水PVC管-PVC排污管-给水PVC管-电线PVC管-米阳建材pvc管厂 | 首页 - 北京明朝万达科技股份有限公司 | 提供技术支持-TXC晶振-晶振厂家-32.768K,石英晶体振荡器厂家销售-NDK振荡器正规代理商 | 辽宁闻天香食品有限公司| 苏州交通设施_道路划线_停车场划线_厂区划线_环氧地坪厂家-推荐【飞扬市政交通设施公司】专注交通设施8年! | 陶瓷透水砖-透水砖厂家-淄博天之润生态科技有限公司 | 宿迁市华泰交通设施有限公司,上海第四代路名牌,天津仿罗马柱路名牌,标准路名牌,路名牌灯箱,公交站台,户外广告灯箱, 交通标志牌,社区阅报栏 | 南宁清洁公司|外墙清洗|开荒清洁|洒水车|管道疏通|园林绿化_广西优而美环境工程有限公司 | 停车场收费管理系统,通道闸系统,门禁系统,东莞停车场收费管理系统,东莞通道闸系统,-东莞市骄阳交通设备有限公司 |