智汇工业-智慧工业、智能制造及工业智能、工业互联门户网站,专业的工业“互联网+”传媒

如何用200美元打造一款聽話的能人臉識別的無人機?

來源:網絡

點擊:1351

A+ A-

所屬頻道:新聞中心

關鍵詞: 無人機,人臉識別

         本文作者是Lukas Biewald—CrowdFlower的創始人,Lukas曾被《Inc.》雜志評選為30歲以下杰出企業家。CrowdFlower成立于2009年,是一個按需勞動力的大數據平臺,幫助企業收集培訓數據并進行人機交互機器學習。

        Lukas Biewald畢業于斯坦福大學,獲得數學學士學位和計算機科學碩士學位。Lukas曾任職Yahoo日本搜索團隊主管,之后作為高級數據科學家就職于Powerset,該公司于2008年被微軟收購。    

        深度學習和廉價硬件的探索

    1501136560818059358.png

    早期航空器,1818(來源:維基百科&美國國會數據庫)

        在制造了一個圖像識別機器人后,顯然下一步是制作一個可飛行的版本。于是我決定打造一款能夠進行面部識別并響應語音命令的自動化無人機。

        選擇一款預制無人機

        對無人機進行編程,最難的部分是如何開始,我是從組裝無人機零件開始的。但是幾乎和之前所有DIY項目一樣,自己組裝無人機花了我很多的錢。而且坦白的說,我手工打造的無人機一直沒有穩定飛行過。可以肯定的是,直接購買預制版本才是更加簡單經濟的選擇。

        大多數無人機制造商都聲稱提供API接口,但對于業余愛好者來說并沒有什么明顯的優勢。市面上帶似乎可用的API接口的無人機,大多售價都超過1000美元,這是一個很高的進入門檻。

        經過一些調查以后,我發現了Parrot AR Drone 2.0(見下圖)。我認為對于業余愛好者來說,這是一款理想的機器。它的價格不高,還可以進行編程。你可以選擇花200美元買一臺新機器,但由于很多人買了無人機又從來不使用它們,因此購買一臺二手機器也是個不錯的選擇。在eBay上二手無人機的售價大約是130美元甚至更低。

    1501136568447032442.png

    △我收藏的各類無人機,Parrot AR Drone無人機掛在最左邊

        Parrot AR無人機飛行的穩定性沒有更貴的新款 Parrot Bebop 2.0 好(售價大約550美元),但是Parrot AR提供一個好用的node.js客戶端庫叫做node-ar-drone,很適合在上面進行開發。

        另外一個優勢:Parrot AR無人機很結實。在測試自動化程序的過程中,無論它被撞墻上、家具上、室內植物上和客人身上,他仍然能夠良好的飛行。

        相比給地面機器人編程,給無人機編程最糟的地方是電池續航時間短。一塊電池需要充電幾個小時,才能飛行大約10分鐘的時間。因此我建議多買兩塊備用電池,測試的時候可以循環使用。

        給我的無人機編程

        由于Javascript天生的驅動能力,因此是非常理想的無人機編程語言。相信我,無人機飛行中會遇到很多異步事件。我雖然沒有在Node上花費很多時間,但這個語言讓我印象深刻。我最近一次認真的為機器人編程使用的是C語言。用C語言處理線程和各種異常是十分痛苦的,因此最好少用。我希望有人為其它無人機平臺建立Javascript開發包,因為這個語言讓我們處理不確定性的開發事件,變得簡單有趣。

        架構

        我決定在筆記本電腦上運行邏輯,在云端進行機器學習。比起直接在樹莓派硬件上運行神經網絡,這種架構的延遲更低。我認為這種架構對目前的業余無人機開發項目來說是可行的。

        微軟、谷歌、IBM和亞馬遜都有快速、廉價的云端機器學習API。最終,我選擇了微軟認知服務API(Cognitive Service API)。因為這是唯一一個提供定制面部識別功能的API。

    1501136582596090502.png

    △無人機的架構

      

      入門

        默認情況下,Parrot AR Drone2.0帶有可供客戶端連接的無線網絡。這個功能對編程者來說非常麻煩。每次你希望嘗試什么的時候,需要先斷開你的網絡然后連上無人機的網絡。幸運的是,有一個名叫ardrone-wpa2的項目非常有用。它可以通過腳本讓無人機加入你自己的WiFi網絡。

        遠程登錄到無人機是件十分有趣的事。Parrot運行在一個剝離版本的Linux上。你最近一次使用遠程登錄功能是什么時候?連接了什么東西?以下是打開終端并直接登錄無人機的示例。

    1501136186231089174.png

        用命令行模式飛行

        安裝node庫以后,創建一個node.js REPL(Read-Evaluate-Print-Loop)并用它引導無人機:

    1501136627727077758.png

        如果你一直跟著做到這步,那么現在你的無人機肯定已經摔過至少幾次了。我上千次重新粘貼了安全殼,直到它徹底損壞,不得不買一個新的。我猶豫要不要提這個,實際上Parrot AR在不安裝安全殼的情況下飛得更好。但無人機在沒有安全殼的情況下更加危險,因為當無人機撞上什么東西時,螺旋槳可能會折斷,而且會在家具上留下痕跡。

        通過網頁控制飛行

        為無人機構建基于web的操作界面并不困難,而且結果令人滿意(見下圖)。使用Express.js框架可以輕松的構建一個漂亮的web服務器。

    1501136640113045904.png

        我設置了一個按鈕來實現AJAX請求。

    1501136651486097274.png

        從無人機上獲得視頻流

        我發現使用無人機攝像頭發送反饋的最佳方法是打開一個連接,并將我的網絡服務器中的PNG連續發送到我的網站。我的網絡服務器使用AR無人機庫從無人機攝像頭中連續拉取PNG圖片。

    1501136667320041652.png

        在無人機圖像上運行人臉識別

        Azure的面部API功能強大且易用。它可以識別你上傳的朋友照片,也可以猜測年齡和性別,我發現這兩個功能的準確率高得令人驚訝。延遲時間約為200毫秒,費用是1.5美元/1,000次。對我開發的這個程序來說,這是完全合理的。下面是關于如何發送一個圖像并進行面部識別的代碼。

    1501136290486029228.png

        我使用ImageMagick庫來注釋PNG圖片中的面孔。在這點上有很多可以擴展的方向,如使用情感API確定面部的情緒等。

        

    運行語音識別控制無人機

        語音識別部分最棘手的不是語音識別本身,而是以微軟的Speech API要求的格式將音頻流從網頁傳輸到本地服務器,最終代碼的大部分是為了實現這個功能。一旦你能夠通過單通道采集到正確頻率的音頻,這個API就可以很好的工作,而且非常容易使用。它的價格是4美元/1000次請求,這對于業務愛好者的應用來說,基本上算是免費的。

        RecordRTC有一個很好的庫,這是客戶端網絡音頻錄制的好起點。在客戶端上,我們可以添加代碼來保存音頻文件:

    1501136361715014839.png

        我使用FFmpeg程序減少音頻采樣點,并將其合并為一個通道,上傳到微軟:

    1501136682936084015.png

        自主搜索路徑

        我用ardrone-autonomy庫為我的無人機繪制自動尋徑地圖。在無人機無數次墜落在客廳的家具和植物上后,我妻子好心的建議我把我的項目搬到車庫里去。那里沒有太多可破壞的東西了,但也沒有太多的空間(見下圖)。

    1501136596543045888.png

    △在我的“實驗室”里試飛無人機

        如果我能獲得更大的實驗空間,我會繼續研究智能搜索算法。但現在我只需要讓我的無人機能夠起飛、旋轉,去尋找我的朋友和敵人:

    1501136716756052924.png

        小結

        一旦建立好一切,你可以通過API控制無人機視頻源,無人機編程就變得非常有趣。伴隨著新的圖像識別技術,給我們提供了各種應用的可能,無論從觀察地面植物到在墻壁上作畫。Parrot無人機不是為在室內小空間飛行設計的,一個價格更高的無人機能讓整個應用變成現實。最終,無人機會變得更加穩定,現實世界中將出現大量類似的應用。

        微軟的認知服務云API易于使用而且價格便宜。首先,我擔心無人機的異常廣角攝像頭會影響面部識別,而無人機螺旋槳的噪音會干擾語音識別。但總體來說,表現要好于預期。延遲問題也不像我所擔心的那樣。使用云計算處理實時圖像流看起來似乎是個奇怪的架構,但它可能是許多應用的未來之路。


    (審核編輯: 林靜)

    聲明:除特別說明之外,新聞內容及圖片均來自網絡及各大主流媒體。版權歸原作者所有。如認為內容侵權,請聯系我們刪除。

    主站蜘蛛池模板: 山东正奇塑料机械有限公司,山东塑料机械,水带机组,塑料管材机,山东吹膜机组厂家,山东农膜机厂家 山东长青石油液压机械有限公司-致力于石油机械设备的研发制造,提供定制服务 | 九江江菱电梯有限公司| 炸鸡汉堡设备厂家-开汉堡炸鸡店需要的设备全套-广州英迪尔电器有限公司 | 易交换在线易货电商平台-互联网易物贸易,以物换物-无锡据风网络科技有限公司 | 浙江欧诺机械有限公司| 宣城市交投汽运有限公司_宣城汽车运输有限公司_宣城汽运 | 性激素6项实验检测,放射免疫实验检测,明胶酶谱试剂盒,科研用人血清,质控标品,试剂盒-南京信帆生物技术有限公司 | 树枝粉碎机,锯末机,木材粉碎机的专业生产厂家利鑫机械,问价格找利鑫 | 武汉印刷厂_为企业提供宣传单页彩页印刷_武汉折页印刷_海报设计印刷与制作 - 武汉泽雅印刷公司 | 湖南九农王机电设备有限公司官网 | 腻子粉厂家_耐水腻子粉_内墙腻子粉批发_生态腻子粉_长沙美恩生态腻子粉厂家 | 样品前处理仪器_光谱仪器_色谱/分析仪器_测量/计量仪器_青岛聚创世纪环保科技有限公司 | 耐磨工业软管,PTFE耐腐蚀软管,耐磨喷砂胶管,超耐磨软管厂家,漯河利通液压管利通科技-耐磨工业软管,PTFE耐腐蚀软管,耐磨喷砂胶管,超耐磨软管厂家,漯河利通液压管利通科技 | 削片机|木材破碎机|木材粉碎机|模板破碎机|双轴撕碎机_郑州木工机械制造厂 | 天津止回阀-止回阀报价/哪家好-天津蝶阀/进口阀门/通风蝶阀批发-闸阀阀门/球阀生产厂家-天津凯维斯阀门制造 | 小程序开发,网站建设,APP开发,商城系统开发,社区团购系统开发,区块链溯源,互联网资质办理-软多信息技术有限公司_河南软多信息技术有限公司 | 提供专业.全面.优质的壁炉服务-莫洛尼官方网站moloney | 买化工,找万创!泉州万创化工贸易有限公司| 阴_阳离子聚丙烯酰胺价格_聚合氯化铝厂家_聚合硫酸铁-巩义市亿洋水处理材料有限公司 | 希希助培是专业的教育信息化全场景服务商,为教育培训机构提供教务管理、招生营销、财务管理、家校互动等 | 假肢价格-大腿假肢小腿假肢假手指-河南舒捷假肢厂家 | 久久黄色一级视频_视频一区精品自拍_理论片免费ā片在线观看_亚洲色视频在线播放网站_香港经典a毛片免费观看_亚州三级久久电影 | 昆明纸箱厂-礼盒定制-包装盒定做-纸箱厂-云南包掌柜包装有限公司 | 上海垃圾房,简易成品环保垃圾房,小区室外垃圾房,上海翼亭智能垃圾房厂家 | 托辊|滚筒|聚氨酯托辊|缓冲托辊|尼龙托琨|衡水良龙输送机械有限公司 | 青浦区摄像头安装/青浦区无线网络覆盖/青浦区网络调试公司/青浦区IT外包公司/金山区网络维护公司/金山区防火墙调试公司 | 系统门窗加盟_门窗十大品牌_欧享门窗官网 | 空气消毒机厂家-医用空气消毒机-医用空气净化器-山东佳境医疗 | 液晶模组铁框_液晶显示压框-南皮县卓腾金属制品有限公司 | 美缝剂_美缝剂加盟_瓷砖美缝剂_美缝剂厂家_填缝剂_领翔美缝剂-【官网】 | 深圳U盘工厂 U盘厂家 U盘生产厂家 礼品U盘定制 深圳正益通电子公司 | 钠长石-硅铁-硅钙-孕育剂-球化剂-安阳李氏实业有限公司 | 上海新航道学校官网_20年专注雅思_托福_SAT_ACT等出国语言培训机构. | 九江市云山油茶科技发展有限公司| 模温机_厂家_现货供应-卡塞尔机械(浙江)有限公司 | 重庆中医针灸推拿培训_产后康复理疗师培训_重庆市六合职业培训学校 | 陕西教师资格网-陕西教师资格考试网| 网上配音_免费配音_广告专题配音_网络录音网站【海豚配音】 | 全地形消防摩托车_背负式细水雾_全氟己酮灭火装置「斯库尔消防」 | 温州方圆仪器有限公司 工业自动化|自动化设备 - 温州方圆仪器有限公司 | 亚澳农机-亚澳南阳农机股份公司,旋耕机,旋播机,旋播施肥机,免耕播种机,旋耕播草多用机,果园机械-首页 |