智汇工业-智慧工业、智能制造及工业智能、工业互联门户网站,专业的工业“互联网+”传媒

當(dāng)AI深度學(xué)習(xí)模型走進(jìn)死胡同時(shí)該咋辦?

來源:網(wǎng)絡(luò)

點(diǎn)擊:1274

A+ A-

所屬頻道:新聞中心

關(guān)鍵詞: AI,人工智能

    深度學(xué)習(xí)是一項(xiàng)龐大又復(fù)雜的工程,在建立深度學(xué)習(xí)模型時(shí),走進(jìn)死胡同被迫從頭再來似乎是常事。

    近日,Semantics3網(wǎng)站的聯(lián)合創(chuàng)始人Govind Chandrasekhar在官方博客上發(fā)表了一篇文章,講述了程序員在解決深度學(xué)習(xí)問題時(shí)的應(yīng)該自問的五個(gè)問題。

    當(dāng)AI深度學(xué)習(xí)模型走進(jìn)死胡同時(shí)該咋辦?

    Semantics3是一家2012年成立的數(shù)據(jù)科學(xué)初創(chuàng)公司,它創(chuàng)建了一個(gè)數(shù)據(jù)庫,跟蹤產(chǎn)品在網(wǎng)上的銷售過程,為零售商提供數(shù)據(jù)。對(duì)于Govind Chandrasekhar寫的這篇文章,量子位全文翻譯如下:

    研究數(shù)據(jù)科學(xué)是一件悲喜交加的事情。喜在當(dāng)你偶然的發(fā)現(xiàn)提高了算法的性能,可能讓你擁有持久的興奮感;悲在你會(huì)經(jīng)常發(fā)現(xiàn)自己站在一條單行道的盡頭,苦苦探索到底哪里出了問題。

    在這篇文章里,我將詳述走過無數(shù)條深度學(xué)習(xí)死路后,得到的五個(gè)教訓(xùn)。在處理新問題或新方法前,我都會(huì)用想想下面這五個(gè)問題。

    問題一:

    先不管神經(jīng)網(wǎng)絡(luò),一個(gè)沒有先驗(yàn)知識(shí)、只受過你的數(shù)據(jù)集訓(xùn)練的人能解決這個(gè)問題嗎?

    這個(gè)問題對(duì)解決監(jiān)督學(xué)習(xí)的困境尤為受用——這些問題的典型前提是,一個(gè)小的高質(zhì)量數(shù)據(jù)集(比如N個(gè)實(shí)體)可以幫助你的模型近似得到一個(gè)潛在的功能,之后泛化到包含1000N個(gè)實(shí)體的整個(gè)數(shù)據(jù)集。

    這些方法的好處在于,人類只需要研究很小部分?jǐn)?shù)據(jù)就可以了,機(jī)器會(huì)學(xué)會(huì)把它運(yùn)用到大范圍的示例中。

    但是在現(xiàn)實(shí)世界中,問題不總是含有可以被優(yōu)先識(shí)別的模式。人們利用外部常識(shí)來解決的認(rèn)知挑戰(zhàn)比我們意識(shí)到的還要多,這經(jīng)常導(dǎo)致我們錯(cuò)誤地期望我們的算法在沒有常識(shí)的情況下能夠解決同樣的挑戰(zhàn)。

    舉個(gè)例子吧,看下面這三種描述:

    Pets First Arkansas Dog Jersey, X-Small, Pink

    Pets First Arizona Dog Jersey, X-Small, Pink

    Pets First AR Dog Jersey, X-Small, Pink

    這三組描述中,有兩個(gè)表示的含義相同,你能找出那個(gè)含義不同的嗎?

    大多數(shù)美國人都不難解決這個(gè)問題,因?yàn)锳R=Arkansas,AR!=Arizona是個(gè)常識(shí)。但是,一個(gè)對(duì)美國并不熟悉的人,可能就不知道答案是什么了。

    你會(huì)發(fā)現(xiàn),你創(chuàng)建的神經(jīng)網(wǎng)絡(luò)也沒有能力解決這個(gè)問題,因?yàn)樵谡Z言應(yīng)用這方面,沒有特定的縮寫規(guī)則可以供神經(jīng)網(wǎng)絡(luò)去模仿。當(dāng)然指定了Arkansas等同于AR的情況除外。

    類似這樣的問題還有很多(可能在一開始你并不理解這些問題),并且它們?cè)趯?shí)際工作中還經(jīng)常出現(xiàn)。回頭審視之前建造的神經(jīng)網(wǎng)絡(luò),并且明確需要補(bǔ)充的新知識(shí)是非常困難的。所以,在構(gòu)建神經(jīng)網(wǎng)絡(luò)時(shí),要及時(shí)跳出自己的思維定式。

    問題二:

    你構(gòu)建的神經(jīng)網(wǎng)絡(luò)能通過正確的視角理解你的數(shù)據(jù)嗎?

    假設(shè)地區(qū)的縮寫始終是名字的前兩個(gè)字母,同時(shí)這個(gè)縮寫不會(huì)重復(fù)。那么,我們?cè)賮碛貌煌氖纠乜磩倓偟钠ヅ鋯栴}:

    “Pets First Arkansas Dog Jersey, X-Small”

    “Pets First Arkansas Dog Jersey, Extra-Small”

    “Pets First AR Dog Jersey, X-Small”

    “Pets First Arkansas Dog Jersey, Large”

    “Pets First MA Dog Jersey, Large”

    你的目標(biāo)是建立一個(gè)神經(jīng)網(wǎng)絡(luò)用于識(shí)別1、2、3等價(jià)而4、5不同。這個(gè)任務(wù)是在考驗(yàn)神經(jīng)網(wǎng)絡(luò)對(duì)“大小”這個(gè)概念理解——它們是否知道X-Small=Extra-Small ?也是在考驗(yàn)它對(duì)縮寫的理解能力,比如Arkansas=ARkansas=AR因?yàn)榍皟蓚€(gè)字母相同,而Arkansas不等于MA,等等。

    你可能會(huì)通過Word2Vec來構(gòu)建一個(gè)嵌入空間,將 X-Small映射為Extra-Small來解決這個(gè)問題。

    盡管這種方法是一個(gè)標(biāo)準(zhǔn)解法,但可能你會(huì)妨礙神經(jīng)網(wǎng)絡(luò)找到你想讓它學(xué)習(xí)的內(nèi)容。如果把AR換成小寫的ar,對(duì)人類來說就比較難識(shí)別了,我們會(huì)糾結(jié)ar到底指的的Arizona還是are。

    同樣,如果你選擇建立詞匯的嵌入空間,有效地將每一個(gè)單詞映射到唯一的標(biāo)記,那么你就掐斷了神經(jīng)網(wǎng)絡(luò)理解組成字符“ARkansans”的機(jī)會(huì)。

    這種模糊網(wǎng)絡(luò)問題在你構(gòu)建網(wǎng)絡(luò)時(shí)經(jīng)常出現(xiàn),尤其是在建立考慮不同類型的輸入信號(hào)的模型時(shí)。

    問題三:

    你的網(wǎng)絡(luò)是在鉆你訓(xùn)練集里的牛角尖,還是幫你解決手頭的問題?

    假設(shè)你正在構(gòu)建一個(gè)二分的圖像分類器,來檢查文檔中的文本是計(jì)算機(jī)打印的還是手寫的。為了構(gòu)建計(jì)算機(jī)打印文本的訓(xùn)練數(shù)據(jù)集,你用電腦上的軟件直接生成了帶文字的jpeg圖片;為了獲取手寫文本的樣本,你把這些jpeg圖片發(fā)送到做數(shù)據(jù)標(biāo)注的公司,讓他們把這些圖片轉(zhuǎn)錄成文字,并將掃描成jpeg文件。

    之后,就可以運(yùn)行你的分類器了。不要高興得太早,雖然目前它的訓(xùn)練準(zhǔn)確率已經(jīng)超過了99%,但當(dāng)我們用實(shí)際場(chǎng)景來測(cè)試時(shí),分類器表現(xiàn)并不好。這是為什么呢?

    你構(gòu)建的神經(jīng)網(wǎng)絡(luò)可能帶有簡(jiǎn)單的指示性偏差,掃描手寫的圖片可能帶有灰白的背景色,而軟件生成的JPEG是純白色的背景。你的神經(jīng)網(wǎng)絡(luò)為了解決你交給它的問題,可能并沒有去分析內(nèi)容、上下文、形狀和顏色等要素,而是只抓住了背景色的這一點(diǎn)微小差別。

    需要記住的是,你的神經(jīng)網(wǎng)絡(luò)永遠(yuǎn)都不會(huì)明白你的大方向,它所做的就是基于手頭的目標(biāo)和數(shù)據(jù),以最簡(jiǎn)單的方式盡快給出一個(gè)答案。

    徹底審查你的數(shù)據(jù)集,消除可供神經(jīng)網(wǎng)絡(luò)鉆牛角尖的特征,可以節(jié)約成本和時(shí)間。

    問題四:

    你的網(wǎng)絡(luò)有兄弟問題可以為它提供支持嗎?

    在特定領(lǐng)域的問題上,諸如GloVe和Inception之類的預(yù)先訓(xùn)練模型可能并不好用。這將迫使你開始隨機(jī)初始化神經(jīng)網(wǎng)絡(luò),也就意味著可能經(jīng)過好幾天的訓(xùn)練,你還不知道自己的模型效果如何。

    你的模型可能還面臨著一個(gè)問題:數(shù)據(jù)集太小了或者質(zhì)量太差了,即使通過旋轉(zhuǎn)、變形等手段擴(kuò)充之后,也還是達(dá)不到訓(xùn)練的要求。

    在這種情況下,尋找它的兄弟問題可能是個(gè)解決辦法。但要注意,這些問題需要符合兩個(gè)標(biāo)準(zhǔn):

    它們不能和你手頭的數(shù)據(jù)集有同質(zhì)量和數(shù)量的問題。

    它們的神經(jīng)網(wǎng)絡(luò)需要有一組層,能捕捉到你的模型所需的概念。

    問題五:

    你的網(wǎng)絡(luò)是做不到還是懶?如果它懶,如何逼迫它學(xué)習(xí)?

    假如你是一個(gè)繪畫外行,讓你猜測(cè)三幅昂貴的繪畫作品價(jià)格。有三個(gè)可用信息可供你查看——作品的年限、作品十年前的價(jià)格和這幅畫的高分辨率圖像。

    在沒有經(jīng)過前期訓(xùn)練的情況下,讓你完成這個(gè)任務(wù),給出盡可能正確的答案,你會(huì)怎么辦?

    你是會(huì)報(bào)名參加一個(gè)為期兩月的繪畫課程,來學(xué)習(xí)復(fù)雜的繪畫技藝,還是會(huì)考慮用作品的年限和十年前的價(jià)格做一個(gè)方程來猜測(cè)價(jià)格?

    即使你能意識(shí)到理想的價(jià)格方程式包含這三種信息的組合,但你還是很愿意接受一個(gè)懶惰的選項(xiàng):、用兩種信息來進(jìn)行預(yù)測(cè)。雖然這個(gè)選項(xiàng)不是最優(yōu)解,但也是在能接受范圍的。你會(huì)更傾向只依賴容易理解和表達(dá)的信息。

    在用機(jī)器學(xué)習(xí)解決真實(shí)問題時(shí),如果你的模型有多個(gè)輸入信息,它們的復(fù)雜度差異很大時(shí),也會(huì)遇到這個(gè)問題。對(duì)這樣的模型進(jìn)行訓(xùn)練,幾個(gè)周期之后,你可能會(huì)發(fā)現(xiàn)你的模型好像已經(jīng)接近完成,并且拒絕進(jìn)一步學(xué)習(xí)。

    在這種情況下,最好的解決方法是去掉一個(gè)輸入項(xiàng),看整體指標(biāo)的變化。如果一個(gè)輸入項(xiàng)和結(jié)果相關(guān),去掉了之后卻對(duì)結(jié)果毫無影響,你就應(yīng)該考慮單獨(dú)用這個(gè)輸入項(xiàng)來訓(xùn)練模型,當(dāng)模型學(xué)會(huì)了依據(jù)這個(gè)輸入項(xiàng)做判斷之后,再逐漸將其余的信息也加入進(jìn)來。

    (審核編輯: 林靜)

    聲明:除特別說明之外,新聞內(nèi)容及圖片均來自網(wǎng)絡(luò)及各大主流媒體。版權(quán)歸原作者所有。如認(rèn)為內(nèi)容侵權(quán),請(qǐng)聯(lián)系我們刪除。

    主站蜘蛛池模板: 上海塑料链条生产厂家-塑料网带批发-柔性齿形链价格-上海瀚幽传动机械有限公司 | 上海祝融起重机械有限公司-德国耶鲁手拉葫芦|耶鲁手拉葫芦|耶鲁手扳葫芦|耶鲁电动葫芦经销代理 | 住友套管总代理-日本住友套管-住友热缩管-上海弘奇电子科技有限公司 | 新东方大学考试官网_考研/英语/雅思/托福/四六级/日语/韩语/教资在线网课官网 | 无锡亮鑫不锈钢有限公司-不锈钢炉胆,马弗炉胆,耐高温炉胆,310s炉胆,网带炉 | 指纹锁_智能锁_指纹密码锁_智能锁十大品牌_智能门锁厂家-深圳市豪力士智能科技有限公司 | 中科迈金节能技术(浙江)有限公司 | 陕西柱塞泵厂家_智能张拉设备_桥梁施工设备_千斤顶_液压分裂棒_液压分裂枪|陕西中拓矿山设备有限公司 | 山东发电机组生产厂家,特种火花塞生产厂家,高压线生产厂家,空气滤芯生产厂家,济南市博盛动力机械有限公司 | 浙江桥梁检测车出租_杭州桥检车出租_桥梁检测车出租_桥检车租赁_桥梁检测车租赁-广州众诚设备租赁有限公司 | 品牌T恤零售/批发厂商/供应商_男女式T恤生产/设计-圣达信T恤 | 取样冷却器-射水抽气器-锅炉炉水取样冷却器-连灵动 | 青岛熔喷过滤芯_青岛过滤器生产厂家_青岛净水滤料厂家_青岛净达过滤技术有限公司 | 套丝机_钢管套丝机_螺栓套丝机S8139_螺纹钢套丝机_智能套丝机价格-瑞捷机械设备有限公司 | 无源电子锁_五防锁_机柜锁_物联网锁_智能锁控管理-Vanma | 生物质蒸发器_燃气蒸发器_燃气锅炉价格|厂家直销-山东泰锅锅炉设备有限公司 | 辣椒烘干机-百信机械提供大中小型辣椒烘干机房设备视频图片厂家价格多少钱 | 移动CRM软件_SaaS CRM_crm管理软件系统_crm客户关系管理系统_销售管理软件-上海企能软件科技有限公司 | 升降作业平台_自行-车载-液压升降机_登车桥-强峰升降台 | 新闻营销媒体发稿-新闻发布-文芳阁网络媒体发稿公司 | 扬州华工电气有限公司|环氧树脂管|金刚石绝缘板|U型绝缘槽|电解槽绝缘材料 | 苏州氮气弹簧厂家_江浙沪氮气弹簧价格_江苏氮气弹簧规格_BelleFlex碟形弹簧_昆山三虑五金机械有限公司 | 螺旋叶片_叶片成型机_叶片冷轧机-深州市广兴五金机械制造有限公司 | 在线计算网 - 超多超好用的在线小工具 | 机器人码垛机-纸箱套袋机-水平缠绕机-贴标机-开箱机-装盒机-杭州贝立智能设备有限公司 | 明康食品有限公司 -方集馓子 亨特小麻花 | 饲料车_散装饲料车_畜禽运输车_散装饲料运输车_饲料车厂家_铝合金运猪车-程力专用汽车股份有限公司 | 湖北大洋塑胶有限公司|AGR|PPR|RTP|HDPE|e-PSP钢塑复合压力管道生产厂家 | 纸袋机|多层纸袋机|高速纸袋机|无锡市天天友情机械有限公司 | 紫外线光疗仪|白癜风光疗仪|牛皮癣治疗仪|308纳米led|SIGMA|上海希格玛高技术有限公司 | 恒温干燥箱厂家-烘箱厂家-马弗炉厂家-生化培养箱-上海有丰科学仪器有限公司 | 深圳家具网-家具展会-家具检测-家具品牌—深圳市家具行业协会官网 | 重庆成考网_重庆成人高考网| 智能化会议系统|多媒体会议系统|无纸化会议系统|会议音箱|高清视频会议终端|智能化会议室|会议系统|视频会议系统-深圳市航视达科技有限公司 | 永康微网站建设、永康手机网站建设、永康营销型网站建设、永康外贸网站建设、永康网站托管、永康网络公司—英汇网络 - 永康市英汇网络技术有限公司 | 深圳市佳顺优印印刷有限公司,佳顺优印,画册印刷,海报印刷,封套印刷,手提袋印刷,包装盒印刷,彩盒印刷,无碳纸印刷,不干胶印刷,信封印刷,便笺印刷,笔记本印刷,台历印刷,挂历印刷,国际会展中心附近印刷厂,宝安印刷厂,宝安教材印刷厂 | 直流电机调速器,直流电机控制器,直流电机调速电源-淄博诚铖创惠电子有限公司 | 环链电动葫芦-群吊电动葫芦-链条电动葫芦-环链葫芦-河北大力起重官方网站 | 行星式球磨机-实验室球磨仪[东方天净]小型高能研磨筛分仪直销厂家 | 宁夏密集型母线槽厂家-封闭式母线槽-电力工程安装-天地经纬电力 宁波允泰仪器有限公司-硬度计、拉力试验机、盐雾试验箱、影像测量仪、气动量仪 | 汽车漆品牌|家具漆代理|涂料加盟厂家|家具漆|汽车漆-邦派漆官网 汽车漆|汽车油漆|工业油漆涂料|汽车漆加盟-佛山市科涂涂料有限公司 |