智汇工业-智慧工业、智能制造及工业智能、工业互联门户网站,专业的工业“互联网+”传媒

麻省理工神科技:大數據分析自動化

來源:網絡大數據

點擊:802

A+ A-

所屬頻道:新聞中心

關鍵詞:云計算,大數據,大數據分析

    大數據分析包括尋找有某種預測能力的埋藏模式。但是,選擇哪些數據的“特征”來進行分析通常需要靠人類的直覺。

     

     

      在一個包含數據庫中,舉個例子,各種促銷和每周的利潤的開始和結束日期,其關鍵數據可能不是日期本身而是它們之間的跨度,或著不是總利潤,但平均跨越這些跨度。

      這套取代人的直覺與算法的系統,優于906個人類團隊中的615個團隊。

      大數據分析包括尋找有某種預測能力的埋藏模式。但是,選擇哪些數據的“特征”來進行分析通常需要靠人類的直覺。在一個包含數據庫中,舉個例子,各種促銷和每周的利潤的開始和結束日期,其關鍵數據可能不是日期本身而是它們之間的跨度,或著不是總利潤,但平均跨越這些跨度。

      麻省理工學院的研究人員的目標是,用一個不僅能搜索模式也能設計特征的新系統把人類元素從大數據分析中剝離出來。為了測試他們系統的第一個原型,他們參加了三個數據科學競賽,它與人類團隊比賽,在不熟悉的數據集中找到預測模式。906個團隊參與了三項比賽,研究人員的“數據科學機器”先于615個團隊完成。

      在三項比賽中,數據科學機器的預測的準確率是94%96%。第三個數字則是一個更為溫和的數字87%。人類的團隊通常需要進行好幾個月的預測算法,而數據科學機器產生它的每一個條目只花了2-12小時。

      “我們把數據科學機器視為人類智能的自然補充,”Kanter說,他在麻省理工的碩士論文是《數據科學機器的基礎》。“有這么多的數據需要進行分析。現在它(機器)只是待在那里沒有做任何事。因此,也許我們可以拿出一個至少讓我們能夠開始著手、讓我們前進的解決方案。”

      項目之間

      Kanter和他的導師KalyanVeeramachaneni,麻省理工學院計算機科學和人工智能實驗室的研究科學家(CSAIL),在他們的論文中描述了數據科學機器,Kanter將在下周的IEEE國際科學數據和先進分析會議上發表。

      Veeramachaneni統一領導計算機科學與人工智能實驗室的所有成員組,在大數據分析的實際問題中采用機器學習技術,如依據風電場場址確定其發電能力或預測學生從在線課程中輟學的風險。

      “我們從解決一些工業數據科學問題的經驗中觀察到的是一個非常關鍵的步驟,稱為特征工程,”Veeramachaneni說。“你要做的第一件事就是把你的數據從數據庫或結構中提取出來,為了做這個,你必須得有很多想法。”

      例如,2個關鍵指標被用在預測輟學上:一個學生花多少時間解決一個問題集和一個學生相比他或她的同學花了多少時間在課程網站上。麻省理工學院的在線學習平臺MITx不記錄那些統計數字,但它可以從推斷中收集數據。

      
    特色組成

      KanterVeeramachaneni使用了一些技巧來制定數據分析候選特征。一種是利用數據庫設計中固有的結構關系。數據庫通常在不同的表中存儲不同類型的數據,使用數字標識表示它們之間的相關性。數據科學機器跟蹤這些相關性,將它們作為一個線索進行功能建設。

      例如,一個表可以列出零售項目和它們的成本;另一個表可能包括在個別客戶購買的項目中列出的項目。數據科學機器將從第一個表中的第一個表輸入到第二個。然后,從第二表的關聯的幾個不同的項目中選擇相同的購買數量,它將執行一套操作,以產生候選功能:總成本,每個訂單,每個訂單的平均成本,最低成本,每個訂單,等等。作為跨表格的數字標識,數據科學機器會在各自層的頂端進行相互操作,找到最小的平均值、平均數、和等。

      它也尋找所謂的分類數據,這似乎是限制在一個有限的范圍內的值,如一周的天數或品牌名稱。然后,它會依據劃分現有的跨類別的功能產生新的功能。

      一旦它生成了一系列的備選項,它會減少它們的數量以確定這些值具有相關性。然后開始測試其樣本數據的簡化特征,使它們以不同的方式來優化它們預測收益率的準確性。

      “數據科學機器是一個令人驚奇的、最前沿的研究解決實際問題的項目,是一種看問題的全新的方式。”MargoSeltzer說到,他是一個沒有參與這項工作的哈佛大學計算機科學教授。“我想他們所做的將迅速成為一種標準——很快就會。”

    (審核編輯: 智慧羽毛)

    聲明:除特別說明之外,新聞內容及圖片均來自網絡及各大主流媒體。版權歸原作者所有。如認為內容侵權,請聯系我們刪除。

    主站蜘蛛池模板: 微波烘干设备厂家-微波烘干干燥设备-山东邦普机械设备有限公司 | 机械智能停车设备_智能机械式立体停车库_立体车库停车设备租赁_山东科博机械车库 | 济宁卡尔迪机械制造有限公司_铁路换枕机_升降驾驶室_挖机加高底盘_加长臂 | 山东荣利中石油机械有限公司 | 意大利留学-意大利语培训-马来西亚留学【长青藤海外】 | 吉安仁济医院「官网」吉安男科医院-吉安仁济男科医院靠谱吗-男性专科医院 | 频谱矢量网络分析仪_鼎阳数字示波器-苏州东伟元电子有限公司 | 深圳喜运达物流官网_东南亚物流|海运|专线|海外仓_泰国菲律宾马来西亚海运|物流专线|海外仓 | 手游下载_app下载_好玩的手游下载_安卓市场下载_163下载 | 中国建材信息总网-中国建材行业权威的信息资讯平台 | 济宁三石工程机械有限公司-首页-小型起重机、环卫设备、小松配件 | 天津成考网-天津成人高考网 | 宁波管道安装_宁波工业冷风机_宁波冷风机厂家_宁波厂房通风降温_「浙江甬风机电」 | 塑料胶水|PVC胶水|PP胶水|橡胶胶水|强力胶水|透明胶水|胶粘剂|粘合剂|UV胶-聚力胶水厂家 | 清河县隆鑫密封件有限公司,汽车用密封条,配电箱柜、集装箱密封胶条,建筑门窗、家具用密封条,无毒环保医用密封条,船舶、农机用密封条,异型产品 | 活性炭吸附设备,UV光氧废气处理设备,破碎机专用除尘器,催化燃烧设备厂家-河北碧清环保设备有限公司 | 湖北大洋塑胶有限公司|AGR|PPR|RTP|HDPE|e-PSP钢塑复合压力管道生产厂家 | 泥沙泵_脱硫泵_潜水泵_离心泵_渣浆泵厂家|诚信为先-泰安华泰泵业制造有限公司 | 微行科技(MicroX):半导体装备核心供应商-超高真空炉 | 全自动拆包机,自动拆包机,全自动逐层拆包机,全自动吨袋拆包机,吨袋拆包机,管链输送机,气流分级机 | 浙江日新电气有限公司| 双效-多效-三效-废水-污水蒸发器_离心喷雾-污泥干燥机_蒸发浓缩器【天辰环保 】 | 江西省力速数控机械有限公司丨火花机丨龙门加工中心丨镜面火花机丨卧式加工中心 | 乌鲁木齐万疆通管道设备有限公司 销售热线;13565955557-新疆 乌鲁木齐 万疆通 管道设备 波纹补偿器 膨胀节 金属软管 伸缩器 管件 阀门 维修 | 全自动沾锡机|端子机|剥线机|昆山市博科鑫源电子设备有限公司 | 化工网-化工新闻资讯平台-中华化工行业门户网站 | 上海鑫迪机械有限公司 上海科蜀智能机械有限公司 | 湖南净声源环保科技有限公司是一家专业从事噪声治理和建筑声学设计生态环境综合治理服务的企业,专业从事株洲电梯隔音治理,湘潭中央空调降噪处理,衡阳邵阳冷却塔噪音治理,岳阳常德大型风机噪声隔音降噪,张家界空压机噪声治理,益阳配电房变压器噪声治理,专业郴州永州工厂企业车间噪声治理,怀化娄底专业机械设备减振降治理,武汉噪音治理隔音降噪公司,孝感噪音治理,立式球磨机的噪声控制,专业隔音降噪公司,、以及各类机械动力设备减振降噪噪声治理的公司,同时为客户提供咨询与解决方案 | 上海鳞片胶泥-环氧胶泥价格-鳞片涂料批发-乙烯基树脂-环氧结构胶-上海富晨 | 值得信赖的云计算 - 美儿云互联 直饮水设备-纯水设备-软化水设备 - 亿家清泉水处理设备厂家 | 视觉检测设备_CCD光学筛选机_分度盘光学筛选机-无锡精质智能装备 | 热水工程|空气能热水工程|超低温采暖工程|太阳能热水工程|空气源热泵厂家|炬邦热能设备有限公司 热熔钻孔机【优质厂家】_多年热熔钻设备研发制造经验 | 耐磨钢板_复合耐磨板_KN60耐磨钢板-北京耐默公司 | 文件管理系统-文件管理软件-文档管理系统-文档管理软件-档案管理系统-档案管理软件 - 致得软件 | 土工布厂家,土工布价格,山东德旭达土工材料有限公司 | 塑料凹版印刷机-干式复合机-分条机-涂布机生产厂家温州华印机械有限公司 | 太阳能路灯-高杆灯-景观灯-玉兰灯-中华灯-LED市电-庭院灯厂家-扬州汉威光电科技有限公司 | 深圳-广州-惠州-东莞-重型货架-悬臂-轻中型货架-深圳市诺普泰仓储设备有限公司 | 江阴月子会所-江阴月子中心-江阴坐月子、月子护理哪家好-乐茵月子中心 | 惠普工作站_联想工作站_HPE服务器_H3C服务器-河南金铭科技有限责任公司 | 制砂机_鹅卵石制砂机_河卵石制砂机_制砂机价格-上海山卓重工机械有限公司 |