智汇工业-智慧工业、智能制造及工业智能、工业互联门户网站,专业的工业“互联网+”传媒

建設(shè)高質(zhì)量數(shù)據(jù)集,讓人工智能更聰明(新視點(diǎn))

來源:人民網(wǎng)

點(diǎn)擊:1485

A+ A-

所屬頻道:新聞中心

關(guān)鍵詞:人工智能 高質(zhì)量數(shù)據(jù)集


    什么是高質(zhì)量數(shù)據(jù)集?簡單來說,就是高價(jià)值、高密度、標(biāo)準(zhǔn)化的數(shù)據(jù)。


    “數(shù)據(jù)之于大模型,就像石油之于汽車。原油只有經(jīng)過一系列復(fù)雜的過程煉化成汽油后,才能供汽車使用。同樣,海量原始數(shù)據(jù)需要經(jīng)過‘煉化’形成高質(zhì)量數(shù)據(jù)集,才能助力大模型精準(zhǔn)學(xué)習(xí)數(shù)據(jù)特征與規(guī)律,有效提升其對(duì)不同場景和任務(wù)的適應(yīng)能力。”中國信息通信研究院副院長魏亮告訴記者,數(shù)據(jù)集的質(zhì)量影響人工智能的“智商”,近期發(fā)布的深度求索系列模型訓(xùn)練中,大量使用了高質(zhì)量推理數(shù)據(jù)集,凸顯了高質(zhì)量數(shù)據(jù)的重要性,“大模型與垂直領(lǐng)域深度融合,同樣也需高質(zhì)量數(shù)據(jù)集的支撐。”


    建設(shè)高質(zhì)量數(shù)據(jù)集,有關(guān)方面在積極行動(dòng)。國家數(shù)據(jù)局等17部門聯(lián)合印發(fā)的《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024—2026年)》提出,“推動(dòng)科研機(jī)構(gòu)、龍頭企業(yè)等開展行業(yè)共性數(shù)據(jù)資源庫建設(shè),打造高質(zhì)量人工智能大模型訓(xùn)練數(shù)據(jù)集”。第八屆數(shù)字中國建設(shè)峰會(huì)上,國務(wù)院國資委發(fā)布首批10余個(gè)行業(yè)、30項(xiàng)央企人工智能行業(yè)高質(zhì)量數(shù)據(jù)集,涵蓋了電網(wǎng)調(diào)度AI負(fù)荷預(yù)測數(shù)據(jù)集、核電SPV設(shè)備健康診斷、運(yùn)行異常及故障預(yù)測數(shù)據(jù)集、金融大模型數(shù)據(jù)集等。


    “隨著基礎(chǔ)模型開源態(tài)勢的形成,各方在算力和模型算法層面的差距正在不斷收窄,數(shù)據(jù)要素價(jià)值更加凸顯,已成為人工智能競爭的核心領(lǐng)域。”國務(wù)院國資委規(guī)劃發(fā)展局副局長胡武婕表示,要推動(dòng)行業(yè)高質(zhì)量數(shù)據(jù)集加速匯聚共享,為人工智能產(chǎn)業(yè)提供充足“養(yǎng)分”,從而持續(xù)進(jìn)行不同場景的訓(xùn)練優(yōu)化,推動(dòng)基礎(chǔ)模型在千行百業(yè)落地應(yīng)用。


    目前,高質(zhì)量數(shù)據(jù)集建設(shè)還存在不少挑戰(zhàn)。魏亮說,一方面,行業(yè)大模型對(duì)數(shù)據(jù)的需求多樣,不同行業(yè)部門對(duì)模型場景數(shù)據(jù)的需求各不相同,增加了數(shù)據(jù)處理和管理的復(fù)雜度。另一方面,在行業(yè)大模型的實(shí)際建設(shè)中,對(duì)于構(gòu)建和采買的數(shù)據(jù)沒有統(tǒng)一衡量標(biāo)準(zhǔn),不同行業(yè)、不同數(shù)據(jù)源的數(shù)據(jù)完整性和準(zhǔn)確性可能參差不齊,影響了大模型的訓(xùn)練效果和預(yù)測準(zhǔn)確性,造成訓(xùn)練資源浪費(fèi)。


    4月30日,《高質(zhì)量數(shù)據(jù)集建設(shè)指南(征求意見稿)》發(fā)布。全國數(shù)據(jù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)提出,將強(qiáng)化標(biāo)準(zhǔn)引領(lǐng),分三類建設(shè)高質(zhì)量數(shù)據(jù)集:一類為“通識(shí)數(shù)據(jù)集”,包含面向社會(huì)公眾、無需專業(yè)背景即可理解的通用知識(shí),主要用于支撐通用模型落地應(yīng)用;一類為“行業(yè)通識(shí)數(shù)據(jù)集”,包含面向行業(yè)從業(yè)人員、需要一定專業(yè)背景才能理解的行業(yè)領(lǐng)域通用知識(shí),主要用于支撐行業(yè)模型落地應(yīng)用;一類為“行業(yè)專識(shí)數(shù)據(jù)集”,包含面向特定業(yè)務(wù)場景相關(guān)人員、需要較深的專業(yè)背景才能理解的行業(yè)領(lǐng)域?qū)I(yè)知識(shí),主要用于支撐業(yè)務(wù)場景模型落地應(yīng)用。


    國家數(shù)據(jù)局副局長夏冰表示,數(shù)據(jù)集的質(zhì)效提升是人工智能賦能實(shí)體經(jīng)濟(jì)的“催化劑”,下一步,國家數(shù)據(jù)局將構(gòu)建部際聯(lián)通、央地協(xié)同的工作機(jī)制,推動(dòng)高質(zhì)量數(shù)據(jù)集標(biāo)準(zhǔn)體系研究,促進(jìn)數(shù)據(jù)、技術(shù)、場景對(duì)接,構(gòu)建多元協(xié)同的數(shù)據(jù)標(biāo)注產(chǎn)業(yè)生態(tài),夯實(shí)人工智能發(fā)展數(shù)據(jù)根基。

    (審核編輯: 光光)

    聲明:除特別說明之外,新聞內(nèi)容及圖片均來自網(wǎng)絡(luò)及各大主流媒體。版權(quán)歸原作者所有。如認(rèn)為內(nèi)容侵權(quán),請(qǐng)聯(lián)系我們刪除。

    主站蜘蛛池模板: 健身器材_健身器材厂_健身器材厂家-徐州兰士健身器材有限公司 | 武汉净化机-武汉全热新风换气机-武汉静音送风机-武汉东信新风节能设备有限公司 | 移动厕所_真空环保厕所_环保厕所_景区生态厕所_雨施捷移动厕所生产厂家 | 聚合氯化铝pac-聚氯化铝-饮水级工业级聚合氯化铝-聚合氯化铝厂家价格 | 模压机|硫化机|平板硫化机生产厂家-南通海利特橡塑机械有限公司 模压化粪池_三格式化粪池_玻璃钢化粪池厂家 | 领先的木工机械生产厂家,原木加工流水线,立式带锯机,数控木工跑车-邢台亚士达机械制造有限公司 | 喷雾式干燥机-真空桨叶干燥机-桨叶干燥器-常州力马干燥科技有限公司 | 天然气车船展、氢能装备展、氢燃料汽车展、核电装备展、国防信息化装备展---北京企发展览服务有限公司 | 泊头市特种油泵阀制造有限公司 - 渣油泵,重油泵,沥青泵,高压齿轮泵,煤焦油泵,导热油泵,三螺杆泵,圆弧齿轮泵,不锈钢齿轮泵, | 日本国际高中学校招生【立学仕日本留学服务】日语中学学校|美术生|艺术生|高中生|本科|研究生|语言学校留学择校申请 | 新能源洗扫车、新能源压缩垃圾车_新能源路面养护车_电动树叶收集车_电动扫地机_电动洗地机_高尔夫球车 | 热水工程|太阳能热水工程|空气能热水工程|太阳能集热工程 | 江阴市海顺机械设备制造有限公司 | 威海华东数控股份有限公司| 天下机械|机床商讯-机械网|机械技术|机械信息|机床资讯|机床设备|机床商讯杂志 | 卡压式管件_不锈钢卡压式管件_双卡压管件_不锈钢沟槽管件_承插焊管件_温州市中达阀门管件有限公司 | 塞伯罗斯官网|二维码门禁|景区验票主板|扫码门禁|扫码开门厂家 | 柚墨yomoer官网_PPT模板_工作总结PPT模板下载_个人简历模板 | 暖气片,暖气片厂家,散热器,暖气片品牌-青岛瑞雪兆散热器有限公司 | 潍坊亿宏重工机械有限公司,破碎机,高性能立磨机,颚式破碎机,锤式破碎机反击式破碎机,重锤式破碎机,高性能反击式破碎机,圆锥式破碎机,给料机系列,链板给料机系列,简易给料机系列,振动给料机 | 上饶市蚂蚁搬家有限公司,上饶搬家公司,上饶同城搬家,上饶同城搬家电话,上饶搬家哪家好,上饶搬家公司电话 | 烟台废旧物资回收,烟台废品回收,烟台物资回收-烟台金泰再生资源有限公司 | 基坑护栏,临边护栏网,爬架网,爬架网片,铁路防护栅栏,公路护栏网,河北昊坤金属制品有限公司 | 余压控制器,余压监控系统,余压传感器-浙江巨川电气科技有限公司 | 水表_智能电表_抄表软件_ic卡水控机_电磁水表厂家-深圳市华熙仪数码科技有限公司 | 景县泉兴永塔业有限公司-广播电视塔、通信塔、电力塔、交通设施、监控杆塔、气象塔、森林防火瞭望塔、避雷塔、烟筒塔、训练塔 | 九江市石化塑业有限公司| 泰州LOGO设计-品牌VI设计-泰州广告设计公司-大唐歌飞广告设计公司 | 清洁公司| 保洁公司| 东莞清洁| 东莞保洁|壹壹清洁 | 首页 菲律宾海运双清|马尼拉海运双清|广州菲律宾专线|广州通达供应链有限公司 | 深圳理津技术有限公司(REHLOGY)-全球工业品供应商:自动化产品|仪器仪表|设备|备品备件|工具|消耗品|非标设备|建筑工程等一站式综合服务! | 活性炭吸附设备,UV光氧废气处理设备,破碎机专用除尘器,催化燃烧设备厂家-河北碧清环保设备有限公司 | 济南晨阳科技有限公司-锅巴生产设备-夹心米果设备-膨化食品机械 集装箱零配件_不锈钢丝绳厂家_镀锌铁链条_合页非标件定制_上海英鑫多实业有限公司 | 泥浆振动筛|卧式泥浆搅拌器|泥浆离心机|泥浆处理固控设备_沧州宏宇石油机械有限公司 | 惠声电子、广州市惠声电子科技有限公司、VBS、VBS惠声电子、VBS公共广播生产厂家、VBS广播功放生产厂家、VBS会议系统设备批发、VBSIP网络对讲系统厂家、VBS会议系统厂家、VBS智能中控厂家、VBS专业扩声厂家 | 输送机电动滚筒_山东电动滚筒_输送机滚筒_皮带输送机-山东中输输送机械有限公司 | 陶瓷纤维模块|陶瓷纤维毯|陶瓷纤维纸|高温隔热材料|陶瓷纤维厂家-济南火龙热陶瓷有限责任公司 | 冷却特性测试仪_ 刀柄热胀仪_加油小车价格_皮带张力仪_上海川奇机电设备有限公司 | 牡丹江网络公司,牡丹江网站建设专家|网络推广|网络营销|黑龙江艺通网络技术开发有限公司 | 消防工程公司,消防工程承接公司-亿杰(北京)工程安装有限公司 | 线性排水沟-成品排水沟-树脂排水沟-树脂混凝土,缝隙式排水沟-时利和 |