高價值語料可信流通基礎設施啟動建設

  • 來源:科技日報
  • 2024-08-20

記者19日從國家區(qū)塊鏈技術創(chuàng)新中心獲悉,由國家區(qū)塊鏈技術創(chuàng)新中心、北京能源集團牽頭,聯(lián)合新華社國家重點實驗室、人民網(wǎng)、高等教育出版社、中國通用技術集團等10余家國內語料數(shù)據(jù)重點單位共同打造的高價值語料可信流通基礎設施正式啟動建設。

高價值語料數(shù)據(jù)是訓練人工智能大模型的關鍵因素。長期以來,高價值語料數(shù)據(jù)存在跨單位、跨行業(yè)、跨地區(qū)分布的特點,部分領域還暴露出濫用語料數(shù)據(jù)、泄露語料隱私等問題。以區(qū)塊鏈、隱私計算為代表的新一代信息技術,憑借可信存證、不可篡改、易確權等性能,可以保障語料數(shù)據(jù)可信安全地流通、使用和管理,有效破解上述難題。

國家區(qū)塊鏈技術創(chuàng)新中心相關負責為人介紹,高價值語料可信流通基礎設施將運用我國自主可控、性能領先的區(qū)塊鏈軟硬件技術,搭建起覆蓋全國的分布式語料數(shù)據(jù)互聯(lián)互通橋梁,鏈接語料供給方、加工方、需求方,實現(xiàn)全國分布式語料數(shù)據(jù)可信接入,跨地域可發(fā)現(xiàn)、可訪問,形成高質量語料數(shù)據(jù)集;同時,運用創(chuàng)新隱私計算技術,通過“數(shù)據(jù)不出域、可用不可見”的方式,保障大模型高價值語料數(shù)據(jù)在處理加工和模型訓練過程中無法二次非授權傳播。

在高價值語料可信流通基礎設施的支撐下,國家語料數(shù)據(jù)的重點單位還將開展基于區(qū)塊鏈與隱私計算的語料數(shù)據(jù)可信安全流通規(guī)范制定,形成高價值語料數(shù)據(jù)流通與增值的可持續(xù)生態(tài)。

久久99精品九九九久久婷婷,精品国偷自产在线电影,欧美人成人亚洲专区中文字幕,欧美一级一区二区三区视频
色综合伊人丁香五月婷婷综合缴情 | 最新在线精品国自产拍视频 | 日韩亚洲欧美中文字幕影音先 | 亚洲中文字幕精品级在线 | 在线观看中文字幕dvd播放 | 色窝窝在线手机视频免费 |