來源:北京科技局
北京市科學(xué)技術委員會(huì)、中關村科技園區管理委員會(huì)就《北京市促進(jìn)通用人工智能(néng)創新發(fā)展的若幹措施(2023-2025年)(征求意見稿)》公開(kāi)征集意見。
《若幹措施》針對(duì)加強算力資源統籌供給能(néng)力、提升高質量數據要素供給能(néng)力、系統布局大模型技術體系持續探索通用人工智能(néng)路徑、推動通用人工智能(néng)技術創新場景應用、探索營造包容審慎監管環境五大方向(xiàng),明确組織機制,提出21項具體措施。
意見稿提出,加強與頭部公有雲廠商等市場主體合作,實施算力夥伴計劃,并确定首批夥伴計劃成(chéng)員;將(jiāng)新增算力建設項目納入算力夥伴計劃,加快推動海澱區“北京人工智能(néng)公共算力平台”,朝陽區“北京數字經(jīng)濟算力中心”等項目建設。
以下是政策原文:
北京市促進(jìn)通用人工智能(néng)創新發(fā)展的
若幹措施(2023-2025年)
(征求意見稿)
爲搶抓大模型發(fā)展機遇,重視通用人工智能(néng)發(fā)展,充分發(fā)揮政府引導作用和創新平台催化作用,整合創新資源,加強要素配置,營造創新生态,重視風險防範,推動我市通用人工智能(néng)領域實現創新引領,提出以下落實措施:
一、加強算力資源統籌供給能(néng)力
(一)組織商業算力定向(xiàng)滿足本市緊迫需求
加強與頭部公有雲廠商等市場主體合作,實施算力夥伴計劃,并确定首批夥伴計劃成(chéng)員,明确供給技術标準、軟硬件服務要求、算力供給規模、優惠策略等,向(xiàng)在京高校院所和中小企業公布一批優質算力供應商。
(二)高效推動新增算力基礎設施建設
將(jiāng)新增算力建設項目納入算力夥伴計劃,加快推動海澱區“北京人工智能(néng)公共算力平台”,朝陽區“北京數字經(jīng)濟算力中心”等項目建設,快速形成(chéng)規模化先進(jìn)算力供給能(néng)力,支撐千億級參數量的大型語言模型、多模态大模型、大規模精細神經(jīng)網絡模拟仿真模型、腦啓發(fā)神經(jīng)網絡等研發(fā)。
(三)建設統一的多雲算力調度平台
利用政府統一入口,降低公有雲采購成(chéng)本,普惠中小企業,同時減少企業分别面(miàn)對(duì)不同雲廠商的溝通成(chéng)本。針對(duì)彈性算力需求,建設統一的多雲算力調度平台,實現異構算力環境統一管理、統一運營,方便企業在不同雲環境上無縫、經(jīng)濟、高效地運行各類人工智能(néng)計算任務。建設北京與河北、天津、山西、内蒙古等省(市)算力集群的直連基礎光傳輸網絡,進(jìn)一步提升平台對(duì)四地算力資源感知能(néng)力,探索開(kāi)展算力交易。
二、提升高質量數據要素供給能(néng)力
(四)歸集高質量基礎訓練數據集
針對(duì)目前大模型訓練高質量中文語料占比過(guò)少,不利于中文語境表達及産業應用的問題,整合現有開(kāi)源中文預訓練數據集和高質量互聯網中文數據并進(jìn)行合規清洗。同時持續擴展高質量多模态數據來源,建設合規安全的中文、圖文對(duì)、音頻、視頻等大模型預訓練語料庫,通過(guò)北京國(guó)際大數據交易所社會(huì)數據專區進(jìn)行定向(xiàng)有條件開(kāi)放。
(五)打造“國(guó)家數據基礎制度先行先試示範區”,謀劃國(guó)家級數據訓練基地
加快推動數據要素高水平開(kāi)放的“國(guó)家數據基礎制度先行先試示範區”建設,争創國(guó)家級數據訓練基地,提升北京人工智能(néng)數據标注庫規模和質量。倡議高質量數據網站所屬企業提供部分脫敏高質量數據,進(jìn)行定向(xiàng)有條件開(kāi)放,企業或科研機構通過(guò)在線申請進(jìn)行有償使用,并探索基于數據貢獻、模型應用的商業化場景合作。
(六)搭建數據集精細化标注衆包服務平台
建設指令數據集及多模态數據集衆包服務平台,開(kāi)發(fā)集成(chéng)相關工具應用的智能(néng)雲服務系統,鼓勵并組織來自不同學(xué)科的專業人員标注通用人工智能(néng)模型訓練數據及指令數據,提高訓練數據的多樣(yàng)性,給予貢獻者适當獎勵,推動平台持續良性發(fā)展。
三、系統布局大模型技術體系,持續探索通用人工智能(néng)路徑
(七)開(kāi)展大模型創新算法及關鍵技術研究
圍繞大型語言模型構建、訓練、調優對(duì)齊、推理部署等全流程,支持開(kāi)展創新算法及核心技術研究,形成(chéng)完整高效的訓練體系并對(duì)外開(kāi)源。探索多模态通用模型架構,研究大模型高效并行訓練技術,以及邏輯和知識推理、指令學(xué)習、人類意圖對(duì)齊等調優方法,研發(fā)支持百億參數模型推理的高效壓縮技術。
(八)加強大模型訓練數據采集及治理工具研發(fā)
從“采、存、管、研、用”五個方面(miàn),研發(fā)包含數據采集、清洗、标注、脫敏、存儲等功能(néng)在内的數據處理工具。重點研究互聯網數據全量實時更新技術,多源異構數據整合與分類方法,數據管理平台相關系統,數據清洗、标注、分類、注釋等軟件工具及算法,數據内容安全審查算法及工具等。
(九)開(kāi)放大模型評測基準及工具
構建多模态多維度的基礎模型評測基準及評測方法。建立基礎模型評測工具集,提供适應性的工具進(jìn)行評測。建立公平高效的自适應評測機制,根據評測目标的不同,自動适配不同的工具和指标。研究人工智能(néng)輔助的智能(néng)模型評測算法,面(miàn)向(xiàng)主觀型或生成(chéng)式的任務,構建自動化評估工具。集成(chéng)包括通用性、高效性、智能(néng)性、魯棒性在内的多維度評測工具,構建基礎模型線上評測服務平台。
(十)推動大模型基礎軟硬件體系研發(fā)
支持研發(fā)分布式高效訓練系統,實現模型訓練任務高效自動并行。研發(fā)适用于模型訓練場景的新一代人工智能(néng)編譯器,實現算子自動生成(chéng)和自動優化,推動人工智能(néng)芯片與框架的廣泛适配。研發(fā)人工智能(néng)芯片評測系統,實現多芯片多框架的自動化評測。爲大模型訓練和應用提供自主創新的基礎軟硬件生态底座。
(十一)探索具身智能(néng)、通用智能(néng)體和類腦智能(néng)等通用人工智能(néng)新路徑
發(fā)展面(miàn)向(xiàng)通用人工智能(néng)的基礎理論框架體系,加強人工智能(néng)數學(xué)機理、自主協同與決策等基礎理論研究。推動具身智能(néng)系統研究及應用,突破機器人在開(kāi)放環境、泛化場景、連續任務等複雜條件下的感知、認知、決策技術。探索價值與因果驅動的通用人工智能(néng)新路徑研究,打造通用人工智能(néng)統一理論框架體系、評級标準及測試平台,研發(fā)通用人工智能(néng)操作系統和編程語言,推動通用智能(néng)體底層技術架構應用。探索類腦智能(néng)等交叉學(xué)科研究,通過(guò)大腦神經(jīng)元連接模式、編碼機制、信息處理原理研究,啓發(fā)新型人工神經(jīng)網絡模型建模和訓練方法。
四、推動通用人工智能(néng)技術創新場景應用
(十二)推動在政務服務領域率先試點應用
圍繞政務咨詢、政策服務、接訴即辦、政務辦事(shì)等工作,率先實現大模型技術賦能(néng)。借助大模型語義理解、自主學(xué)習和智能(néng)推理等能(néng)力,提高政務咨詢系統智能(néng)問答水平,增強多語種(zhǒng)交互能(néng)力。支撐“京策”平台建設,優化政策規範管理和精準服務。輔助市民服務熱線更高效回應市民訴求,深化民生大數據高效利用。提升辦事(shì)服務便利度,輔助引導辦事(shì)人員表單填寫,輔助綜合窗口人員更精準提供辦事(shì)指引,輔助審批人員提高審批效率,推進(jìn)業務數據更充分共享、業務流程更高效協同。
(十三)探索在醫療領域示範應用
支持我市有條件的研究型醫療機構提煉智能(néng)導診、輔助診斷、智能(néng)治療等場景需求,充分挖掘醫學(xué)文獻、醫學(xué)知識圖譜、醫學(xué)影像等多模态醫療數據,構建基于醫療領域通用數據與專業數據的智能(néng)應用,實現對(duì)各種(zhǒng)疾病和症狀的準确識别和預測,輔助醫療機構提高疾病診斷、治療和預防的決策水平。
(十四)探索在科學(xué)研究領域示範應用
發(fā)展科學(xué)智能(néng),加速人工智能(néng)技術賦能(néng)新材料和創新藥物領域科學(xué)研究。支持我市能(néng)源、材料、生物領域相關實驗室設立科研合作專項,與我市相關科研機構和創新企業開(kāi)展聯合研發(fā),充分挖掘材料、蛋白質和分子藥物領域實驗數據,研發(fā)科學(xué)計算模型,開(kāi)展新型合金材料、蛋白質序列和創新藥物化學(xué)結構序列預測,縮短科研實驗周期。
(十五)推動在金融領域示範應用
進(jìn)一步挖掘我市金融行業應用場景,系統布局一批金融機構場景開(kāi)放“揭榜挂帥”項目。支持金融科技企業針對(duì)金融場景中信息負載高,信息更新快,金融從業者難以快速全面(miàn)的獲取準确信息的問題,探索面(miàn)向(xiàng)金融文本深度理解和分析的人工智能(néng)技術應用。聚焦智能(néng)風控、智能(néng)投顧、智能(néng)客服等環節,推動實現金融專業長(cháng)文本的精準解析和模型知識的更新,突破複雜決策邏輯與模型信息處理能(néng)力間的融合技術,實現從複雜金融信息處理到投資決策建議的轉化,支撐金融領域的投資輔助決策。
(十六)探索在自動駕駛領域示範應用
支持自動駕駛企業研發(fā)多模态自動駕駛技術,發(fā)揮大型語言模型高維語義理解和泛化優勢,基于車路協同數據和車輛行駛多傳感器融合數據,提高自動駕駛模型多維感知和預測性能(néng),有效解決複雜場景長(cháng)尾問題,輔助提高車載自動駕駛模型泛化能(néng)力。支持在北京市高級别自動駕駛示範區3.0建設中,構建車路協同數據庫,引導企業開(kāi)展基于真實場景的自動駕駛模型訓練叠代。探索基于低時延通訊的雲控自動駕駛模型測試,發(fā)展自動駕駛新技術路徑。
(十七)推動在城市治理領域示範應用
支持人工智能(néng)研發(fā)企業結合智慧城市建設場景需求,率先在城市大腦建設中引進(jìn)大模型技術,開(kāi)展多感知系統融合處理技術研發(fā),打破城市治理中各系統數據孤島,實現智慧城市底層業務的統一感知、關聯分析和态勢預測,科學(xué)調配政府資源和行政力量,爲城市治理提供更加綜合全面(miàn)的輔助決策能(néng)力。
五、探索營造包容審慎的監管環境
(十八)持續推動監管政策和監管流程創新
探索營造穩定包容的監管環境,積極推動人工智能(néng)領域新技術賦能(néng)傳統行業的包容審慎監管,支持人工智能(néng)算法、框架等基礎技術的自主創新、推廣應用、國(guó)際合作。鼓勵優先采用安全可信的軟件、工具、計算和數據資源,通過(guò)改進(jìn)算法等技術手段,确保訓練數據集的規範性。鼓勵生成(chéng)式人工智能(néng)産品在科研等非面(miàn)向(xiàng)公衆服務領域實現向(xiàng)上向(xiàng)善應用。積極向(xiàng)國(guó)家網信部門争取,在中關村核心區建立先行先試,推動實行包容審慎監管試點。
(十九)建立常态化服務和指導機制
做好(hǎo)對(duì)拟面(miàn)向(xiàng)公衆提供服務的生成(chéng)式人工智能(néng)産品的安全評估工作,建立常态化聯系服務和指導機制,督促企業遵守法律法規要求,尊重社會(huì)公德、公序良俗。優化安全評估流程機制,細化對(duì)大模型算法設計、訓練數據源篩選、内容安全性、人工标注規則的審核評估标準,開(kāi)展精準化服務指導,加快推進(jìn)我市人工智能(néng)企業相關技術産品的安全評估工作。指導企業建立健全算法安全防範機制,在産品研發(fā)階段引入技術工具進(jìn)行安全檢測,督促企業積極履行算法備案和變更、注銷備案手續。發(fā)布《北京市互聯網信息服務算法推薦合規指引》,引導創新主體樹立安全責任意識,健全管理制度、強化技術手段、促進(jìn)企業算法合規發(fā)展。
(二十)加強網絡服務安全防護和個人數據保護
指導算力運營主體落實《網絡安全法》《數據安全法》《個人信息保護法》等法律規定,加強網絡和數據安全管理,明确網絡安全、數據安全和個人信息保護主體責任,強化安全管理制度建設和工作落實,鼓勵企業開(kāi)展數據安全管理認證及個人信息保護認證,落實數據跨境傳輸安全管理制度,全面(miàn)提升網絡安全和數據安全防護能(néng)力。
(二十一)持續提升人工智能(néng)産業倫理治理自律自治能(néng)力
落實國(guó)家新一代人工智能(néng)創新發(fā)展試驗區建設任務,加強人工智能(néng)倫理安全規範及社會(huì)治理實踐研究,研發(fā)并部署人工智能(néng)倫理治理公共服務平台,服務政府監管與産業自律自治,強化相關責任主體科技倫理規範意識,提升科技倫理治理能(néng)力。