中國信通院啟動DeepSeek國產化適配測評

2025-02-15

近日,中國原創人工智能(AI)大模型DeepSeek活躍度持續上升,其在運營商、各大雲平台,甚至地方政府的政務系統中都被廣泛應用,也引發一波行業變革。1月31日,英偉達、亞馬遜和微軟這三家美國科技巨頭在同一天宣布接入大語言模型DeepSeek-R1。據報道,DeepSeek-R1被公認為是目前最先進的大語言模型之一,能夠提供高質量的語言處理能力。香港中通社

【香港中通社2月14日電】 中國信息通信研究院14日正式啟動DeepSeek國產化適配測評工作,為DeepSeek系列模型在多硬件多場景下的適配部署提供參考。

中國信通院微信公眾號消息指,DeepSeek國產化適配測評工作,一是評價模型在包括硬件芯片、計算設備、智算集群等軟硬件系統中的適配效果。主要圍繞DeepSeek不同模態、不同尺寸的系列模型,面向推理、微調、訓練過程,低成本使用測試工具AISHPerf,從適配成本、功能完備性、優化效果、性能指標等多方面開展測試評估。

二是反映模型在軟硬件系統適配過程中軟件棧及工具的適配易用性及開發部署成本,將面向包括芯片、服務器、集群、開發框架及工具鏈、智算設施及平台等在內的人工智能軟硬件產品及系統開展。

近期,DeepSeek陸續開源V3、R1系列高性能、低成本模型,人工智能軟硬件協同創新重要性進一步凸顯。面向產業應用需求,中國包括芯片、框架、雲計算、智算中心等在內的人工智能軟硬件創新主體積極開展DeepSeek系列模型適配工作,進一步強化面向大模型的國產軟硬件支撐能力,加速推動軟硬件協同創新。

DeepSeek創立不到2年,據統計,去年底至今,DeepSeek的AI軟件已登頂全球140個市場中的移動應用下載量排行榜首。推出ChatGPT的美國OpenAI公司承認,DeepSeek給AI行業帶來“震撼”。美國AI龍頭英偉達稱,DeepSeek-R1是最先進的大語言模型。