中評社北京2月5日電/據新華社報導,《經濟參考報》2月5日刊發記者郭倩采寫的文章《AI產業進入新階段 大模型競爭或激發創新浪潮》。文章稱,近段時間,隨著深度求索公司(DeepSeek)發布其最新開源模型DeepSeek-R1在國內外引發熱烈關注,百度智能雲、騰訊雲、阿里雲、華為雲等多平台宣布上線DeepSeek旗下模型。業內人士認為,DeepSeek的新進展透露出2025年大模型競爭的新動向,有望激發一波創新浪潮,各家企業將探索具有成本效益的AI開發和部署方法,推動全球AI繼續進步。
據深度求索公司官網介紹,DeepSeek-R1在後訓練階段大規模使用了強化學習技術,在僅有很少標注數據的情況下極大提升了模型的推理能力,在數學、代碼、自然語言推理等任務上,測評性能與美國開放人工智能研究中心(OpenAI)開發的GPT-o1模型正式版接近。
賽智產業研究院人工智能研究所副所長安贇在接受記者採訪時表示,DeepSeek-R1通過開源策略、低成本高效推理及強化學習結合混合專家架構(MoE)等創新,實現了突破性的技術進展。“開源打破了大企業的技術壟斷,促進了AI技術的普惠化。其低成本的算法優化模式改變了長期以來對算力堆砌的依賴,推動了效率導向的競爭格局。”
“DeepSeek將開啟全球大模型開發和應用的新階段。”北京前沿未來科技產業發展研究院院長陸峰認為,DeepSeek的高性價比和低訓練成本極大地降低了大模型的投資、開發、運營成本,開放開源性降低了融合應用的技術門檻,為大模型的千行百業廣泛落地普及應用提供了更多可能。
記者注意到,DeepSeek憑借其強大的語言處理能力和技術優勢吸引了眾多國內外企業的關注。連日來,百度智能雲、華為雲、阿里雲、騰訊雲、360數字安全集團等多個平台宣布上線DeepSeek旗下大模型。此外,在1月31日,英偉達、亞馬遜和微軟這三家美國科技巨頭在同一天宣布接入DeepSeek-R1。
例如,騰訊雲方面表示,騰訊雲TI平台全面支持DeepSeek系列模型的一鍵部署。作為企業級機器學習平台,TI平台還提供模型服務管理、監控運營、資源伸縮等能力,幫助企業和開發者將DeepSeek模型高效、穩定地接入實際業務中。 |