中評社香港2月7日電(記者 郭至君)最近一段時間,中國AI公司推出DeepSeek在全世界掀起了AI風暴,重創美國科技股,讓許多研究人員和投資人目瞪口呆,雖然DeepSeek的某些論斷仍有許多不確定性,但其最新型號的效能可與ChatGPT媲美,而開發成本卻似乎衹有它的一小部分。美國市場擔心,如果主要使用較不先進的半導體的中國新興公司能夠模仿矽谷巨頭的能力,那麼不僅Nvidia的價值被高估,整個美國的人工智能產業也會被高估。美國外交關係協會(CFR)的幾位研究員日前對此進行了評析。
駐校技術師Sebastian Elbaum解釋了DeepSeek如何能夠媲美其他AI模型的表現,而訓練成本卻低得多的原因。“自相矛盾的是,DeepSeek令人印象深刻的部分成果很可能是由於中國工程師可用的資源有限,他們無法使用最強大的Nvidia硬件進行訓練,這種限制促使他們在模型架構、訓練程序和硬件管理方面進行了一系列巧妙的優化。其中有兩項優化最為突出。首先是硬件的低階程式設計以解決頻寬的限制,其次是讓模型自我改善。”
數字與網路空間政策資深研究員Kat Duffy認為,這些創新方法突顯出美國在人工智能方面的弊端:美國創新環境的重點在於發展人工一般智能,並建立越來越大的模型,這與全球多數國家的需求並不一致。對他們來說,最大的興趣是盡快抓住功能性人工智能的潛力,現有的芯片和開放模型可以在很大程度上實現這一目標。
美國越是強迫中國開發者在高度受限的環境中進行開發,就越有可能促使中國成為開發具有成本效益、節能的人工智能方法的全球領導者。對於許多政府和企業家來說,這些遠比一直推動美國人工智能投資和創新優先順序的“要麼計算,要麼破產”思維更有說服力。
|