20美元26分鐘,便可以創做 AI

20美元26分鐘,便可以創做 AI

瀏覽:314

20美元26分鐘,便可以創做 AI

在人工智能技術飛速發展的今天,低成本高效的 AI 模型成為了科技界的焦點。近期,一位美籍華裔科學家帶領其團隊,僅花費 20 美元及 26 分鐘,便成功創建出一個名為 s1 的 AI 推理模型。這一模型的表現媲美 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型,引起了廣泛關注。

20美元26分鐘,便可以創做 AI


高效模型的誕生

這位科學家是史丹福大學的首位紅杉講席教授,同時也是美國國家工程院的院士。她與史丹福大學及華盛頓大學的研究團隊合作,在短短一個月內研發出 s1 模型。這一模型並非從零開始,而是基於阿里巴巴的通義千問 Qwen2.5 -32B-Instruct 開源模型進行監督微調。團隊使用了 16 塊輝達 H100 GPU,經過 26 分鐘的微調,成功訓練出這一新模型。

20美元26分鐘,便可以創做 AI


「預算控制」策略的應用

在研究過程中,科學家團隊提出了「預算控制」策略。這一策略通過加入「wait 指令」等方式,強制延長模型的推理過程和思考時間,從而促使模型自我檢查並修正錯誤的推理步驟,提升推理品質。根據研究論文《s1:Simple test-time scaling》,s1 模型在數學和編碼能力測試中的表現,可以媲美 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型,並在競賽數學問題上表現更佳,高出 o1-preview 27%。

成本效益分析

值得注意的是,s1 模型的成功並非偶然。由於其基於現成模型進行監督微調,因此成本遠低於從零開始訓練一個模型。此外,20 美元的費用僅包含了訓練時的 GPU 算力費用,並未計入其他數據、設備和消融實驗等費用。這與 DeepSeek-V3 不到 600 萬美元的訓練成本形成了鮮明對比,後者同樣僅包含了訓練時的 GPU 算力費用。

這一事件再次證明了在 AI 技術發展過程中,低成本高效的模型具有巨大的潛力和價值。未來,隨著更多創新策略的應用,AI 技術將會變得更加普及和易於訪問。

專家觀點

根據內媒每日經濟新聞報道,復旦大學計算機學院副教授在受訪時指出,像 DeepSeek 或類似的公司,在尋找有效的整合解決方案時,需要進行大量的前期研究與消融實驗。這意味著前期需要投入大量資金,而 s1 模型的成功則為這一領域提供了新的思路。

結論

總結來說,s1 模型的成功研發不僅展示了低成本高效 AI 模型的可能性,也為未來 AI 技術的發展提供了寶貴的經驗。隨著技術的不斷進步,我們有理由相信,AI 將會在更多領域發揮其巨大的潛力。




Health Bank 保多康:養眼
澳洲製造的天然護眼配方,含葡萄籽精華、葉黃素、野生藍莓及深海魚油,有效改善視力、保護視網膜、防止藍光傷害,舒緩眼睛乾燥及退化。每日 1-2 粒,餐後服用,助您提升眼睛健康。

Health Bank 保多康:虎芝咳喘清
虎芝咳喘清結合虎乳靈芝及鱷魚肉,止咳化痰、潤肺補氣,適合久咳未癒、氣喘及呼吸不暢人士。天然成分,強化呼吸道,提升免疫力,成人和小童均可服用。
猜你可能會喜歡:

瀏覽:3406
遭 AI 取代,5 產業大規模裁員

瀏覽:3099
微信、DeepSeek 深夜突發消息

瀏覽:375
Arm 執行長:DeepSeek 最終會遭到關閉


返回主頁

@ 2019-2025
最後更新:2025-06-19
文章數:8276 / 閱讀量:60571392