中国AI追上来了!国产模型DeepSeek V3火爆:拿几百万2000张显卡做的开源模型,赶上了OpenAI的水平;西方技术圈懵逼:怎么做到的?华尔街争议20241227

Описание к видео 中国AI追上来了!国产模型DeepSeek V3火爆:拿几百万2000张显卡做的开源模型,赶上了OpenAI的水平;西方技术圈懵逼:怎么做到的?华尔街争议20241227

大家好!歡迎來到我們的华尔街争议节目!今天,我們要揭開一個驚人的科技突破——DeepSeek最近發佈的全新開源模型DeepSeek-v3。這個模型被宣稱是目前最強的開源大模型,其能力甚至與閉源的GPT-4o不相上下,令人匪夷所思的是,它的訓練僅需2048張英偉達H800 AI芯片,這在行業內引發了廣泛的熱議。

DeepSeek-v3採用了混合專家架構,擁有6710億的參數,推理速度比其前代模型提升了3倍,讓它在多項測試中超越了阿里云Qwen2.5和Meta的Llama-3.1,與OpenAI和Anthropic的閉源模型不相上下。此外,這個模型的訓練成本僅為557.6萬美元,遠低於行業平均水準,這讓許多業內專家都感到驚訝。

計算機科學家Andrej Karpathy更是指出,這樣的成果在資源受限的情況下,展示了對研究和工程的卓越追求。這不僅是技術上的突破,更是中國大模型創業者在嚴峻的算力和資金環境中,努力進行算法優化的一次成功展現。

李開復的評論也不容忽視,他強調中國大模型公司的優勢在於低成本和高效率,並指出與國外同行相比,他們的訓練成本和推理價格都有顯著優勢。

所以,這場科技的競爭將如何影響未來?DeepSeek的成功是否會改變行業格局?請大家繼續收看詳細內容!

#DeepSeek #开源模型 #DeepSeek-v3 #GPT-4o #英伟达H800AI #MoE架构 #参数量6710亿 #激活参数370亿 #训练成本557.6万美元 #训练效率

Комментарии

Информация по комментариям в разработке