9月12日,阿里發(fā)布了下一代基礎(chǔ)模型架構(gòu)Qwen3-Next,并開源了基于該架構(gòu)的Qwen3-Next-80B-A3B系列模型。相比于Qwen3的MoE結(jié)構(gòu),Qwen3-Next架構(gòu)進行了一系列核心改進,具有更高效的特點。Qwen3-Next-80B-A3B-Base模型擁有800億參數(shù),激活參數(shù)僅30億,實現(xiàn)了與Qwen3-32B dense模型相近甚至略好的性能,而訓(xùn)練成本僅為十分之一不到,實現(xiàn)了極致的訓(xùn)練和推理性價比。
本站鄭重聲明:第一黃金網(wǎng)中的操作建議僅代表第三方觀點與本平臺無關(guān),投資有風(fēng)險,入市需謹(jǐn)慎。據(jù)此交易,風(fēng)險自擔(dān)。