零一萬物回應大模型架構爭議:對模型和訓練的理解做了大量工作
李開復旗下AI企業零一萬物開源大模型被指責完全使用LLaMA的架構,只對兩個張量(Tensor)名稱進行修改。對此,零一萬物表示:GPT是一個業界公認的成熟架構,Llama在GPT上做了總結。
零一萬物研發大模型的結構設計基於GPT成熟結構,借鑒了行業頂尖水平的公開成果,由於大模型技術發展還在非常初期,與行業主流保持一致的結構,更有利於整體的適配與未來的迭代。同時零一萬物團隊對模型和訓練的理解做了大量工作,也持續探索模型結構層面本質上的突破。