最近的Elephant-Alpha
我个人推测应该
可以排除Kimi系和GLM,尺寸体系对不上(Kimi系目前都是超大T级别模型,GLM的Flash都是3xB)
排除Stepfun,尺寸对不上,他们据说在搞Step3.5/Step4顾不上新模型
排除Minimax 尤其是M2.8 M2系都是一个底模架构炼的,尺寸也对不上
有一定概率是DS V4lite,但我不确定
有拿一套POC Token试探一下吗
我个人推测应该
可以排除Kimi系和GLM,尺寸体系对不上(Kimi系目前都是超大T级别模型,GLM的Flash都是3xB)
排除Stepfun,尺寸对不上,他们据说在搞Step3.5/Step4顾不上新模型
排除Minimax 尤其是M2.8 M2系都是一个底模架构炼的,尺寸也对不上
有一定概率是DS V4lite,但我不确定
有拿一套POC Token试探一下吗