开yun体育网MiniMax在短短三周内完成了模子耕种-开云app下载ky官方网站入口登录
中国AI公司MiniMax认真晓示开源其最新大型言语模子(LLM)MiniMax-M1开yun体育网,该模子以超长高下文推理才气和高效历练老本激勉群众蔼然。AIbase整理最新信息,为您带来MiniMax-M1的全面解读。
创记录的高下文窗口:1M输入,80k输出
MiniMax-M1以其惊东谈主的100万token输入和8万token输出的高下文窗口,成为现在开源模子中最擅长长高下文推理的杰出人物。这一才气意味着模子大约一次性处理相配于一册演义致使悉数这个词书系列的信息量,远超OpenAI GPT-4o的128,000token高下文窗口。不管是复短文档分析、长篇代码生成,依然多轮对话,MiniMax-M1皆能行云活水,为企业和耕种者提供了渊博的器用。
开源模子中的代理才气时尚
MiniMax-M1在代理器用使用方面推崇不凡,性能比好意思顶级贸易模子如OpenAI o3和Claude4Opus。收货于其夹杂巨匠模子(MoE)架构与Lightning Attention机制的连合,MiniMax-M1在复杂任务如软件工程、器用调用和长高下文推理中展现出接近起始进的性能。这种开源模子的渊博代理才气,为群众耕种者社区带来了前所未有的契机。
超高性价比:53万好意思元打造前沿LLM
MiniMax-M1的历练老本令东谈主介怀,仅需53.47万好意思元,比较DeepSeek R1的500-600万好意思元和OpenAI GPT-4的超1亿好意思元,号称“平价遗迹”。通过高效的强化学习(RL)时间和仅512个H800GPU的硬件赞成,MiniMax在短短三周内完成了模子耕种。此外,MiniMax始创的CISPO优化算法进一步升迁了推理章程,确保进攻信息不丢失,同期裁汰历练老本。
时间亮点:456亿参数与高效架构
MiniMax-M1基于MiniMax-Text-01耕种,领有4560亿总参数,每个token激活约45.9亿参数,通过MoE架构达成高效打算。模子赞成40k和80k念念维预算的两种推理形式,无礼不同场景需求。在数学、编码等推理密集型任务的基准测试中,MiniMax-M1推崇强劲,特地了DeepSeek R1和Qwen3-235B-A22B等模子。
开源生态的里程碑
MiniMax-M1聘用Apache2.0许可证,已上架Hugging Face平台,供群众耕种者免费使用。这一举措不仅挑战了DeepSeek等中国AI企业的开源模子,也为群众AI生态注入了新的活力。MiniMax暗示,改日还将发布更多时间细节,进一步鼓吹开源社区的革新。
MiniMax-M1的发布象征着开源AI模子在长高下文推理和代理才气上的关键冲突。其超长高下文窗口、高效历练老本和渊博性能,为企业和耕种者提供了极具性价比的措置决策。AIbase以为开yun体育网,MiniMax-M1的开源将加快AI时间在复杂任务中的诓骗,鼓吹群众AI生态迈向新高度。