2025年开年,AI领域迎来了一次重大突破。继全模态模型家族公布后,MiniMax于近日再次亮相两大全新模型——MiniMax-Text-01和MiniMax-VL-01,并宣布模型权重完全开源。这一举措不仅标志着MiniMax在技术研发上的重大进展,更引发了行业内外的广泛关注。
突破传统架构:线性注意力机制的首次大规模实现
此次发布的两大模型采用了新型的Lightning Attention blog.lfkunhao.com 架构,突破了传统Transformer架构的限制,实现了线性注意力机制的大规模应用。线性注意力机制将传统注意力机制的二次计算复杂度转变为线性复杂度,显著降低了计算复杂度,提升了模型训练速度。这一技术优化早在2019年就被提出,但此前从未在大规模模型中实现。MiniMax此次率先突破,为处理长文本、大规模数据等复杂任务提供了有力支持,证明了线性注意力机制在大规模商用模型中的可行性。
图片来源:careers.lfkunhao.com
MiniMax-Text-01:性能卓越,成本低廉
MiniMax-Text-01是一款基础语言大模型,其性能在多项基准测试中表现出色。评测结果显示,MiniMax-Text-01在大多数任务上成功追平了海外最先进的GPT-4o和Claude-3.5-Sonnet等顶级闭源模型,以及Qwen2.5、DeepSeek v3、Llama 3.1等开源模型。在某些特定场景下,MiniMax-Text-01的响应速度和准确率甚至更胜一筹。
例如,在MMLU portfolio.lfkunhao.com 基准测试中,MiniMax-Text-01得分与DeepSeek-V3相同,均为88.5分,明显高于GPT-4o的85.7分。在HumanEval上,MiniMax-Text-01的表现也优于Instruct Qwen2.5-72B。此外,在具有挑战性的GPQA Diamond about.lfkunhao.com 问答数据集上,MiniMax-Text-01取得了54.4的成绩,超过了大多数开源指令微调的LLM以及最新版本的GPT-4o。
MiniMax-Text-01的长上下文处理能力尤为突出。与Google的Gemini模型相比,MiniMax-Text-01在长上下文检索、理解和学习任务中表现出色,尤其在128K输入级别以上,其性能衰减最慢,显示出明显优势。这使得MiniMax-Text-01在处理长文档、长篇对话等场景时,能够更好地保持对信息的理解和处理能力,提供更准确、连贯的输出。
MiniMax-VL-01:多模态融合的创新实践
MiniMax-VL-01是一款视觉多模态大模型,它将图像编码器和图像适配器集成到MiniMax-Text-01模型基础上开发而成。该模型采用多模态大语言模型常用的ViT-MLP-LLM contact.lfkunhao.com 框架,并具备动态分辨率功能,可以根据预设网格调整输入图像的大小,形成完整的图像表示。MiniMax-VL-01不仅继承了文本处理的高效性,还具备强大的视觉理解能力。
在多个基准测试中,MiniMax-VL-01展现出与顶尖模型相媲美的性能。尤其在视觉问答(services.lfkunhao.com)任务中,其性能与GPT-4o相当。此外,MiniMax-VL-01在长文本理解与检索能力的评估中也表现出色,优于多数同类模型。
MiniMax-VL-01的训练过程分为四个阶段,处理的数据集总量达到5120亿token。其创新性的混合架构结合了Lightning Attention、Softmax Attention以及Mixture-of-Experts(news.lfkunhao.com),并通过LASP+、varlen ring attention、ETP等优化的并行策略和高效的计算通信重叠方法,最终模型参数达到4560亿,每次激活459亿。
图片来源:careers.lfkunhao.com
开源与商业化:推动AI技术普惠化
MiniMax此次发布的两大模型不仅在技术上取得了突破,更在商业化和开源方面做出了重要尝试。MiniMax 01模型已在海螺AI(国内APP、haiuoai.com)以及海外平台(hailuo.ai events.lfkunhao.com)上线,用户可以通过这些平台便捷地体验其强大功能。此外,MiniMax还提供了完整的API服务,基于线性注意力架构创新和算力优化,以业内最低价格提供文本和多模态理解API服务。
更重要的是,MiniMax 01模型的完整权重完全开源,并且MiniMax承诺后续更新也会及时上传。这一举措不仅降低了企业入局大模型的门槛,还为开发者提供了更多的创新空间。MiniMax的创始人曾表示:“大语言模型领域,两个模型性能相似,一定是速度更快的那个模型更容易带来产品数据增长。”通过开源,MiniMax希望更多开发者能够在模型基础上进行二次开发和创新,推动Agent时代的到来。
行业反响:开源模型引发广泛关注
MiniMax 01模型完全开源的消息引发了行业内外的广泛关注。CSDN知名博主红目香薰表示,MiniMax 01的上下文处理能力在高校计算机教学中具有重要价值,开源后可用于辅助备课和解答疑问,提升教学效率。另一位知名博主申屠鹏会则认为,MiniMax开源模型不仅降低了企业入局大模型的门槛,还拓展了AI应用的范围,为更多圈层人群的参与提供了可能。
展望未来:MiniMax的Agent时代布局
进入2025年,Agent时代的趋势愈发明显。MiniMax对于这一趋势的嗅觉更为敏锐。2024年,MiniMax的创始人就曾预测2025年将是AI Agent时代。截至目前,MiniMax shop.lfkunhao.com 已经自主研发了文本、语音、图像、视频等多种模态的通用大模型,并推出了生产力工具海螺AI、AI内容社区星野等原生应用。此外,MiniMax的开放平台为超过40000家企业和开发者提供了API服务。
MiniMax的“全模态模型+APP产品+开放平台”增长飞轮,不仅为其在AI时代的大模型商业化提供了新的思路,也为实现通用人工智能(AGI)奠定了基础。随着MiniMax 01模型的开源和推广,MiniMax有望在Agent时代占据重要地位,推动AI技术的普惠化发展。
MiniMax此次发布的两大模型——MiniMax-Text-01和MiniMax-VL-01,不仅在技术上取得了重大突破,更在开源和商业化方面做出了重要尝试。线性注意力机制的首次大规模实现、卓越的性能表现以及完全开源的策略,使得MiniMax在AI领域再次引领风骚。随着Agent时代的到来,MiniMax的全模态模型布局和开放平台战略,将为AI技术的未来发展提供新的思路和方向。
<文章参考来源:;
- 随机文章
- 热门文章
- 热评文章
- 国外问卷调查能赚到钱吗?
- 优酷与番茄小说达成合作,共同推动网文IP影视化
- 优酷联手番茄小说,超级IP大挖掘、网文影视化再加速!
- 网文小说作者,稳定收入是多少,年收入大概有多少?
- 七猫免费小说屡次侵害用户权益被通报 总裁韩红昌重视吗?
- 七猫免费小说鸿蒙原生应用核心版本交付,全场景阅读体验升级!
- 古典小说 | 《狐狸缘全传》第七回
- 四本为国家做贡献的小说,主角重回到七八十年代,复兴祖国
还没有评论,来说两句吧...