主机论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 80|回复: 5

又出来一个大模型 minimax ... 最近速度好快啊

[复制链接]

54

主题

309

回帖

1040

积分

金牌会员

Rank: 6Rank: 6

积分
1040
发表于 2025-3-12 22:29:04 | 显示全部楼层 |阅读模式
本帖最后由 欢迎新会员 于 2025-3-12 22:30 编辑

MiniMax-01开源:新架构开启Agent时代

https://minimaxi.com/news/minimax-01-%E7%B3%BB%E5%88%97

在 MiniMax-01系列模型中,我们做了大胆创新:首次大规模实现线性注意力机制,传统 Transformer架构不再是唯一的选择。这个模型的参数量高达4560亿,其中单次激活459亿。模型综合性能比肩海外顶尖模型,同时能够高效处理全球最长400万token的上下文,是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。

基于业界主流的文本和多模态理解测评结果如下图所示,我们在大多数任务上追平了海外公认最先进的两个模型,GPT-4o-1120以及Claude-3.5-Sonnet-1022。在长文任务上,我们对比了之前长文最好的模型 Google的Gemini。如图(c)所示,随着输入长度变长,MiniMax-Text-01 是性能衰减最慢的模型,显著优于Google Gemini。

回复

使用道具 举报

54

主题

309

回帖

1040

积分

金牌会员

Rank: 6Rank: 6

积分
1040
 楼主| 发表于 2025-3-12 22:33:37 | 显示全部楼层
嗯,还开源了,虽然我看不懂

https://github.com/MiniMax-AI
回复

使用道具 举报

43

主题

913

回帖

2449

积分

金牌会员

Rank: 6Rank: 6

积分
2449
发表于 2025-3-12 22:40:11 | 显示全部楼层
试了一下,发现还可以
回复

使用道具 举报

50

主题

442

回帖

1570

积分

金牌会员

Rank: 6Rank: 6

积分
1570
发表于 2025-3-12 22:42:27 | 显示全部楼层
哪家公司的?
回复

使用道具 举报

54

主题

309

回帖

1040

积分

金牌会员

Rank: 6Rank: 6

积分
1040
 楼主| 发表于 2025-3-12 22:50:06 | 显示全部楼层

稀宇极智科技(MiniMax)
https://www.thepaper.cn/newsDetail_forward_29692389
回复

使用道具 举报

16

主题

71

回帖

272

积分

中级会员

Rank: 3Rank: 3

积分
272
发表于 2025-3-12 22:42:00 | 显示全部楼层
大模型四小龙 很早的玩家了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|主机论坛

GMT+8, 2025-5-14 06:56 , Processed in 0.078872 second(s), 18 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表