主机论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 55|回复: 0

GPT 5.5发布,在AI agent工具调用协调方面 遥遥领先!

[复制链接]

156

主题

135

回帖

856

积分

高级会员

Rank: 4

积分
856
发表于 2026-4-24 14:05:19 | 显示全部楼层 |阅读模式
        Rank        Agent        Model        Date        Agent Org        Model Org       
Accuracy

       
1
Codex        GPT-5.5        2026-04-23        OpenAI        OpenAI       
82.0%± 2.2

       
2
ForgeCode        GPT-5.4        2026-03-12        ForgeCode        OpenAI       
81.8%± 2.0

       
3
TongAgents        Gemini 3.1 Pro        2026-03-13        BIGAI        Google       
80.2%± 2.6

       
4
ForgeCode        Claude Opus 4.6        2026-03-12        ForgeCode        Anthropic       
79.8%± 1.6

       
5
SageAgent        GPT-5.3-Codex        2026-03-13        OpenSage        OpenAI       
78.4%± 2.2

       
6
ForgeCode        Gemini 3.1 Pro        2026-03-02        ForgeCode        Google       
78.4%± 1.8

       
7
Droid        GPT-5.3-Codex        2026-02-24        Factory        OpenAI       
77.3%± 2.2

       
8
Capy        Claude Opus 4.6        2026-03-12        Capy        Anthropic       
75.3%± 2.4

       
9
Simple Codex        GPT-5.3-Codex        2026-02-06        OpenAI        OpenAI       
75.1%± 2.4

       
10
Terminus-KIRA        Gemini 3.1 Pro        2026-02-23        KRAFTON AI        Google       
74.8%± 2.6



======================================================

国产开源模型 kimi最高, 排名62  
62
Terminus 2        Kimi K2.5        2026-02-04        AfterQuery        Kimi       
43.2%± 2.9
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|主机论坛

GMT+8, 2026-5-16 09:07 , Processed in 0.050206 second(s), 18 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表