
【CNMO科技音信】近日,跟着东说念主工智能模子“龙虾”的热度合手续攀升,建造者们在遴荐适配OpenClaw框架的最好模子时,无数靠近沿途贫苦:如安在到手率、速率和资本之间找到最好均衡?对此,OpenClaw之父亲Peter Steinberger自支招欧洲杯体育,保举温文一个名为PinchBench的专项榜单。

Peter Steinberger
据CNMO了解,PinchBench可被视为一份专为“龙虾”接洽的“适配性指南”。它由专注于Agent基础措施的创业团队Kilo AI推出,旨在通过模拟实在职责流,而非传统的学问问答或数学推理,来评估天下各大模子对OpenClaw框架的扩充智商。榜单从到手率、开动速率和推理价钱三个中枢维度进行及时排行,为建造者提供了明晰的选型依据。

值得提防的是,中国模子在到手率和速率维度上展现出苍劲竞争力。在到手率排行中,谷歌的Gemini 3 Flash以95.1%的收获位居榜首,紧随后来的第二名和第三名均来自中国:MiniMax的M2.1模子获得了93.6%的到手率,Kimi的K2.5模子则以93.4%的到手率位列第三。值得提防的是,获得佳绩的MiniMax M2.1并非其最新的M2.5版块。

在开动速率方面,国产模子的发扬更为拉风。MiniMax的最新一代模子M2.5越过了Gemini、Llama等海外有名模子,登顶速率榜。据先容,M2.5在联系测试中的任务完成速率较前代栽培了37%,其端到端开动技术已与Claude Opus 4.6合手平。
关联词,在价钱维度上,国产模子当今仍靠近挑战。榜单流露,最具价钱上风的是OpenAI专为高性价比场景接洽的GPT-5-nano模子,其输入和输出价钱区别低至0.05好意思元和0.4好意思元每百万tokens。比拟之下,国内模子中价钱较优的MiniMax M2.1,折算后的资本约为GPT-5-nano的三倍。
当今,PinchBench已扫数开源欧洲杯体育,建造者不错自行开动测试或添加新任务,为合手续变化的“龙虾”模子生态提供动态的适配参考。
