Алиса Дмитриева (Редактор отдела «Из жизни»)
Поделитесь мнением! Оставьте оценку!
,推荐阅读safew获取更多信息
Опубликован перечень столичных округов с сократившейся стоимостью арендного жилья14:49
综合基准测试显示这是一个能力均衡的模型。GLM-5.1在AIME 2026获得95.3分,HMMT 2025年11月版94.0分,HMMT 2026年2月版82.6分,研究生级科学推理基准GPQA-Diamond达86.2分。在智能体与工具使用基准方面,CyberGym得分68.7(较GLM-5的48.3实现大幅跃升),BrowseComp 68.0分,τ³-Bench 70.6分,MCP-Atlas(公开集)71.8分——最后一项尤其重要,因为MCP在生产环境智能体系统中的重要性正日益凸显。在Terminal-Bench 2.0中模型取得63.5分,使用Claude Code作为脚手架时升至66.5分。
3月4日凌晨,林俊旸在X上宣布自己要离开千问,之后多名千问模型团队核心成员宣布离职,随即引发大范围讨论;
该方案已成为2025年4月发布的OpenSSH 10.0的默认新标准。