BrowseComp:AI 浏览代理性能评估的新基准

AI代理技术正迎来全新突破,20日公布的最新「BrowseComp」基准测试结果引发行业震动。作为首个专注于AI自主浏览能力的综合评测体系,该标准不仅标志着技术评估从代码测试转向实际应用的新阶段,也为各大科技巨头在Web智能领域的竞争画出了清晰赛道。