OpenAI 推出 GDPval 新评价:衡量 AI 模型在44个经济职业中的真实世界表现

OpenAI 社科领域新突破:GDPval 标准将重塑 AI 行业评价体系

北京时间10月26日,OpenAI 在官方网站公布一项重大突破——发布名为的新评估体系。该系统通过将44项职业工作纳入评估范畴,首次建立衡量大型语言模型现实世界经济价值的标准化测试框架。这一创新举措被业内人士称为