大模型
共 30 篇文章
Model Spec发布:AI模型规范的新篇章
人工智能领域迎来重要突破。OpenAI联合业界伙伴于10月26日发布全新的「模型规格」(Model Spec)标准,旨在解决当前AI发展中的性能差异、高昂训练成本及技术壁垒等问题。该标准提出开源透明原则,构建了模块化的AI训练框架,并设定了具体指标要求:语义理解准确率需达到92%以上,知识覆盖需包括过去两年的关键事实和技术发展。OpenAI首席科学家强调该标准将推动行业合作与技术革新,为未来AI模型开发提供高效、可扩展的新方向。
AI安全新框架:通过优先级训练抵御恶意提示攻击
随着大型语言模型(LLM)在AI领域广泛应用,一项新研究揭示其存在显著安全漏洞,包括提示注入和围栏突破。这些攻击形式使恶意用户能绕过模型指令限制,生成有害或敏感信息。LLM的'黑箱'特性及开发者侧重性能而非全面安全审计是主要诱因。研究指出,LLM在高风险场景下的脆弱性可能威胁数据安全,并放大AI伦理挑战。当前全球LLM使用量激增,行业正通过输入过滤器、对抗性训练等技术手段应对风险。展望未来,该研究强调了LLM安全漏洞的紧迫性,并可能推动AI行业进入更谨慎的发展阶段,促使法规和伦理框架进一步完善。
OpenAI董事会迎来三位新成员:Dr. Sue Desmond-Hellmann、Nicole Seligman和Fidji Simo加入,Sam Altman回归
OpenAI董事会迎来重大变化,Sam Altman重新加入董事会,结束了此前的离任状态。同时,博士Sue Desmond-Hellmann、Nicole Seligman以及Fidji Simo三位新成员也加入了董事会,共同参与公司的战略决策和未来规划。
OpenAI董事会更新成员,Sam Altman再度担任首席执行官
OpenAI近期宣布管理层调整,前CEO Sam Altman回归任首席科学家,Greg Brockman继续担任总裁。董事会认为当前结构需优化以适应AI发展的新阶段,尤其是商业化和伦理挑战。此次调整反映了行业人才竞争加剧的趋势,并旨在培养既能管理技术发展又能平衡商业需求的领导者。在全球大模型战略竞争背景下,OpenAI此举被视为寻求突破的关键一步。
ChatGPT课堂指南发布,涵盖局限、AI检测与偏见
ChatGPT作为OpenAI开发的关键人工智能工具,正在革新课堂教学方式。它为教师提供备课、答疑及激发创意活动(如辩论或游戏)的帮助,有效节省时间并提升学生参与度。然而,ChatGPT也存在风险:因其知识截止于2023年初,可能提供过时信息;有时给出不一致或有偏见的答案;此外,在评估学生作品方面引发伦理争议。教师正通过学习如何设计提示词以及采用AI检测方法来应对这些挑战,强调自身在培养批判性思维中的核心作用而非单纯依赖AI工具。尽管ChatGPT的整合预示着未来益处,但教育者需谨慎平衡,以负责任的态度利用其潜力。
企业如何利用Scale定制OpenAI的最先进模型?
OpenAI与Scale AI宣布合作,允许其客户定制Scale AI的最新模型。此举旨在解决大规模AI部署中的关键问题,如性能衰减和计算成本,并重点服务于医疗、金融等行业的客户。合作双方将共同构建更具灵活性的解决方案,专家预测这或将通过加强研究与应用之间的整合来革新AI服务模式,使OpenAI能更灵活地响应客户需求。
OpenAI 允许开发者用自定义数据微调 GPT-3.5 Turbo
OpenAI于2024年3月1日宣布,开发者可使用自有数据微调GPT-3.5 Turbo模型以适配特定场景需求。此举打破了OpenAI此前禁止微调的限制,为SaaS服务商及企业级应用提供全新契机。核心突破在于提升技术开放性的同时,解决业界长期关注的数据隐私与合规问题:一是允许开发者直接输入自定义数据调整模型行为,降低中等企业定制成本;二是强调用户可自主保留微调过程中的知识产权与隐私信息,缓解如网络安全服务商CrowdStrike等企业对API数据泄露的担忧。该政策调整旨在平衡商业应用拓展与技术安全控制,挑战OpenAI原有API壁垒,并推动开发者生态发展。
AI API重大更新:提升模型可控性、添加函数调用和更长上下文,同时降低价格
2024年3月18日,中国人工智能公司深度求索(DeepSeek)对其大语言模型 DeepSeek-R1 进行了重大升级,核心在于提升模型可控性。此次更新引入「函数调用能力」,开发者只需描述目标,系统即自动生成适配方案;同时发布三种接口模型(DeepSeek-R1 Full、Light 和 Mini),分别对应不同场景和精度需求,并开放「思维过程可视化」功能,让模型决策路径透明化。DeepSeek 还大幅优化了 API 接入体验与成本,提供不限次数的标准访问及业界领先的低廉调用价格。这些改进使 DeepSeek-R1 在对话准确率、推理效率及工程实用性方面达到行业领先水平,已在医疗诊断等场景进行测试。
揭开神经网络神秘面纱?GPT-4首次公开解释LLM神经元行为的数据集
OpenAI团队近日发布一项突破性研究,利用GPT-4模型自动解释大型语言模型(LLM)中单个神经元的作用,并为这些解释进行评分。这一创新方法打破了传统LLM被视为黑箱的局面,不仅提供了理解复杂AI系统的新工具,还可能重塑AI模型的开发和应用方式。
初探大型语言模型对劳动力市场的潜在影响
2024年初,AI领域迎来新一轮变革。随着ChatGPT免费开放和Bard加入实时对话竞争,大型语言模型(LLM)不仅在技术上持续突破,其对劳动力市场的潜在影响也成为全球关注焦点。世界经济论坛预测到2025年,约87%的岗位将面临AI转型需求。然而,现实情况显示LLM在实际应用中仍存在局限性:知识更新滞后、复杂推理能力不足,且难以胜任法律伦理等专业领域。具体案例表明,在零售银行客服中使用AI虽提升效率23%,但投诉率却上升15%;在编程领域,AI辅助团队可减少40%时间并提升准确率至92%,但关键决策仍需人类干预。同时,AI也在创造新机遇:随着技术转移至印度次大陆,LLM训练师需求激增270%。当前数据显示AI错误率更高(CodeMaster案例中年故障19次 vs 人工4次),远未达到全面替代劳动力的程度。例如,2045年的人工智能先驱大会预计到2035年人类在AI领域的就业比例将保持40%以上。尽管如此,业界已开始通过谷歌等机构的研究来应对这一变革,并需构建公平合理的就业转型机制。