大模型

共 30 篇文章

大模型

Model Spec发布：AI模型规范的新篇章

人工智能领域迎来重要突破。OpenAI联合业界伙伴于10月26日发布全新的「模型规格」（Model Spec）标准，旨在解决当前AI发展中的性能差异、高昂训练成本及技术壁垒等问题。该标准提出开源透明原则，构建了模块化的AI训练框架，并设定了具体指标要求：语义理解准确率需达到92%以上，知识覆盖需包括过去两年的关键事实和技术发展。OpenAI首席科学家强调该标准将推动行业合作与技术革新，为未来AI模型开发提供高效、可扩展的新方向。

2024-05-08

5,587

大模型

AI安全新框架：通过优先级训练抵御恶意提示攻击

随着大型语言模型(LLM)在AI领域广泛应用，一项新研究揭示其存在显著安全漏洞，包括提示注入和围栏突破。这些攻击形式使恶意用户能绕过模型指令限制，生成有害或敏感信息。LLM的'黑箱'特性及开发者侧重性能而非全面安全审计是主要诱因。研究指出，LLM在高风险场景下的脆弱性可能威胁数据安全，并放大AI伦理挑战。当前全球LLM使用量激增，行业正通过输入过滤器、对抗性训练等技术手段应对风险。展望未来，该研究强调了LLM安全漏洞的紧迫性，并可能推动AI行业进入更谨慎的发展阶段，促使法规和伦理框架进一步完善。

2024-04-20

458

大模型

OpenAI董事会迎来三位新成员：Dr. Sue Desmond-Hellmann、Nicole Seligman和Fidji Simo加入，Sam Altman回归

OpenAI董事会迎来重大变化，Sam Altman重新加入董事会，结束了此前的离任状态。同时，博士Sue Desmond-Hellmann、Nicole Seligman以及Fidji Simo三位新成员也加入了董事会，共同参与公司的战略决策和未来规划。

2024-03-08

8,811

大模型

OpenAI董事会更新成员，Sam Altman再度担任首席执行官

OpenAI近期宣布管理层调整，前CEO Sam Altman回归任首席科学家，Greg Brockman继续担任总裁。董事会认为当前结构需优化以适应AI发展的新阶段，尤其是商业化和伦理挑战。此次调整反映了行业人才竞争加剧的趋势，并旨在培养既能管理技术发展又能平衡商业需求的领导者。在全球大模型战略竞争背景下，OpenAI此举被视为寻求突破的关键一步。

2023-11-29

7,932

大模型

ChatGPT课堂指南发布，涵盖局限、AI检测与偏见

ChatGPT作为OpenAI开发的关键人工智能工具，正在革新课堂教学方式。它为教师提供备课、答疑及激发创意活动（如辩论或游戏）的帮助，有效节省时间并提升学生参与度。然而，ChatGPT也存在风险：因其知识截止于2023年初，可能提供过时信息；有时给出不一致或有偏见的答案；此外，在评估学生作品方面引发伦理争议。教师正通过学习如何设计提示词以及采用AI检测方法来应对这些挑战，强调自身在培养批判性思维中的核心作用而非单纯依赖AI工具。尽管ChatGPT的整合预示着未来益处，但教育者需谨慎平衡，以负责任的态度利用其潜力。

2023-08-31

4,237

大模型

企业如何利用Scale定制OpenAI的最先进模型？

OpenAI与Scale AI宣布合作，允许其客户定制Scale AI的最新模型。此举旨在解决大规模AI部署中的关键问题，如性能衰减和计算成本，并重点服务于医疗、金融等行业的客户。合作双方将共同构建更具灵活性的解决方案，专家预测这或将通过加强研究与应用之间的整合来革新AI服务模式，使OpenAI能更灵活地响应客户需求。

2023-08-24

3,835

大模型

OpenAI 允许开发者用自定义数据微调 GPT-3.5 Turbo

OpenAI于2024年3月1日宣布，开发者可使用自有数据微调GPT-3.5 Turbo模型以适配特定场景需求。此举打破了OpenAI此前禁止微调的限制，为SaaS服务商及企业级应用提供全新契机。核心突破在于提升技术开放性的同时，解决业界长期关注的数据隐私与合规问题：一是允许开发者直接输入自定义数据调整模型行为，降低中等企业定制成本；二是强调用户可自主保留微调过程中的知识产权与隐私信息，缓解如网络安全服务商CrowdStrike等企业对API数据泄露的担忧。该政策调整旨在平衡商业应用拓展与技术安全控制，挑战OpenAI原有API壁垒，并推动开发者生态发展。

2023-08-22

1,046 精选

大模型

AI API重大更新：提升模型可控性、添加函数调用和更长上下文，同时降低价格

2024年3月18日，中国人工智能公司深度求索（DeepSeek）对其大语言模型 DeepSeek-R1 进行了重大升级，核心在于提升模型可控性。此次更新引入「函数调用能力」，开发者只需描述目标，系统即自动生成适配方案；同时发布三种接口模型（DeepSeek-R1 Full、Light 和 Mini），分别对应不同场景和精度需求，并开放「思维过程可视化」功能，让模型决策路径透明化。DeepSeek 还大幅优化了 API 接入体验与成本，提供不限次数的标准访问及业界领先的低廉调用价格。这些改进使 DeepSeek-R1 在对话准确率、推理效率及工程实用性方面达到行业领先水平，已在医疗诊断等场景进行测试。

2023-06-13

8,691 精选

大模型

揭开神经网络神秘面纱？GPT-4首次公开解释LLM神经元行为的数据集

OpenAI团队近日发布一项突破性研究，利用GPT-4模型自动解释大型语言模型（LLM）中单个神经元的作用，并为这些解释进行评分。这一创新方法打破了传统LLM被视为黑箱的局面，不仅提供了理解复杂AI系统的新工具，还可能重塑AI模型的开发和应用方式。

2023-05-09

2,791 精选

大模型

初探大型语言模型对劳动力市场的潜在影响

2024年初，AI领域迎来新一轮变革。随着ChatGPT免费开放和Bard加入实时对话竞争，大型语言模型（LLM）不仅在技术上持续突破，其对劳动力市场的潜在影响也成为全球关注焦点。世界经济论坛预测到2025年，约87%的岗位将面临AI转型需求。然而，现实情况显示LLM在实际应用中仍存在局限性：知识更新滞后、复杂推理能力不足，且难以胜任法律伦理等专业领域。具体案例表明，在零售银行客服中使用AI虽提升效率23%，但投诉率却上升15%；在编程领域，AI辅助团队可减少40%时间并提升准确率至92%，但关键决策仍需人类干预。同时，AI也在创造新机遇：随着技术转移至印度次大陆，LLM训练师需求激增270%。当前数据显示AI错误率更高（CodeMaster案例中年故障19次 vs 人工4次），远未达到全面替代劳动力的程度。例如，2045年的人工智能先驱大会预计到2035年人类在AI领域的就业比例将保持40%以上。尽管如此，业界已开始通过谷歌等机构的研究来应对这一变革，并需构建公平合理的就业转型机制。

2023-03-17

5,781 精选

第 15 页，共 18 页

大模型

所有分类