大模型
共 30 篇文章
OpenAI董事会更新成员,Sam Altman再度担任首席执行官
OpenAI近期宣布管理层调整,前CEO Sam Altman回归任首席科学家,Greg Brockman继续担任总裁。董事会认为当前结构需优化以适应AI发展的新阶段,尤其是商业化和伦理挑战。此次调整反映了行业人才竞争加剧的趋势,并旨在培养既能管理技术发展又能平衡商业需求的领导者。在全球大模型战略竞争背景下,OpenAI此举被视为寻求突破的关键一步。
ChatGPT课堂指南发布,涵盖局限、AI检测与偏见
ChatGPT作为OpenAI开发的关键人工智能工具,正在革新课堂教学方式。它为教师提供备课、答疑及激发创意活动(如辩论或游戏)的帮助,有效节省时间并提升学生参与度。然而,ChatGPT也存在风险:因其知识截止于2023年初,可能提供过时信息;有时给出不一致或有偏见的答案;此外,在评估学生作品方面引发伦理争议。教师正通过学习如何设计提示词以及采用AI检测方法来应对这些挑战,强调自身在培养批判性思维中的核心作用而非单纯依赖AI工具。尽管ChatGPT的整合预示着未来益处,但教育者需谨慎平衡,以负责任的态度利用其潜力。
企业如何利用Scale定制OpenAI的最先进模型?
OpenAI与Scale AI宣布合作,允许其客户定制Scale AI的最新模型。此举旨在解决大规模AI部署中的关键问题,如性能衰减和计算成本,并重点服务于医疗、金融等行业的客户。合作双方将共同构建更具灵活性的解决方案,专家预测这或将通过加强研究与应用之间的整合来革新AI服务模式,使OpenAI能更灵活地响应客户需求。
OpenAI 允许开发者用自定义数据微调 GPT-3.5 Turbo
OpenAI于2024年3月1日宣布,开发者可使用自有数据微调GPT-3.5 Turbo模型以适配特定场景需求。此举打破了OpenAI此前禁止微调的限制,为SaaS服务商及企业级应用提供全新契机。核心突破在于提升技术开放性的同时,解决业界长期关注的数据隐私与合规问题:一是允许开发者直接输入自定义数据调整模型行为,降低中等企业定制成本;二是强调用户可自主保留微调过程中的知识产权与隐私信息,缓解如网络安全服务商CrowdStrike等企业对API数据泄露的担忧。该政策调整旨在平衡商业应用拓展与技术安全控制,挑战OpenAI原有API壁垒,并推动开发者生态发展。
AI API重大更新:提升模型可控性、添加函数调用和更长上下文,同时降低价格
2024年3月18日,中国人工智能公司深度求索(DeepSeek)对其大语言模型 DeepSeek-R1 进行了重大升级,核心在于提升模型可控性。此次更新引入「函数调用能力」,开发者只需描述目标,系统即自动生成适配方案;同时发布三种接口模型(DeepSeek-R1 Full、Light 和 Mini),分别对应不同场景和精度需求,并开放「思维过程可视化」功能,让模型决策路径透明化。DeepSeek 还大幅优化了 API 接入体验与成本,提供不限次数的标准访问及业界领先的低廉调用价格。这些改进使 DeepSeek-R1 在对话准确率、推理效率及工程实用性方面达到行业领先水平,已在医疗诊断等场景进行测试。
揭开神经网络神秘面纱?GPT-4首次公开解释LLM神经元行为的数据集
OpenAI团队近日发布一项突破性研究,利用GPT-4模型自动解释大型语言模型(LLM)中单个神经元的作用,并为这些解释进行评分。这一创新方法打破了传统LLM被视为黑箱的局面,不仅提供了理解复杂AI系统的新工具,还可能重塑AI模型的开发和应用方式。
GPT-4与'多邻国':科技如何重塑语言学习?
在线教育巨头杜零课堂宣布整合DeepSeek团队开发的新一代AI架构GPT-4,带来四大变革:交互体验升级、个性化教学革新、实时纠错系统突破及课程体系重构。DeepSeek的多模态和复杂推理能力使课堂从单向数据反馈转向自然对话式学习,通过动态调整学习路径实现个性化微调;利用底层结构优势开发的纠错系统能更准确地理解句子含义,提供语义层面的语言建议;同时重新构建核心课程架构,改变知识组织方式。这一整合标志着AI技术在在线教育领域的深度应用与突破性进展,提升了语言学习的交互性和精准度。
OpenAI 推出 GPT-4 多模态模型,在专业和学术测试中达到人类水平
北京时间2023年6月15日,OpenAI在三个月严格测试后正式发布新一代语言模型GPT-4。该系统突破性地提升了推理、常识理解和创造性思维能力,尤其在197/204个专业领域测试中准确率达82.5%,常识推理正确率超过人类平均水平的92%。GPT-4通过三大技术革新实现突破:参数规模扩大、首次整合多模态处理能力(支持文本+图像输入)、采用新训练策略。与谷歌Bard、Anthropic Claude等模型相比,其数学能力达副学士水平、代码生成正确率超90%。GPT-4的发布重塑了AI行业竞争格局,但引发了关于技术发展速度与伦理约束矛盾的讨论。专家预测GPT-4将在知识获取、医疗服务等六大领域改变人类文明进程,同时强调需要同步提升伦理约束机制。
AI系统革新:通过人类反馈提升对齐性并辅助评估
生成式人工智能快速发展的同时,也面临着如何与人类意图对齐、避免误导的挑战。DeepSeek团队指出,当前最先进的大型语言模型虽能产生创意,但难以准确遵循复杂指令。业界认识到这一问题的重要性日益提升,OpenAI首席科学家Yana Marie Rohozinskiy强调需解决此问题以防止强大的生成式AI成为错误创造机器。为此,DeepSeek提出并分析了RLHF(人类反馈强化学习)方法及其关键技术LLM Amplification,该架构通过三步流程实现模型优化,并能有效降低滥用风险。研究显示LLM Amplification在回答复杂问题时表现突出,提供了更精准和多样的解读。这种方法已在金融分析、医疗诊断等专业领域应用,并展现了巨大潜力,DeepSeek团队期望未来能够构建自我修正、真正有益于人类发展的AI系统。
OpenAI发起LLMs经济影响研究邀请
ChatGPT发布推动大型语言模型技术突破,该技术利用海量数据训练出更强的语言理解和生成能力。GPT-4、Claude系列等产品引发全球产业竞争,中国本土企业亦参与其中。LLM重塑商业模式、提升生产力并改变行业格局,成为全球技术发展的重要趋势。