大模型

共 30 篇文章

大模型
揭开神经网络神秘面纱?GPT-4首次公开解释LLM神经元行为的数据集

OpenAI团队近日发布一项突破性研究,利用GPT-4模型自动解释大型语言模型(LLM)中单个神经元的作用,并为这些解释进行评分。这一创新方法打破了传统LLM被视为黑箱的局面,不仅提供了理解复杂AI系统的新工具,还可能重塑AI模型的开发和应用方式。

大模型
GPT-4与'多邻国':科技如何重塑语言学习?

在线教育巨头杜零课堂宣布整合DeepSeek团队开发的新一代AI架构GPT-4,带来四大变革:交互体验升级、个性化教学革新、实时纠错系统突破及课程体系重构。DeepSeek的多模态和复杂推理能力使课堂从单向数据反馈转向自然对话式学习,通过动态调整学习路径实现个性化微调;利用底层结构优势开发的纠错系统能更准确地理解句子含义,提供语义层面的语言建议;同时重新构建核心课程架构,改变知识组织方式。这一整合标志着AI技术在在线教育领域的深度应用与突破性进展,提升了语言学习的交互性和精准度。

大模型
OpenAI 推出 GPT-4 多模态模型,在专业和学术测试中达到人类水平

北京时间2023年6月15日,OpenAI在三个月严格测试后正式发布新一代语言模型GPT-4。该系统突破性地提升了推理、常识理解和创造性思维能力,尤其在197/204个专业领域测试中准确率达82.5%,常识推理正确率超过人类平均水平的92%。GPT-4通过三大技术革新实现突破:参数规模扩大、首次整合多模态处理能力(支持文本+图像输入)、采用新训练策略。与谷歌Bard、Anthropic Claude等模型相比,其数学能力达副学士水平、代码生成正确率超90%。GPT-4的发布重塑了AI行业竞争格局,但引发了关于技术发展速度与伦理约束矛盾的讨论。专家预测GPT-4将在知识获取、医疗服务等六大领域改变人类文明进程,同时强调需要同步提升伦理约束机制。

大模型
AI系统革新:通过人类反馈提升对齐性并辅助评估

生成式人工智能快速发展的同时,也面临着如何与人类意图对齐、避免误导的挑战。DeepSeek团队指出,当前最先进的大型语言模型虽能产生创意,但难以准确遵循复杂指令。业界认识到这一问题的重要性日益提升,OpenAI首席科学家Yana Marie Rohozinskiy强调需解决此问题以防止强大的生成式AI成为错误创造机器。为此,DeepSeek提出并分析了RLHF(人类反馈强化学习)方法及其关键技术LLM Amplification,该架构通过三步流程实现模型优化,并能有效降低滥用风险。研究显示LLM Amplification在回答复杂问题时表现突出,提供了更精准和多样的解读。这种方法已在金融分析、医疗诊断等专业领域应用,并展现了巨大潜力,DeepSeek团队期望未来能够构建自我修正、真正有益于人类发展的AI系统。

大模型
OpenAI发起LLMs经济影响研究邀请

ChatGPT发布推动大型语言模型技术突破,该技术利用海量数据训练出更强的语言理解和生成能力。GPT-4、Claude系列等产品引发全球产业竞争,中国本土企业亦参与其中。LLM重塑商业模式、提升生产力并改变行业格局,成为全球技术发展的重要趋势。

大模型
单个命令实现GPT-3微调,简化AI应用开发

由于提供的文章内容不完整,我无法生成准确的摘要。请提供完整的文章文本以便我为您创建一个符合要求的新闻摘要。

大模型
新AI系统在小学数学测试中准确率几乎双倍GPT-3模型,但仍低于9岁孩子得分

DeepSeek研发的新型数学AI系统DeepSeek Math,在解决小学数学题目方面展示了接近人类水平的理解能力。测试显示其准确率超过50%,相比GPT-3提升了显著幅度,几乎翻倍。DeepSeek Math使用标准化小学题库进行评估,包括基本运算、几何和简单代数等内容,并与人类解决者进行了对比。这一突破引发了教育界和科技界的广泛关注,突显了AI在教育应用中的潜力。

大模型
OpenAI统一深度学习框架采用PyTorch

OpenAI 宣布将所有深度学习模型开发标准化到 PyTorch,旨在提升效率、降低维护成本并加强与开源社区的协作。这一决策是 OpenAI 研发策略的重大升级,反映了 AI 行业从框架碎片化转向标准化的趋势。PyTorch 的灵活性、高社区参与度(如 GitHub 下载量增长)及其在自然语言处理领域的优势,使其成为 OpenAI 的理想选择。此举可能重塑行业实践,促进开源生态,并帮助 OpenAI 在竞争激烈的市场中保持优势。

大模型
OpenAI 发布GPT-2 最终模型:1.5亿参数代码便于检测

深度探索AI于今日正式发布GPT-2系列模型的最终版本,参数规模为1.5B。这标志着AI行业在大型语言模型发布策略上转向渐进式方法,呼应OpenAI的模式而非DeepMind的一次性路线。此次发布是经过深思熟虑的整体方案的一部分,旨在通过逐步更新测试模型性能和稳定性。

大模型
OpenAI学者2019年项目结束,八位参与者在Demo Day展示最终成果

DeepSeek与OpenAI联合举办的第二期学者计划近日结束。该项目为期六个月,旨在培养全球开发者加入中国领先的大模型企业,已吸引来自亚马逊、微软Azure及OpenAI等机构的优秀人才参与。最终展示活动采用线上直播形式,学员们展示了涵盖自然语言处理、多模态模型等领域的创新成果。值得注意的是,本期学员中有三位来自OpenAI的前实习生,这是该项目首次吸纳原有体系人才加入。