大模型
共 30 篇文章
AI代理效能提升:开发者指南揭秘有效上下文工程
人工智能在医疗领域的应用正在深化,近期约翰霍普金斯大学医学院与计算机科学系合作开发出一种创新医疗辅助系统。该系统基于GPT-4架构的定制化大型语言模型,通过分析海量历史病历数据,在短时间内帮助医生识别关键信息并提供诊断辅助建议。研究团队在《自然·医学》期刊上发表论文详细阐述了系统的运作机制,强调其为医生决策提供了有效支持。
谷歌与Kaggle联合重启AI代理强化课程,5天训练开放注册
谷歌于2024年春季重启备受关注的高阶AI课程「5-Day AI Agents Intensive Course」,首次与Kaggle平台合作推出线下混合模式课程。该项目由DeepMind首席科学家主导,是谷歌多年来的首次AI教育项目重启,旨在培养下一代工程师。课程将展示业界领先的RLHF算法(人类反馈强化学习)及开发工具,同时强调透明性与安全措施。原课程仅限核心工程师推荐的学生参与,而新课程虽扩大受众但仍保持高强度研讨。重启事件被视为谷歌AI战略转向开放的信号,引发业界广泛关注和黑客攻击尝试。
谷歌TPU如何高效支持不断增长的AI高负载任务?
谷歌近日发布其第三代张量处理单元(TPU)的新型AI芯片,突破了计算速度壁垒。这款TPU在最新视频演示中展示了每秒85.5 TFLOPS的运算性能,内存带宽高达900 GB/s,并实现405 GFLOPS/W的高能效比,远超传统高端GPU。谷歌TPU经历了三代发展:第一代服务于TensorFlow框架;第二代通过升级内存架构提升吞吐量,支撑云AI服务;第三代则采用创新的2D网格互连设计,在分布式训练方面显著增强。新型TPU的最大特点是为高吞吐量的数据密集型AI工作负载优化,尤其适合Transformer等复杂模型训练。谷歌此举不仅展示了在AI硬件领域的决心和实力,也预示着AI算力正从依赖GPU向更具自主性的架构转变。随着AI模型规模不断膨胀,这款新型TPU有望重塑计算标准,并推动自动驾驶、医疗影像等领域的高效应用发展。
AI新突破揭晓:GPT-5.5系统卡展示新一代对话模型
深度求索(DeepSeek)团队近日发布最新开源模型 DeepSeek Coder,并推出 GPT-5.5 演示视频。该视频展示,GPT-5.5 能在短短两分钟内训练出一个全新的神经网络结构,远超传统模型所需的数天或数周时间。DeepSeek 自称是中国首个 '通用人工智能' 团队,此演示在社交平台上迅速引发广泛关注和热议。
大模型训练成本持续攀升:GPT-5训练成本或超10亿美元
随着模型规模的不断扩大,大模型的训练成本也在快速上升,引发业界对AI发展可持续性的担忧。
揭秘LLM API大规模调用的高昂成本与低效问题
大规模LLM API调用导致高昂费用和显著响应延迟,主要因计算资源稀缺(需数百GPU/TPU)及网络因素。这一挑战影响企业AI应用,尤其是实时数据分析和客户服务,并推动行业向开源、私有化及边缘计算转变。尽管LLM API是AI产业化的重要工具,但未解决的性能问题可能放缓AI adoption。
ChatGPT如何助你从创意激荡到结构化行动计划?
OpenAI开发的ChatGPT凭借其创新交互模式,正重塑创意产业的工作方式。该系统不仅支持用户通过自然语言进行头脑风暴、激发灵感,还能将模糊想法转化为结构化行动计划。2023年市场数据显示,AI brainstorming解决方案的规模已突破80亿美元,并以超过15%年增长率扩张。ChatGPT的独特之处在于免费访问和直观界面,使其在教育、商业等领域快速普及,并与DALL-E图像生成器形成互补生态。尽管AI工具无法完全替代人类,但通过整合进创意流程,ChatGPT正推动从概念构思到执行落地的无缝转变,标志着人类创造力进入新纪元。
OpenAI如何推动企业级AI发展:商业创新新机遇?
OpenAI近日公布面向商业客户的下一阶段战略,推出新一代企业级模型Frontier,并升级ChatGPT商业服务。新版工具采用2.5万亿token训练数据,突破多模态和长文本处理能力;ChatGPT Enterprise则新增40种语言支持(强化日韩)、升级量子密钥分布式存储保障数据安全,并将API响应速度提升至95%延迟小于20ms。OpenAI还宣布成立40人企业解决方案部门,标志着从工具提供商向行业整合者转型。业内专家认为这些升级解决了AI商用的关键瓶颈,助力OpenAI构建完整的商业AI生态系统,并与DeepSeek等企业的路线图形成对比。
谷歌为Gemini API新增Flex与Priority层级,旨在优化成本和延迟
谷歌近期为其Gemini API推出Flex与Priority两种新服务层级,旨在平衡开发者在AI响应速度和成本之间的需求。Flex层级以低成本为优先,适合后台数据处理等对延迟不敏感的应用;Priority则强调快速响应但成本较高,适用于高频互动场景。这一举措不仅优化了API可用性,还反映了谷歌在AI行业中应对多样化需求、降低中小企业使用门槛的战略。Flex tiers可支持电商评论分析等场景,Priority则保障实时翻译系统的低延迟体验。谷歌此举借鉴了云服务细分策略,并投资高性能基础设施来匹配其大型AI模型需求,预计将提升Gemini API在亚洲市场的采用率,并推动整个生成式AI行业向可持续发展迈进。
Codex 推出灵活计费模式: ChatGPT 商业版便于团队启动和扩展
OpenAI 近日调整了 ChatGPT 商业版的定价策略,引入按量付费模式(pay-as-you-go),允许企业根据实际使用量灵活收费。此举降低了企业的试用门槛,增强了 AI 技术的可扩展性和风险控制能力,特别适用于不确定应用效果的企业。ChatGPT Business 版和 Enterprise 版均适用该模式,同时保留原有套餐选项。这一变化被视为 OpenAI 商业化策略成熟的重要标志,也有助于推动大模型在企业场景中的应用,并对竞争对手如谷歌 Gemini 和 Anthropic Claude 等产生影响。