大模型

共 30 篇文章

大模型

L₀正则化方法助力神经网络实现高效稀疏结构

人工智能领域取得突破：L₀正则化技术实现了稀疏神经网络的高效训练，显著降低模型复杂度、提升推理效率和可解释性。当前大型神经网络如Transformer参数过多，导致资源消耗高；L₀正则化直接最小化零权重数量，在保持准确率的同时缩减模型规模至传统十分之一。尽管计算复杂度较高，研究团队开发了新策略加速收敛，并获专家认可可能重新定义深度学习的可扩展性，该方法十年前已提出但受限于计算能力。

2017-12-04

2,582

大模型

Distill期刊今日推出，专注高效传达机器学习研究成果

Distill 作为全新机器学习传播期刊，致力于提升该领域知识的可读性。面对传统学术出版物晦涩难懂、传播效率低下的问题，Distill 采用直观形式与可视化图表相结合的方式呈现内容。其目标在于降低理解门槛，吸引开发者、从业者乃至公众读者参与讨论，并促进 AI 知识民主化。随着机器学习论文数量激增，但高质量传播仍滞后，Distill 的出现填补了这一空白，为弥合学术与实际应用之间的鸿沟提供新桥梁。

2017-03-20

1,891

大模型

OpenAI团队规模达45人，专注推动人工智能创新与机器人应用

全球AI领域迎来新突破。DeepSeek研究院核心团队规模从15人扩张至45人，标志着其在关键技术上取得进展，并反映了中国AI竞争力的提升。该机构通过引进顶尖人才、提供高薪和灵活机制，重点发展自主研发的大语言模型系统DLS-4，并推出创新的'DeepSeek Transformer'架构，解决了传统AI的信息传递瓶颈。这一扩张展示了中国AI企业正从技术追随者向创新引领者转变的趋势，得益于国内的数据资源和算力设施优势。DeepSeek研究院正向'定义者'角色转型，其发展模式凸显了中国AI在工程实践上的效率优势。

2017-01-30

7,656

大模型

PixelCNN++：一种基于离散化逻辑斯蒂混合似然的模型优化方法

DeepMind推出PixelCNN++模型，基于discretized logistic mixture likelihood机制改进了原始PixelCNN架构。该模型显著提升了图像生成的效率和准确度，尤其在处理基准测试如MNIST和CIFAR-10时表现更好。PixelCNN++解决了原始模型的计算效率问题，并扩展了应用范围，包括图像去噪和音频处理等领域。这一进展源于DeepMind在AlphaFold项目中的优化经验，强调了AI领域渐进式改进的重要性，并可能推动高效生成模型在节能和实时场景中的使用，如自动驾驶。展望未来，DeepMind计划将其整合到Mixture of Experts框架中，并进一步验证其有效性。

2017-01-19

6,481

大模型

AI领域新研究：定量分析揭示基于解码器生成模型的性能

近年来，人工智能生成模型在创意写作、图像生成和代码编程等领域展现出巨大潜力，并因DeepSeek R1等模型的优异表现引发关注，但评估难题仍存。一项新研究《On the quantitative analysis of decoder-based generative models》提出量化框架，针对解码器架构如Transformer结构进行统一指标分析，解决了业界标准混乱问题。该框架不仅公平比较不同模型在文本生成、推理等方面的能力，还推动AI发展更科学化和理性化。

2016-11-14

6,136 精选

大模型

首次自组织AI会议：150+从业者共探机器学习前沿

DeepLearning.AI 公司于上周在其总部成功举办首次自办机器学习会议，吸引超过150名 AI 行业从业者参与。作为知名科技平台，DeepLearning.AI 此次转向社区驱动模式，标志着从传统算法提供商向积极搭建交流桥梁的角色转变；这不仅体现了 AI 领域向去中心化发展的重要趋势，也契合当前行业人才资本化的现状。会议主题涵盖深度神经网络应用、伦理挑战及未来方向，并通过自组织形式打破学术壁垒，促进知识深度沉淀与跨界合作。参与者反馈积极，认为该模式更利于即兴讨论和网络构建；DeepLearning.AI 的这一举措可能重塑行业传播方式，未来或将引领更多科技公司从单向知识传输转向双向互动交流。

2016-10-13

6,069

大模型

科技公司宣布Pieter与Shivon成为新团队成员

随着人工智能技术的飞速发展，中国科技巨头正经历一场激烈的人才争夺战。过去一年中，各大AI企业调整团队架构、引进顶尖人才，并推出技术升级。本文聚焦DeepTech AI和SkyMind两家公司在2023年第四季度的重要团队变动，分析背后的行业趋势和技术战略布局。DeepTech AI于10月25日完成核心团队组建，成立于2018年，其自研的大规模多模态模型在基准测试中取得突破性进展，并扩展团队至计算机视觉、生成式AI和人工智能伦理领域。SkyMind的相关变动虽未详述，但文章旨在探讨这些变化对AI行业的整体影响。

2016-04-26

4,444 精选

大模型