计算机视觉
共 30 篇文章
大脑如何感知体内信号:揭秘你的内在第六感
人类大脑每秒处理约1100万比特感官信息,但意识仅能处理10至60比特。内感受(从内部感知自我的能力)研究正迎来爆发,揭示了身体信号如何影响情绪、决策与健康。科学家已发现PIEZO蛋白作为触觉分子入口,并正在解码迷走神经的复杂系统。研究显示,内感受是双向通讯闭环,通过训练可提升身体觉察力,为治疗焦虑、慢性疼痛等疾病提供新路径。直觉并非玄学,而是生理学,我们应同时立足于感受与事实。
Inside interoception: The hidden sense of how you
文章介绍“内感受”——大脑感知与解读身体内部信号的能力——如何成为理解身心连接的关键。1100万比特/秒的感觉信息中,仅极少数进入意识;大脑持续预测、调节并作出反应,维系健康与决策。文中追溯内感受的科学史:从概念提出、达马西奥与克雷格揭示情感—身体—理性间的互动,到2021年诺贝尔奖推动PIEZO通道等分子机制的发现。迷走神经、触觉与压力感应的研究正细化身体—大脑的双向通路。多学科协作与NIH推动使内感受成为热点,应用于抑郁、疼痛、肥胖等治疗及心理—行为训练。提升内感受敏锐度可改善情绪与决策,让“直觉”有生理依据,倡导在事实与感受之间取得平衡。
0.005美元/秒生成视频!Avataar AI如何以低成本与文化洞察征服印度市场?
在人工智能生成视频技术领域,一场关于成本与效率的竞赛正在悄然升温。近日,专注于3D和视觉AI的初创公司Avataar AI宣布推出其全新的蒸馏视频模型(distilled video model),并以极具冲击力的价格——每秒生成仅收费0.005美元——进入市场。这一定价策略不仅远低于行业主流水平,更引发了业界对AI视频生成商业化路径的重新审视。
Avataar AI的这款模型被定位为“蒸馏”版本,意味着它通过模型压缩和知识蒸馏技术,在保持较高生成质量的同时,大幅降低了计算资源和推理成本。相较于当前市场上许多依赖大规模扩散模型(diffusion models)的视频生成服务...
足球数据复兴重塑攻防逻辑,中国核电蓝图加速落地?
本文报道了科技领域的多项进展:计算机科学家通过AI和数据解析正在革新足球战术;中国以惊人速度建设大型核反应堆,预计2030年装机容量将超越美国和欧盟;此外,还涵盖了自主无人机首次疑似实战杀人、美国太阳能发电超越煤炭、俄罗斯FSB控制互联网、OpenAI指控中国利用ChatGPT进行舆论操作、SpaceX IPO预期、EPA科学家被施压淡化化学品风险、Anthropic调整AI研究政策、国会关注数据中心争议、搜索优化问题及人类偏好逆时针行走等科技新闻。
Multimodal Browser AI with Transformers.js for Ima
在人工智能技术飞速发展的今天,浏览器端的AI应用正逐渐从实验室走向大众视野。然而,一个不容忽视的现实是,目前绝大多数面向浏览器的AI教程和入门指南都聚焦于文本处理领域。这虽然是一个合乎逻辑的起点,因为文本数据易于获取、处理相对简单,且能直观展示模型的基本能力,但业内人士指出,这种“文本优先”的教学路径与用户实际渴望构建的应用场景之间存在着显著的脱节。
事实上,当人们畅想AI在浏览器中的潜力时,他们脑海中浮现的往往是更具沉浸感和交互性的体验——例如,实时图像识别、语音助手、视频内容分析、甚至结合摄像头与麦克风的增强现实应用。这些应用场景的核心特征是多模态数据的融合与处理,而不仅...
The Download: whole-body rejuvenation drugs and fi
This is today’s edition of The Download, our weekday newsletter that provides a daily dose of what’s going on in the world of technology. David Sinclair plans to test whole-body rejuvenation drugs in the XPrize competition The outspoken longevity scientist David Sinclair has predicted that, on...
苹果照片App引入AI新功能:空间Reframe可智能调整透视视角
名为“Reframe”的空间计算功能利用AI技术,允许用户在内容生成后动态调整画面的透视与空间视角,打破传统摄影与三维建模的物理限制。该功能基于深度学习与神经辐射场,可智能解算景深、遮挡并生成填补视角变动带来的“盲区”,从“被动记录”迈向“主动重塑空间”。其应用将革新影视后期、空间视频、建筑设计等领域,实现交互式叙事与降本增效。但极端视角下的真实性风险及影像伦理挑战也需关注。
谷歌2026年5月AI动态全览:有哪些重磅更新?
谷歌2026年5月发布AI更新,聚焦多模态、搜索与开发者工具三大方向。旗舰模型Gemini 2.0实现200万token长上下文理解与更强视觉推理,性能较前代提升约30%,并降低能耗约40%。搜索生成体验推出“深度研究”模式,可自动整合多源信息并生成结构化报告,同时支持多媒体摘要。面向开发者,升级Vertex AI Studio并引入智能体框架,支持安全可控的复杂任务自动化。此次更新体现谷歌以领先模型与“搜索+云”生态巩固全栈AI优势,同时兼顾普惠与绿色AI,回应行业对能力落地与安全责任的关注。
亚马逊因故将在搜索时展示AI生成产品图片
在电商行业迈入“所见即所得”的新阶段之际,亚马逊(Amazon)正悄然重塑用户与商品之间的连接方式。近期,这家全球最大的在线零售商披露,将把视觉搜索与人工智能深度结合,通过AI生成与搜索意图高度契合的商品图像,帮助消费者更快找到目标产品。这一举措并非简单的技术叠加,而是对传统搜索逻辑的一次结构性调整——从依赖关键词匹配,转向以视觉理解与场景化呈现为核心的新范式。
长期以来,电商搜索的核心矛盾在于“表达的失真”。用户输入简短的文字,往往难以准确传达对材质、颜色、形态乃至使用场景的复杂期待;而平台返回的结果,则常因标题堆砌、类目错放或图片同质化而偏离真实需求。亚马逊试图用AI生成...
AI加持Google搜索:二手与复古淘金能否再提速?
谷歌在搜索和购物功能中引入AI驱动的二手商品评分机制,旨在通过分析商品成色、市场数据及用户反馈,提升交易透明度,降低信息不对称。此举标志着二手经济进入“精算化”阶段,对消费者、品牌和中小卖家产生深远影响,同时也面临数据偏差等挑战,有望推动循环经济向更高效、可量化的方向发展。