计算机视觉

共 30 篇文章

计算机视觉

大脑如何感知体内信号：揭秘你的内在第六感

人类大脑每秒处理约1100万比特感官信息，但意识仅能处理10至60比特。内感受（从内部感知自我的能力）研究正迎来爆发，揭示了身体信号如何影响情绪、决策与健康。科学家已发现PIEZO蛋白作为触觉分子入口，并正在解码迷走神经的复杂系统。研究显示，内感受是双向通讯闭环，通过训练可提升身体觉察力，为治疗焦虑、慢性疼痛等疾病提供新路径。直觉并非玄学，而是生理学，我们应同时立足于感受与事实。

2026-06-12

7,706

计算机视觉

Inside interoception: The hidden sense of how you

文章介绍“内感受”——大脑感知与解读身体内部信号的能力——如何成为理解身心连接的关键。1100万比特/秒的感觉信息中，仅极少数进入意识；大脑持续预测、调节并作出反应，维系健康与决策。文中追溯内感受的科学史：从概念提出、达马西奥与克雷格揭示情感—身体—理性间的互动，到2021年诺贝尔奖推动PIEZO通道等分子机制的发现。迷走神经、触觉与压力感应的研究正细化身体—大脑的双向通路。多学科协作与NIH推动使内感受成为热点，应用于抑郁、疼痛、肥胖等治疗及心理—行为训练。提升内感受敏锐度可改善情绪与决策，让“直觉”有生理依据，倡导在事实与感受之间取得平衡。

2026-06-12

5,010

计算机视觉

0.005美元/秒生成视频！Avataar AI如何以低成本与文化洞察征服印度市场？

在人工智能生成视频技术领域，一场关于成本与效率的竞赛正在悄然升温。近日，专注于3D和视觉AI的初创公司Avataar AI宣布推出其全新的蒸馏视频模型（distilled video model），并以极具冲击力的价格——每秒生成仅收费0.005美元——进入市场。这一定价策略不仅远低于行业主流水平，更引发了业界对AI视频生成商业化路径的重新审视。

Avataar AI的这款模型被定位为“蒸馏”版本，意味着它通过模型压缩和知识蒸馏技术，在保持较高生成质量的同时，大幅降低了计算资源和推理成本。相较于当前市场上许多依赖大规模扩散模型（diffusion models）的视频生成服务...

2026-06-12

7,848

计算机视觉

足球数据复兴重塑攻防逻辑，中国核电蓝图加速落地？

本文报道了科技领域的多项进展：计算机科学家通过AI和数据解析正在革新足球战术；中国以惊人速度建设大型核反应堆，预计2030年装机容量将超越美国和欧盟；此外，还涵盖了自主无人机首次疑似实战杀人、美国太阳能发电超越煤炭、俄罗斯FSB控制互联网、OpenAI指控中国利用ChatGPT进行舆论操作、SpaceX IPO预期、EPA科学家被施压淡化化学品风险、Anthropic调整AI研究政策、国会关注数据中心争议、搜索优化问题及人类偏好逆时针行走等科技新闻。

2026-06-11

1,881 精选

计算机视觉

Multimodal Browser AI with Transformers.js for Ima

在人工智能技术飞速发展的今天，浏览器端的AI应用正逐渐从实验室走向大众视野。然而，一个不容忽视的现实是，目前绝大多数面向浏览器的AI教程和入门指南都聚焦于文本处理领域。这虽然是一个合乎逻辑的起点，因为文本数据易于获取、处理相对简单，且能直观展示模型的基本能力，但业内人士指出，这种“文本优先”的教学路径与用户实际渴望构建的应用场景之间存在着显著的脱节。

事实上，当人们畅想AI在浏览器中的潜力时，他们脑海中浮现的往往是更具沉浸感和交互性的体验——例如，实时图像识别、语音助手、视频内容分析、甚至结合摄像头与麦克风的增强现实应用。这些应用场景的核心特征是多模态数据的融合与处理，而不仅...

2026-06-10

4,329 精选

计算机视觉

The Download: whole-body rejuvenation drugs and fi

This is today’s edition of The Download, our weekday newsletter that provides a daily dose of what’s going on in the world of technology. David Sinclair plans to test whole-body rejuvenation drugs in the XPrize competition The outspoken longevity scientist David Sinclair has predicted that, on...

2026-06-09

2,377

计算机视觉

苹果照片App引入AI新功能：空间Reframe可智能调整透视视角

名为“Reframe”的空间计算功能利用AI技术，允许用户在内容生成后动态调整画面的透视与空间视角，打破传统摄影与三维建模的物理限制。该功能基于深度学习与神经辐射场，可智能解算景深、遮挡并生成填补视角变动带来的“盲区”，从“被动记录”迈向“主动重塑空间”。其应用将革新影视后期、空间视频、建筑设计等领域，实现交互式叙事与降本增效。但极端视角下的真实性风险及影像伦理挑战也需关注。

2026-06-09

4,007

计算机视觉

谷歌2026年5月AI动态全览：有哪些重磅更新？

谷歌2026年5月发布AI更新，聚焦多模态、搜索与开发者工具三大方向。旗舰模型Gemini 2.0实现200万token长上下文理解与更强视觉推理，性能较前代提升约30%，并降低能耗约40%。搜索生成体验推出“深度研究”模式，可自动整合多源信息并生成结构化报告，同时支持多媒体摘要。面向开发者，升级Vertex AI Studio并引入智能体框架，支持安全可控的复杂任务自动化。此次更新体现谷歌以领先模型与“搜索+云”生态巩固全栈AI优势，同时兼顾普惠与绿色AI，回应行业对能力落地与安全责任的关注。

2026-06-05

4,095

计算机视觉

亚马逊因故将在搜索时展示AI生成产品图片

在电商行业迈入“所见即所得”的新阶段之际，亚马逊（Amazon）正悄然重塑用户与商品之间的连接方式。近期，这家全球最大的在线零售商披露，将把视觉搜索与人工智能深度结合，通过AI生成与搜索意图高度契合的商品图像，帮助消费者更快找到目标产品。这一举措并非简单的技术叠加，而是对传统搜索逻辑的一次结构性调整——从依赖关键词匹配，转向以视觉理解与场景化呈现为核心的新范式。

长期以来，电商搜索的核心矛盾在于“表达的失真”。用户输入简短的文字，往往难以准确传达对材质、颜色、形态乃至使用场景的复杂期待；而平台返回的结果，则常因标题堆砌、类目错放或图片同质化而偏离真实需求。亚马逊试图用AI生成...

2026-06-03

2,591

计算机视觉

AI加持Google搜索：二手与复古淘金能否再提速？

谷歌在搜索和购物功能中引入AI驱动的二手商品评分机制，旨在通过分析商品成色、市场数据及用户反馈，提升交易透明度，降低信息不对称。此举标志着二手经济进入“精算化”阶段，对消费者、品牌和中小卖家产生深远影响，同时也面临数据偏差等挑战，有望推动循环经济向更高效、可量化的方向发展。

2026-06-03

6,080

计算机视觉

所有分类