计算机视觉

共 30 篇文章

计算机视觉

谷歌与巴西政府合作开发新卫星地图，助力森林保护

科技巨头Google与南美国家合作，启动亚马逊卫星地图绘制项目。该项目旨在利用商业遥感公司GeoEye和DigitalGlobe的高分辨率图像，结合美国航天局的数据，创建更精确、高频更新的地图。这对提升巴西政府森林监测能力至关重要，有助于应对非法采伐和人类活动扩张对亚马逊生态系统的威胁。项目还将建立实时在线系统，提高执法响应速度，并促进生态系统保护的创新尝试，尽管面临数据获取、隐私及平衡发展与保护等挑战。

2026-04-01

1,441

计算机视觉

谷歌2026年3月AI又有新动向？

谷歌于2026年3月发布Gemini 1.5 Advanced系列模型，这是AI战略从追求参数规模转向提升实用性的关键里程碑。该系列包含三个级别：Ultra具备强大的推理和多模态处理能力，Pro优化企业应用效率，Nano适合资源有限的环境。谷歌展示了在视觉推理和多模态对话方面的技术实力，使AI更好地理解和生成多媒体内容，并构建了更灵活的生态系统。

2026-04-01

5,253 精选

计算机视觉

Google 推出 Veo 3.1 Lite 的付费预览版：通过 Gemini API 和 AI Studio 访问

谷歌推出Veo 3.1 Lite，一款轻量级AI视频生成工具。用户可通过Gemini API的付费预览模式或Google AI Studio进行测试访问。此次升级简化了从文本描述到视频的生成流程，尤其满足教育、数字营销等领域的日益增长的需求。Gemini API与该工具的整合，进一步拓展了AI应用范围，体现了谷歌在当前快速发展的人工智能生态系统中，将高效与易用作为关键考量因素的战略布局。

2026-04-01

3,985

计算机视觉

Sora模型震撼发布：AI视频生成进入新纪元（更新）

OpenAI发布Sora视频生成模型，能够根据文本描述生成高质量的长视频，标志着AI视频生成技术的重大突破。...

2026-03-29

1,193

计算机视觉

ChatGPT推出基于Agentic Commerce Protocol的视觉沉浸购物系统

OpenAI的ChatGPT最近更新了代理式电商协议，为用户带来沉浸式的视觉购物体验。该协议结合AI代理与图像识别等多模态功能，使用户能够直观地探索商品，并直接与商家比较选项。此举旨在解决电商中的用户疲劳问题，通过简化决策流程并提供个性化推荐来提升购物效率。同时，它增强了商家的整合能力与库存管理，但也引发了关于隐私保护的新担忧，需要进一步解决。

2026-03-24

7,678

计算机视觉

AI人脸识别技术引发隐私争议：多地立法限制使用（深度分析）

人脸识别技术的广泛应用引发隐私担忧，多个城市和国家开始立法限制其在公共场合的使用。...

2026-03-22

3,399 精选

计算机视觉

3D视觉感知技术突破：机器人精准操控物体（深度分析）

最新的3D视觉感知技术使机器人能够更精准地识别和操控物体，为工业自动化带来新机遇。...

2026-03-07

7,245

计算机视觉

AI医学影像分析：癌症早期筛查准确率大幅提升（更新）

AI医学影像分析系统在癌症早期筛查中展现出惊人的准确率，为癌症防治带来新希望。...

2026-02-27

9,354

计算机视觉

AI艺术创作引发版权争议：谁拥有AI生成作品的版权？

AI艺术创作工具的普及引发了复杂的版权问题，法律界和艺术界对此存在广泛争议。

2026-02-26

6,024

计算机视觉

DeepMind AI首次提交'First Proof'数学挑战证明，测试高级推理能力

First Proof [数学挑战]是AI社区组织的一项年度测试，旨在评估系统在解决高等数学难题（如数论或拓扑学定理）上的推理和创新能力。DeepMind的AlphaMath模型参与挑战，成功解决了约40%的问题，展示了AI从数据中识别模式并构建逻辑链条的能力。这一事件不仅标志着AI在理论研究中的里程碑，还挑战了人类对数学证明的认知，并揭示了AI在处理抽象、不确定性强问题时的局限性，强调人类监督的重要性。未来，First Proof可能推动数学研究的新范式，促进AI作为辅助工具与专家合作。

2026-02-20

7,630

第 6 页，共 15 页

计算机视觉

所有分类