计算机视觉

共 30 篇文章

计算机视觉
谷歌与巴西政府合作开发新卫星地图,助力森林保护

科技巨头Google与南美国家合作,启动亚马逊卫星地图绘制项目。该项目旨在利用商业遥感公司GeoEye和DigitalGlobe的高分辨率图像,结合美国航天局的数据,创建更精确、高频更新的地图。这对提升巴西政府森林监测能力至关重要,有助于应对非法采伐和人类活动扩张对亚马逊生态系统的威胁。项目还将建立实时在线系统,提高执法响应速度,并促进生态系统保护的创新尝试,尽管面临数据获取、隐私及平衡发展与保护等挑战。

计算机视觉
谷歌2026年3月AI又有新动向?

谷歌于2026年3月发布Gemini 1.5 Advanced系列模型,这是AI战略从追求参数规模转向提升实用性的关键里程碑。该系列包含三个级别:Ultra具备强大的推理和多模态处理能力,Pro优化企业应用效率,Nano适合资源有限的环境。谷歌展示了在视觉推理和多模态对话方面的技术实力,使AI更好地理解和生成多媒体内容,并构建了更灵活的生态系统。

计算机视觉
Google 推出 Veo 3.1 Lite 的付费预览版:通过 Gemini API 和 AI Studio 访问

谷歌推出Veo 3.1 Lite,一款轻量级AI视频生成工具。用户可通过Gemini API的付费预览模式或Google AI Studio进行测试访问。此次升级简化了从文本描述到视频的生成流程,尤其满足教育、数字营销等领域的日益增长的需求。Gemini API与该工具的整合,进一步拓展了AI应用范围,体现了谷歌在当前快速发展的人工智能生态系统中,将高效与易用作为关键考量因素的战略布局。

计算机视觉
Sora模型震撼发布:AI视频生成进入新纪元(更新)

OpenAI发布Sora视频生成模型,能够根据文本描述生成高质量的长视频,标志着AI视频生成技术的重大突破。...

计算机视觉
ChatGPT推出基于Agentic Commerce Protocol的视觉沉浸购物系统

OpenAI的ChatGPT最近更新了代理式电商协议,为用户带来沉浸式的视觉购物体验。该协议结合AI代理与图像识别等多模态功能,使用户能够直观地探索商品,并直接与商家比较选项。此举旨在解决电商中的用户疲劳问题,通过简化决策流程并提供个性化推荐来提升购物效率。同时,它增强了商家的整合能力与库存管理,但也引发了关于隐私保护的新担忧,需要进一步解决。

计算机视觉
AI人脸识别技术引发隐私争议:多地立法限制使用(深度分析)

人脸识别技术的广泛应用引发隐私担忧,多个城市和国家开始立法限制其在公共场合的使用。...

计算机视觉
3D视觉感知技术突破:机器人精准操控物体(深度分析)

最新的3D视觉感知技术使机器人能够更精准地识别和操控物体,为工业自动化带来新机遇。...

计算机视觉
AI医学影像分析:癌症早期筛查准确率大幅提升(更新)

AI医学影像分析系统在癌症早期筛查中展现出惊人的准确率,为癌症防治带来新希望。...

计算机视觉
AI艺术创作引发版权争议:谁拥有AI生成作品的版权?

AI艺术创作工具的普及引发了复杂的版权问题,法律界和艺术界对此存在广泛争议。

计算机视觉
DeepMind AI首次提交'First Proof'数学挑战证明,测试高级推理能力

First Proof [数学挑战]是AI社区组织的一项年度测试,旨在评估系统在解决高等数学难题(如数论或拓扑学定理)上的推理和创新能力。DeepMind的AlphaMath模型参与挑战,成功解决了约40%的问题,展示了AI从数据中识别模式并构建逻辑链条的能力。这一事件不仅标志着AI在理论研究中的里程碑,还挑战了人类对数学证明的认知,并揭示了AI在处理抽象、不确定性强问题时的局限性,强调人类监督的重要性。未来,First Proof可能推动数学研究的新范式,促进AI作为辅助工具与专家合作。