AI资讯AI大模型
热点谷歌发布新一代AI模型Gemini 3,多模态能力再升级
在今日的开发者大会上,谷歌正式推出了其最新的Gemini 3系列大模型,展示了其在视频理解和长文本处理方面的显著进步。
Gemini 3能够直接处理和分析长达2小时的视频内容,并能处理超过100万字的文本上下文,创下行业新纪录。该模型在多个基准测试中超越了GPT-4等竞争对手,特别是在多模态任务上表现出色。谷歌CEO表示,Gemini 3将首先在企业级应用中部署,并逐步向消费者产品开放。
来源:
02.05共 2 条相关资讯
在今日的开发者大会上,谷歌正式推出了其最新的Gemini 3系列大模型,展示了其在视频理解和长文本处理方面的显著进步。
Gemini 3能够直接处理和分析长达2小时的视频内容,并能处理超过100万字的文本上下文,创下行业新纪录。该模型在多个基准测试中超越了GPT-4等竞争对手,特别是在多模态任务上表现出色。谷歌CEO表示,Gemini 3将首先在企业级应用中部署,并逐步向消费者产品开放。
新模型在视频理解和代码生成方面表现卓越,能够直接根据复杂的视频内容生成可执行的应用程序代码,推动人机交互进入新阶段。
谷歌旗下AI研究机构DeepMind今日发布了其最新的通用人工智能模型‘Gemini 3’。据官方介绍,‘Gemini 3’在多模态理解和生成能力上取得了重大突破,特别是在视频内容分析和跨模态代码生成方面。在演示中,研究人员向模型输入了一段复杂的制造流程视频,‘Gemini 3’成功理解了其中的逻辑和步骤,并直接生成了一个用于监控该流程的Python应用程序。此项进展预示着AI在自动化软件开发和复杂任务处理方面的巨大潜力。