谷歌发布新一代多模态大模型“Gemini 3.0”,原生支持视频理解与生成
在年度I/O大会的预热活动中,谷歌出人意料地发布了其最新的旗舰级AI模型Gemini 3.0,展示了其在视频内容理解和生成方面的突破性进展。
谷歌今日通过其官方博客宣布推出Gemini 3.0。据介绍,该模型不仅在文本、图像处理能力上超越了前代,更实现了对视频内容的原生理解和实时生成。在演示中,Gemini 3.0能够根据简单的文字描述,快速生成高质量、高连贯性的短视频片段。谷歌表示,该模型将首先通过Vertex AI平台向企业客户开放,并逐步集成到YouTube和Google Photos等产品中。