标签

#多模态大模型

共 2 条相关资讯

AI资讯2 条

AI资讯AI大模型

谷歌DeepMind开源新一代多模态大模型Gemini 2

Gemini 2在视频理解和代码生成方面表现卓越，模型参数规模达到1.8万亿，向研究社区免费提供。

谷歌旗下AI研究机构DeepMind宣布，将开源其最新的多模态大模型Gemini 2。该模型在理解和处理文本、图像、音频和视频等多种信息格式方面取得了重大突破。据官方技术报告显示，Gemini 2在多个基准测试中超越了GPT-4，尤其在长视频内容摘要和复杂代码生成任务上表现突出。此举旨在推动AI研究的开放与协作。

谷歌 DeepMind Gemini 2 多模态大模型

来源：

Google AI Blog

02.21

AI资讯AI大模型

OpenAI发布新一代多模态大模型GPT-5，支持视频内容生成

继其文生图模型Sora取得巨大成功后，OpenAI再次引领行业潮流，正式发布了其最新研发的多模态大模型GPT-5。该模型在语言理解和生成能力上实现飞跃，并首次加入了视频内容的生成和编辑功能。

据OpenAI官方介绍，GPT-5不仅在代码生成、自然语言推理等方面表现出色，其最大的亮点在于能够理解视频内容，并根据文本提示生成全新的高清视频片段。这一突破性功能预示着AI在内容创作领域的应用将更加广泛，有望颠覆电影、广告等多个行业。

OpenAI GPT-5 多模态大模型 AIGC

来源：

OpenAI Blog·TechCrunch

02.04