综合资讯平台
返回标签列表
标签

#多模态大模型

共 2 条相关资讯

AI资讯2 条
AI资讯AI大模型

谷歌DeepMind开源新一代多模态大模型Gemini 2

Gemini 2在视频理解和代码生成方面表现卓越,模型参数规模达到1.8万亿,向研究社区免费提供。

谷歌旗下AI研究机构DeepMind宣布,将开源其最新的多模态大模型Gemini 2。该模型在理解和处理文本、图像、音频和视频等多种信息格式方面取得了重大突破。据官方技术报告显示,Gemini 2在多个基准测试中超越了GPT-4,尤其在长视频内容摘要和复杂代码生成任务上表现突出。此举旨在推动AI研究的开放与协作。

02.21
AI资讯AI大模型

OpenAI发布新一代多模态大模型GPT-5,支持视频内容生成

继其文生图模型Sora取得巨大成功后,OpenAI再次引领行业潮流,正式发布了其最新研发的多模态大模型GPT-5。该模型在语言理解和生成能力上实现飞跃,并首次加入了视频内容的生成和编辑功能。

据OpenAI官方介绍,GPT-5不仅在代码生成、自然语言推理等方面表现出色,其最大的亮点在于能够理解视频内容,并根据文本提示生成全新的高清视频片段。这一突破性功能预示着AI在内容创作领域的应用将更加广泛,有望颠覆电影、广告等多个行业。

02.04