
千影 QianYing 是一款由巨人网络 AI Lab 推出的有声游戏生成大模型,包含游戏视频生成大模型 YingGame 和视频配音大模型 YingSound。通过先进的人工智能技术,千影 QianYing 能够自动生成高质量、有声的游戏视频。YingGame 通过自定义角色、动作控制和物理模拟,创造互动性强的游戏内容;YingSound 则为视频添加高保真音效,实现精确的跨模态对齐和时间同步。千影 QianYing 旨在大幅提升游戏创作效率,助力游戏开发进入创作平权时代,让创意无限延展。
YingGame
YingGame 是面向开放世界游戏的视频生成大模型,由巨人网络 AI Lab 与清华大学 SATLab 联合研发。它首次实现了角色多样动作的交互控制和个性化定制,以及强大的物理模拟特性。用户可以自定义游戏角色,并通过理解用户输入(如鼠标、键盘按键等)控制角色的多种动作和精细的主体控制,生成具有复杂运动和动作连续性的交互性游戏视频。
YingSound
YingSound 是由巨人网络 AI Lab、西北工业大学 ASLP Lab 和浙江大学联合研发的视频配音大模型。它具备超强的时间对齐和视频语义理解能力,能够为各种类型的视频(包括真实场景视频、动漫视频和游戏视频)生成高精细度的音效。YingSound 支持从视频或视频文本结合的方式生成高保真音效,有效提升少样本场景下的生成质量,实现精确的跨模态对齐效果。
技术创新与应用:
千影 QianYing 通过技术层面的多项创新,包括跨模态特征融合、细粒度角色表征、运动增强与多阶段训练策略,结合高效高质量的游戏视频训练数据生产管线,确保生成内容具备高交互能力和多样化应用场景。
前景与展望:
随着千影 QianYing 的发布,巨人网络实现了自研语义大模型、语音大模型及视频大模型的多模态全矩阵布局,加速“游戏+AI”从降本增效向颠覆式创新的转化。未来,千影 QianYing 将极大提升游戏发行内容的创作效率,并为游戏生产管线、交互方式、游戏玩法带来深远影响。
巨人网络 AI 实验室将持续推进模型能力的升级迭代,同时启动“千影共创计划”,对外开放模型技术、模型应用和原创游戏项目的合作共创、应用落地和人才招募,推动游戏创作的平权化,让更多人实现游戏开发梦想。
数据统计
相关导航

SDXL-Lightning是一款由字节跳动开发的开源免费的文生图开放模型,能根据文本快速生成相应的高分辨率图像。该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模型之一。

LTX Video
LTX Video是由 Lightricks公司推出的首个REAL-TIME AI视频生成开源模型。它基于 DiT (Diverse Image Transformer) 架构,能够实时生成高质量的视频。LTX Video 能够以 24 FPS 和 768x512 分辨率生成视频,生成速度比观看速度还要快。

SDXL-Lightning
SDXL-Lightning是一款由字节跳动开发的开源免费的文生图开放模型,能根据文本快速生成相应的高分辨率图像。该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模型之一。

Animate Anyone
DreaMoving是一种基于扩散模型打造的可控视频生成框架,通过图文就能制作高质量人类跳舞视频。用户只需上传一张人像,以及一段提示词,就能生成对应的视频,而且改变提示词,生成的人物的背景和身上的衣服也会跟着变化。简单来说就是,一张图、一句话就能让任何人或角色在任何场景里跳舞。

Boximator
Boximator是字节跳动推出的一款利用深度学习技术进行视频合成的先进工具。它使用文本提示和额外的盒子约束来生成丰富且可控制的视频运动,从而为用户创造独特的视频场景提供了灵活的运动控制。具体来说,Boximator可以通过文本精准控制生成视频中人物或物体的动作,能生成包含多个角色以及特定类型运动的复杂场景,并能精确生成物体和背景的细节。

光语大模型
光语大模型是无限光年公司推出的一款结合大语言模型与符号推理的 AI 大模型,融合视觉与语言处理技术,拥有 10 亿视觉模型参数和 130 亿语言模型参数。该模型在金融、医疗等垂直领域表现出色,通过灰盒可信技术确保输出的稳定性和可靠性,有效解决幻觉问题,提升推理精度和可信度。

GPT智库
GPT 智库是一款强大的人工智能大模型综合应用,提供互联网境外访问绿色通道、汇聚了全球顶尖的人工智能大模型和学术资源。它具备智能对话、文生图、图生图、音频翻译、图像分析和全球学术资料搜索等多种功能,为科研院所、新闻媒体、高校和政府部门提供安全、合规、可控的全球一流人工智能服务。

腾讯混元DiT
腾讯混元DiT是一个基于Diffusion transformer的文本到图像生成模型,也是业内首个中文原生的DiT架构文生图开源模型。该模型具有中英文细粒度理解能力,能够与用户进行多轮对话,根据上下文生成并完善图像。
暂无评论...