热门

CineMaster

1年前发布 43 00

CineMaster是一个3D感知和可控的文本到视频生成框架，旨在帮助用户创建高质量的电影视频。该框架通过两个阶段的工作流程，赋予用户专业电影导演般的控制力，允许他们在 3D 空间中精确地放置场景中的对象，并灵活地操控对象和摄像机。

收录时间：

2025-04-08

打开网站手机查看

AI大模型 # 3D感知视频生成 # AI大模型 # 分类导航 # 创意视频生成工具 # 文本到视频生成

CineMaster

CineMaster

CineMaster是一个3D感知和可控的文本到视频生成框架，旨在帮助用户创建高质量的电影视频。该框架通过两个阶段的工作流程，赋予用户专业电影导演般的控制力，允许他们在 3D 空间中精确地放置场景中的对象，并灵活地操控对象和摄像机。核心功能特点 3D 感知和可控性：用户可以在 3D 空间中精确地放置场景中的对象，并灵活地操控对象和摄像机，确保生成的视频符合用户的意图。交互式工作流程：提供一个交互式工作流程，允许用户通过定位对象边界框和定义摄像机运动来直观地构建 3D 感知的条件信号。文本到视频扩散模型：使用文本到视频扩散模型生成用户期望的视频内容，确保生成的视频符合用户的意图。自动数据标注管道：通过自动数据标注管道，从大规模视频数据中提取 3D 边界框和摄像机轨迹作为控制信号。应用场景电影制作：帮助专业电影导演精确控制场景中的对象和摄像机运动。广告制作：生成高质量的广告视频，吸引观众的注意力。内容创作：为内容创作者提供强大的工具，生成创意视频。

数据统计

相关导航

MusiConGen

MusiConGen是一种基于Transformer的文本到音乐生成模型。它通过引入时间条件机制，显著提升了对音乐节奏和和弦的控制能力。该模型是在预训练的MusicGen-melody框架基础上进行微调的，主要用于生成各种风格的音乐片段。

商量拟人大模型

商量拟人大模型是商汤科技推出的一款AI拟人大模型，它支持个性化角色创建与定制、知识库构建、长对话记忆、多人群聊等功能，可实现行业领先的角色对话、人设及剧情推动能力。该模型广泛应用于情感陪伴、影视/动漫/网文IP角色、明星/网红/艺人AI分身、语言角色扮演游戏等拟人对话场景。

Etna模型

Etna大模型是七火山科技推出的一个文生视频的AIGC模型，它能够根据简短的文本描述生成相应的视频内容。七火山科技发布的Etna文生视频模型支持生成视频时长达到8~15秒，每秒可达60帧，分辨率最高可达4K（3840*2160），画面细腻逼真。

Step-Video-T2V

Step-Video-T2V 是由阶跃星辰与吉利汽车集团联合开源的一款先进文本生成视频（Text-to-Video）模型。这款模型在 2025 年 2 月 18 日正式发布，具备强大的多模态生成能力，支持中文和英文输入，适用于广告、影视制作、教育等多个场景。

可灵大模型

可灵大模型是快手AI团队自研的一款视频生成大模型，采用类似Sora的技术路线，能够生成符合物理规律的大幅度运动视频，模拟真实世界的特性。支持生成长达2分钟的30fps的超长视频，分辨率高达1080p，且支持多种宽高比。2024年6月，快手正式推出了可灵大模型，并在快影App开放邀测体验。

腾讯混元3D

腾讯混元3D，全称为 Hunyuan3D-1.0，是腾讯推出的首个同时支持文生和图生的3D开源模型，专门解决现有3D生成模型在生成速度和泛化能力方面的不足。该模型采用了基于Diffusion 技术的架构，能够同时支持文本生成和图像生成3D资产。

VideoCrafter2

VideoCrafter2是腾讯推出的一个先进的视频生成模型，它借助深度学习技术，致力于提高视频的视觉质量、动态效果以及概念组合，能够根据用户提供的文本描述生成高质量、流畅的视频作品。

SEED-Story

SEED-Story是一个腾讯开源的基于大型语言模型（MLLM）的多模态长篇故事生成模型，它能够根据用户提供的图片和文本生成连贯的叙事文本和风格一致的图片。无论是小说创作、剧本编写还是视觉故事，SEED-Story都能提供高质量、多模态的内容，助力创意产业的发展。

暂无评论

您必须登录才能参与评论！

暂无评论...