腾讯混元3D,全称为Hunyuan3D-1.0,是腾讯推出的首个同时支持文生和图生的3D开源模型,专门解决现有3D生成模型在生成速度和泛化能力方面的不足。该模型采用了基于Diffusion 技术的架构,能够同时支持文本生成和图像生成3D资产。 腾讯混元3D:首个同时支持文生和图生的3D开源模型 技术特点与创新 快速生成:轻量版模型能够在 10 秒内生成高质量的 3D 资产,支持快速单图生成 3D,包括 mesh 和 texture 提取。 两阶段生成方法:采用多视图生成和多视图重建的两步流程。首先通过多视角扩散模型合成多个不同视角的新图像,然后使用基于 Transformer 的稀疏视角大规模重建模型生成 3D 资产。 自适应 CFG 技术:在多视图生成阶段,通过调整不同视角和时间步的 classifier-free guidance(CFG)尺度值,确保生成的图像既接近输入又具有多样性。 开源全面性:模型权重、推理代码、算法等全部开放,提供轻量版和标准版,极大降低了 3D 内容创作的门槛。 强大的泛化能力:能够重建各类尺度的物体,大到建筑,小到工具花草,适应多种创作需求。 性能与应用 超越 SOTA:在定性和定量评估中,Hunyuan3D-1.0 的表现超越了其他开源模型,尤其在生成速度和泛化能力方面。 应用广泛:已应用于腾讯的多个业务场景,如腾讯地图的 3D 车标重建和自定义 3D 导航车标功能等,显著提升了效率和创作自由。 行业影响:为游戏开发、影视制作、虚拟现实(VR)等领域提供了强大的工具,促进了 AI 生成 3D 内容的创新和应用。 应用场景 游戏开发:生成高质量的游戏角色、道具和建筑等 3D 资产,大幅提升游戏开发效率。 影视动画:为创作者自动生成 3D 影视角色及动作效果,辅助完成动画创作。 电商广告:根据广告创意主题生成 3D 商品,实现互动特效,提升广告内容创意。 虚拟现实(VR)/增强现实(AR):生成逼真的 3D 虚拟环境元素及互动内容,增强沉浸式体验。 开源信息 腾讯混元3D 生成大模型 Hunyuan3D-1.0 已于 11 月 5 日正式开源。该模型是业界首个同时支持文字、图像生成 3D 的开源大模型,提供轻量版和标准版两种选择,为开发者提供更多的创作机会。 Github 项目 Hugging Face
数据统计
相关导航
Yi大模型是由李开复博士领导的AI公司“零一万物”发布的一款开源的中英双语预训练大模型。这个模型在多个性能指标上取得了国际最佳性能认可,被称为“全球最强开源模型”。Yi-34B模型特别之处在于它拥有全球最长的200K上下文窗口,能够处理40万汉字的超长文本输入,这在语言模型中是非常重要的,因为它对于理解和生成与特定上下文相关的文本至关重要。
RAGFlow
RAGFlow是一款开源的检索增强生成(RAG)引擎,专为深入理解文档而设计。它为各类企业和个人提供简洁高效的RAG工作流程,与大语言模型(LLM)相结合,针对各种复杂格式的数据提供可靠的问答及有依据的引用。RAGFlow非常适合需要动态内容生成且依赖外部知识库的场景,如智能客服、文档生成和数据分析等,助力用户高效挖掘大量数据中的有价值信息。
光语金帆
光语金帆 是由无限光年公司推出的金融大模型,结合了顶尖的人工智能技术和人才资源,旨在构建超越客户期望的人工智能生成内容(AIGC)产品组合,推动金融行业生产力和用户交互体验的全面提升,实现金融服务的智能化、公平化和普惠化。
文心大模型
文心大模型是百度发布的产业级知识增强大模型,是千行百业AI开发的首选基座大模型。文心大模型既包含基础通用的大模型,也包含了面向重点领域和重点任务的大模型,还提供丰富的工具与平台,支撑企业与开发者进行高效便捷的应用开发。
Harmonai
Harmonai是一个开源生成音频工具,让音乐创作更有趣。您可以使用舞蹈扩散模型生成各种风格的音乐,或者使用Harmonai Studio在线制作自己的音乐作品。加入Harmonai,体验AI音乐的魅力。
Sora
Sora是一个能以文本描述生成视频的人工智能模型,由美国人工智能研究机构OpenAI开发。它能够根据用户的文本描述生成长达 60 秒、1080P 高质量视频,其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。并在单个生成视频中创建多个镜头,准确保留角色和视觉风格。
Llama 2
Llama 2是Meta AI推出的新一代大型语言模型(LLM),参数规模从70亿到700亿不等。它是为对话场景而优化的,称为Llama 2-Chat,能够在多数基准上超越开源的对话模型,并且在人类评估的有用性和安全性上,可能是闭源模型的合适替代品。
ClotheDreamer
ClotheDreamer 是一种基于 3D 高斯方法的工具,用于从文本提示生成可穿戴的、可生产的 3D 服装资产。由上海大学、上海交通大学、复旦大学和腾讯优图实验室共同推出。它采用了一种名为 Disentangled Clothe Gaussian Splatting (DCGS) 的新型表示方法,使得服装和人体模型可以分别优化。
暂无评论...
