
6月29日,在杭州召开的D20全球设计院长峰会上,阿里大文娱发布自研影视妆造大模型——神力霓裳,这也是首个针对影视剧服饰造型设计而打造的AI大模型。这个模型可以根据要求快速生成影视级的各朝代服饰造型,辅助造型师进行创意设计。它主要服务于古装剧,包含造型设计、妆发设计和纹样设计三大功能。 例如,造型师可以设定朝代、性别、身份等条件,输入相关提示词,2分钟内就能获得造型图片。目前,神力霓裳已经应用到《掌心》等多部古装和民国剧中。 阿里大文娱相关负责人表示,目前大模型最擅长的是唐代造型,可以生成官服、仕女服、舞女服、异族服等多种造型。 神力霓裳发布现场 神力霓裳大幅节省了造型师在概念设计阶段的时间。《掌心》造型指导高秋婉介绍,一部30集以上的古装剧,通常需要200套以上的妆造图,算上设计产生的中间版本,总量将接近1000套。如果由画师手绘,每套妆造图要耗费数小时。 唐仕女妆造图 神力霓裳的主要功能特点 快速生成能力:神力霓裳能够根据设定的条件(如朝代、性别、身份等)和相关的提示词,迅速生成影视级别的服饰造型。这种快速生成能力极大地提高了设计效率,使得造型师能够在短时间内获得多种造型方案,从而进行选择和优化。 多样化设计:该模型能够生成多种类型的服饰造型,包括但不限于不同朝代的官服、仕女服、舞女服以及异族服饰等。这种多样化的设计能力满足了影视剧中对服饰造型的多样化需求,有助于丰富剧情和角色形象。 辅助创意设计:神力霓裳不仅仅是一个生成工具,它还能在创意设计过程中为造型师提供灵感和多样化的方案。造型师可以利用这些方案进行进一步的修改和完善,从而创造出更加符合剧情和角色需求的服饰造型。 高效性:相比传统的手工设计方式,神力霓裳的自动化生成过程大大提高了设计效率。造型师可以在短时间内获得大量的造型方案,并通过筛选和优化找到最佳方案。这种高效性使得造型师能够更专注于创意和设计本身,而不是繁琐的绘制过程。 可定制性:虽然神力霓裳提供了多种预设的服饰造型模板,但它也支持用户根据具体需求进行定制。用户可以通过调整参数、添加细节等方式来定制符合自己需求的服饰造型。这种可定制性使得神力霓裳更加灵活和实用。 融合传统与现代技术:神力霓裳将传统服饰文化与现代AI技术相结合,通过大数据分析和机器学习算法来生成服饰造型。这种融合不仅保留了传统服饰文化的精髓,还赋予了它们新的生命力和表现形式。 应用场景 古装剧:神力霓裳已经在多部古装剧中投入使用,如《掌心》等。它可以快速生成符合历史背景的服饰、妆容和发型设计,极大地提高了设计效率和质量。 民国剧:除了古装剧,神力霓裳也适用于民国时期的影视作品,帮助设计师创造出符合时代特征的造型。 历史题材影视作品:无论是古代还是近现代的历史题材,神力霓裳都能提供精准的服饰和妆造设计,确保角色造型的历史准确性和美观度。 奇幻类影视作品:在奇幻类影视作品中,神力霓裳可以结合历史元素和创意设计,生成独特的角色造型,增加作品的视觉吸引力。 文化展示和教育:神力霓裳还可以用于文化展示和教育项目,通过生成各个历史时期的服饰和妆容,帮助观众更好地理解和欣赏中华传统文化。
数据统计
相关导航

文心千帆是百度智能云推出的产业级知识增强大模型,包括基础大模型、任务大模型、行业大模型,以及丰富的工具与平台,支撑企业与开发者进行高效便捷的应用开发。它能够从海量数据和大规模知识中融合学习,效率更高,效果更好,具备知识增强、检索增强和对话增强的技术特色。

灵境矩阵
灵境矩阵是百度推出的一个基于文心大模型的智能体(Agent)平台。它支持开发者根据自己的行业领域和应用场景,选择不同的开发方式来构建产品,以适应大模型时代的需求。开发者可以通过低成本的prompt编排方式来开发智能体,同时平台还提供了流量分发路径,帮助开发者完成商业闭环。

LTX Video
LTX Video是由 Lightricks公司推出的首个REAL-TIME AI视频生成开源模型。它基于 DiT (Diverse Image Transformer) 架构,能够实时生成高质量的视频。LTX Video 能够以 24 FPS 和 768x512 分辨率生成视频,生成速度比观看速度还要快。

Darwin
Darwin是一个开源项目,专注于自然科学领域的大型语言模型构建,主要涵盖物理、化学和材料科学。通过对科学文献和数据集进行预训练和微调,Darwin 在科学问答和多任务学习任务中表现优异。它结合了结构化和非结构化的科学知识,提升了语言模型在科学研究中的效能。

CatVTON
CatVTON是一款基于扩散模型的虚拟试穿技术工具,旨在提供高效、低资源需求的虚拟试穿体验。通过在空间维度上简单地拼接服装和人物图像来实现不同类别服装的虚拟试穿,该方法有效地降低了模型复杂度和计算成本,同时保持了高质量的虚拟试衣效果,特别适用于电商平台、时尚设计、个人造型顾问、增强现实应用和虚拟时装秀等场景。

Hibiki
Hibiki是一个Kyutai Labs开发的一个用于流式语音翻译(也称为同步翻译)的模型。与离线翻译不同,离线翻译需要等待源语句结束后才开始翻译,而 Hibiki 能够实时积累足够的上下文,以逐块生成正确的翻译。用户在讲话时,Hibiki 会在目标语言中生成自然的语音,并提供文本翻译。

Mistral AI
Mistral AI 是一家来自法国的人工智能服务商,专注于大型语言模型和生成式人工智能的构建、培训和应用。Mistral AI 的目标是与 OpenAI 和 谷歌 竞争,为企业开发生成式人工智能基础设施

序列猴子
序列猴子是出门问问自研的一款大语言模型,它以语言为核心的能力体系涵盖了知识、对话、数学、逻辑、推理和规划等六个维度。它可以同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务,展现出强大的多模态表达能力。
暂无评论...