热门

昇思MindSpore

1年前发布 42 00

昇思MindSpore是由华为自研的一种适用于端边云场景的全场景深度学习框架，MindSpore提供了友好的设计和高效的执行，旨在提升数据科学家和算法工程师的开发体验，并为Ascend AI处理器提供原生支持，以及软硬件协同优化。

收录时间：

2025-04-08

打开网站手机查看

AI大模型 # AI大模型 # 全场景深度学习框架 # 分类导航 # 昇思MindSpore

昇思MindSpore

昇思MindSpore

昇思MindSpore是由华为自研的一种适用于端边云场景的新型开源深度学习训练/推理框架，MindSpore提供了友好的设计和高效的执行，旨在提升数据科学家和算法工程师的开发体验，并为Ascend AI处理器提供原生支持，以及软硬件协同优化。昇思MindSpore的功能特点原生支持动态图与静态图：MindSpore能够灵活地在动态图（方便调试）和静态图（执行高效）之间进行切换，从而满足用户在开发和执行阶段的不同需求。端边云协同：MindSpore支持全场景部署，不仅能在云端进行大规模的训练和推理，也能在边缘端和终端设备上实现轻量级的推理任务，满足各种实际场景的需求。自动微分：MindSpore提供了自动微分功能，可以自动计算神经网络训练过程中的梯度，大大简化了开发者的工作。模型并行和数据并行：为了满足大规模分布式训练的需求，MindSpore提供了模型并行和数据并行两种并行方式，可以充分利用集群的计算资源，提高训练效率。支持多种硬件平台：MindSpore具有良好的硬件兼容性，可以支持多种硬件平台，包括CPU、GPU、Ascend等，使得开发者能够充分利用各种硬件资源。强大的算子库和模型库：MindSpore提供了丰富的算子库和模型库，涵盖了深度学习领域的各种常见算子和模型，方便开发者快速构建和训练自己的神经网络。高效的内存管理和优化：MindSpore在内存管理和优化方面做得很出色，能够有效地减少内存占用和提高计算效率，这对于处理大规模数据集和复杂模型来说尤为重要。

数据统计

相关导航

Animate Anyone

DreaMoving是一种基于扩散模型打造的可控视频生成框架，通过图文就能制作高质量人类跳舞视频。用户只需上传一张人像，以及一段提示词，就能生成对应的视频，而且改变提示词，生成的人物的背景和身上的衣服也会跟着变化。简单来说就是，一张图、一句话就能让任何人或角色在任何场景里跳舞。

PixArt-Σ

PIXART-Σ是华为推出的图像生成模型，由华为诺亚方舟实验室、大连理工大学和香港大学的研究团队开发。采用Diffusion Transformer (DiT) 架构，专用于生成 4K 分辨率的 AI 图像。用户只需输入一段文字描述就能生成具有4K高分辨率的图像，相较于前身PixArt-α，它提供了更高的图像保真度和与文本提示更好的对齐。

百度智能云客悦

百度智能云客悦是百度推出的智能客服平台。其旗下的智能外呼平台是一款集合NLP（自然语言处理）、ASR（自动语音识别）、TTS（语音合成）等人工智能技术，提供公有云服务并支持同时面向多名用户，自动发起外呼通话的智能化产品。

言犀

言犀是京东自营智能人机交互平台，助力企业服务数智化转型。以AI技术驱动，从文字、语音到多模态交互，从对话智能到情感智能，聚焦体验、效率与转化，旨在打造新一代智能人机交互平台，面向不同行业和客户场景助力企业服务和营销实现数智化转型升级。

CogVideo

CogVideo是目前最大的通用领域文本到视频生成预训练模型，含94亿参数。CogVideo将预训练文本到图像生成模型（CogView2）有效地利用到文本到视频生成模型，并使用了多帧率分层训练策略。用于文本到视频的生成。它是基于Transformer架构的，旨在通过理解和转换文本描述来生成相应的视频内容。CogVideo能够处理大量的文本-视频对数据，并通过学习这些数据的模式来生成与文本描述相匹配的视频。

灵境矩阵

灵境矩阵是百度推出的一个基于文心大模型的智能体（Agent）平台。它支持开发者根据自己的行业领域和应用场景，选择不同的开发方式来构建产品，以适应大模型时代的需求。开发者可以通过低成本的prompt编排方式来开发智能体，同时平台还提供了流量分发路径，帮助开发者完成商业闭环。

腾讯混元大模型

腾讯混元大模型，这是一款由腾讯全方位自研的大型通用语言模型，拥有强悍的参数规模超过千亿级别，预训练语料库超过2万亿tokens。其独步全球的中文理解与创作能力，以及出色的逻辑推理能力和稳定的任务执行能力，都令人震撼。

Tarsier

Tarsier是由字节跳动研发的大规模视频语言模型家族，旨在生成高质量的视频描述，并具备良好的视频理解能力。Tarsier 采用了简单的模型结构，结合了 CLIP-ViT 编码帧和 LLM 模型来建模时间关系。通过精心设计的两阶段训练策略，Tarsier 展现出了强大的视频描述能力和视频理解能力，在多个公共基准测试中取得了最先进的成果。

暂无评论

您必须登录才能参与评论！

暂无评论...