PengChengStarling

1年前发布 40 00

收录时间：

2025-04-08

打开网站手机查看

AI大模型 # AI大模型 # PengChengStarling # 分类导航 # 实时流式语音识别 # 开源语音识别模型 # 语音识别开源项目

PengChengStarling

打开网站

PengChengStarling是由 PengCheng Labs 开发的多语言自动语音识别工具，支持中文、英语、俄语、越南语、日语、泰语、印度尼西亚语和阿拉伯语。相比 Whisper-Large v3，PengChengStarling 的模型仅占其 20% 大小，但推理速度提高了 7 倍，且流式语音识别效果卓越。PengChengStarling 是开源的，采用 Apache 2.0 许可证，适用于语音助手、翻译工具、字幕生成和语音搜索等多种应用场景。 PengChengStarling – 多语言实时语音识别解决方案 PengChengStarling的主要功能特点多语言支持：支持中文、英语、俄语、越南语、日语、泰语、印度尼西亚语和阿拉伯语。高效性：相比 Whisper-Large v3，PengChengStarling 的模型大小仅为其 20%，但推理速度提高了 7 倍。流式语音识别：支持实时流式语音识别，适用于需要实时处理的应用场景。开源：采用 Apache 2.0 许可证，允许商业和个人使用。完整的 ASR 管道：提供从数据处理、模型训练、推理、微调到部署的完整 ASR 管道。高性能：在多种语言上的流式 ASR 性能与 Whisper-Large v3 相媲美甚至更优。灵活性：支持多种数据集的预处理，生成所需的输入格式。模型微调：支持模型的微调，以适应特定任务需求。便于部署：提供 PyTorch 和 ONNX 格式的模型，便于在各种环境中部署。多功能应用：适用于语音助手、翻译工具、字幕生成和语音搜索等多种应用场景。 PengChengStarling的使用方法安装依赖：首先，使用 Anaconda 或其他包管理器安装必要的依赖项，如 Python、TensorFlow 或 PyTorch 等。下载模型：从 Hugging Face 或其他官方渠道下载 PengChengStarling 模型。配置环境：创建一个虚拟环境，并激活它。准备数据：将原始数据预处理为所需的输入格式，通常涉及到在 zipformer/prepare.py 中适应 make_*_list 方法，生成data.list文件。训练模型：使用 zipformer/train.py 脚本进行模型训练，配置训练参数时，可以参考 config_train 目录中的 YAML 文件。评估模型：在测试集上评估模型性能，使用 zipformer/streaming_decode.py 脚本进行流式模型评估。导出模型：将最佳检查点导出为 ONNX 格式，以便在各种环境中部署。

数据统计

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

PengChengStarling

数据统计

相关导航

孟子生成式大模型

Loopy AI

Idea-2-3D

V-Express

Lumiere

DreamTalk

文心千帆

MiracleVision奇想智能

暂无评论

网址

Envato

水果派TV解说视频

龙腾网

丫丫动漫

bt磁力天堂

虫虫影视

热门推荐