Shortcut by PoisedShortcut by Poised是一个基于语音的AI助手,旨在通过自然对话的方式提升用户的工作效率。它允许用户通过语音输入快速获得答案、整理思路、起草消息、电子邮件和文档,同时保持工作流程的连贯性。产品通过AI技术将自然语言转换为精炼的文本,并提供多种语言风格选项,满足不同场合的需求。Shortcut by Poised的背景信息显示,它在Product Hunt上发布,并即将推出Windows和移动应用版本,目前Mac版本已可下载。040文案写作# AI助手# 个性化# 工作效率
OpenVoiceChatOpenVoiceChat是一个开源项目,旨在提供一个与大型语言模型(LLM)进行自然语音对话的平台。它支持多种语音识别(STT)、文本到语音(TTS)和LLM模型,允许用户通过语音与AI进行交互。项目采用Apache-2.0许可,强调开放性和易用性,目标是成为封闭商业实现的开源替代品。040语音处理# 开源# 文本到语音# 自然语言处理
WeSTWeST是一个开源的语音识别转录模型,以300行代码的简洁形式,基于大型语言模型(LLM)实现语音到文本的转换。它由一个大型语言模型、一个语音编码器和一个投影器组成,其中仅投影器部分可训练。WeST的开发灵感来源于SLAM-ASR和LLaMA 3.1,旨在通过简化的代码实现高效的语音识别功能。020语音处理# 开源# 机器学习# 自然语言处理
AIAvatarKitAIAvatarKit是一个用于快速构建基于AI的会话头像的工具。它支持在VRChat、集群和其他元宇宙平台以及现实世界的设备上运行。该工具易于启动,具有无限的扩展能力,可以根据用户的需求进行定制。主要优点包括:1. 多平台支持:可以在多种平台上运行,包括VRChat、集群和元宇宙平台。2. 易于启动:用户可以立即开始对话,无需复杂的设置。3. 扩展性:用户可以根据需要添加无限功能。4. 技术支持:需要VOICEVOX API、Google或Azure的语音服务API密钥以及OpenAI API密钥。040头像生成# AI# VRChat# 会话头像
ultravox-v0_4_1-llama-3_1-70bfixie-ai/ultravox-v0_4_1-llama-3_1-70b是一个基于预训练的Llama3.1-70B-Instruct和whisper-large-v3-turbo的大型语言模型,能够处理语音和文本输入,生成文本输出。该模型通过特殊伪标记<|audio|>将输入音频转换为嵌入,并与文本提示合并后生成输出文本。Ultravox的开发旨在扩展语音识别和文本生成的应用场景,如语音代理、语音到语音翻译和口语音频分析等。该模型遵循MIT许可,由Fixie.ai开发。050文案写作# 多模态# 大型语言模型# 文本生成
场辞场辞是一款基于语音识别技术的视频字幕制作软件,提供语音转字幕、一键加字幕、视频加字幕,字幕快捷校对等功能,最快5min即可完成1小时的视频字幕制作,准确率高达97.5060综合资源# AI字幕# AI工具集# AI工具集资源
场辞场辞是一款基于语音识别技术的视频字幕制作软件,提供语音转字幕、一键加字幕、视频加字幕,字幕快捷校对等功能,最快5min即可完成1小时的视频字幕制作,准确率高达97.50130综合资源# AI字幕# AI工具集# AI工具集资源
知意字稿知意字稿专注于通过AI来实现在线声音转文字、声音转成字幕文件,识别准、速度快,能够有效帮助用户快速识别,完成音频整理、文案提取等工作。除了音/视频转文字/字幕等功能外,还提供图片文字提取、表格图片提取等其他各类转写/转换操作。0100AI语言翻译# AI语言翻译# AI音频工具# 分类导航
场辞场辞是一款先进且高效的AI视频字幕制作软件,依托于先进的语音识别技术,为您的视频制作提供全面且精准的字幕解决方案。通过场辞,您可以轻松实现语音转字幕、一键加字幕、视频加字幕等操作,它改变了传统的字幕制作方式,极大地提高了效率和准确性。080AI视频工具# AI字幕# AI视频工具# 分类导航
度加剪辑度加剪辑是百度官方出品的一款简洁、好用的视频剪辑工具,专为泛知识类作者设计。通过简单易用的剪辑功能、高效准确的智能识别字幕能力以及与百度网盘的打通,帮助用户高效地完成视频作品,降低创作门槛,助力生产优质的作品。0140视频创作# ducut# vlog编辑器# 免费视频编辑软件
智东西智东西是中国领先的智能产业媒体和创新服务平台。聚焦于以人工智能为核心的新技术驱动的创新创业和传统产业升级。自创立以来,智东西以“聚焦智能变革 服务产业升级”为愿景,已形成媒体、公开课以及产业活动三大产品业务体系,并构建了庞大的智能产业垂直社群。017003-科技数码# 03-科技数码# AI芯片# CPU
场辞一款基于语音识别技术的视频字幕制作软件,提供语音转字幕、一键加字幕、视频加字幕,字幕快捷校对等功能,最快5min即可完成1小时的视频字幕制作,准确率高达97.5%。070字幕配音# AI字幕# 后期# 场辞
场辞一款基于语音识别技术的视频字幕制作软件,提供语音转字幕、一键加字幕、视频加字幕,字幕快捷校对等功能,最快5min即可完成1小时的视频字幕制作,准确率高达97.5%。0170字幕配音# AI字幕# 后期# 场辞
ArcTime Pro跨平台字幕软件ArcTime是使用Java编写的免费跨平台字幕软件,是一款全新概念的可视化字幕编辑器,独创字幕块概念,在时间线上拖动、调整字幕块即可轻松完成字幕创建工作。0100字幕配音# AE字幕# After Effects字幕# ArcTime
ArcTime Pro跨平台字幕软件ArcTime是使用Java编写的免费跨平台字幕软件,是一款全新概念的可视化字幕编辑器,独创字幕块概念,在时间线上拖动、调整字幕块即可轻松完成字幕创建工作。080字幕配音# AE字幕# After Effects字幕# ArcTime
CuboxCubox是一款专为深度阅读与学习设计的智能工具,利用先进的人工智能技术自动解读文章内容,充分释放用户在高亮标 […]0180AI办公工具AI工具导航# AI# annotation# bookmark
度加剪辑度加剪辑是百度官方出品的一款简洁、好用的视频剪辑工具,专为泛知识类作者设计。通过简单易用的剪辑功能、高效准确的智能识别字幕能力以及与百度网盘的打通,帮助用户高效地完成视频作品,降低创作门槛,助力生产优质的作品。0350视频工具# ducut# vlog编辑器# 免费视频编辑软件
知意字稿知意字稿专注于通过AI来实现在线声音转文字、声音转成字幕文件,识别准、速度快,能够有效帮助用户快速识别,完成音频整理、文案提取等工作。除了音/视频转文字/字幕等功能外,还提供图片文字提取、表格图片提取等其他各类转写/转换操作。0390AI语言翻译# 字幕制作软件# 录音整理# 录音转文字