VPot(详情请点击官网)是一款免费、无广告的文字转语音工具,内置多种语言和声音角色,能够将任意文字转换为流畅的语音文件。工具完全依赖微软及Edge公共API接口,采用纯CPU处理,非常适合短视频配音、在线教学、有声读书等多种应用场景。
尽管类似的文字转语音软件不在少数,尤其是在线网页版,但多数都存在字数限制,且有时需要登录或限制使用次数。此外某些高质量的真人克隆类TTS技术虽然已经相当成熟,但受限于老旧操作系统,无法使用。这类技术不在本帖推荐范围内。
VPot并无以上限制。说到TTS技术,微软TTS的音质和表现可谓是业界顶尖,简洁易用,无需登录接口,且不限次数、不限字数,能够高质量输出语音文件,支持Windows 7至11的64位系统。近期更新,欢迎下载使用。
软件特点:
- 支持导入txt、srt字幕文件;
- 提供音频文件管理功能,方便反复试听和对比;
- 可自定义音频保存目录;
- 支持超长文本的转录;
- 文件重命名不再受软件限制。
使用说明:
单文件版即开即用,复制粘贴相应的文字后,合成语音成功后,系统会自动弹出生成的音频文件。支持多种常见语种的识别,包括普通话、粤语、港普、台语、日韩、马来语等,前提是外语文字要匹配正确。所以通常来说,公共API接口已经能够满足大部分转录需求。文本越长,合成所需时间也会越长。
对于使用Windows 7或精简版系统的用户,需先安装微软官方的WebView2运行环境才能正常使用。可能还需要安装C++运行库,相关资料可以在论坛中找到。
如果你需要更多语种支持和多角色演绎,并且愿意折腾,可以通过微软Azure申请免费API并自行导入,相关教程在小破站随处可见,具体操作请自行搜索。你也可以录制语音报时功能,方便用于某些自动化任务工具(例如,设置“报时”任务时,音频文件会默认保存在对应的Data——Sound目录中,只需替换原始音频文件即可)。
经过测试,VPot在Windows 11平台上能顺利处理3万字以上的章节文本,并成功输出约1个半小时的音频文件,极限字数可自行测试。
备注:
- 经测试,火绒安全软件无拦截,具体查杀结果请查看此处。如果你担心安全问题,可以将其放入虚拟环境中运行。如果介意,请勿下载使用,推荐直接删除。
- 文本中不能包含特殊符号或表情符号(如井号、星号或表情符号等),否则可能会导致合成失败。由于公共API可能会受到网络环境的影响,偶尔可能会出现不稳定情况。
支持语种:(仅限默认设置)
![图片[1]-[Windows] VPot v2411 文字转语音工具_单文件版(支持 Win 7 至 Win 11 系统)](https://zyw.qfzyk.com/wp-content/uploads/replace/944633661fb7220bb21a65379dbf1a00.png)
主要界面:(文本导入及音频输出)
![图片[2]-[Windows] VPot v2411 文字转语音工具_单文件版(支持 Win 7 至 Win 11 系统)](https://zyw.qfzyk.com/wp-content/uploads/replace/39da62994352e3b1f3fb25b1ee592531.png)
导入文件界面:(可Ctrl+ A全选copy到主界面使用)
![图片[3]-[Windows] VPot v2411 文字转语音工具_单文件版(支持 Win 7 至 Win 11 系统)](https://zyw.qfzyk.com/wp-content/uploads/replace/a70a6834d8fe6f331e8b8855596e4aa1.png)