文字转语音(在线朗读,免费)
把一段文案、一篇稿子、一段旁白脚本变成能听的人声——文字转语音就是干这个的。转换猫用 Kokoro 这个开源语音模型,直接在你浏览器里把文字合成自然人声,给你一个能播放、也能下载的 WAV 文件,有多种英式/美式音色可选。一句实话:模型首次会下载约 80MB(之后缓存在你浏览器里,再用就是即时的),合成全程在你这台设备上跑,文字从不上传——所以它免费、不限次、无水印,是 ElevenLabs(每月 $22 起)这类付费配音的零成本替代。当前音色以英语为主,中文长稿请按句拆开分段合成。
把一段文案、一篇稿子、一段旁白脚本变成能听的人声——文字转语音就是干这个的。转换猫用 Kokoro 这个开源语音模型,直接在你浏览器里把文字合成自然人声,给你一个能播放、也能下载的 WAV 文件,有多种英式/美式音色可选。
首次会下载 Kokoro 语音模型(约 80MB),之后缓存在你浏览器里,再用即时。全程在你设备上运行,文字从不上传。
如何文字转语音?
- 1在输入框里粘贴或输入要朗读的文字(建议单次 2000 字以内)。
- 2选一个音色(不同性别、英式/美式口音)。
- 3点「生成语音」。首次会下载语音模型(约 80MB,之后缓存),合成很快。
- 4在线试听,满意就点下载,保存成 WAV 文件。
为什么用转换猫文字转语音?
- 文字不出本机:合成在你浏览器里完成,稿件、剧本、私人备注从不上传任何服务器。
- 免费、不限次、无水印:生成多少段都一样,导出的音频上不会被盖任何标记或叫你升级。
- 开源 Apache 模型可商用:用的是 Kokoro-82M(Apache-2.0),生成的语音可放心用于视频旁白、播客等场景。
常见问题
可以。转换猫用的是 Kokoro-82M 模型,采用 Apache-2.0 许可(允许商用),合成在你本地完成,输出的 WAV 归你自由使用。当然,最终内容是否合规仍取决于你朗读的文字本身。
第一次需要把约 80MB 的语音模型下载到你浏览器(之后会缓存进浏览器,再用就是即时的,不用重下)。下载完之后的每一次合成都很快。用支持 WebGPU 的 Chrome / Edge 会明显更快,其它浏览器会自动退回到 WASM 也能用。
当前版本音色以英语(美式/英式)为主,对英文文本效果最好。中文朗读暂不是强项;要朗读长文,建议按句子或段落拆开分段生成再拼接。
不会。整个合成在你这台设备的浏览器里完成,文字和生成的音频都不上传到任何服务器,自然也不会被收集或用于训练。
更新于 · 转换猫团队