让网页文字开口说话——文字转语音功能上线

选中任意文字,即可即刻朗读。陪读蛙现已支持由 OpenAI 语音模型驱动的文字转语音功能。

你的专属阅读伙伴会说话了 🔊

阅读长文章?学习新语言?有时候,听文字比读文字更有效。

我们很高兴为陪读蛙引入 文字转语音(TTS) 功能——只需一键,就能将网页上的任何文字转换为自然流畅的语音。

当前版本: TTS 功能目前仅支持 OpenAI 提供商。未来版本将支持更多 AI 提供商。

特别感谢:这个功能由社区贡献者 @darmau 开发并贡献。感谢他为陪读蛙带来这个实用的功能!

为什么需要文字转语音?

阅读并不总是方便。也许你正在:

🚶 步行或通勤途中
👀 长时间盯着屏幕后让眼睛休息一下
🌍 学习外语发音
📚 更有效地吸收长篇内容

有了 TTS,你可以在多任务处理、学习或放松时聆听内容。

你知道吗? 聆听内容可以提高理解力和记忆力,尤其对听觉型学习者更有效。

如何使用

开始使用 TTS 非常简单:

1. 配置你的语音设置

进入选项 → 文字转语音来自定义你的聆听体验。

你可以选择:

语音:从 11 种自然流畅的声音中挑选(Alloy、Ash、Ballad、Coral、Echo 等)
模型:在 gpt-4o-mini-tts、tts-1 或 tts-1-hd(更高质量)之间选择
速度:调整播放速度,从 0.25 倍到 4 倍,匹配你的偏好

专业提示:试试预览按钮,在选择之前聆听每个声音。找到最适合你听觉风格的完美声音!

2. 选择并聆听

配置完成后,只需:

选择任意文字 在任何网页上
点击扬声器图标 在工具栏中
坐下来聆听 文字被朗读出来

之前	之后
只能手动阅读	浏览时聆听
复制粘贴到外部 TTS 工具	一键即时播放
无语音自定义	11+ 种声音可供选择

智能性能特性

我们在构建 TTS 时考虑了效率:

音频缓存

音频生成后会本地缓存——无需重新生成即可即时重播相同文字。

缓存使用智能 LRU(最近最少使用)策略存储多达 10 个音频文件,因此你最常播放的内容始终准备就绪。

长文本支持

选择了一大段文字?没问题。 扩展程序会自动分块长文本,无缝流式传输音频以实现不间断聆听。

单一播放控制

一次只播放一个音频。再次点击扬声器图标即可停止或切换到新选择,避免音频混乱重叠。

支持的模型和语音

可用模型

模型	描述	最适合
`gpt-4o-mini-tts`	最新模型,拥有 11 种语音	新用户,最佳质量
`tts-1`	标准质量,9 种语音	快速播放,成本更低
`tts-1-hd`	高清音频,9 种语音	音质发烧友,清晰度

语音选项

从多样化的语音中选择,包括:

Alloy、Ash、Ballad(平静清晰)
Coral、Echo、Fable(温暖富有表现力)
Nova、Onyx、Sage(专业清晰)
Shimmer、Verse(明亮引人入胜)

设置要求

要使用 TTS,你需要:

✅ 在陪读蛙中配置 OpenAI API 密钥
✅ 选择支持 TTS 的 AI 提供商(目前为 OpenAI)

注意: TTS 目前处于公开测试阶段。我们正在持续改进语音质量、性能并添加更多提供商支持。

使用场景

语言学习

在阅读外语内容时听到正确发音——非常适合提高听力理解能力。

无障碍访问

通过将视觉文本转换为音频,使网络对那些更喜欢或需要听觉输入的人更易访问。

多任务处理

在烹饪、锻炼或通勤时聆听文章、文档或新闻。

校对

通过聆听文字听起来如何来捕捉写作中的错误——现在这个经典的编辑技巧已内置到你的浏览器中。

未来展望

这只是陪读蛙 TTS 的开始。我们正在探索:

🌐 支持更多 AI 提供商(Anthropic、DeepSeek 等)
🎯 翻译文本的 TTS(朗读翻译内容)
🎧 后台播放控制
📱 移动扩展支持

立即尝试

更新到最新版本的陪读蛙,体验文字转语音的强大功能。

有反馈? 我们很想知道你如何使用 TTS!在 GitHub Issues 上分享你的想法或加入我们的社区讨论。

愉快聆听! 🎧

作者

ananaBMaster

发布于

2025年10月14日周二

扩展版本

1.13.0