你的专属阅读伙伴会说话了 🔊
阅读长文章?学习新语言?有时候,听文字比读文字更有效。
我们很高兴为陪读蛙引入 文字转语音(TTS) 功能——只需一键,就能将网页上的任何文字转换为自然流畅的语音。
当前版本: TTS 功能目前仅支持 OpenAI 提供商。未来版本将支持更多 AI 提供商。
特别感谢:这个功能由社区贡献者 @darmau 开发并贡献。感谢他为陪读蛙带来这个实用的功能!
为什么需要文字转语音?
阅读并不总是方便。也许你正在:
- 🚶 步行或通勤途中
- 👀 长时间盯着屏幕后让眼睛休息一下
- 🌍 学习外语发音
- 📚 更有效地吸收长篇内容
有了 TTS,你可以在多任务处理、学习或放松时聆听内容。
你知道吗? 聆听内容可以提高理解力和记忆力,尤其对听觉型学习者更有效。
如何使用
开始使用 TTS 非常简单:
1. 配置你的语音设置
进入选项 → 文字转语音来自定义你的聆听体验。
你可以选择:
- 语音:从 11 种自然流畅的声音中挑选(Alloy、Ash、Ballad、Coral、Echo 等)
- 模型:在
gpt-4o-mini-tts、tts-1或tts-1-hd(更高质量)之间选择 - 速度:调整播放速度,从 0.25 倍到 4 倍,匹配你的偏好
专业提示:试试预览按钮,在选择之前聆听每个声音。找到最适合你听觉风格的完美声音!
2. 选择并聆听
配置完成后,只需:
- 选择任意文字 在任何网页上
- 点击扬声器图标 在工具栏中
- 坐下来聆听 文字被朗读出来
| 之前 | 之后 |
|---|---|
| 只能手动阅读 | 浏览时聆听 |
| 复制粘贴到外部 TTS 工具 | 一键即时播放 |
| 无语音自定义 | 11+ 种声音可供选择 |
智能性能特性
我们在构建 TTS 时考虑了效率:
音频缓存
音频生成后会本地缓存——无需重新生成即可即时重播相同文字。
缓存使用智能 LRU(最近最少使用)策略存储多达 10 个音频文件,因此你最常播放的内容始终准备就绪。
长文本支持
选择了一大段文字?没问题。 扩展程序会自动分块长文本,无缝流式传输音频以实现不间断聆听。
单一播放控制
一次只播放一个音频。再次点击扬声器图标即可停止或切换到新选择,避免音频混乱重叠。
支持的模型和语音
可用模型
| 模型 | 描述 | 最适合 |
|---|---|---|
gpt-4o-mini-tts | 最新模型,拥有 11 种语音 | 新用户,最佳质量 |
tts-1 | 标准质量,9 种语音 | 快速播放,成本更低 |
tts-1-hd | 高清音频,9 种语音 | 音质发烧友,清晰度 |
语音选项
从多样化的语音中选择,包括:
- Alloy、Ash、Ballad(平静清晰)
- Coral、Echo、Fable(温暖富有表现力)
- Nova、Onyx、Sage(专业清晰)
- Shimmer、Verse(明亮引人入胜)
设置要求
要使用 TTS,你需要:
- ✅ 在陪读蛙中配置 OpenAI API 密钥
- ✅ 选择支持 TTS 的 AI 提供商(目前为 OpenAI)
注意: TTS 目前处于公开测试阶段。我们正在持续改进语音质量、性能并添加更多提供商支持。
使用场景
语言学习
在阅读外语内容时听到正确发音——非常适合提高听力理解能力。
无障碍访问
通过将视觉文本转换为音频,使网络对那些更喜欢或需要听觉输入的人更易访问。
多任务处理
在烹饪、锻炼或通勤时聆听文章、文档或新闻。
校对
通过聆听文字听起来如何来捕捉写作中的错误——现在这个经典的编辑技巧已内置到你的浏览器中。
未来展望
这只是陪读蛙 TTS 的开始。我们正在探索:
- 🌐 支持更多 AI 提供商(Anthropic、DeepSeek 等)
- 🎯 翻译文本的 TTS(朗读翻译内容)
- 🎧 后台播放控制
- 📱 移动扩展支持
立即尝试
更新到最新版本的陪读蛙,体验文字转语音的强大功能。
有反馈? 我们很想知道你如何使用 TTS!在 GitHub Issues 上分享你的想法或加入我们的社区讨论。
愉快聆听! 🎧
作者
ananaBMaster
发布于
Tue Oct 14 2025
扩展版本
1.13.0