让网页文字开口说话——文字转语音功能上线

选中任意文字,即可即刻朗读。陪读蛙现已支持由 OpenAI 语音模型驱动的文字转语音功能。

返回

你的专属阅读伙伴会说话了 🔊

阅读长文章?学习新语言?有时候,文字比读文字更有效。

我们很高兴为陪读蛙引入 文字转语音(TTS) 功能——只需一键,就能将网页上的任何文字转换为自然流畅的语音。

当前版本: TTS 功能目前仅支持 OpenAI 提供商。未来版本将支持更多 AI 提供商。

特别感谢:这个功能由社区贡献者 @darmau 开发并贡献。感谢他为陪读蛙带来这个实用的功能!


为什么需要文字转语音?

阅读并不总是方便。也许你正在:

  • 🚶 步行或通勤途中
  • 👀 长时间盯着屏幕后让眼睛休息一下
  • 🌍 学习外语发音
  • 📚 更有效地吸收长篇内容

有了 TTS,你可以在多任务处理、学习或放松时聆听内容。

你知道吗? 聆听内容可以提高理解力和记忆力,尤其对听觉型学习者更有效。


如何使用

开始使用 TTS 非常简单:

1. 配置你的语音设置

进入选项 → 文字转语音来自定义你的聆听体验。

你可以选择:

  • 语音:从 11 种自然流畅的声音中挑选(Alloy、Ash、Ballad、Coral、Echo 等)
  • 模型:在 gpt-4o-mini-ttstts-1tts-1-hd(更高质量)之间选择
  • 速度:调整播放速度,从 0.25 倍到 4 倍,匹配你的偏好

专业提示:试试预览按钮,在选择之前聆听每个声音。找到最适合你听觉风格的完美声音!

2. 选择并聆听

配置完成后,只需:

  1. 选择任意文字 在任何网页上
  2. 点击扬声器图标 在工具栏中
  3. 坐下来聆听 文字被朗读出来
之前之后
只能手动阅读浏览时聆听
复制粘贴到外部 TTS 工具一键即时播放
无语音自定义11+ 种声音可供选择

智能性能特性

我们在构建 TTS 时考虑了效率:

音频缓存

音频生成后会本地缓存——无需重新生成即可即时重播相同文字。

缓存使用智能 LRU(最近最少使用)策略存储多达 10 个音频文件,因此你最常播放的内容始终准备就绪。

长文本支持

选择了一大段文字?没问题。 扩展程序会自动分块长文本,无缝流式传输音频以实现不间断聆听。

单一播放控制

一次只播放一个音频。再次点击扬声器图标即可停止或切换到新选择,避免音频混乱重叠。


支持的模型和语音

可用模型

模型描述最适合
gpt-4o-mini-tts最新模型,拥有 11 种语音新用户,最佳质量
tts-1标准质量,9 种语音快速播放,成本更低
tts-1-hd高清音频,9 种语音音质发烧友,清晰度

语音选项

从多样化的语音中选择,包括:

  • Alloy、Ash、Ballad(平静清晰)
  • Coral、Echo、Fable(温暖富有表现力)
  • Nova、Onyx、Sage(专业清晰)
  • Shimmer、Verse(明亮引人入胜)

设置要求

要使用 TTS,你需要:

  • ✅ 在陪读蛙中配置 OpenAI API 密钥
  • ✅ 选择支持 TTS 的 AI 提供商(目前为 OpenAI)

注意: TTS 目前处于公开测试阶段。我们正在持续改进语音质量、性能并添加更多提供商支持。


使用场景

语言学习

在阅读外语内容时听到正确发音——非常适合提高听力理解能力。

无障碍访问

通过将视觉文本转换为音频,使网络对那些更喜欢或需要听觉输入的人更易访问。

多任务处理

在烹饪、锻炼或通勤时聆听文章、文档或新闻。

校对

通过聆听文字听起来如何来捕捉写作中的错误——现在这个经典的编辑技巧已内置到你的浏览器中。


未来展望

这只是陪读蛙 TTS 的开始。我们正在探索:

  • 🌐 支持更多 AI 提供商(Anthropic、DeepSeek 等)
  • 🎯 翻译文本的 TTS(朗读翻译内容)
  • 🎧 后台播放控制
  • 📱 移动扩展支持

立即尝试

更新到最新版本的陪读蛙,体验文字转语音的强大功能。

有反馈? 我们很想知道你如何使用 TTS!在 GitHub Issues 上分享你的想法或加入我们的社区讨论。

愉快聆听! 🎧

作者

ananaBMaster

发布于

Tue Oct 14 2025

扩展版本

1.13.0