你的專屬閱讀夥伴會說話了 🔊
閱讀長篇文章?學習新語言?有時候,聽文字比讀文字更有效。
我們很高興為陪讀蛙引入 文字轉語音(TTS) 功能——只需一鍵,就能將網頁上的任何文字轉換為自然流暢的語音。
目前版本: TTS 功能目前僅支援 OpenAI 提供者。未來版本將支援更多 AI 提供者。
特別感謝:這個功能由社群貢獻者 @darmau 開發並貢獻。感謝他為陪讀蛙帶來這個實用的功能!
為什麼需要文字轉語音?
閱讀並不總是方便。也許你正在:
- 🚶 步行或通勤途中
- 👀 長時間盯著螢幕後讓眼睛休息一下
- 🌍 學習外語發音
- 📚 更有效吸收長篇內容
有了 TTS,你可以在多工、學習或放鬆時聆聽內容。
你知道嗎? 聆聽內容可以提高理解力和記憶力,尤其對聽覺型學習者更有效。
如何使用
開始使用 TTS 非常簡單:
1. 配置你的語音設定
進入選項 → 文字轉語音來自訂你的聆聽體驗。
你可以選擇:
- 語音:從 11 個自然流暢的聲音中挑選(Alloy、Ash、Ballad、Coral、Echo 等)
- 模型:在
gpt-4o-mini-tts、tts-1或tts-1-hd(更高品質)之間選擇 - 速度:調整播放速度,從 0.25 倍到 4 倍,符合你的偏好
專業提示:試試預覽按鈕,在選擇之前聆聽每個聲音。找到最適合你聽覺風格的完美聲音!
2. 選擇並聆聽
配置完成後,只需:
- 選擇任意文字 在任何網頁上
- 點選揚聲器圖示 在工具列中
- 坐下來聆聽 文字被朗讀出來
| 之前 | 之後 |
|---|---|
| 只能手動閱讀 | 瀏覽時聆聽 |
| 複製並貼上到外部 TTS 工具 | 一鍵即時播放 |
| 無語音自訂 | 11+ 種聲音可供選擇 |
智慧性能特性
我們在建構 TTS 時考慮了效率:
音訊緩存
音訊產生後會本機快取-無需重新產生即可即時重播相同文字。
快取使用智慧 LRU(最近最少使用)策略儲存多達 10 個音訊檔案,因此你最常播放的內容始終準備就緒。
長文本支持
選了一大段文字?**沒問題。 ** 擴充程式會自動分塊長文字,無縫串流音訊以實現不間斷聆聽。
單一播放控制
一次只播放一個音訊。再次點擊揚聲器圖示即可停止或切換到新選擇,避免音訊混亂重疊。
支援的模型和語音
可用模型
| 模型 | 描述 | 最適合 |
|---|---|---|
gpt-4o-mini-tts | 最新模型,擁有 11 種語音 | 新用戶,最佳品質 |
tts-1 | 標準品質,9 種語音 | 快速播放,成本更低 |
tts-1-hd | 高清音訊,9 種語音 | 音質發燒友,清晰度 |
語音選項
從多樣化的語音中選擇,包括:
- Alloy、Ash、Ballad(平靜清晰)
- Coral、Echo、Fable(溫暖富有表現力)
- Nova、Onyx、Sage(專業清晰)
- Shimmer、Verse(明亮引人入勝)
設定要求
要使用 TTS,你需要:
- ✅ 在陪讀蛙中設定 OpenAI API 密鑰
- ✅ 選擇支援 TTS 的 AI 提供者(目前為 OpenAI)
注意: TTS 目前處於公開測試階段。我們正在持續改進語音品質、效能並添加更多提供者支援。
使用場景
語言學習
在閱讀外語內容時聽到正確發音—非常適合提高聽力理解能力。
無障礙訪問
透過將視覺文字轉換為音訊,使網路對那些更喜歡或需要聽覺輸入的人更容易存取。
多工處理
在烹飪、運動或通勤時聆聽文章、文件或新聞。
校對
透過聆聽文字聽起來如何來捕捉寫作中的錯誤——現在這個經典的編輯技巧已內建到你的瀏覽器中。
未來展望
這只是陪讀蛙 TTS 的開始。我們正在探索:
- 🌐 支援更多 AI 供應商(Anthropic、DeepSeek 等)
- 🎯 翻譯文本的 TTS(朗讀翻譯內容)
- 🎧 後台播放控制
- 📱 移動擴展支持
立即嘗試
更新到最新版本的陪讀蛙,體驗文字轉語音的強大功能。
有回饋? 我們很想知道你如何使用 TTS!在 GitHub Issues 上分享你的想法或加入我們的社群討論。
愉快聆聽! 🎧
作者
ananaBMaster
發佈於
2025年10月14日週二
擴充版本
1.13.0