讓網頁文字開口說話－文字轉語音功能上線

選取任意文字,即可即刻朗讀。陪讀蛙現已支援由 OpenAI 語音模型驅動的文字轉語音功能。

你的專屬閱讀夥伴會說話了 🔊

閱讀長篇文章?學習新語言?有時候,聽文字比讀文字更有效。

我們很高興為陪讀蛙引入 文字轉語音(TTS) 功能——只需一鍵,就能將網頁上的任何文字轉換為自然流暢的語音。

目前版本: TTS 功能目前僅支援 OpenAI 提供者。未來版本將支援更多 AI 提供者。

特別感謝:這個功能由社群貢獻者 @darmau 開發並貢獻。感謝他為陪讀蛙帶來這個實用的功能!

為什麼需要文字轉語音?

閱讀並不總是方便。也許你正在:

🚶 步行或通勤途中
👀 長時間盯著螢幕後讓眼睛休息一下
🌍 學習外語發音
📚 更有效吸收長篇內容

有了 TTS,你可以在多工、學習或放鬆時聆聽內容。

你知道嗎? 聆聽內容可以提高理解力和記憶力,尤其對聽覺型學習者更有效。

如何使用

開始使用 TTS 非常簡單:

1. 配置你的語音設定

進入選項 → 文字轉語音來自訂你的聆聽體驗。

你可以選擇:

語音:從 11 個自然流暢的聲音中挑選(Alloy、Ash、Ballad、Coral、Echo 等)
模型:在 gpt-4o-mini-tts、tts-1 或 tts-1-hd(更高品質)之間選擇
速度:調整播放速度,從 0.25 倍到 4 倍,符合你的偏好

專業提示:試試預覽按鈕,在選擇之前聆聽每個聲音。找到最適合你聽覺風格的完美聲音!

2. 選擇並聆聽

配置完成後,只需:

選擇任意文字 在任何網頁上
點選揚聲器圖示 在工具列中
坐下來聆聽 文字被朗讀出來

之前	之後
只能手動閱讀	瀏覽時聆聽
複製並貼上到外部 TTS 工具	一鍵即時播放
無語音自訂	11+ 種聲音可供選擇

智慧性能特性

我們在建構 TTS 時考慮了效率:

音訊緩存

音訊產生後會本機快取－無需重新產生即可即時重播相同文字。

快取使用智慧 LRU(最近最少使用)策略儲存多達 10 個音訊檔案,因此你最常播放的內容始終準備就緒。

長文本支持

選了一大段文字?**沒問題。 ** 擴充程式會自動分塊長文字,無縫串流音訊以實現不間斷聆聽。

單一播放控制

一次只播放一個音訊。再次點擊揚聲器圖示即可停止或切換到新選擇,避免音訊混亂重疊。

支援的模型和語音

可用模型

模型	描述	最適合
`gpt-4o-mini-tts`	最新模型,擁有 11 種語音	新用戶,最佳品質
`tts-1`	標準品質,9 種語音	快速播放,成本更低
`tts-1-hd`	高清音訊,9 種語音	音質發燒友,清晰度

語音選項

從多樣化的語音中選擇,包括:

Alloy、Ash、Ballad(平靜清晰)
Coral、Echo、Fable(溫暖富有表現力)
Nova、Onyx、Sage(專業清晰)
Shimmer、Verse(明亮引人入勝)

設定要求

要使用 TTS,你需要:

✅ 在陪讀蛙中設定 OpenAI API 密鑰
✅ 選擇支援 TTS 的 AI 提供者(目前為 OpenAI)

注意: TTS 目前處於公開測試階段。我們正在持續改進語音品質、效能並添加更多提供者支援。

使用場景

語言學習

在閱讀外語內容時聽到正確發音—非常適合提高聽力理解能力。

無障礙訪問

透過將視覺文字轉換為音訊,使網路對那些更喜歡或需要聽覺輸入的人更容易存取。

多工處理

在烹飪、運動或通勤時聆聽文章、文件或新聞。

校對

透過聆聽文字聽起來如何來捕捉寫作中的錯誤——現在這個經典的編輯技巧已內建到你的瀏覽器中。

未來展望

這只是陪讀蛙 TTS 的開始。我們正在探索:

🌐 支援更多 AI 供應商(Anthropic、DeepSeek 等)
🎯 翻譯文本的 TTS(朗讀翻譯內容)
🎧 後台播放控制
📱 移動擴展支持

立即嘗試

更新到最新版本的陪讀蛙,體驗文字轉語音的強大功能。

有回饋? 我們很想知道你如何使用 TTS!在 GitHub Issues 上分享你的想法或加入我們的社群討論。

愉快聆聽! 🎧

作者

ananaBMaster

發佈於

2025年10月14日週二

擴充版本

1.13.0