亞馬遜發布 Nova Sonic 聲音模型,聲稱性能超越 OpenAI 和谷歌

亞馬遜今天推出了 Nova Sonic,這是一種先進的語音到語音模型,使開發人員能夠建立能夠即時與類似人類的聲音交談的應用程式。亞馬遜聲稱這款新型音訊車型擁有業界領先的性價比和低延遲。

通常,開發支援語音的應用程式需要開發人員同時使用多個模型:

  • 用於將音訊轉換為文字的語音辨識模型。
  • 用於理解和產生回應的大型語言模型 (LLM)。
  • 文字轉語音模型。

這種方法不僅複雜,而且常常忽略聲調、節奏和說話風格等重要的聲學背景。

亞馬遜發布 Nova Sonic 聲音模型,聲稱性能超越 OpenAI 和谷歌

Nova Sonic 透過將聲音理解和生成整合到單一模型中來解決這項挑戰。統一的方法有助於模型捕捉語氣、風格和音訊輸入,從而創造更自然的對話。它還可以確定適當的反應時間並更好地處理插話。

Nova Sonic 支持男性和女性的聲音,並帶有多種英語口音,例如美式英語、英式英語。開發人員可以使用支援函數呼叫的雙向流 API 透過 Amazon Bedrock 存取模型。該模型還具有內容審核和浮水印等內建保護功能。

在這方面,OpenAI 上個月宣布了新一代語音轉文字模型——GPT-4O-Transcribe 和 GPT-4O-Mini-Transcribe,與先前的 Whisper 模型相比,它們的單字錯誤率、語言辨識和準確性都有顯著提升。

Sign up and earn $1000 a day ⋙

Leave a Comment

2025 年最適合學生的筆記型電腦

2025 年最適合學生的筆記型電腦

學生需要一台特定類型的筆記型電腦來學習。它不僅要性能強大,能夠出色地完成所選專業,還要小巧輕便,方便全天攜帶。

如何在 Windows 10 中新增印表機

如何在 Windows 10 中新增印表機

在 Windows 10 中新增印表機很簡單,儘管有線設備的過程與無線設備的過程不同。

如何以最高的準確率檢查電腦上的 RAM 和 RAM 錯誤

如何以最高的準確率檢查電腦上的 RAM 和 RAM 錯誤

眾所周知,RAM 是電腦中非常重要的硬體部件,它充當處理資料的內存,並且是決定筆記型電腦或 PC 速度的關鍵因素。在下面的文章中,WebTech360 將向您介紹一些在 Windows 上使用軟體檢查 RAM 錯誤的方法。

普通電視和智慧電視的差別

普通電視和智慧電視的差別

智慧電視確實風靡全球。憑藉如此多的強大功能和互聯網連接,科技改變了我們觀看電視的方式。

為什麼冷凍室沒有燈,冷藏室有燈?

為什麼冷凍室沒有燈,冷藏室有燈?

冰箱是家庭中常見的家用電器。冰箱通常有 2 個隔間,冷藏室寬敞,並且每次使用者打開時都會自動亮燈,而冷凍室狹窄且沒有燈。

解決 Wi-Fi 速度變慢的網路擁塞問題的 2 種方法

解決 Wi-Fi 速度變慢的網路擁塞問題的 2 種方法

除了路由器、頻寬和乾擾之外,Wi-Fi 網路還受到許多因素的影響,但也有一些智慧的方法可以增強您的網路效能。

如何使用 Tenorshare Reiboot 將 iOS 17 降級到 iOS 16 且不遺失數據

如何使用 Tenorshare Reiboot 將 iOS 17 降級到 iOS 16 且不遺失數據

如果您想在手機上恢復穩定的 iOS 16,這裡是卸載 iOS 17 並從 iOS 17 降級到 16 的基本指南。

每天吃優​​格會對身體產生什麼影響?

每天吃優​​格會對身體產生什麼影響?

酸奶是一種美妙的食物。每天吃優​​格好嗎?每天吃酸奶,你的身體會發生怎樣的變化?讓我們一起來了解一下吧!

哪種米最有益於健康?

哪種米最有益於健康?

本文討論了最有營養的米種類以及如何最大限度地發揮所選米的健康益處。

如何早上準時起床

如何早上準時起床

制定睡眠時間表和就寢習慣、更改鬧鐘以及調整飲食都是可以幫助您睡得更好、早上準時起床的一些措施。

玩 Rent Please! 的提示新手模擬房東

玩 Rent Please! 的提示新手模擬房東

請租用! Landlord Sim 是一款適用於 iOS 和 Android 的模擬手機遊戲。您將扮演一個公寓大樓的房東,開始出租公寓,目標是升級公寓的內部並為租戶做好準備。

最新浴室塔防代碼及代碼輸入方法

最新浴室塔防代碼及代碼輸入方法

取得浴室塔防 Roblox 遊戲代碼並兌換令人興奮的獎勵。它們將幫助您升級或解鎖具有更高傷害的塔。

變壓器的結構、符號和工作原理

變壓器的結構、符號和工作原理

讓我們以最準確的方式了解變壓器的結構、符號和運作原理。

人工智慧讓智慧電視更上一層樓的四種方式

人工智慧讓智慧電視更上一層樓的四種方式

從更好的影像和聲音品質到語音控制等等,這些人工智慧功能讓智慧電視變得更好!

為什麼 ChatGPT 比 DeepSeek 更好

為什麼 ChatGPT 比 DeepSeek 更好

最初,人們對DeepSeek寄予厚望。作為 ChatGPT 強勁競爭對手的 AI 聊天機器人,它承諾提供智慧聊天功能和體驗。