語音模型
」懶得打字就用說的!ChatGPT紛擾中推出語音對話功能 免費版也能用
近期科技領域最大的新聞,莫過於就是生成式AI聊天機器人ChatGPT母公司OpenAI的內部鬥爭吧!截至目前為止,尚不清楚OpenAI要如何進行收尾,但就在這紛紛擾擾之際,OpenAI竟然正式釋出了ChatGPT的語音對話功能,而且就連免費版用戶也能使用。首先要強調的是,這項功能其實早在10月初時就陸續開放給全球ChatGPT Plus(付費用戶)使用,如今是正式開放使用,連免費版用戶也能正常使用。如果要使用這項功能,最快的方式就是前往Google Play商店或是App Store下載ChatGPT的App。ChatGPT正式釋出語音對話功能,只要點選App中耳機的圖案,就能開啟對話功能。而且你與ChatGPT之間的對話,也能轉換成完整的文字。(圖/翻攝自ChatGPT)在下載完成App、打開ChatGPT完成登錄後,就可以看到原本輸入文字的對話框右邊,出現了一個小小的麥克風圖案。第一次點選這個功能的時候,系統還會要求你選擇你偏好的語音模型,接著你就可以透過對話的方式與其進行自然的溝通。第一次使用的時候,可以選擇各種不同語調的模型跟你對話。(圖/翻攝自ChatGPT)經由《CTWANT》實測,初次使用ChatGPT的對話功能時,AI很有可能直接對著你說英文。但你只要一句「請使用中文與我溝通」,這時候AI模型就會切換成超級流暢的中文與你對話。而經過測試後,發現ChatGPT的語音模型真的是流暢異常,只能在一些枝微末節的地方感覺到那種一般AI人聲特有的「機械感」。除此之外,ChatGPT的語音對話功能也能當作翻譯機來使用,美中不足的是,多次與ChatGPT溝通後,目前要讓ChatGPT實現翻譯功能的話,就需要在他每次聆聽到外語前、後,對ChatGPT用口語下達翻譯指令,與坊間的自動偵測後實現自動翻譯仍有一大段距離。跟ChatGPT對話時畫面圖案的含意,左邊的圓形是正在聽你說,中間的不規則形狀是ChatGPT正在思考中,右邊的四個橢圓形則是ChatGPT正在語音回答中。(圖/翻攝自ChatGPT)
柯文哲北流活動深夜急喊卡 競辦回應:將另尋場地
民眾黨總統參選人柯文哲競辦昨(18)日傍晚發出採訪通知,原訂今(19)日在北流卡夫卡舉辦AI語音模型暨單曲發表會,結果昨深夜突臨時通知將另尋場地舉辦。昨日柯文哲競辦於深夜11點51分突發布通知,原訂今(19)日於北流卡夫卡餐廳舉辦「柯文哲AI語音模型暨單曲發表會」,將進行調整,待確認時間地點後再行通知。柯辦發言人陳智菡表示,活動同仁租借場地時,該餐廳業者相當熱情,表示屬商業租借沒有問題。然採訪通知於晚間發出後,北市文化局接獲消息並翻閱合約內容,認為餐廳可能因此有違約之疑慮。競辦釐清後,即刻與文化局蔡詩萍局長聯繫,感謝文化局善意提醒,並決定另尋場地舉辦。北市文化局長蔡詩萍在臉書發文表示,突然有消息說柯文哲要宣布AI競選歌曲,地點就辦在北流的餐廳,「我當然很驚訝!怎麼又來了!」蔡詩萍當下即請北流查詢相關合約,確定了營業場所內,提供的販售品項、服務、內容等,都「不得涉及政黨活動」或違反法令。蔡詩萍把相關訊息傳給柯辦後,柯辦給了正面的回應,決定不違反規定,另覓場地辦AI競選歌曲發布會,「這場風波,算是消弭於無形了。」更坦言身為台北市文化局的一份子,必當全力維護我們所轄之館所場地,在大選中的中立角色,也希望各政黨,尊重文化超越政治的信念,共同打拚民主政治的里程碑。
用《聖經》練習!Meta推AI語音模型 支援全球4千種語言
臉書(Meta) 今(23)日發表一系列的 AI大規模多語言語音(Massively Multilingual Speech,簡稱 MMS),可以辨識超過4,000種口語語言,文字和語音之間的轉換也支援超過1,100種語言,不僅能夠使用偏好的語言操作、用於AR及VR,更可理解每個人的聲音。過去最大型的語音資料庫最多僅涵蓋 100 種語言,因此開發此技術所面臨的第一個挑戰即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰,Meta 使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如《聖經》,作為語言的文字訓練資料。聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta 創造的資料集,蒐集超過1,100種語言的《新約聖經》有聲讀物資料集,平均為每種語言提供 32 小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過4,000種語言。Meta 將持續擴增大規模多語言語音模型的涵蓋範圍,以支援更多語言的轉換及辨識,並努力克服現有語音技術難以處理方言的挑戰。