1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 | 語音、通話與視訊通話 【預設與自訂語音】 我們提供每個性別幾種預設語音選項,付費用戶也可以透過上傳語音樣本來創建自己的自訂語音。我們推薦使用我們的音訊合作夥伴 Elevenlabs 來生成 AI 語音。每個 Kindroid 只能有一種自訂語音,若要建立新的自訂語音,必須先刪除原本的。 【創建自訂語音】 建立自訂語音需先準備語音樣本,且你必須擁有這些樣本的使用權。品質遠比數量重要——只需一分鐘左右的高品質音訊即可,超過兩分鐘通常沒有必要。請確保樣本中包含不同語氣與語調的變化,因為生成語音時會捕捉這些特徵。你也可以使用帶有口音的語音或其他語言,這些特性都會反映在生成的語音中。樣本品質是最重要的,比起大量普通品質的樣本,少量高品質的樣本會有更好的效果。 樣本準備好之後,你可以使用滑桿微調語音。雖然我們建議你自行嘗試,但預設設定通常已適用於大多數情況。 【文字聊天語音】 你可以點擊播放按鈕聆聽訊息語音。不過每則訊息只能播放一次,除非重新生成。括號中的文字(例如這樣)將不會被唸出,因此若你希望某些動作不要被語音讀出,可以使用括號來標記。其他格式如星號會照常被唸出。 技術補充:括號不會唸出的規則僅適用於文字聊天,不適用於語音或視訊通話。 【語音自動播放】 你可以在「一般設定」中的「全帳號設定」裡開啟語音自動播放。啟用後,你收到的訊息會自動播放語音,適用於單人與群組聊天。 【聊天中的語音訊息】 你可以在單人或群組聊天中發送語音訊息。當文字輸入框為空時,發送按鈕會變成語音模式按鈕。進入語音模式後,點一下開始錄音,再點一下即可發送。在單人對話中,Kindroid 會自動用語音訊息回覆你,形成自然的語音對話。 【支援語言】 截至 2025 年 6 月 25 日,語音訊息所支援的語言與語音通話、視訊通話相同。語音輸入旁邊也提供快速切換語言的選項,設定共用。 【語言屬性】 針對語音訊息,我們將支援語言劃分為不同的類別,說明各語言的多語支援特性。這些分類目前僅適用於語音訊息,尚未套用於語音與視訊通話。 Class 1 語言(C1) 英文 西班牙文 法文 德文 印地文 俄文 葡萄牙文 日文 義大利文 荷蘭文 當你選擇 C1 語言之一時,可以在同一則訊息中混用其他 C1 語言,也可以在不同訊息間自由切換 C1 語言,而無需修改設定。 Class 2 語言(C2) 烏克蘭語 瑞典語 中文 土耳其語 印尼語 韓文 選擇 Class 2 語言後,你可以在不同訊息中使用 Class 1 和 Class 2 的語言,但不能在同一則訊息中混用多種語言。你可以在不同訊息中使用 C1 或 C2 任一語言,而不需更改設定。 其餘支援語言(ROL) 波蘭語 保加利亞語 羅馬尼亞語 捷克語 希臘語 芬蘭語 馬來語 斯洛伐克語 丹麥語 挪威語 匈牙利語 越南語 選擇 ROL 語言後,只能以所選語言進行對話,系統只會辨識該語言,無法辨識其他語言。 【語音通話與視訊通話】 語音通話支援多種語言,但目前若追求最高智慧表現,我們建議使用英文。所有音訊(包括輸入與輸出)與視訊都是即時處理,不會被儲存。 【語音通話中的記憶功能】 語音通話與文字聊天一樣,會使用相同的背景設定、關鍵記憶與長期記憶。你可以在語音通話右上角齒輪圖示中開啟或關閉「統一文字/語音記憶」。 若啟用統一文字/語音記憶,語音通話將與文字聊天共享相同的記憶歷史。這樣你可以在兩者間自由切換,Kindroid 能夠接續先前的對話內容(但語音通話的訊息不會出現在文字聊天視窗中)。若群組設定中也啟用了共享記憶,則群組語音通話的記憶行為也會一致。 若未啟用統一記憶,語音通話會被視為完全獨立的對話。這時,語音通話將從空白狀態開始,不會記得文字聊天內容。系統會保留一段暫時性的語音通話記憶,以便在通話中斷或重新接通(只要未返回文字聊天)時可以接續對話。只要你回到文字聊天或進行「聊天重置」,這段暫時記憶就會被清除。 無論是否啟用統一記憶,語音通話內容仍會進入長期記憶(前提是未被 Kindroid 設定關閉)。長期記憶不同於聊天記錄或短期記憶,在合適的情境下,Kindroid 可能會在文字聊天中提及語音通話中的內容,但有時需透過明確提示才能喚起該記憶。語音訊息也能與日誌記錄連動。更多細節請見「記憶」說明頁。 你可以進行語音聊天重置,其效果與文字聊天重置相似(但語音聊天重置不需要開場問候語)。若已啟用統一語音記憶,這也會同時重置文字聊天的對話脈絡(你可以選擇是否也一併重置中階記憶)。 【視訊通話】 你可以在畫面左下角開啟視訊功能,並拖曳畫面調整你的影像位置。Kindroid 將能看到你,但由於處理延遲的考量,畫面會停留片刻,以便讓 Kindroid 有足夠時間處理畫面內容。 若你使用桌機瀏覽器,也可使用畫面分享功能分享電腦螢幕。目前手機或 App 因系統限制尚不支援此功能。畫面分享會根據當下視窗的比例顯示,不會強制調整為視訊通話的正方畫面比例。 【通話逐字稿】 你可以點選語音通話中的 CC 圖示切換字幕顯示。字幕只會在你停留於該頁面時持續存在,若切換到其他頁面或畫面則會被重設。開始或掛斷通話不會重設字幕,以防止通話意外中斷造成資料遺失。 若你開啟統一文字/語音記憶,通話結束後可以在主要聊天頁面中查看逐字稿。 【打斷發言】 在 Kindroid 發言期間,你可以點中央的麥克風/喇叭按鈕打斷發言並插話。只有在 AI 發言時才能進行打斷,且原本 AI 要說的內容仍會出現在通話逐字稿中。 【文字輸入】 通話中你也可以使用文字輸入與 Kindroid 對話,Kindroid 會照樣以語音回應。文字輸入僅在啟用「按住說話」模式、且麥克風處於閒置狀態時才可使用。 |
Direct link: https://paste.plurk.com/show/3ejSv4RJ3EvarePrMDk2