8 月 21 日消息,谷歌為旗下人工智能助手 Gemini Live 帶來了一系列新功能,旨在提升用戶與之進行實時對話的體驗。從下周開始,Gemini Live 將具備直接在用戶屏幕上突出顯示內容的功能,當用戶共享攝像頭畫面時,這一功能將使 AI 助手能夠指出特定物品。

例如,當你需要在一堆工具中找到合適的工具來完成一個項目時,你可以將智能手機的攝像頭對準這些工具,Gemini Live 將在屏幕上高亮顯示正確的工具。這項功能將率先在 8 月 28 日上市的全新 Pixel 10 系列手機上推出。與此同時,谷歌將開始向其他安卓設備推出視覺引導功能,并計劃在未來幾周內擴展至 iOS 系統。

谷歌還宣布了 Gemini Live 與更多應用程序的新整合,使其能夠與包括消息、電話和時鐘等應用進行交互。例如,當你與 Gemini 就前往目的地的路線進行對話時,如果你意識到自己要遲到,你可以中斷聊天機器人,對它說:“這條路線看起來不錯。現在,給亞歷克斯發一條消息,告訴他我大概會遲到 10 分鐘。”隨后,谷歌將為你草擬一條短信發送給你的朋友。

此外IT之家注意到,谷歌還為 Gemini Live 推出了一款新的音頻模型,該公司表示,這一模型將“顯著改善”聊天機器人對人類語音關鍵要素(如語調、節奏和音高)的運用。不久之后,Gemini 將根據你所討論的話題改變語調,例如在你詢問有關壓力較大的話題時,它會使用更平靜的聲音。
你還可以調整 Gemini 說話的速度,使其更快或更慢。而且,如果你要求 Gemini 從某個特定角色或歷史人物的視角來生動地講述一個故事,聊天機器人可能會采用相應的口音,以營造出“豐富、引人入勝的敘事”效果。