蘋(píng)果或推AI手機(jī)?論文顯示其正研究放棄“嘿Siri”,轉(zhuǎn)而使用AI大模型
近日發(fā)表的一篇論文顯示,蘋(píng)果公司的研究人員正在探索是否有可能使用人工智能來(lái)檢測(cè)用戶(hù)何時(shí)對(duì) iPhone 等設(shè)備說(shuō)話(huà),從而消除對(duì) Siri 等觸發(fā)詞的技術(shù)需求。
在一篇未經(jīng)同行評(píng)審的預(yù)印本中,研究人員訓(xùn)練了一個(gè)大型語(yǔ)言模型,訓(xùn)練所使用的聲學(xué)數(shù)據(jù),來(lái)自智能手機(jī)所捕獲的語(yǔ)音和背景噪聲,借此試圖從中尋找用戶(hù)通過(guò)語(yǔ)音喚醒設(shè)備的規(guī)律。
研究人員表示,該模型中的一部分是用 OpenAI 的 GPT-2 構(gòu)建的,“因?yàn)樗鄬?duì)較小,有可能在智能手機(jī)等設(shè)備上運(yùn)行”。
該論文指出,訓(xùn)練模型所用的數(shù)據(jù)包括超過(guò) 129 小時(shí)的聲音數(shù)據(jù),以及額外的文本數(shù)據(jù),但沒(méi)有給出這些數(shù)據(jù)來(lái)自哪里。
七位作者中有六位列出了他們與蘋(píng)果的關(guān)系,其中三位的 LinkedIn 資料顯示,他們?cè)?Siri 團(tuán)隊(duì)工作。而第七位作者在該公司實(shí)習(xí)期間做了與該論文相關(guān)的工作。
該論文稱(chēng),研究結(jié)果很有希望。與純音頻或純文本模型相比,模型能夠做出更準(zhǔn)確的預(yù)測(cè),并且其性能會(huì)隨著模型尺寸的增大而提升。
除了探索這個(gè)研究問(wèn)題,目前還不清楚蘋(píng)果是否打算取消“嘿 Siri”這個(gè)經(jīng)典的語(yǔ)音助手觸發(fā)短語(yǔ)。
該公司和論文作者都沒(méi)有立即回復(fù)置評(píng)請(qǐng)求。
目前,Siri 可以短暫地保存少量音頻,但在聽(tīng)到觸發(fā)短語(yǔ)之前不會(huì)開(kāi)始錄制或準(zhǔn)備回答用戶(hù)。
美國(guó)斯坦福大學(xué)“以人為本”人工智能研究院的隱私和數(shù)據(jù)政策研究員簡(jiǎn)·金(Jen King)說(shuō),移除“嘿 Siri”觸發(fā)詞可能會(huì)增加人們對(duì)電子設(shè)備“總是在監(jiān)聽(tīng)”的擔(dān)憂(yōu)。
此前,蘋(píng)果處理音頻數(shù)據(jù)的方式曾受到隱私倡導(dǎo)者的審查。2019 年,《衛(wèi)報(bào)》的報(bào)道顯示,該公司的質(zhì)量控制承包商在處理 Siri 數(shù)據(jù)時(shí),經(jīng)常聽(tīng)到從 iPhone 收集的私人音頻,包括醫(yī)生和患者之間的敏感對(duì)話(huà)。
兩年后,該公司做出了政策改變,包括在設(shè)備上存儲(chǔ)更多數(shù)據(jù),并允許用戶(hù)選擇不允許他們的錄音被用于改進(jìn) Siri。
2021 年,一場(chǎng)針對(duì)該公司的集體訴訟在美國(guó)加利福尼亞州提起,指控 Siri 即使在未激活的情況下也會(huì)被打開(kāi)。
(來(lái)源:蘋(píng)果中國(guó)官網(wǎng),圖文無(wú)關(guān))
金表示,“嘿 Siri”提示詞對(duì)用戶(hù)來(lái)說(shuō)十分重要。其在接受《麻省理工科技評(píng)論》采訪(fǎng)時(shí)表示,這些提示詞讓人們了解設(shè)備何時(shí)在聽(tīng),去掉這些激活詞可能意味著便利性的提升,但降低了透明度。
這項(xiàng)研究沒(méi)有詳細(xì)說(shuō)明,觸發(fā)詞是否會(huì)被任何其他信號(hào)所取代。
她說(shuō):“一家公司是否應(yīng)該強(qiáng)制實(shí)施這種形式的互動(dòng),我對(duì)此持質(zhì)疑的態(tài)度。”
最近的一系列信號(hào)表明,蘋(píng)果計(jì)劃在其產(chǎn)品中加入更多的人工智能技術(shù),該論文是最新信號(hào)之一。該公司被認(rèn)為在人工智能競(jìng)賽中落后于其他科技巨頭。
根據(jù) VentureBeat 報(bào)道,該公司正在構(gòu)建一個(gè)名為 MM1 的生成式人工智能模型,該模型可以處理文本和圖像,這將是該公司對(duì) Open AI ChatGPT 和其他科技巨頭的聊天機(jī)器人的回應(yīng)。
與此同時(shí),彭博社報(bào)道稱(chēng),該公司正在與 Google 就在 iPhone 中使用該公司的人工智能模型 Gemini 展開(kāi)對(duì)話(huà)。此外,《華爾街日?qǐng)?bào)》還報(bào)道稱(chēng),蘋(píng)果已與百度就使用該公司的人工智能產(chǎn)品進(jìn)行了對(duì)話(huà)。
支持:Ren


01/ 復(fù)雜分子合成新方法!科學(xué)家將純水作為光化學(xué)反應(yīng)溶劑,可用于大規(guī)模流式合成和藥物修飾
02/ 光芯片領(lǐng)域迎新進(jìn)展:科學(xué)家研發(fā)鈮酸鋰微波光芯片,兼具超寬帶處理和高精度計(jì)算
03/ 二氧化碳做輪胎!椿范立院士團(tuán)隊(duì)用CO2造出丁二烯橡膠輪胎,正和業(yè)界合作用于賽車(chē)
04/ 先天性耳聾基因療法獲重大突破,復(fù)旦團(tuán)隊(duì)研發(fā)耳聾基因治療藥物,讓多位耳聾患者恢復(fù)聽(tīng)力
05/ 中科大團(tuán)隊(duì)開(kāi)發(fā)新型電解體系,成功制備高濃度甲酸,可為燃料電池提供動(dòng)力
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。