搜狗聽(tīng)寫(xiě),現(xiàn)在是錄音筆硬件的“操作系統(tǒng)”了
本文經(jīng)AI新媒體量子位(公眾號(hào) ID: QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
本文引用地址:http://www.ljygm.com/article/201908/404248.htmGoogle把安卓做成了操作系統(tǒng),讓其他手機(jī)廠商也能用這樣的系統(tǒng),融入安卓的生態(tài)。
微軟把Windows做成了操作系統(tǒng),讓各種PC廠商都能接入,融入Windows生態(tài)。
搜狗也要這樣做了。
在手機(jī)和PC之外,搜狗瞄準(zhǔn)了錄音筆這個(gè)硬件行業(yè),并正式將搜狗聽(tīng)寫(xiě)能力開(kāi)放給業(yè)界,萬(wàn)城集團(tuán)、索尼、愛(ài)國(guó)者、紐曼是第一批吃螃蟹的合作伙伴。
也就是說(shuō),日后如果你購(gòu)買(mǎi)搜狗和這四家廠商中任意一家接入了搜狗聽(tīng)寫(xiě)能力的錄音筆硬件產(chǎn)品,都可以使用同樣的交互方式來(lái)使用它,并且都可以借助搜狗聽(tīng)寫(xiě)能力,實(shí)現(xiàn)語(yǔ)音轉(zhuǎn)文字、同聲傳譯、文本編輯能功能。
并且,對(duì)于這幾家廠商來(lái)說(shuō),也不需要專門(mén)做適配,而是可以直接實(shí)現(xiàn)自動(dòng)適配了。
這幾乎等于一個(gè)操作系統(tǒng)了。
打通搜狗輸入法,還能在線編輯
這個(gè)操作系統(tǒng)的具體功能,主要包括以下幾項(xiàng):
語(yǔ)音轉(zhuǎn)寫(xiě):語(yǔ)音轉(zhuǎn)成文字,識(shí)別準(zhǔn)確率95%。背后搜狗的語(yǔ)音識(shí)別技術(shù)訪問(wèn)量達(dá)到了每日6億次。
搜狗輸入法:接入搜狗輸入法,以及背后的用戶賬號(hào),用戶在輸入法中常用的個(gè)性化詞庫(kù)也可以用在語(yǔ)音識(shí)別里,常用的專業(yè)詞匯、人名地名都可以被識(shí)別。
多端同步編輯:無(wú)論在PC、安卓還是iOS上,用戶都可以同步錄音和轉(zhuǎn)寫(xiě)的文字,進(jìn)行編輯。由于配備了聲紋識(shí)別能力,轉(zhuǎn)寫(xiě)的文字可以自動(dòng)區(qū)分出說(shuō)話人的角色,而不是直接呈現(xiàn)沒(méi)有人物區(qū)分、不分段的一大片文字。另外,如果有轉(zhuǎn)寫(xiě)不確定的部分,搜狗聽(tīng)寫(xiě)服務(wù)會(huì)提供多個(gè)可能的詞匯備選,不用手動(dòng)一個(gè)字一個(gè)字的人工刪改。
云存儲(chǔ)服務(wù):用戶的錄音和轉(zhuǎn)寫(xiě)都能保存在云端。
接入手機(jī)、PC端
除了錄音筆之外,在移動(dòng)端和PC端也可以使用搜狗聽(tīng)寫(xiě)服務(wù)。
手機(jī)端的搜狗錄音助手App,就介入了轉(zhuǎn)寫(xiě)同傳能力,面向藍(lán)牙協(xié)議開(kāi)放。
而在PC端,即使是沒(méi)有接入搜狗聽(tīng)寫(xiě)的的錄音筆,如果連到電腦的USB接口上,用戶也可以用PC端的搜狗輸入法管理錄音筆中的錄音,提供轉(zhuǎn)寫(xiě)服務(wù)。
而且,當(dāng)連接到PC時(shí),由于打開(kāi)時(shí)使用的是你自己的搜狗輸入法賬號(hào),像朋友的名字、行業(yè)詞匯、喜歡的動(dòng)漫主角這些特殊詞匯都存儲(chǔ)在自己的賬號(hào)里,因此轉(zhuǎn)錄的時(shí)候,轉(zhuǎn)錄結(jié)果也會(huì)貼近你的詞庫(kù)。
舉個(gè)例子說(shuō),如果你是《長(zhǎng)安十二時(shí)辰》的粉絲,平常使用輸入法有寫(xiě)過(guò)劇中的相關(guān)詞匯,語(yǔ)音轉(zhuǎn)文字的時(shí)候,AI系統(tǒng)就能夠聽(tīng)出“伏火雷”;
如果你是是機(jī)器學(xué)習(xí)研究者,那么你一定經(jīng)常使用輸入法寫(xiě)相關(guān)的技術(shù)名詞,語(yǔ)音轉(zhuǎn)文字的時(shí)候,系統(tǒng)就可以分辨出“卷積神經(jīng)網(wǎng)絡(luò)”。
因此,即使是同一段錄音,由不同人的賬戶來(lái)轉(zhuǎn)寫(xiě),得到的結(jié)果可能也是不同的。
另外,語(yǔ)音轉(zhuǎn)文字的速度也有保證,一個(gè)小時(shí)的錄音,大約要5分鐘就能轉(zhuǎn)寫(xiě)完。
開(kāi)放服務(wù),而非技術(shù)
在開(kāi)放搜狗聽(tīng)寫(xiě)能力的發(fā)布會(huì)上,搜狗與萬(wàn)城集團(tuán)、索尼、愛(ài)國(guó)者、紐曼成立了“AI創(chuàng)新聯(lián)盟”。在搜狗CTO楊洪濤看來(lái),錄音筆這個(gè)產(chǎn)品,單純提供錄音功能,20年來(lái)都沒(méi)有改進(jìn),而用戶拿到錄音后去聽(tīng)、去記的過(guò)程,更是繁瑣的很。
因此,借助語(yǔ)音識(shí)別技術(shù),結(jié)合搜狗輸入法,提供更豐富的服務(wù),可以突破錄音筆這個(gè)行業(yè)的天花板,在企業(yè)會(huì)議、學(xué)習(xí)培訓(xùn)、媒體采訪、寫(xiě)作記事等領(lǐng)域充分提供服務(wù)。
簡(jiǎn)單來(lái)說(shuō),原來(lái)你覺(jué)得整理錄音太麻煩,還不如現(xiàn)場(chǎng)記,因此不會(huì)購(gòu)買(mǎi)錄音筆;但如果整理錄音的過(guò)程變簡(jiǎn)單,能讓你更方便的整理老板在會(huì)上的講話、老師在課上講的知識(shí)點(diǎn),或者直接用語(yǔ)音輸入來(lái)寫(xiě)作,這樣,你就會(huì)選擇入手一支錄音筆。
行業(yè)的天花板,被升高了。
不過(guò),讓合作伙伴的產(chǎn)品也能用上搜狗的聽(tīng)寫(xiě)能力,為什么不選擇直接做一個(gè)開(kāi)發(fā)者平臺(tái),讓全部的開(kāi)發(fā)者都能接入API來(lái)實(shí)現(xiàn)呢?
“開(kāi)放的是服務(wù),不是技術(shù)”,楊洪濤這樣說(shuō)。
在他看來(lái),市面上的語(yǔ)音識(shí)別API已經(jīng)相當(dāng)多了,搜狗不希望再去做一個(gè)開(kāi)放平臺(tái),而是利用搜狗的優(yōu)勢(shì),提供具備產(chǎn)業(yè)價(jià)值和商業(yè)價(jià)值的服務(wù)。
而這,也是搜狗將聽(tīng)寫(xiě)服務(wù)與搜狗輸入法中的用戶定制詞庫(kù)連接起來(lái)的原因。
最后,除了聽(tīng)寫(xiě)能力之外,搜狗公司AI交互技術(shù)中心總經(jīng)理王硯峰表示,未來(lái)搜狗的AI分身、變聲、同傳等在行業(yè)內(nèi)有競(jìng)爭(zhēng)力的、能提供完整服務(wù)體驗(yàn)的能力都會(huì)逐步開(kāi)放。
評(píng)論