“一塊豆腐兩塊,買三塊要花幾塊?”盡管來中國工作已有時(shí)日,面對(duì)中文里的“燒腦”提問,從事演員行當(dāng)?shù)奈靼嘌廊舜笮l(wèi)還是會(huì)顯得力不從心。
一次偶然的契機(jī),大衛(wèi)接觸到一款名為“時(shí)空壺”的人工智能(AI)同傳耳機(jī)。“現(xiàn)在不僅聽得懂,而且不會(huì)在感謝同事時(shí)說‘我會(huì)給你好果子吃’了。”他說。
一聽一說間,如何跨越語言障礙?4月初,科技日?qǐng)?bào)記者在深圳時(shí)空壺技術(shù)有限公司體驗(yàn)到了“時(shí)空壺”的方便實(shí)用——兩個(gè)說著不同語言的人,各自佩戴一只耳機(jī),通過連接手機(jī)端App,來言去語便可即時(shí)互譯,實(shí)現(xiàn)“無感溝通”。
靈感源自巴別魚
“意外!”深圳時(shí)空壺技術(shù)有限公司創(chuàng)始人田力如此描述創(chuàng)業(yè)靈感的閃現(xiàn)。
“十多年前,我的父母在歐洲旅游時(shí)突發(fā)疾病。面對(duì)醫(yī)生詢問,卻因手機(jī)中的翻譯軟件操作繁瑣、識(shí)別遲緩,險(xiǎn)些延誤救治。”田力說。
這次經(jīng)歷深深觸動(dòng)了田力。他意識(shí)到,依靠翻譯軟件雖能解決簡(jiǎn)單的日常溝通問題,但人與人之間的交流,仍需一種“沉浸式”體驗(yàn)。
我們需要什么樣的翻譯設(shè)備?
道格拉斯·亞當(dāng)斯小說《銀河系漫游指南》里巴別魚的形象浮現(xiàn)在了田力的腦海中。
巴別魚是這部小說中的一種虛構(gòu)生物,植入耳內(nèi),可實(shí)時(shí)翻譯宇宙任何語言,消除交流障礙。
田力說:“耳機(jī),不正是一個(gè)完美的‘巴別魚’嗎?”
當(dāng)使用者說話時(shí),語音識(shí)別技術(shù)精準(zhǔn)捕捉聲音,并將其轉(zhuǎn)化為可處理的文本信息;在傾聽者的耳中,耳機(jī)則將翻譯后的文本,轉(zhuǎn)化為自然流暢的語音輸出。
把靈感和構(gòu)想裝進(jìn)商業(yè)策劃案,田力將初代“時(shí)空壺”構(gòu)想放在了海外眾籌平臺(tái)Kickstarter上,先獲取用戶的反饋,再?zèng)Q定項(xiàng)目的可行性。
在這一過程中,“耳機(jī)只能翻譯、不能聽歌,功能有點(diǎn)少……”這樣的反饋層出不窮。
田力陷入沉思:要不要向用戶妥協(xié)?
“產(chǎn)品本身體積就很小,如果按當(dāng)時(shí)的元器件集成水平,即便做出一個(gè)‘既能、又能、還能’的產(chǎn)品,各種功能都會(huì)大打折扣。”田力分析道,“就像瑞士軍刀,功能疊加只會(huì)讓每個(gè)刀刃都不鋒利。”
經(jīng)過反復(fù)斟酌,田力決定:“即便眾籌金額會(huì)受限,也要先保證翻譯功能好用。”
2018年,在獲得數(shù)百萬美元天使輪融資后,初代“時(shí)空壺”同傳耳機(jī)的商業(yè)案從文件走向代工廠,隨之量產(chǎn)。
布局亞馬遜、架設(shè)獨(dú)立站、投放廣告……成功出圈后,“時(shí)空壺”的出海之路按下了加速鍵。
反復(fù)驗(yàn)證破難題
初代“時(shí)空壺”同傳耳機(jī)略有所成,讓田力和團(tuán)隊(duì)下定決心乘勝追擊。
2019年,“時(shí)空壺”ZERO系列翻譯機(jī)在日本眾籌資金超過7000萬日元,在中國臺(tái)灣也取得不錯(cuò)的成績(jī),眾籌金額超過2200萬新臺(tái)幣。
然而,這款隨身翻譯機(jī)發(fā)布還不到兩個(gè)月,境遇急轉(zhuǎn)直下。
“我們當(dāng)時(shí)向工廠下單了20萬臺(tái),但隨之而來的差評(píng)讓退貨率不斷上升,直到現(xiàn)在還有幾萬臺(tái)積壓在倉庫里。”田力說。
田力與團(tuán)隊(duì)“閉門思過”。通過拆解用戶反饋的2000多條意見,他們發(fā)現(xiàn),核心痛點(diǎn)是降噪功能差導(dǎo)致翻譯效果不佳。
這一次經(jīng)歷,也讓田力與團(tuán)隊(duì)認(rèn)識(shí)到,要將產(chǎn)品推向市場(chǎng),還需要在不同場(chǎng)景里反復(fù)驗(yàn)證。
“過去市場(chǎng)上沒有這類產(chǎn)品,所以每一步都是‘從0到1’的探索。”深圳時(shí)空壺技術(shù)有限公司研發(fā)負(fù)責(zé)人石偉說。
從實(shí)驗(yàn)室到工廠,再從工廠到市場(chǎng),3年間三代產(chǎn)品迭代,這樣的驗(yàn)證周而復(fù)始。
在這一過程中,團(tuán)隊(duì)破解了“雙工通信”難題,改寫了傳統(tǒng)藍(lán)牙耳機(jī)的單向傳輸特性,創(chuàng)新算法讓兩只耳機(jī)實(shí)現(xiàn)雙向?qū)崟r(shí)互譯。產(chǎn)品也從入耳式到掛耳式,再到多語多向同傳AI翻譯終端,不斷豐富。
“我們研發(fā)了一套全球首創(chuàng)的算法,它可以在方向上和距離上對(duì)聲音進(jìn)行判斷。”田力說,“這樣使得收取的聲音能被翻譯得更為精準(zhǔn)。”
與此同時(shí),“時(shí)空壺”獨(dú)創(chuàng)的矢量降噪算法,通過三麥克風(fēng)陣列實(shí)現(xiàn)聲音定向捕捉。
“這如同為聲音世界裝上了‘顯微鏡’。”石偉說,他們追求的終極目標(biāo)是利用降噪技術(shù),完全消除說話者以外的雜音、噪聲。
“無感溝通”在路上
一邊不斷升級(jí)通信、降噪技術(shù)和算法,一邊從用戶和同聲傳譯從業(yè)者的反饋中彌合語言背后的邏輯差異,田力的目標(biāo)是實(shí)現(xiàn)“無感溝通”。
記者采訪時(shí)了解到,目前同聲傳譯最快的響應(yīng)速度是2秒到3秒,而且這只有世界頂尖譯員才能做到。
2023年,記者在深圳高交會(huì)現(xiàn)場(chǎng)與德國采購商通過“時(shí)空壺”交流時(shí),尚有幾秒延遲;如今當(dāng)記者再用新產(chǎn)品與他人測(cè)試時(shí),幾乎感覺不到“時(shí)差”。
“我們?cè)谌蚍秶鷥?nèi)布局200余臺(tái)服務(wù)器,以確保海內(nèi)外用戶都能有良好的體驗(yàn)。”田力說。
在企業(yè)文化墻上,不僅展示著每一代產(chǎn)品,也記錄著產(chǎn)品背后的用戶故事。
“現(xiàn)在我什么都可以聽懂了!”在2023年杭州亞運(yùn)會(huì)期間,烏茲別克斯坦代表團(tuán)使用“時(shí)空壺”了解中國文化時(shí),副團(tuán)長卡莫爾丁·埃爾加舍夫發(fā)出了由衷的贊嘆。
時(shí)下,搭載Babel OS同傳系統(tǒng)的新款耳機(jī),支持40種語言、93種口音即時(shí)互譯,已遠(yuǎn)銷全球170多個(gè)國家和地區(qū)。
“這是發(fā)到美國的,這是發(fā)到法國的,這是發(fā)到西班牙的……”在深圳時(shí)空壺技術(shù)有限公司的倉庫里,公司首席市場(chǎng)官吳衛(wèi)兵表示,“時(shí)空壺”海外銷售額占比達(dá)70%,今年的訂單已經(jīng)排到將近6個(gè)月之后了。
當(dāng)前,這個(gè)平均年齡只有28歲的團(tuán)隊(duì),已集合算法、聲學(xué)、嵌入等領(lǐng)域的50多名研發(fā)人員,手握100多項(xiàng)全球?qū)@J(rèn)證。
“技術(shù)因解決問題而生,解決問題只能一步一個(gè)腳印來,沒有任何捷徑。”田力說。