四年一度球迷的盛會又開始了,畢竟足球是全球第一大運(yùn)動,世界杯更是萬眾矚目。但不知從什么時(shí)候開始,預(yù)測冠軍、預(yù)測每場比賽的結(jié)果、甚至關(guān)鍵場次的比分,已經(jīng)變得比賽事本身受關(guān)注程度更高。從章魚保羅,到百度、谷歌,從游戲公司到科技巨頭,世界杯預(yù)測正在由普通人茶余飯后的八卦,變成科技公司AI能力的比拼。
在2018年的世界杯上,瑞士銀行使用了通常用于分析投資機(jī)會的計(jì)量經(jīng)濟(jì)學(xué)工具進(jìn)行比賽預(yù)測,得出的最終結(jié)論是:德國、巴西和西班牙將分列前3名。高盛采用深度學(xué)習(xí)的方法進(jìn)行預(yù)測,結(jié)果截然不同,法國、巴西、葡萄牙將最終登上領(lǐng)獎臺。
時(shí)隔五年,AI對本屆世界杯的預(yù)測依然有很大分歧,到底冠軍花落誰家讓我們拭目以待。盡管在外界看來,這樣的預(yù)測更多是噱頭,看起來也更像是玄學(xué)范疇,但事實(shí)上在人工智能領(lǐng)域,基于大數(shù)據(jù)的預(yù)測是建立在嚴(yán)格的人類認(rèn)知科學(xué)基礎(chǔ)之上。
(資料圖)
人工智能正走向AI 2.0時(shí)代,成為引領(lǐng)新一輪科技與產(chǎn)業(yè)變革的底層技術(shù)和驅(qū)動性力量。人工智能不但體現(xiàn)在智慧城市、智慧交通、智能醫(yī)療、智能制造等宏觀產(chǎn)業(yè)布局,還潛移默化的改變著每個(gè)人工作生活的節(jié)奏。
“我們正在做的‘玩秘’不是簡單的智能生活助理,它就像鋼鐵俠離不開的‘賈維斯’,玩秘也可以說是全生活場景的賈維斯,它能全權(quán)‘包辦’點(diǎn)外賣、打車、看電影、訂酒店等這些生活瑣事。”蘇州輪子科技有限公司創(chuàng)始人兼CEO 余軻向36氪表示。
賈維斯(J.A.R.V.I.S.)是漫威漫畫中讓人印象深刻的人工智能系統(tǒng),它的全稱是Just A Rather Very Intelligent System。如果每個(gè)人都可以擁有一個(gè)免費(fèi)的賈維斯,或許我們每個(gè)人都可以離理想中的英雄更進(jìn)一步。
輪子科技是一家NLP技術(shù)公司,從事語義解析型自然語言理解技術(shù)(Semantic Parsing NLP)的研發(fā)。不同于市場上大部分提供語音、語義識別及交互功能的NLP技術(shù),語義解析型NLP可以在高階應(yīng)用中實(shí)現(xiàn)更高的準(zhǔn)確率。
玩秘是輪子科技基于領(lǐng)先的語義解析型NLP技術(shù)所提供的個(gè)人數(shù)字生活助理服務(wù),同目前其他類似服務(wù)所采用基于深度學(xué)習(xí)的“匹配”分類器方法完全不同,玩秘應(yīng)用了因果關(guān)系推斷算法框架(Bayesian Network),以此為基礎(chǔ)才能演化為高階“智能大腦”。
日前,36氪與余軻博士就Semantic Parsing NLP的落地場景、商業(yè)模式、發(fā)展空間等人工智能領(lǐng)域廣泛關(guān)注的問題進(jìn)行了一次開放的探討。
自然語言處理(Natural Language Processing, NLP)是人工智能領(lǐng)域中最重要的分支之一,而語義分析(Semantic Parsing) 則是NLP諸多任務(wù)中最核心、也最具挑戰(zhàn)的一項(xiàng)。
語義分析旨在將自然語言轉(zhuǎn)換為機(jī)器能夠理解的結(jié)構(gòu)化語義表示,基于語義表示,下游NLP任務(wù)(例如智能問答和對話系統(tǒng)等)能夠從對應(yīng)的結(jié)構(gòu)化知識圖譜中進(jìn)行相關(guān)信息的精準(zhǔn)查詢,并將其用于輸出結(jié)果的生成。
“2011年,加州大學(xué)洛杉磯分校的知名教授Judea Pearl因?yàn)殚_發(fā)并倡導(dǎo)因果推斷算法,并應(yīng)用在人工智能領(lǐng)域所作出的貢獻(xiàn)而獲得圖靈獎?!庇噍V博士介紹到:“Bayesian Network(貝葉斯網(wǎng)絡(luò))毫無疑問是因果推斷算法里程碑式的研發(fā)成果,在海外的學(xué)界和產(chǎn)業(yè)界都產(chǎn)生了巨大的影響?!?/p>
人工智能、量子計(jì)算等前沿領(lǐng)域的大量最新技術(shù)都會率先應(yīng)用于金融科技、生命科學(xué)、高能物理等領(lǐng)域。 “貝葉斯網(wǎng)絡(luò)是非常經(jīng)典的白箱方法,我?guī)ьI(lǐng)大規(guī)模算法與工程化團(tuán)隊(duì)在這個(gè)領(lǐng)域進(jìn)行過5年以上的深入研發(fā)。”余軻進(jìn)一步談到。
余博士曾任國際頂級投行與算法交易商摩根大通公司的新聞信息流算法交易(News-Driven Algorithm Trading)全球總負(fù)責(zé)人,所帶領(lǐng)近三百人團(tuán)隊(duì)的NLP算法交易業(yè)績居華爾街第一。此前,在NLP領(lǐng)域只有華爾街的新聞信息流算法交易團(tuán)隊(duì)與Google公司的Duplex/LaMDA團(tuán)隊(duì),在國際上曾大規(guī)模對Semantic Parsing NLP技術(shù)進(jìn)行研發(fā)并商用化。
“盡管我們團(tuán)隊(duì)的交易收益率已經(jīng)全球領(lǐng)先,但量化交易的本質(zhì)是量化套利,真正的套利空間只有 2% 到 3% 。并且,雖然交易離錢最近,但對全球尖端的 Semantic Parsing NLP 技術(shù)來說,幾百億的市場天花板有點(diǎn)太低了,這項(xiàng)技術(shù)可以通過產(chǎn)品和服務(wù)的形態(tài),去改變每個(gè)人的生活方式,甚至成為生活中必不可少的一部分?!庇噍V認(rèn)為 Semantic Parsing NLP 有著非常廣闊的應(yīng)用前景。
輪子科技在過去多年底層技術(shù)研究的基礎(chǔ)上自主研發(fā)了基于貝葉斯網(wǎng)絡(luò)的Causal Inference NLP算法框架,模擬人類因果認(rèn)知系統(tǒng),實(shí)現(xiàn)高理解準(zhǔn)確度的Semantic Parsing NLP解決方案。
過去一年多以來,元宇宙始終是科技、創(chuàng)投領(lǐng)域關(guān)注的焦點(diǎn),但從整體來說又進(jìn)展緩慢,即使Meta這樣規(guī)模的科技巨頭也被元宇宙拖住了增長的腳步。
但從長遠(yuǎn)來看,技術(shù)的瓶頸終將被打破,元宇宙也不僅限于改善文化、游戲、電商、娛樂等應(yīng)用領(lǐng)域的體驗(yàn),更將是數(shù)字技術(shù)的革命,同時(shí)帶來生產(chǎn)力的大幅提升,從而在更大的范圍內(nèi)推動社會進(jìn)步。元宇宙是數(shù)字文明的重要成果,擁有廣闊的發(fā)展空間和無限的可能性,同時(shí),也將不斷地回饋社會。
余軻認(rèn)為:正在成為趨勢的第四次工業(yè)革命和元宇宙,本質(zhì)上是由算力和人工智能水平的大幅提升所驅(qū)動,而NLP作為AI的基礎(chǔ)能力,也正迎來變革和巨大的發(fā)展空間,玩秘的愿景則是成為元宇宙時(shí)代的生活虛擬助理。
從技術(shù)的角度來說,語義分析引擎(Semantic Parsing Engine)已經(jīng)成為目前很多人工智能產(chǎn)品的核心模塊,比如新一代的搜索引擎、數(shù)字人等。但是在現(xiàn)實(shí)應(yīng)用場景中,對自然語言進(jìn)行語義分析標(biāo)注的成本高、效率低、難度大,因此,無論是產(chǎn)業(yè)界,還是學(xué)術(shù)界,現(xiàn)有的語義分析數(shù)據(jù)集存在數(shù)據(jù)規(guī)模小、問題種類少、問題模板結(jié)構(gòu)過于單一等缺陷。
在實(shí)際生活場景中,只有最低等級復(fù)雜度的語義理解,如詢問天氣、定鬧鐘等可以達(dá)到較高的理解率,這也是智能音箱等語音交互類智能終端目前的技術(shù)瓶頸。
遇到比如訂電影票或者打車這種中等復(fù)雜度的語義理解場景,大部分NLP的理解率尚不足50%。而對于外賣訂餐這樣的高復(fù)雜度場景,不只包括推薦餐品,還涉及到湊單滿減、葷素組合搭配等多重變量,語義分析維度和復(fù)雜度非常高,對于傳統(tǒng)NLP來說很難獲得到令人滿意的理解率。
余軻博士向36氪介紹:在最近一年中,輪子科技集中精力進(jìn)行算法框架的研發(fā),目前,玩秘已經(jīng)從第6代NLP框架迭代到第7代框架,對訂外賣等高階語義理解難度領(lǐng)域,語義理解率從45%已升至約80%的水平。
提高中高階語義理解難度場景的理解率是應(yīng)用得以商業(yè)化的核心前提,建立在Causal Inference NLP算法框架上的Semantic Parsing NLP解決方案,讓基于移動端、車端、智能家居等不同智能終端的高理解準(zhǔn)確度個(gè)人數(shù)字生活助理服務(wù)成為可能。
下一步,玩秘的服務(wù)將會涵蓋訂外賣、打車、推薦餐廳、線下娛樂、預(yù)訂酒店等領(lǐng)域,覆蓋全國95%以上的地級市。通過智能終端,采用語音交互的方式,玩秘可以識別用戶的多重需求,并給出精準(zhǔn)推薦和簡便的服務(wù)。
余博士認(rèn)為:從長遠(yuǎn)來看,NLP會成為伴隨元宇宙逐漸具象化的底層技術(shù),并且,對于元宇宙中的AR/VR/MR等各種可穿戴智能設(shè)備,NLP都是更自然、且交互成本最低的交互手段,玩秘在本地生活領(lǐng)域突破最難的挑戰(zhàn)之后,也會把Semantic Parsing NLP的核心能力運(yùn)用到游戲、數(shù)字人、直播、娛樂的元宇宙場景中。
作為面向下一代互聯(lián)網(wǎng)的商業(yè)化產(chǎn)品和服務(wù),NLP還需要一定的時(shí)間來下沉到不同的垂域,去探索終端用戶真正的需求和體驗(yàn)。余軻強(qiáng)調(diào):如果一家公司想長久創(chuàng)造可觀的利潤,一定要為社會提供價(jià)值。玩秘致力于通過為更多用戶提高生活便利性,創(chuàng)造“便利性溢價(jià)”,從而體現(xiàn)人工智能的社會價(jià)值。