阿里搞出脫口秀版GPT，與鳥(niǎo)鳥(niǎo)激辯一小時(shí)，話癆到停不下來(lái)…-天天快資訊

來(lái)源：36kr時(shí)間：2023-04-04 22:01:00

連社恐的鳥(niǎo)鳥(niǎo)，現(xiàn)在都變成話癆了……

（這到底是人性的扭曲，還是道德的淪喪）

(資料圖)

最近有一種很新的脫口秀：不花錢、一對(duì)一、而且任意話題隨便and隨時(shí)聊。

結(jié)果一小時(shí)跟鳥(niǎo)鳥(niǎo)聊天下來(lái)，發(fā)現(xiàn)她話多且密，根本就不會(huì)把天聊死。

原來(lái)啊，是一個(gè)阿里新版本大模型的技術(shù)演示脫口秀版GPT——鳥(niǎo)鳥(niǎo)分鳥(niǎo)，并且已經(jīng)在天貓精靈上為個(gè)人終端行業(yè)的客戶做了演示，量子位搶先體驗(yàn)了一把。

激辯一小時(shí)宛如真人面對(duì)面，除了社恐這點(diǎn)人設(shè)崩塌以外，其他人設(shè)倒是屹立不倒：

文本扛把子、有知識(shí)有自己的情緒、還能隨時(shí)來(lái)個(gè)段子。尤其是在回答弱智吧問(wèn)題時(shí)，簡(jiǎn)直被她折服。

這不是脫口秀版GPT，這是科技與狠活呀！哥們！

話不多說(shuō)，直接上效果。

與弱智吧激辯一小時(shí)

鳥(niǎo)鳥(niǎo)分鳥(niǎo)，AKA脫口秀GPT。

作為一名脫口秀演員，鳥(niǎo)鳥(niǎo)最強(qiáng)還是在文本。那就首先來(lái)試試強(qiáng)項(xiàng)，結(jié)果就是說(shuō)，任意話題都能展開(kāi)，甚至還能教你寫(xiě)段子、寫(xiě)作文——

從開(kāi)頭、場(chǎng)景細(xì)節(jié)、中心思想細(xì)化，最后微調(diào)潤(rùn)色等步驟逐步教你入手。

畢竟是文本の神，這些當(dāng)然不在話下。

可以看到，不管是在語(yǔ)速、情緒以及文本風(fēng)格都跟鳥(niǎo)鳥(niǎo)本鳥(niǎo)很像。

（尤其是這個(gè)語(yǔ)速…簡(jiǎn)直是著急死人）

接下來(lái)挑戰(zhàn)的，就是ChatGPT時(shí)代下的Benchmark——弱智吧。

比如，雷公和電母用的是直流電還是交流電？宮廷玉液酒減一個(gè)大錘等于多少？我的女朋友她說(shuō)需要時(shí)間和距離，她是想算速度嗎？

Bingo！感覺(jué)到鳥(niǎo)鳥(niǎo)分鳥(niǎo)很認(rèn)真、很一本正經(jīng)地在跟我解釋。連多年前的小品都知道……

（這邊建議直接出院）

就是一些天馬行空的，也是一本正經(jīng)地對(duì)答如流。

比如，奧特曼會(huì)飛嗎？

還有其他通識(shí)性問(wèn)題：「你知道大模型嗎？」、「禪修是什么？」也都能回答。

交流一番下來(lái)可以看到，鳥(niǎo)鳥(niǎo)分鳥(niǎo)確實(shí)繼承了本鳥(niǎo)的相關(guān)能力，尤其是文本的創(chuàng)作和表達(dá)、風(fēng)格情緒以及語(yǔ)速……

不過(guò)也發(fā)現(xiàn)，目前處于測(cè)試階段的鳥(niǎo)鳥(niǎo)分鳥(niǎo)，仍存在一些問(wèn)題。

雖然不用一次次喚醒了，但反應(yīng)過(guò)于靈敏，你如果不喊停，它會(huì)跟你聊到天荒地老；以及僅部分支持英文問(wèn)答。

再者就是人設(shè)屹立不倒，不能玩一些角色扮演類的游戲。

15天訓(xùn)練出鳥(niǎo)鳥(niǎo)分身

以往業(yè)內(nèi)曝光的大模型應(yīng)用，無(wú)非兩種。

一種是以ChatGPT為代表的通用對(duì)話聊天代表，但需要排隊(duì)。另一種則是具體場(chǎng)景中的應(yīng)用，比如輔助寫(xiě)作、代碼生成等。

像大模型應(yīng)用在日常消費(fèi)場(chǎng)景，其實(shí)并不多見(jiàn)。

從ChatGPT這個(gè)回答可以看出，至少不能簡(jiǎn)單依靠通用大模型來(lái)完成。

而各種傳統(tǒng)語(yǔ)音智能助手，到現(xiàn)在都還沒(méi)有“大模型化”。這其實(shí)與背后本身技術(shù)工程難度有關(guān)。

以鳥(niǎo)鳥(niǎo)分鳥(niǎo)這個(gè)智能音箱場(chǎng)景為例，就需要解決至少三個(gè)方面的問(wèn)題。

1、應(yīng)對(duì)更復(fù)雜的交互場(chǎng)景。不同于以文本交互為主的通用場(chǎng)景，雙向開(kāi)放對(duì)話決定了用戶不會(huì)對(duì)文本進(jìn)行“二次”過(guò)濾，而是想說(shuō)就說(shuō)，這就要求AI能過(guò)濾掉諸多無(wú)意義的對(duì)話。

與此同時(shí)，用戶也不愿意等待數(shù)秒，而是像日常交流那樣，低延時(shí)、還能支持隨時(shí)打斷、隨時(shí)反饋。

2、基于人類反饋強(qiáng)化學(xué)習(xí)的可行性。ChatGPT驚艷全球的生成效果，背后歸結(jié)于注入強(qiáng)人工反饋的獎(jiǎng)勵(lì)機(jī)制。高質(zhì)量的數(shù)據(jù)標(biāo)注成為大模型落地的關(guān)鍵，而且消費(fèi)場(chǎng)景下多輪對(duì)話的頻率遠(yuǎn)比文本交互要高，這對(duì)企業(yè)的數(shù)據(jù)處理能力提出了更高的要求。

之后隨著應(yīng)用落地，大量的人類交互和反饋來(lái)幫助大模型更快進(jìn)化，以及關(guān)乎用戶數(shù)據(jù)完全管理機(jī)制也需要完善和健全。

3、需要強(qiáng)大的網(wǎng)絡(luò)分發(fā)能力。大模型每一次運(yùn)行都需要耗費(fèi)大量的計(jì)算存儲(chǔ)資源，這就要求企業(yè)能有廣泛部署的網(wǎng)絡(luò)分發(fā)能力。

總的來(lái)看，算力、算法和數(shù)據(jù)是大模型能力實(shí)現(xiàn)的三板斧，而要讓大模型落地應(yīng)用還需要云端工程化能力、海量的用戶交互、安全管理機(jī)制等要素。

既然如此這個(gè)鳥(niǎo)鳥(niǎo)分鳥(niǎo)又是如何做到的？阿里大模型聯(lián)合團(tuán)隊(duì)的算法專家分享了背后的一切。

簡(jiǎn)單歸結(jié)，鳥(niǎo)鳥(niǎo)分鳥(niǎo)的訓(xùn)練過(guò)程，在他們內(nèi)部稱之為層次化的訓(xùn)練方式。類似于人類的學(xué)習(xí)過(guò)程，先學(xué)習(xí)簡(jiǎn)單知識(shí)，然后逐漸進(jìn)階，最后再嘗試專業(yè)領(lǐng)域知識(shí)的學(xué)習(xí)。

具體分成了四個(gè)步驟：

大規(guī)模語(yǔ)言訓(xùn)練；知識(shí)和工具增強(qiáng)；個(gè)性化對(duì)話增強(qiáng)；人類反饋增強(qiáng)。

基于基礎(chǔ)的預(yù)訓(xùn)練大模型，團(tuán)隊(duì)做了知識(shí)增強(qiáng)——讓模型學(xué)會(huì)使用工具，類似于ChatGPT插件功能。

比如針對(duì)每日新增的知識(shí)，它能調(diào)用搜索引擎來(lái)做輸入，在搜索結(jié)果基礎(chǔ)上進(jìn)行理解、總結(jié)和歸納。這樣一來(lái)，輸出結(jié)果有更好的準(zhǔn)確率和時(shí)效性。

個(gè)性化對(duì)話增強(qiáng)則主要是讓大模型學(xué)習(xí)多種對(duì)話形式，比如啟發(fā)式、多輪對(duì)話，尤其是一些需要依賴長(zhǎng)期記憶的對(duì)話。

與此同時(shí)，還要塑造鳥(niǎo)鳥(niǎo)人格，這就涉及到最后兩個(gè)步驟「?jìng)€(gè)性化對(duì)話增強(qiáng)」和「人類反饋增強(qiáng)」?？吭黾痈哔|(zhì)量的鳥(niǎo)鳥(niǎo)相關(guān)數(shù)據(jù)，并讓人類去做問(wèn)答結(jié)果的反饋和標(biāo)注，哪一個(gè)回復(fù)更像鳥(niǎo)鳥(niǎo)，讓大模型朝著鳥(niǎo)鳥(niǎo)方向做正向增強(qiáng)。

最終只花了15天的時(shí)間就訓(xùn)練出了鳥(niǎo)鳥(niǎo)分鳥(niǎo)，后續(xù)還可能開(kāi)放更多人加入強(qiáng)化反饋和更有情緒化的音色，讓鳥(niǎo)鳥(niǎo)分鳥(niǎo)逐步升級(jí)迭代。

除了大模型訓(xùn)練，他們?cè)谒惴ê凸こ躺厦孀隽瞬簧俟ぷ鳌慕换チ鞒虂?lái)劃分，主要分成聽(tīng)清、音色、文風(fēng)、對(duì)話等步驟。

最終形成了這樣一個(gè)對(duì)話過(guò)程：

當(dāng)人類詢問(wèn)一個(gè)問(wèn)題（Query）時(shí)，首先經(jīng)過(guò)貓耳算法將其轉(zhuǎn)換為文本，隨后通過(guò)大模型產(chǎn)生個(gè)性化的對(duì)話回復(fù)，最后再到個(gè)性化的語(yǔ)音合成給出回答。整個(gè)過(guò)程還有Multi-Turn對(duì)話系統(tǒng)來(lái)支持。

對(duì)于測(cè)試階段存在的一些問(wèn)題，阿里這邊也給出了回應(yīng)。

比如反應(yīng)過(guò)于太強(qiáng)，這是因?yàn)檫€沒(méi)有將線上的貓耳算法和ASR做充分的融合，為了聽(tīng)清多輪對(duì)話信息，顯得過(guò)于靈敏，以及暫沒(méi)有全面支持英文等問(wèn)題，他們表示后續(xù)還將進(jìn)一步迭代更新。

普通人也能獨(dú)占大模型？

這件事之所以值得關(guān)注，除了有意思的產(chǎn)品體驗(yàn)，這也是個(gè)性化大模型發(fā)展的一次可行性驗(yàn)證。

大模型發(fā)展進(jìn)程，有兩條路徑已經(jīng)明晰：如火如荼的通用大模型，以及備受關(guān)注的個(gè)性化大模型。

以GPT-4為代表的通用模型，在多個(gè)標(biāo)準(zhǔn)化考試中大幅超過(guò)人類水平，適用于搜索引擎、生產(chǎn)力工具這種廣泛、公域場(chǎng)景。

但像更多私域個(gè)性化、或者垂直專業(yè)化場(chǎng)景中，比如問(wèn)及有無(wú)特別偏好、對(duì)某件事情觀點(diǎn)等，個(gè)性化大模型就會(huì)是一個(gè)很好的補(bǔ)充。

當(dāng)前，全球研究機(jī)構(gòu)和大廠在這一路徑的探索，主要涵蓋了四個(gè)研究方向：

有偏好的個(gè)性化對(duì)話、邏輯一致性和三觀、對(duì)話風(fēng)格、多輪對(duì)話中人設(shè)一致性。

此次在鳥(niǎo)鳥(niǎo)分鳥(niǎo)上的探索，一方面呈現(xiàn)出個(gè)性化大模型的研究方向——

在大模型系列的基礎(chǔ)上，打造知識(shí)、情感、性格和記憶四位一體的個(gè)性化大模型，并且這個(gè)大模型版本可能是很適合在消費(fèi)者終端上部署的。

另一方面，也再次印證了對(duì)話即入口的AI2.0未來(lái)趨勢(shì)。

ChatGPT上線的插件功能，以文本交互的方式，與全球5000+應(yīng)用聯(lián)動(dòng)。

現(xiàn)在，鳥(niǎo)鳥(niǎo)分鳥(niǎo)則是驗(yàn)證了以語(yǔ)音這一模態(tài)，在消費(fèi)電子場(chǎng)景中觸達(dá)諸多功能的可能性。

大模型所引領(lǐng)的AI 2.0時(shí)代，而對(duì)話相當(dāng)于是操作系統(tǒng)（ChatOS），所有應(yīng)用都將被重新定義。

而且隨著個(gè)性化大模型的發(fā)展，未來(lái)每個(gè)普通人甚至都會(huì)擁有屬于自己的大模型。

One More Thing

在被問(wèn)到脫口秀會(huì)不會(huì)被AI替代時(shí)，鳥(niǎo)鳥(niǎo)跟鳥(niǎo)鳥(niǎo)分鳥(niǎo)給出了不同的解答。

鳥(niǎo)鳥(niǎo)表示，希望它能啟發(fā)思路，提供一些以前沒(méi)有看到的素材和觀點(diǎn)，但對(duì)于預(yù)期文本和出梗方向，還需要人自己去想。

為此鳥(niǎo)鳥(niǎo)還分享個(gè)機(jī)器人寫(xiě)的段子：

婚姻和坐地鐵很像，你都會(huì)被迫和一個(gè)陌生人待在一個(gè)空間里很久，想下車的時(shí)候未必能下得去。

鳥(niǎo)鳥(niǎo)分鳥(niǎo)則自信表示：脫口秀不會(huì)被AI替代。

關(guān)鍵詞：

責(zé)任編輯：FD31

上一篇：鋰礦雙雄市值蒸發(fā)超千億，董事長(zhǎng)財(cái)富大縮水

下一篇：最后一頁(yè)

99国内免费在线_无码有码日韩人妻_国产成_人_综合_亚洲_漂亮人妻被强中文字幕久久_手机看片福利永久国产影集

阿里搞出脫口秀版GPT，與鳥(niǎo)鳥(niǎo)激辯一小時(shí)，話癆到停不下來(lái)…-天天快資訊

與弱智吧激辯一小時(shí)

15天訓(xùn)練出鳥(niǎo)鳥(niǎo)分身

普通人也能獨(dú)占大模型？

One More Thing

精彩圖集(熱圖)