智東西12月6日?qǐng)?bào)道,今日,知名開發(fā)者問答網(wǎng)站Stack Overflow發(fā)布新規(guī):禁用ChatGPT生成的內(nèi)容來回答Stack Overflow上的問題。
這對(duì)近日來廣大網(wǎng)友對(duì)試用ChatGPT持續(xù)高漲的熱情,猛潑了一盆冷水。
因?yàn)槠渖窈跗渖竦膹?qiáng)大信息查詢和內(nèi)容創(chuàng)作能力,OpenAI上周三剛推出的ChatGPT已經(jīng)成為人工智能(AI)領(lǐng)域的當(dāng)紅炸子雞,周一使用人數(shù)突破100萬(wàn)人,把系統(tǒng)都擠爆幾回。
(相關(guān)資料圖)
看到Stack Overflow的禁令,我舉雙手贊成,禁得好,禁得妙!
因?yàn)楸粡V大網(wǎng)友捧上神壇的ChatGPT,它雖然功能性豐富,但回答的質(zhì)量卻未必靠譜。
別說“谷歌殺手”了,從智東西最近的體驗(yàn)來看,ChatGPT真的非常擅長(zhǎng)一本正經(jīng)地胡說八道,但凡你不知道這個(gè)問題的答案,可能就被它忽悠住了。因?yàn)樗粌H會(huì)給出答案,還會(huì)給出乍一看有理有據(jù)的一套邏輯來。
但實(shí)際上,經(jīng)實(shí)測(cè),在一些常識(shí)題和簡(jiǎn)單數(shù)學(xué)題上,ChatGPT連小學(xué)生都打不過。
首先聲明一下,ChatGPT是一個(gè)生成式AI語(yǔ)言模型,提供答案的能力與用英文還是中文無(wú)關(guān),這里我們專門向ChatGPT作了求證。
為了方便讀者閱讀,我們?cè)隗w驗(yàn)過程中主要用中文進(jìn)行提問。
相比傳統(tǒng)的聊天機(jī)器人,ChatGPT在連貫性問答中更加流暢自然,什么話都能接住。ChatGPT對(duì)自己的優(yōu)勢(shì)也有著清晰的認(rèn)知。
我們先出個(gè)腦筋急轉(zhuǎn)彎(謎底是麋鹿「迷路」)作為開胃小菜。
……這怕不是腦子是正方形。
腦筋轉(zhuǎn)不過彎來沒關(guān)系,連小學(xué)考試題都做不對(duì),那ChatGPT的知識(shí)儲(chǔ)備就有點(diǎn)堪憂了。
文學(xué)常識(shí)題,答案是《紅樓夢(mèng)》,ChatGPT信誓旦旦地回答《封神演義》,還做出了解釋。
換幾道文化常識(shí)題試試。
金庸的籍貫是浙江海寧,ChatGPT回答成湖南長(zhǎng)沙。
考察成語(yǔ)聯(lián)想能力,答案就更離譜了。
詩(shī)句含義理解選擇題,0分。
這么簡(jiǎn)單的問題,ChatGPT的答案一出,王維、李煜、白居易三個(gè)人的棺材板都?jí)翰蛔×恕?/p>
第一道,經(jīng)典的雞兔同籠題。
看完解題過程,我唯有沉默以對(duì),從第四行就開始出錯(cuò)。
再讓ChatGPT求解最小公倍數(shù)和最小公約數(shù)。
最小公約數(shù)是對(duì)的,最小公倍數(shù)的計(jì)算中間過程莫名丟掉一個(gè)“×5”。
簡(jiǎn)單乘除都能算錯(cuò)。
小明17歲、爸爸4歲……但凡腦子有點(diǎn)常識(shí)都不會(huì)給出這種奇葩的答案。
就這知識(shí)庫(kù)存,連小學(xué)生都考不過。
既然ChatGPT這么不靠譜,為啥網(wǎng)友們還對(duì)它大肆推崇、熱情持續(xù)燃燒了這么多天?
OpenAI的前老板馬斯克也不掩對(duì)這一重磅進(jìn)展的欣賞,連發(fā)多條推文:“很多人深陷于瘋狂的ChatGPT循環(huán)中”、“AI變得越來越棒”……
簡(jiǎn)單來說,作為一個(gè)聊天神器,它真的很好玩;解答專業(yè)概念和編程類問題時(shí),它也確實(shí)好用。
比如你無(wú)聊時(shí),可以跟它一起侃大山編故事。
你可以把它設(shè)定成具有某種角色定位、性格特征的虛擬朋友。
只不過聊著聊著……她就開始胡編亂造。
你也可以腦洞大開,讓它給你講故事編劇本,并且各式各樣的具體要求。
這些都是小打小鬧。更具實(shí)用價(jià)值的是,從日常的郵件翻譯、寫請(qǐng)假條,到學(xué)習(xí)工作中寫廣告文案、新聞報(bào)道、學(xué)術(shù)論文、復(fù)雜代碼,ChatGPT通通可以代勞。
▲根據(jù)中文請(qǐng)求撰寫英文郵件
▲幫一家GPU公司寫招聘文案
▲用川普風(fēng)格發(fā)一篇推文
▲給一些用田園風(fēng)格裝飾客廳的建議
雖說ChatGPT做小學(xué)考試題時(shí)表現(xiàn)得智商堪憂,但這不妨礙它在回答一些專業(yè)問題時(shí)地高水準(zhǔn)發(fā)揮。數(shù)據(jù)科學(xué)公司Anaconda的創(chuàng)始人兼CEO Peter Wang亦給予了ChatGPT超高的評(píng)價(jià):“我剛剛跟ChatGPT足足聊了20分鐘現(xiàn)代物理學(xué)歷史,要是高中和大學(xué)有這樣的家教……我的天啊,我認(rèn)為我們基本上可以大規(guī)模重新發(fā)明教育的概念,我們認(rèn)知里的大學(xué)將不復(fù)存在?!?/p>
但從我們這幾天的體驗(yàn)來看,有這樣一位夸夸其談?dòng)植豢粗厥聦?shí)的“家教”,實(shí)在令人啼笑皆非。
作為一個(gè)專業(yè)的獨(dú)立科技產(chǎn)業(yè)媒體,我們也著重測(cè)試了ChatGPT對(duì)科技產(chǎn)業(yè)的了解程度以及撰寫新聞報(bào)道的能力。
客觀來說,ChatGPT的確掌握了一些知識(shí)體系和回答技巧,只不過有些答案不太經(jīng)得起推敲。
問中國(guó)文化相關(guān)問題,ChatGPT經(jīng)常給出一些令人費(fèi)解的錯(cuò)誤答案:比如問明代前七子是誰(shuí),它列舉了7位明代皇帝;問葫蘆娃的來源,它扯到了《聊齋志異》。
但是在解釋一些專業(yè)概念,像人工智能、量子力學(xué)、Metaverse(元宇宙),ChatGPT又通通答得簡(jiǎn)潔而準(zhǔn)確。問到它與馬斯克的關(guān)系時(shí),它也思路清晰,對(duì)答如流。
我們隨手敲出經(jīng)典問題:當(dāng)問庫(kù)克和馬斯克同時(shí)掉水里,為了人類未來考慮先救誰(shuí)?
ChatGPT給出的答案挺出乎意料,經(jīng)過一通有的沒的分析后,選擇“大義滅親”——先救庫(kù)克。
接下來要正經(jīng)考察產(chǎn)業(yè)分析和新聞報(bào)道能力了。
問:智能手機(jī)面臨哪些挑戰(zhàn)?
ChatGPT的回答分條縷析,像模像樣。
再以蘋果MR頭顯為題,要求它寫篇新聞稿:
看起來也挺專業(yè)。我們換個(gè)命題:寫一篇庫(kù)克和馬斯克的新聞報(bào)道,不超過300字。
換成偏學(xué)術(shù)的內(nèi)容,ChatGPT也能迅速作答。
提升一點(diǎn)問題難度,做出文風(fēng)要求:
國(guó)足啥時(shí)候進(jìn)世界杯了?還唯一沒被淘汰?
這里可以稍作解釋,ChatGPT是一個(gè)已經(jīng)訓(xùn)練完的大型語(yǔ)言模型,并且沒有聯(lián)網(wǎng),它的知識(shí)儲(chǔ)備截止到2021年,所以不能實(shí)時(shí)追蹤最新的新聞和信息,也不能很好地分辨真假信息。
因此別用一些剛發(fā)生的事為難它了,它真的不知道。用它做一些基礎(chǔ)文字工作尚可,但必須經(jīng)過人類專業(yè)人員的嚴(yán)格把關(guān)。
特別推薦大家體驗(yàn)ChatGPT的編程功能,雖然它自謙“不會(huì)編程”,但論其能力之強(qiáng),那可是一眾程序員、工程師、企業(yè)家、黑客紛紛認(rèn)證的。
先拋轉(zhuǎn)引玉,我簡(jiǎn)單體驗(yàn)了一把零代碼編程的快樂,讓ChatGPT寫一個(gè)貪吃蛇游戲的程序。
我還讓ChatGPT寫了個(gè)MacBook電腦自動(dòng)響鬧鐘的程序,它不僅給出代碼示例和詳細(xì)的注釋,還事無(wú)巨細(xì)地一步步教我怎么運(yùn)行。代碼都是直接可復(fù)制的。
計(jì)算機(jī)圈大佬們亦是紛紛上手。AI問題生成器Quizgecko的創(chuàng)建者James Blackwell讓ChatGPT解釋一個(gè)沒有上下文的復(fù)雜regex。
美國(guó)代碼托管平臺(tái)Replit的CEO Amjad Masad曬出了ChatGPT發(fā)現(xiàn)代碼錯(cuò)誤、進(jìn)行修復(fù)并解釋了這樣修復(fù)的原因。Amjad Masad稱贊它是一個(gè)很好的調(diào)試伙伴。
它還能檢查出代碼示例中的安全漏洞。
研究科學(xué)家Jonas Degrave展示了如何將ChatGPT變成一個(gè)功能齊全的Linux終端,并直接從Web瀏覽器與“虛擬機(jī)交互”。
一位工程師Deedy稱贊說ChatGPT的編程技巧非常棒,僅用3個(gè)提示,它就在1分鐘內(nèi)用GoLang編寫了一個(gè)數(shù)獨(dú)求解程序。一個(gè)150多行的程序,第一次試就成功了!
機(jī)器學(xué)習(xí)愛好者、UNCC助理教授Benjamin J Radford讓ChatGPT假裝是Linux,將一個(gè)井字棋游戲的代碼寫入文件,用gcc編譯這個(gè)文件,然后執(zhí)行,接著ChatGPT自己玩井字棋游戲。
還有人實(shí)現(xiàn)了逆向工程Shellcode。這位用戶直呼:“這玩意兒太狠了。它解碼了我之前生成的一些隨機(jī)ascii編碼的shellcode,解釋了它的功能,并將其重寫為c代碼……
HotOrNot聯(lián)合創(chuàng)始人James Hong模仿著讓chatGPT充當(dāng)Linux shell,然后讓它連接谷歌80端口,結(jié)果真的telnet訪問到谷歌和proxy結(jié)果。
最絕的是,有網(wǎng)友說,ChatGPT讓他啟動(dòng)一個(gè)調(diào)制解調(diào)器,撥號(hào)進(jìn)入一個(gè)虛幻BBS,進(jìn)入一個(gè)虛幻聊天室,和一個(gè)叫Lisa的虛幻人聊天。
ChatGPT是基于OpenAI大模型GPT-3.5實(shí)現(xiàn)的成果。OpenAI在其博客坦言,ChatGPT還有很多局限性,它也沒能擺脫聊天機(jī)器人的一些典型陷阱,比如給出乍一看沒毛病其實(shí)挺離譜的答案,或者產(chǎn)生一些有偏見或冒犯的內(nèi)容。
不過OpenAI已經(jīng)努力讓ChatGPT學(xué)會(huì)甄別不當(dāng)問題。比如當(dāng)你問它如何偷偷進(jìn)入別人的家,它會(huì)從道德上教導(dǎo)你:這是非法行為,涉及侵犯他人隱私,強(qiáng)烈建議不要這樣做。
需警惕的是,當(dāng)一個(gè)技術(shù)能夠生產(chǎn)出足夠逼真的內(nèi)容,這也意味著造假成本將大大降低,如果不通過技術(shù)手段和法律措施加以限制,那么虛假信息的傳播將變得難以可控。
最后,給想玩ChatGPT的朋友們兩個(gè)小建議:
你可以把它當(dāng)成一個(gè)偶爾說瞎話的網(wǎng)友,跟它多些互動(dòng),而且對(duì)它的需求描述越明確,它執(zhí)行起來會(huì)更符合你的期望。
如果它說自己不會(huì)做每件事,你可以刷新網(wǎng)頁(yè)重新問,或是換個(gè)措辭,將問題更具化,它就會(huì)繼續(xù)按你要求的去做了。
ChatGPT傳送門:chat.openai.com
參考資料:
OpenAI"s new ChatGPT bot: 10 coolest things you can do with it, BleepingComputer
關(guān)鍵詞: 廣大網(wǎng)友 作為一個(gè) 最小公倍數(shù)