整理 | 申莉琦
采訪、編輯 | 王與桐
【資料圖】
ChatGPT無疑是2023年截至目前的關(guān)鍵詞。而如我們所知,ChatGPT令人驚艷的AI能力,不僅僅體現(xiàn)在“回答”,更體現(xiàn)在“生成”。
“生成”能力,也是目前國內(nèi)企業(yè)競相追求的下一代AI發(fā)展方向。而秘塔寫作貓,就已經(jīng)進化出了“生成”文章的能力。
成立于2018年的秘塔科技,最早是在法律賽道做翻譯,后來逐漸深入寫作場景,成為國產(chǎn)版本Grammarly。
而秘塔寫作貓顯然并不滿足于此。在去年秋天,秘塔寫作貓推出了“量子速寫”這一文章生成器,很快就獲得了廣泛的關(guān)注,一周時間內(nèi)達到上萬的日活。
今年以來,整個ChatGPT領(lǐng)域不斷有新聞發(fā)生,GPT-3.5-turbo的API開放、GPT4上線、百度文心一言上線等等。我們采訪了秘塔寫作貓創(chuàng)始人&CEO閔可銳,一起聊聊了從Grammarly到ChatGPT,下一個時代的文章工具,應(yīng)該是什么樣。
以下是專訪實錄,經(jīng)36氪整理:
36氪:按我個人的理解是:ChatGPT由生成式對話與搜索資料這兩部分功能組成,在您看來,這兩部分中哪一個是讓ChatGPT火起來最重要的原因?
閔可銳:在一定程度上來說ChatGPT的爆火不只是需求上的原因。對于對話式交互領(lǐng)域,學(xué)術(shù)界一直在發(fā)展革新,但對于普通的民眾來說,并沒有感知。以前在大家印象中能達到30分-40分用戶體驗的功能短時間提升到了80分-90分,讓很多人都感到震驚,造成廣泛的自傳播。實際上,在去年9月份我們推出小程序速寫時,也讓很多人感到驚喜。
36氪:我最早接觸你們,是因為你們的文本糾錯能力;去年年底你們又推出了智能寫作的功能;但據(jù)我們所知,秘塔最早涉足的是法律翻譯相關(guān)的領(lǐng)域。作為秘塔寫作貓的CEO,您能分享一下您創(chuàng)業(yè)的歷程,以及秘塔科技寫作貓的發(fā)展迭代邏輯嗎?
閔可銳:一直以來我從事的都是研發(fā)相關(guān)的工作,早在2013年時我創(chuàng)立過另一家公司做自然語言處理,在B端有一定的影響力。2018年起,我們開始了秘塔這個項目。在秘塔剛創(chuàng)立的時候,我們就已經(jīng)料想到新一代以深度學(xué)習(xí)為代表的技術(shù),能達到準(zhǔn)專業(yè)級腦力勞動上的效果,就像現(xiàn)在大家都在討論的ChatGPT??赡茉诖酥按蠹覍θ斯ぶ悄艿睦斫膺€停留在小愛同學(xué)的級別,你發(fā)出的一些比較標(biāo)準(zhǔn)的指令能夠得到滿足,但只要超出這個的范疇,它就束手無策。而現(xiàn)在ChatGPT的出現(xiàn)相當(dāng)于給全民做了一個AI能力的普及。
18年起,我們就在朝這個方向努力,選擇了法律這個領(lǐng)域切入,因為這個領(lǐng)域本身就具備付費的意愿與能力。在做跨國交易的時候,律師可能需要花費兩三周的時間進行翻譯與校對的工作,這就體現(xiàn)了human intelligence能夠被替代的單點,且有意愿付費。就算在較好的律所里配有專職的翻譯團隊,單價卻非常昂貴。這就促成了我們第一個產(chǎn)品落地的定位,就是把翻譯這件事做好。
19年我們發(fā)布了第一個翻譯產(chǎn)品,當(dāng)時還在北大法學(xué)院舉辦了相關(guān)活動,通過邀請資深的律師和公司法務(wù)觀摩不同學(xué)校代表隊與AI進行PK,讓大家直觀地感受到了目前機器的翻譯能力已經(jīng)達到一個專業(yè)的水平。隨后基本上國內(nèi)頂級的幾百家律所也陸續(xù)成為了我們的客戶。
為了使用機器幫助減少重復(fù)性腦力勞動的工作量并提高工作的效率,我們在2020年的時候推出了糾錯校對的產(chǎn)品。對于一些白領(lǐng)來說,跟大量的文本打交道是不可避免的,無奈的是,市面上并沒有一個好的產(chǎn)品去幫助他們進行一些糾錯潤色或者校對提示。傳統(tǒng)的Word也達不到上述的要求。
36氪:我使用中文時,出現(xiàn)錯別字、語法問題,從未被Word提示。
閔可銳:Word在十幾年前集成了這一套基礎(chǔ)的語法檢查體系,對于英文還行,但在中文這種語法不那么規(guī)則化的語言面前是很難施展的,由于中文語法本身的高度模糊性,導(dǎo)致市面上一直沒有比較流行且靠譜的產(chǎn)品,這恰恰是新一代技術(shù)可以施展拳腳的地方?;谖覀儗π蝿莸呐袛?,三年前我們發(fā)布了我們第一個版本的寫作貓,很大程度上減輕了文字工作者的苦惱。
近兩年,我們也逐步加入了針對英文的檢查與改寫潤色。在整個過程中,我們也意識到了很多用戶的價值感知最高的,不是幫助他找出文章的錯誤,而是幫助他從0到1生成文章,或給他一些ideas與靈感上的啟發(fā)。
36氪:那是怎么想到做文章續(xù)寫、智能寫作這方面的事情呢?
閔可銳:我們起初做糾錯這個產(chǎn)品時,在海外對標(biāo)的是09年成立的Grammarly公司,它花了大概十余年的時間讓營收達到了小一億美金的級別。
而AI應(yīng)用公司——Jasper——利用新技術(shù)作為杠桿,加上自身對營銷的理解,在創(chuàng)立短短的兩年時間里就達到了接近一億美金的規(guī)模,可見AI的價值。
學(xué)術(shù)上證明了GPT可行性后,Jasper公司又在商業(yè)上證明了這件事的可行性。
因為我們自身有相關(guān)技術(shù)儲備,在去年下半年推出了一個叫量子速寫的小程序:哪怕你只輸入一個標(biāo)題,我們也能給你生成2000字并具有完整邏輯的文章。事實證明反響還不錯,也驗證了AI寫作的直接需求。
量子速寫的生成文字
量子速寫的生成文字
后續(xù)我們也在不斷進行優(yōu)化與模型迭代,去年11月份時,寫作貓正式從“你來寫我來改”的模式變成了一個更一體化AI寫作平臺。
營銷宣傳的團隊,在使用寫作貓之前,人工一天可能寫出上千字,而使用寫作貓后,客戶只需要定義好需要的描述或賣點,我們就可以為我們的客戶生成一批相關(guān)的文案,就算客戶后續(xù)再手動地進行修改與調(diào)整,速度上也會比原先單純使用人工去完成任務(wù)更快。
現(xiàn)在看來,去年國內(nèi)市場還是比較安靜的。相比較之下,海外從2021年起便涌現(xiàn)一系列創(chuàng)業(yè)公司借助OpenAI的API開放應(yīng)用層產(chǎn)品。
36氪:不久前有很多人提到ChatGPT會取代Grammarly,您對此有什么想法嗎?從邏輯上來說是可行的,但ChatGPT這樣更好的生成式技術(shù),用于檢查語法、錯字,是不是相當(dāng)于用牛刀殺雞呢?
閔可銳:如果這把牛刀足夠便宜,殺雞也是可行的。和小模型相比,就算大模型的成本上存在幾十倍的差異,這些差異最終在客戶端都被抹平。
我在團隊內(nèi)部里也提到,如果一個工具能提升20%-30%的效率,那么它可以被定義為一個良好的工具;如果它能提升高達30倍的效率,這時大概率會遇到倫理問題。
Grammarly目前的定位與追求是輔助者,而不是幫助用戶直接生成文章,畢竟大幅提升效率的新產(chǎn)品難免會和傳統(tǒng)價值觀產(chǎn)生一定的沖突。這也是Grammarly沒有選擇快速轉(zhuǎn)型的原因。但是,當(dāng)人們發(fā)現(xiàn)一件事10秒就能完成時,便不愿再花費10分鐘去完成。在現(xiàn)在這個時代,一旦潘多拉魔盒被開啟,就很難再把它裝回去。
36氪:所以您也是會認同Grammarly會被取代這種觀點?
閔可銳:這還要取決于他們自己的營銷策略,畢竟目前為止他們還擁有一個比較廣泛的應(yīng)用群體。但如果Grammarly只專注于幫助用戶檢查錯誤,會受到具有更綜合功能產(chǎn)品的挑戰(zhàn)。
36氪:目前AI對話、AI寫作領(lǐng)域的實踐模式,大多是搜索加語料庫的路徑,你們調(diào)用的路徑是與ChatGPT不一致的嗎?你們使用的數(shù)據(jù)又是從何而來的呢?
閔可銳:我們從2018年成立,產(chǎn)品所用到的模型均為自研。在前GPT3時代,生成式的內(nèi)容很不靠譜,會有各式各樣低級的錯誤。在大模型基礎(chǔ)上,我們進行一系列良好的訓(xùn)練與工程的優(yōu)化后,寫作貓長文生成質(zhì)量達到了實用級別。對于數(shù)據(jù)方面,我們使用的都是全網(wǎng)各種新聞網(wǎng)頁或其他公開資料洗出來的高質(zhì)量數(shù)據(jù)。
36氪:我們之前試用過mini max公司的旗下產(chǎn)品glow,發(fā)現(xiàn)其對話風(fēng)格與近年來流行的劇本殺風(fēng)格類似,那么它們的數(shù)據(jù)來源又是什么呢?
閔可銳:網(wǎng)絡(luò)小說。在中國有著極其豐富的網(wǎng)絡(luò)小說資源,這個量級在全球范圍內(nèi)都首屈一指。中國目前網(wǎng)絡(luò)小說存量加起來比OpenAI訓(xùn)練GPT3的數(shù)據(jù)還要多。
36氪:前段時間,OpenAI宣布開放ChatGPT的API接口,對于這件事您怎么看?
閔可銳:在我看來,它的商業(yè)推進速度是非常之快。并且這套定價體系的出現(xiàn),會讓很多全球范圍內(nèi)跟OpenAI處于一定競爭關(guān)系、使用類似商業(yè)模式的公司感到十分難受這也是OpenAI在12個月里第二次降價, 總計下調(diào)到了1/30,這給所有其他想要利用大模型并提供上層API調(diào)用的公司而言無疑是巨大的壓力。且不論你的模型無法與之相比,在定價時,它采取的甚至不是以獲取正向利潤為目的定價策略。
36氪:這種策略與中國互聯(lián)網(wǎng)滴滴美團這些公司十分類似。
閔可銳:這其實是一個非常激進地去普及其API的方式,在一定程度上來說,這個方式可能也是行之有效的。微軟投入的巨額資金,其中的大部分也會在自己平臺上重新被使用,所以也算是收入的一部分,或者更通俗來說,可以看成是一種優(yōu)惠券,換來的可能是市場上絕對優(yōu)勢的壟斷地位,這就讓其他公司很難再通過類似的模式賺取利潤。
36氪:正如您之前所說,ChatGPT開放API接口會讓很多公司難受,但主要提及的是海外與其采用類似商業(yè)模式的公司。您認為對于一些國內(nèi)相關(guān)領(lǐng)域的公司,他們難受的點在哪里呢?
閔可銳:我認為,我們國內(nèi)是需要自主自研的可控大模型的。但單從商業(yè)角度來說,我很難想象國內(nèi)的公司和它在市場上進行價格上的競爭。
我自己原來也在Google和微軟等公司實習(xí),很多時候大公司從研發(fā)到推出產(chǎn)品的流程需要以年來計時。我們已經(jīng)很多年沒有見到像微軟這樣體量的企業(yè),每周都會對其主產(chǎn)品線做更新,并把它的技術(shù)提升應(yīng)用到它核心的產(chǎn)品線,包括Bing的搜索上。
36氪:目前ChatGPT大模型的API已經(jīng)可以調(diào)用,在價格還比較低廉的情況下,秘塔寫作貓會考慮接入嗎?
閔可銳:我個人的觀點是,如果我們現(xiàn)在面臨的是30門全科能力的考試,OpenAI確實有機會通過它的規(guī)模與算力在綜合性的30門考試中取得比我們更好的成績。而我們的優(yōu)勢在于我們直面用戶,解決特定剛需場景問題,在我們重點關(guān)注的領(lǐng)域做到比它們好。
36氪:那我可以理解你們團隊是對標(biāo)的Jasper而不是OpenAI嗎?
閔可銳:就目前來說,我們不愿意提所謂對標(biāo)OpenAI這類邏輯。在一個月內(nèi),有太多公司從資本市場冒出并公開表明對標(biāo)OpenAI。我們保持敬畏。
36氪:我會傾向于把你們類比成中國版的Jasper,如果中國版的ChatGPT,也就是百度的文心一言成功上線,對你們公司會產(chǎn)生沖擊嗎?
閔可銳:首先,我們也很期待在這個節(jié)點上百度推出的產(chǎn)品展示技術(shù)能力;如果百度希望做成中國版的ChatGPT,那與我們其實不會產(chǎn)生直接沖擊。我們希望我們的產(chǎn)品更貼合專業(yè)且具體的場景,而ChatGPT更像是一個好的技術(shù)而不是一個收費的工具。
36氪:目前有很多投資人認為Jasper是一個很好的標(biāo)的,那么 Jasper這種模式在中國國內(nèi)是可以復(fù)制的嗎?
閔可銳:我們目前所看到的情況是,在國內(nèi)不論你針對什么環(huán)境,與國際市場的付費意愿相比而言是糟糕的,但不可否認偏營銷端的產(chǎn)品相對來說更好。很多公司并不愿意為單純具備管理職能的軟件每年支付上萬元,可如果某產(chǎn)品能為公司帶來可量化的1萬新增用戶,那公司就很有可能為其買單。他們可以選擇使用較小的金額去驗證產(chǎn)品帶來的效果,當(dāng)發(fā)現(xiàn)效果不錯以后,他們也會相應(yīng)地投入更多的金額。
36氪:了解了你們在應(yīng)用層面與OpenAI有較大差別以后,我想知道如果在投資到位的情況下,你們會選擇去擴張團隊的規(guī)模,在底層技術(shù)去追趕它們;還是會選擇把更多的精力放在實際應(yīng)用這個方面呢?
閔可銳:底層技術(shù)是我們一定會去不斷投入的方向,但對于是否需要千億模型這件事,我們的態(tài)度是不一定。
36氪:那您認為最有決定效果的方面是什么呢?
閔可銳:我們之所以認為OpenAI很強的重要原因是在它達到85分效果需要完成的這100件事里,每一件事它都沒有短板。我們會去探索更高的參數(shù)量,評估其必要性千億模型對成本來說是一個負擔(dān),在接近的應(yīng)用效果方面,我們會希望它越小越好,而不是越大越好,因為后者會帶來更大的成本。
就像Facebook最近也在訓(xùn)練一些較小的模型并利用它們達到千億級別的效果。所以理論上可以在更小的規(guī)模上達到2020年GPT3版本的訓(xùn)練效果, GPT-3的1700億參數(shù)訓(xùn)練并未充分。
36氪:未來ChatGPT的API廣泛應(yīng)用于中國市場的話,你認為會不會涌現(xiàn)出很多做相同事情的廠商?
閔可銳:我相信這是不可避免的。從2020年起,市場上就有大量試圖模仿我們的產(chǎn)品,雖然效果有顯著差異。
無論是國內(nèi)還是國外,競爭是常態(tài)。但凡是有價值的領(lǐng)域,就會有很多公司參與競爭。
36氪:您作為公司的CEO,在新的一年里對公司有什么具體的規(guī)劃嗎?或者換另一種說法,當(dāng)你們今年只能做好一件事時,您希望公司更看重商業(yè)化還是技術(shù),或者其他別的選項?
閔可銳:我們始終會考慮把商業(yè)化和技術(shù)兩件事捆綁在一起完成,希望我們在生成能力這項技術(shù)上的投入能直接反哺到客戶數(shù)量的增長,提升客戶的滿意度與復(fù)購的意愿,然后我們才能有更大的資源讓客戶了解到我們,這是一個正向循環(huán)的過程。驗證大家是否認可你最簡單的方式就是用錢投票。
關(guān)鍵詞: