拳打谷歌ChatGPT火出圈！投資人稱更需警惕投資泡沫化跟風

2022年12月07日 14:54　來源：第一財經

大字體

小字體

分享到：

　　一夕之間，ChatGPT突然火了。

　　所謂ChatGPT，是在今年11月30日，由人工智能實驗室OpenAI上線的新模型，其網頁應用允許用戶免費使用，目前用戶與ChatGPT之間的對話互動包括了普通聊天、信息咨詢、撰寫詩詞作文、修改代碼等，甚至令用戶產生ChatGPT能否取代谷歌等搜索引擎的疑慮。

　　一位技術領域人士認為，讓ChatGPT 類平臺、以及短視頻平臺或購物社交平臺來取代搜索引擎，容易讓知識來源單一化，這是危險的。東吳證券團隊也認為，ChatGPT模型仍無法很好解決虛假信息的問題，甚至過度猜測用戶意圖導致回答偏差較大，因此其本質仍偏向AIGC內容生產工具，而非搜索引擎。

　　此外，ChatGPT火速出圈，但對話過程中也經常會發生因語料積累不足而產生的“事故”。多位AI界行業人士對第一財經記者表示，無需因ChatGPT的智能而對AI產生恐懼，ChatGPT的出圈本質是算力與樣本量提升后得到的自然結果，更需警惕的是將ChatGPT歸屬于AIGC賽道后引發的創業與投資泡沫。

　　“上癮”的聊天AI

　　據官網介紹，計算模型GPT-3.5支持的通用聊天機器人ChatGPT，能回答連續性的問題、承認自己的錯誤、質疑不正確的假設，甚至拒絕不合理的需求。從寫劇本、寫詩、設計游戲，到給程序找bug，乃至制定一份“毀滅人類”的計劃，這個AI能做的事情超乎想象。

　　美國企業家馬斯克詢問了ChatGPT如何設計Twitter，AI回答稱：“為了使用戶更容易查看線程互聯網對話并與之交互，你可以將線性一維界面轉換為二維無限網格。”

　　有人認為，ChatGPT的出現堪比AlphaGo打敗李世石。12月5日，OpenAI創始人兼CEO阿爾特曼(Sam Altman)發布推文表示，ChatGPT用戶數已突破了100萬。在這條推特下，馬斯克詢問“每次聊天的平均費用是多少”，阿爾特曼回復表示，“用戶平均每次聊天所花費的可能是個位數美分?！?/p>

　　目前ChatGPT仍處于免費測試階段，不限量向公眾開放，基于其破百萬的用戶數，平臺所花費的成本不算小。不過，在使用過程中，用戶提供的反饋對OpenAI也是最有價值的信息，可以不斷訓練語言模型，修正錯誤答案。

　　第一財經記者注冊并體驗了一下ChatGPT對話。雖然目前ChatGPT并沒有開放給中國地區的用戶，但界面仍可使用中文。記者首先讓AI自我介紹，其回復，“我是Assistant，一個由 OpenAI 訓練的大型語言模型。我的工作是幫助人們回答各種問題，盡可能提供準確和詳細的信息。我可以回答各種問題，無論是關于歷史、科學、人文還是其他話題?！?/p>

　　計算機領域從業人士高毅對第一財經表示，試用ChatGPT的體驗很奇妙，一個聊天AI 能寫代碼，能用“意念”分析代碼，甚至能用“意念”分析一個超時程序的運行結果，“一開始以為他打開了個gcc 或者 python 之類的外部進程輔助分析，但試下來感覺并不是這樣，而是他真的像人一樣在試圖理解這些代碼。”

　　高毅故意提供了一些有問題的輸入程序，使其根本無法正確執行，還故意給了個有生之年無法運行結束的程序，而ChatGPT像人而非機器一樣，無視了上述這些不重要的問題，轉而專注于問題的核心點，并在有限時間內給出了解答，“雖然他回答有小的錯誤，但能夠做到這一步真的已經非常厲害了?！?/p>

　　東吳證券研報分析認為，ChatGPT的模型經歷從GPT到GPT3的升級，優化主要來自算力增加。GPT、GPT-2和GPT-3在算法模型并沒有太大改變，但參數量從1.17億增加到1750億，預訓練數據量從5GB增加到45TB，其中GPT-3訓練一次的費用是460萬美元，總訓練成本達1200萬美元。雖然訓練數據量和算力大幅增加使GPT-3有顯著優化，但高額投入也使其只能走B端變現。

　　此次ChatGPT出圈，其技術模型最大變化出現在2022年推出的GPT3.5，技術迭代成優化來源于1月發布的InstructGPT模型中增加了人類對模型輸出結果的演示，并在對結果進行排序的基礎上訓練，加上指令調整的幫助，雖然其只有13億個參數，但回答準確率、道德表現卻好于GPT-3。

　　ChatGPT雖然強大，仍然有其局限性，比如偶爾會犯錯誤，有一定的誤導性；作為一個AI，它也不能提供對人或事件的判斷和評價。但基于其反饋強化學習系統，ChatGPT也在不斷學習完善。有用戶表示，前幾天問ChatGPT的時候提供的錯誤答案，過了一天之后就已經被修正，或許是很多用戶的反饋幫助ChatGPT對正確的答案進行了排序。

　　日常對ChatGPT進行調戲逗樂僅是娛樂項目，一旦作為嚴肅工作內容，則需要嚴謹對待。據了解，程序員交友網站Stack Overflow上已出現大量通過ChatGPT自動生成的內容，給Stack Overflow的質量管理造成影響。Stack Overflow方面發布公告稱，由于從ChatGPT中獲得正確答案的平臺比率太低，發布由ChatGPT創建的答案對網站和詢問者以及尋找正確答案的用戶都有很大危害?！敖褂肅hatGPT直接生成垃圾答案，否則封號。這是一個臨時性規定，目的是應對目前論壇上ChatGPT生成內容的泛濫之勢。”

　　對此，ChatGPT回應稱，“因為AI生成的答案不總是準確或相關的，可能會導致Stack Overflow上混淆錯誤答案，誤導在尋求幫助的用戶。”“Stack Overflow禁止用AI生成答案是合理的?！卑柼芈脖硎荆噲D阻止ChatGPT隨機編造，現階段讓其與當前技術保持平衡是很棘手的。隨著時間的推移，會根據用戶反饋來改進。

　　對AI無需過分恐慌

　　開發出ChatGPT的公司是何來頭？公開信息顯示，ChatGPT由人工智能公司OpenAI開發，成立至今已經七年，坊間傳言其最新估值已達到兩百億美元。

　　OpenAI最初是由馬斯克、阿爾特曼等六人在2015年聯合創辦，最初為非營利性機構。2018年馬斯克宣布退出，2019年，OpenAI宣布重組為一家“有限營利(capped-profit)企業”，并接受了微軟10億美元的投資，雙方表示將合作替Azure云端平臺服務開發人工智能技術。此次推出的ChatGPT也是在微軟Azure AI服務器上完成的訓練。

　　阿爾特曼在12月6日發布的推文中感謝微軟和Azure，他表示，微軟和Azure做了大量的工作，構建了迄今為止最好的AI 基礎設施，但目前并沒有因為OpenAI 推出的東西而獲得足夠的榮譽。

　　此次ChatGPT的火熱出圈也引發外界對AI是否即將戰勝人類的恐慌。但多位AI界面人士對記者稱，目前ChatGPT更多是算力與語料調教后的正常結果。

　　據國盛證券研報，ChatGPT的背后離不開大模型、大數據、大算力，其技術底座使用的是微調后的GPT-3.5系列模型，有著多達1750億個模型參數，OpenAI主要使用的公共爬蟲數據集有著超過萬億單詞的人類語言數據集。GPT-3.5在微軟Azure AI超算基礎設施上進行訓練，總算力消耗約3640PF-days(即每秒一千萬億次計算，運行3640個整日)。

　　針對外界認為ChatGPT可以取代搜索引擎的觀點，前Google總部科學家、出門問問創始人李志飛認為，相對于語音助手和搜索引擎，ChatGPT目前還有很多不能干或干不好的實情，如不能查詢附近的川菜館，不能進行打電話、定日歷、播放歌曲等手機本地操作。此外，ChatGPT大概率不能回答訓練時它沒有看到的最新網頁知識，不一定能正確回答一個五年前政治人物今年的年齡，大概率不能做對簡單的邏輯題和加減乘除題。

　　總結來說，李志飛認為，ChatGPT的“認知”建立在虛擬訓練文本上，沒有跟實時的數據庫或信息連接，也沒有顯式的邏輯推理，仍有些“空中樓閣”的味道，所以特別適合插科打諢。

　　雖有不少聲音將ChatGPT與谷歌等搜索引擎對比，但東吳證券團隊認為，由于ChatGPT模型仍無法很好解決虛假信息的問題，甚至過度猜測用戶意圖導致回答偏差較大，因此其本質仍偏向AIGC內容生產工具。搜索引擎核心是海量信息集合，而非信息創造；但在“存在標準答案”的編碼、數學計算等領域，ChatGPT或將對搜索引擎產生一定沖擊。其次，相比更多面向B端客戶的GPT-3，C端學習和使用成本低、產出效果好的ChatGPT有望助力AIGC破圈，并在接收海量用戶反饋的過程中繼續迭代，推動AIGC文字內容生產走向全民化。

　　不少游戲人士和插畫人士也開始關注ChatGPT，但不少用戶在使用之后反饋表示ChatGPT并沒有想象中那么智能。有一位游戲行業人士發現，ChatGPT對于2021年之后發生的事情似乎了解得并不多，“問它《原神》，它不知道稻妻(原神的一個地名)是哪里。”該用戶說。另有用戶向ChatGPT提問“《原神》的開發公司是哪家”，得到的回應不是米哈游而是騰訊。

　　對此，另一位用戶表示，目前ChatGPT的學習的數據樣本只截止到2021年，等到訓練的人數增加了，反饋內容的質量便會有所提升。此外，部分用戶向記者反饋認為，ChatGPT在不同語種的識別和解讀上存在差異，使用中文和同樣內容轉譯成的英文輸入得到的反饋結果并不相同。

　　盡管目前ChatGPT僅能實現文字應答，但是不少插畫人士也開始利用ChatGPT工作。一位插畫師告訴記者，對于目前市面上流行的AI繪畫軟件stablediffusion，插畫師常苦于反復修改提示語但仍無法得到理想的結果。不過ChatGPT提供了一個新的思路：用于生成指導AI作畫的提示語模板，即利用AI告訴AI如何作畫?！跋喈斢诎袰hatGPT當成一個人類慣用語和ai繪畫能理解的語言中間的翻譯器，只需要在它生成的模板中填寫幾個關鍵詞然后粘貼到stablediffusion就好了，經過ChatGPT轉換后的指令成的圖比原先手動輸入的內容相比要好很多?！?/p>

　　相較而言，人工智能研究專家、創新工場人工智能工程院執行院長王詠剛持有更謹慎的態度，他表示，其一，AI創作目前在知識教育領域爭議很大，例如王詠剛杜撰了一個學術概念“鏡像等離子規范場”，但ChatGPT竟然真的一本正經地進行了解讀。

　　王詠剛稱，ChatGPT的模仿能力和文筆越好，這個未來風險就越值得重視且需要提前應對。今天的AI生成理論，還沒辦法保證生成內容的邏輯正確與合理；建立人類領域專家參與的AI訓練過程，發展與正確性相關的增強學習算法可能會是未來的一個AI科研熱點。

　　其二的擔憂點在于AI/CS專業人需保持冷靜，王詠剛認為，面對大幅提升多輪對話能力的ChatGPT，越是AI/CS的從業者越是不能一味地頂禮膜拜；最起碼，應該有測試和驗證的精神，不斷探索新模型的能力上限，甄別模型生成答案時真正的“記憶認知”和基于特征相似性的“模仿游戲”。

　　警惕盲目跟風

　　ChatGPT的火爆讓國內創投圈再次熱議AIGC的投資價值，AIGC 全稱AI-Generated Content，指利用AI技術尋找數據規律并泛化生成的內容。

　　國泰君安研發分析稱，AI繪畫是AIGC的一大重要分支，目前處于由簡單的降本增效向創造額外價值升級的階段，跨文字和圖像的多模態內容成為關鍵的發展節點。2022年8月，Stable Diffusion、Midjourney等AI繪畫應用因《太空歌劇院》作品的獲獎而在海外迅速出圈，此后熱度蔓延至國內，無界版圖AI、意間AI等應用于9月底相繼上線，其中意間AI用戶數在42天內突破百萬。此次ChatGPT僅用5天便實現百萬用戶數，AI問答及其他分支應用的熱度有望持續攀升。

　　就技術層面而言，國泰君安稱，模型效率、素材庫豐富度是AIGC應用的核心競爭力。以AI繪畫為例，此前流行的GAN模型存在一定局限性，包括從噪聲/條件到最終結果的一步到位式生成方式難度較高，面對復雜數據時容易訓練失敗，跨模態生成效果較差等。但2022年出現的Diffusion模型在這三方面均有改善，模型迭代驅動多個AI繪畫應用出圈。

　　并且此次OpenAI發布的ChatGPT模型較前代而言有較大進步，如減少不真實回答、避免有害回答、挑戰用戶問題前提等，同時還具備連續對話的記憶能力，人機交互體驗更為逼真。豐富的內容素材庫保障模型得到充分訓練，并最終生成高質量內容，是AIGC應用的另一核心競爭力。

　　因此，浙商證券研報認為，ChatGPT模型的出現對于文字模態的AIGC應用具有重要意義。從下游相關受益應用來看，包括但不限于代碼機器人、小說衍生器、對話類搜索引擎、語伴、語音工作助手、對話虛擬人等。從上游增加需求來看，包括算力、數據標注、自然語言處理(NLP)等。

　　至于ChatGPT加入后對行業造成的“威脅”，高毅表示，ChatGPT不一定能完全替代所有人，但可能是相對基礎的那部分，“具體到軟件行業，今天能離譜地生成和分析代碼，那明天很有可能 PRD 文檔都能直接生成軟件產品，僅需少量資深產品研發測試等人力介入。作為從業者，平時還是得多想想，哪些技能是更深的、不那么容易被替代的。”

　　就目前ChatGPT存在的問題而言，主要是來自于訓練過程和數據集的局限性，此次面向用戶免費開放能夠進一步強化訓練，從而完善模型質量。國盛證券研究所發現，目前OpenAI等巨頭已著手自建計算集群來滿足AIGC的要求，這種集中式的訓練對GPU、存儲、機房、供電等基礎設施均有巨大需求。國內部分創業團隊目前基于公有云訓練，隨著需求的增加，也有望轉向自建集群。

　　今年以來，我國“東數西算”戰略自上而下快速推進，作為數字經濟的基礎，“算力即權力”，其重要性不言而喻，此前國內廠商的更多互聯網應用聚焦于“存”而非“算”，隨著AIGC技術在全球的興起，“東數西算”的算力需求將越來越顯著。

　　未來隨著深度學習模型不斷完善、開源模式的推動、大模型探索商業化的可能，AIGC有望加速發展。但針對此次ChatGPT再次點燃創投圈內AIGC賽道的火熱，王詠剛持有謹慎態度。2022年11月，王詠剛前往硅谷，拜訪了多家投資公司、科技公司、創業團隊，他發現科技圈里幾乎人人都在談論AIGC，似乎沒有AIGC包裝的創業項目就不是好項目，沒有AIGC概念的科研就發不出好論文。

　　但實情的確如此嗎？在后續與OpenAI兩位聯合創始人的交流中，王詠剛發現，對方會通過非常技術化、務實的心態談論其工作計劃與技術思考，但他們并不知道AIGC到底是什么意思，這令王詠剛非常詫異，思考之后王詠剛認為，“從科技上開創AIGC這個新領域的OpenAI創始人，其實并不需要知道類似AIGC之類純粹用來包裝科技概念的新名詞。他們要研究的是大模型結構、并行訓練加速、神經網絡優化等等具體科學與技術。這樣的人才是真正的創建者和領航者。”

　　目前國內AIGC一片火熱，在王詠剛看來，其中一部分創業者、投資者、或將AIGC快速包裝成應用產品的大多數，其實只是并無能力決定科技大方向的跟風者?！捌谕L者在AIGC這個大舞臺上，不要過于頭腦發熱，還是要多判斷一下，自己構建的所謂‘產品’，到底是有益于人類進步的，還是向已經碎片化的內容世界繼續灌水或傾倒垃圾的。”王詠剛表示。

【編輯:彭婧如】

更多精彩內容請進入財經頻道

發表評論文明上網理性發言，請遵守新聞評論服務協議

經濟新聞精選：

中央定調：要創新，不要內卷

2024年12月18日 15:20:42
外企在中國｜萬億園區，中新制造

2024年12月18日 10:03:30
70城房價，今年以來首次出現這種趨勢！

2024年12月17日 09:33:57
世界級深水港湛江港實現40萬噸級船舶常態化夜航靠泊

2024年12月16日 13:22:33
外貿頂住“壓力測試”

2024年12月16日 08:34:50
河北八縣市簽署中藥材“百縣百倉”項目共建協議

2024年12月15日 20:13:20
中國央行官員：研究擴大碳減排支持工具的規模和使用范圍

2024年12月15日 20:09:20
“智改數轉” 高山風電集群實現智慧化管理

2024年12月14日 18:11:09
20位專家解讀中央經濟工作會議：2025年經濟工作這么干！

2024年12月13日 13:24:02
特朗普在紐交所敲響開市鐘重申減稅計劃

2024年12月13日 10:17:14

換一批