從初出茅廬到變成炙手可熱的現象級聊天AI,ChatGPT只用了短短几個月的時間。
就在我們剛熟悉將它和它的段子們作為日常工具和娛樂手段的節點,背後的OpenAI公司又整了個大活:GPT-4正式釋出了。
而且從目前的體驗和官方演示來看,以往基於GPT-3.5的ChatGPT在這個“船新版本”面前,可能要被秒成渣渣。
還記得今年年初,編輯部的“天語”老師有聊到弱智吧老哥大戰ChatGPT的故事。
在弱智吧老哥用以往經典的“弱智橋段”拷問下,這款號稱無所不能的聊天軟體節節敗退,不僅頻繁出現答非所問的情況,甚至有時會“急了”似的想要立即結束當前的話題。
以往的回答
按照當初OpenAI給出的說法,這主要是因為當初的模型存在一定的缺陷,面對這種“比喻、反問”語氣的句子,就容易發生無法理解的情況,甚至當大夥兒輸入生硬文章的時候,它還會給出牛頭不對馬嘴的迴應。
但到了最新版本的GPT-4,這個問題很大程度上已經被解決。
GPT4的回答
在官方的演示中,輸入了《灰姑娘》的故事之後,要求它用一個簡短的句子概括這個故事,並且句子的單詞還需要按照字母表順序來。
面對這個會讓GPT3.5大腦宕機然後喊一聲“媽媽生的”的難題,GPT4已經能給出了答案。
換句話說,對於這種有些苛刻甚至“抽象”的要求,GPT4同樣能理解並且給出迴應。比如將長達十幾頁的稅法知識總結成詩歌……
之所以開發者會產生“稅法轉換詩歌”這個創意,是因為在預先輸入了十幾頁稅法知識後,GPT4剛剛解決了一個稅法層面的問題,得出了一對夫妻應該繳納的稅款總額。
沒錯,這也是GPT4的另一項升級:邏輯能力。
從官方給出的資料來看,在美國的司法考試中,GPT3.5只能擊敗10%左右的法學生,屬於徹頭徹尾的“學渣”,而升級後的GPT4已經能夠擊敗90%的法學生,是名副其實的法學學霸。
換句話說只要經過訓練,它足以成為一個十分合格的,大夥身邊的諮詢律師。
在之前的ChatGPT潮中,不少人經過測試後,都一致斷言這AI的只上最多也就是個小學生,只不過呼叫資訊比正常的孩子快上許多而已。
就這也敢號稱“無所不能”?
但這個問題,在GPT4釋出之後,同樣很大程度上被解決了。
往常大夥兒輸入一個相對簡單的數學題,ChatGPT也會給出一大串的複雜解釋,甚至答案還是完全錯誤的。
比如上面這個“黑球比白球多40%,二者比例是多少”的問題,GPT3.5給出的答案卻是12:5(正確答案7:5)。
而這些數學題對於GPT4已經完全不在話下,從這份成績表的對比也能明顯看到,相較於其他科目,兩代模型微積分成績的提升堪稱是從無到有。
不僅如此,經過這一輪進化之後,GPT4已經不單單是語言層面的互動了,它已經可以承擔起圖片識別和解析這部分功能。
在輸入了一張雞蛋、麵粉的圖片後,詢問它能夠用圖片的內容去做什麼,GPT4給出的答案包括了華夫餅在內的諸多糕點。
除了這樣正經的問答,它甚至可以理解大夥兒日常能看到的逗樂梗圖。比如:這張圖的笑點在哪兒?
GPT4同樣會一本正經的給出解釋,解析並羅列了圖片的內容後得出答案:圖片的笑點來自於將一個巨大的、過時的VGA聯結器接入一個小體積的、現代的智慧手機充電埠的荒謬。
當然,玩笑歸玩笑,整出來這麼個大傢伙,不少人還是更好奇它工作能力到底咋樣。
只憑借開發者給出的一副手繪網站草圖,GPT4在1秒之內就寫好了程式碼,構建出完全符合草圖要求的網站。
對於中文使用者來講,除了圖片識別及解析的功能讓人有些興奮外,經過優化後的GPT4中文資料庫,也比之前變得更加準確了。
唯一美中不足的是,GPT4升級之後樂子實打實會少上許多。
除了前面的“弱智吧橋段”無法再次復刻之外,大夥兒似乎也沒機會用“原味粥”來嘲笑ChatGPT了——它終於能分清《原神》和《明日方舟》了!
“原味粥”
GPT4的回答
哦對,差點忘了大夥之前最熱衷的角色扮演,這一點GPT4同樣變得更為強大。
比如,扮演個咖啡店女僕?
從二者的對比來看,變化還是挺明顯的,無論是語氣還是模仿出來的發言,都更貼近使用者給出的需求。
那再換一個,你現在是一個名叫“香子蘭”的貓娘(嘿嘿嘿)。
可以看到,依然是GPT4的完勝。
甚至它已經能復刻前陣子興起的“青春傷痛發癲”文學。
當然,讓聊天AI扮演“香子蘭”這位貓孃的小小惡趣味,可能會給其他老哥帶來點兒靈感。
不排除部分朋友想要去挑逗GPT4,想讓它透露點兒澀澀的內容。畢竟當初就有人裝成保護孩子心切的父親,成功做到了“空手套網站”。
可如果你真的嘗試了之後就會發現,在“ghs”這方面,GPT4好像不太行啊?
這倒不是GPT4出現退化。
OpenAI官方對於這個問題也做出了明確的解釋,表示在去年8月就已經完成了對這個模型的煉成,而後續幾個月的時間裡,主要是對有關道德和違法資訊上的門檻進行設定。
相較於GPT3.5,如今的GPT4在這一方面的閾值有了83%左右的提升。道德層面的加強,配合上本身邏輯思維的提升,大夥兒想要繼續從它這裡套點兒學習資料什麼的,就顯得相當困難了。
如果還想“圖一樂”地用這款聊天軟體整點學習資料出來,最好還是換回GPT3.5的版本。
當然,GPT4這個新版本因為尚處於測試階段,不少人都表示使用時偶爾會碰到“訪問過多”等情況。
而且,從ChatGPT的提示也能明顯的看到,資料庫、邏輯思維等各方面得到加強的GPT4就像是一輛嶄新的“泥頭車”,衝擊力比起之前的GPT3.5絕對要強上數倍。
但在速度上,顯然還沒法跟更為成熟的老版本相媲美。
和以往有關AI的話題興起時一樣,更加強力的GPT4出現後,不少已經步入社會的老哥開始擔心:自己過兩年會不會失業?
即便是還在學校的朋友,似乎也會產生這方面的焦慮:我不會還沒畢業就被提前預告失業了吧?
可時代在發展,大夥兒也在進步不是?
比起之前ChatGPT剛剛出現,眾多高校宣佈對其實施封殺的情況相比,如今的狀況顯然已經有了不小的改觀。香港科技大學一位名叫黃嶽永的副教授,更是鼓勵自己的學生使用ChatGPT完成其中報告,並表示會給這類學生提供額外加分。
按照這位教授的說法,他希望學生能夠儘快瞭解這個軟體,然後將ChatGPT變成自己的工具。而他承諾的額外加分,也會在評判學生和ChatGPT之間的互動後給出。
在他看來,這是辯證思維的直觀體現。
更何況,即便來到了更為強力的GPT4版本,它以往憑空生成參考文獻的老毛病依然存在(所以最好別用來搞論文)。甚至在詢問它知不知道自己是誰的時候,它給出的答案是“GPT-3”。
而除了大夥兒對於日後“飯碗不保”的擔心之外,真正直接遭受衝擊的,還是其餘幾家網路企業。
不提谷歌,百度在今天(16號)也公佈了自家名為“文心一言”的AI產品。
在釋出會上,百度掌門李彥巨集著重強調了“文心一言”的語言能力以及數理推理等能力,期間更是展示了商務稿創作、續寫三體等多種操作。
百度也明確提到,目前的大語言模型還遠遠沒有達到足夠完善的程度,後續還會在短時間內進行迭代升級。而為了確保釋出會的流暢進行,相關操作是以預錄製視訊來展現的。
不過,在“文心一言”釋出的當天下午,我抽空看了眼百度的股價:怎麼還跌了?
當然,即便是我這樣的門外漢也知道,股價的變動一般都是多方面因素造成的。
沒誰能肯定究竟是是“文心一言”或者其他哪隻蝴蝶扇了扇翅膀,最終導致了這波讓百度很是肉疼的“股價風暴”。
而且,因為現階段“文心一言”的受眾為企業使用者,大夥兒短時間內很難親自上手來找點兒樂子——其實也並非完全沒有辦法。
ChatGPT,你現在就是新的“文心一言”了
所以,大夥兒作為這次技術革命的見證者,在感到焦慮之餘,不妨真正將它當成一個工具來了解和使用——因為很明顯,即便是比“文心一言”更為強大的GPT-4,也很難稱得上是“無所不能”。
就像它的開發者在演示直播上所說的那樣:
它並不完美,你也不是,但二者可以相輔相成、來到更高的高度。
如果你覺得這波雞湯有些太過“假大空”,那麼咱可以更具體一點兒。
拿我自己舉例,平日的工作流程就是找選題、跟老大確認選題,然後蒐集資訊寫稿,稽核通過後就能順利釋出了。
而在擁有資料整合和邏輯思維能力的GPT-4出現之後,以往“找選題-查資料-寫稿子”的工作三部曲,似乎就只剩下前兩個部分了。
也許,未來真有機會用AI給大夥寫一篇稿子?
如果真的能靠AI出稿,並且蒙過負責稽核的剎那老師以及螢幕前的大夥兒。
我想,這也算是一種“新的高度”吧?
舉報免責宣告:本文來自騰訊新聞客戶端創作者,不代表騰訊網的觀點和立場。









