




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ChatGPT人工智能新紀(jì)元PAGEPAGE100內(nèi)容簡(jiǎn)介ChatGPT爆火,標(biāo)志著人工智能從量變到質(zhì)變的飛躍,一場(chǎng)新的人工智能革命已經(jīng)到來(lái)。本書(shū)共6章,介紹了ChatGPT的誕生和發(fā)展,以及ChatGPT背后的技術(shù)路線;分析了ChatGPT及大模型訓(xùn)練對(duì)全球商業(yè)格局的沖擊與影響,涉及OpenAI、微軟、谷歌、百度、騰訊、阿里巴巴等廣受關(guān)注的互聯(lián)網(wǎng)科技公司;選取了具有代表性的行業(yè),解讀ChatGPT狂潮引發(fā)的產(chǎn)業(yè)顛覆與模式創(chuàng)新。同時(shí),本書(shū)對(duì)未來(lái)的強(qiáng)人工智能與人類(lèi)社會(huì)的關(guān)系進(jìn)行了深度研討。前言從2022年末到了2023年初,ChatGPT火遍了全球互聯(lián)網(wǎng)。2022年11月30日,OpenAI發(fā)布AI對(duì)話模型ChatGPT。由于ChatGPT的能力過(guò)于驚艷,上線僅5天就吸引了100萬(wàn)名用戶。推出兩個(gè)月后,ChatGPT的月活躍用戶就已經(jīng)達(dá)到1億人次,成為歷史上用戶數(shù)量增長(zhǎng)最快的消費(fèi)級(jí)應(yīng)用。要知道,海外版抖音——TikTok在全球發(fā)布后,經(jīng)過(guò)大約9個(gè)月的時(shí)間才達(dá)到月活1億人次,Instagram達(dá)到這一量級(jí)則用了兩年半的時(shí)間。ChatGPT之所以能夠?qū)崿F(xiàn)用戶數(shù)量的爆發(fā)式增長(zhǎng),歸根結(jié)底是ChatGPT超凡出眾的產(chǎn)品能力——成熟乃至驚人的理解和創(chuàng)作能力:除寫(xiě)代碼、寫(xiě)劇本、詞曲創(chuàng)作外,ChatGPT還可以與人類(lèi)對(duì)答如流,并且充分體現(xiàn)出辯證分析能力。ChatGPT甚至能質(zhì)疑不正確的前提和假設(shè)、主動(dòng)承認(rèn)錯(cuò)誤及能力有限、主動(dòng)拒絕不合理的問(wèn)題,這是前所未有的。更重要的是,ChatGPT的成功,證明了大模型技術(shù)路線的正確性。這意味著,人工智能(Artificial 終于從之前的大數(shù)據(jù)統(tǒng)計(jì)分類(lèi)階段,走向類(lèi)人邏輯溝通階段,并且人工智能在其強(qiáng)大的學(xué)習(xí)能力之下,進(jìn)化速度將超出我們的預(yù)料?;诖竽P图夹g(shù)路線,ChatGPT就像一個(gè)通用的任務(wù)助理,能夠與不同行業(yè)結(jié)合,衍生出很多應(yīng)用場(chǎng)景。可以說(shuō),ChatGPT為通用AI打開(kāi)了一扇大門(mén),真正讓人工智能落了地。ChatGPT“一夜躥紅”,迅速在全球范圍內(nèi)掀起一股沖擊波,引爆了中國(guó)、美國(guó)的人工智能產(chǎn)業(yè),人工智能公司全面入局,并引發(fā)資本市場(chǎng)震蕩。中國(guó)互聯(lián)網(wǎng)科技公司紛紛踏上了尋找“中國(guó)版ChatGPT”之路,如百度的類(lèi)ChatGPT應(yīng)用、自然語(yǔ)言處理大模型項(xiàng)目“文心一言”,阿里巴巴處于內(nèi)測(cè)階段的阿里版聊天機(jī)器人等。除在科技行業(yè)與商業(yè)領(lǐng)域引起震動(dòng)外,ChatGPT也在沖擊著人類(lèi)社會(huì),“ChatGPT能否取代人類(lèi)”“ChatGPT倫理問(wèn)題”等話題隨之而熱。其實(shí),任何一項(xiàng)新技術(shù),尤其是革命性技術(shù)的出現(xiàn),都會(huì)引發(fā)爭(zhēng)論??陀^來(lái)看,人工智能時(shí)代來(lái)臨是必然的趨勢(shì),只是ChatGPT讓我們?cè)O(shè)想中的人工智能時(shí)代離我們更近了。ChatGPT的出現(xiàn)標(biāo)志著人工智能從量變到質(zhì)變的飛躍,一場(chǎng)新的人工智能革命到來(lái)——本書(shū)正是基于此,介紹了ChatGPT的誕生和發(fā)展,以及ChatGPT背后的技術(shù)路線;分析了ChatGPT及大模型訓(xùn)練對(duì)全球商業(yè)格局的沖擊與影響,涉及OpenAI、微軟、谷歌、百度、騰訊、阿里巴巴等廣受關(guān)注的互聯(lián)網(wǎng)科技公司;選取了具有代表性的行業(yè),解讀ChatGPT狂潮引發(fā)的產(chǎn)業(yè)顛覆與模式創(chuàng)新;對(duì)未來(lái)的強(qiáng)人工智能與人類(lèi)社會(huì)的關(guān)系進(jìn)行了深度研討。本書(shū)力求用通俗易懂、富于趣味的語(yǔ)言進(jìn)行表述,內(nèi)容深入淺出、循序漸進(jìn),以幫助讀者全方位了解ChatGPT,并在紛繁的信息中梳理人工智能的演變線索與發(fā)展思路。作為科技創(chuàng)新時(shí)代的標(biāo)簽,人工智能所引領(lǐng)的科技變革更是在雕刻著這個(gè)時(shí)代,我們需要有所準(zhǔn)備。第1ChatGPT,爆了橫空出世的ChatGPT從2022年末到2023年初,由OpenAI公司打造的ChatGPT火遍了全球互聯(lián)網(wǎng),一躍成為人工智能(AI)領(lǐng)域的現(xiàn)象級(jí)應(yīng)用。由于ChatGPT的能力過(guò)于驚艷,發(fā)布僅僅5天,注冊(cè)用戶數(shù)量就超過(guò)了100萬(wàn),當(dāng)年的臉書(shū)用了10個(gè)月才達(dá)到這個(gè)“里程碑”。根據(jù)瑞銀的報(bào)告,2023年1月末,ChatGPT推出僅兩個(gè)月,月活用戶已經(jīng)突破了1億人次,成為史上用戶量增長(zhǎng)速度最快的消費(fèi)級(jí)應(yīng)用程序。那么,這個(gè)橫空出世的ChatGPT究竟是什么?怎么突然就火了呢?六邊形AI戰(zhàn)士ChatGPT是由OpenAI公司發(fā)布的最新一代的AI語(yǔ)言模型,是自然語(yǔ)言處理(NaturalLanguageProcessing,NLP)中一項(xiàng)引人矚目的成果。這款A(yù)I語(yǔ)言模型,與過(guò)去那些智能語(yǔ)音助手的回答模式有很大的不同——ChatGPT呈現(xiàn)了出人意料的“聰明”。與當(dāng)前市面上的一些人工智能客服相比較,ChatGPT跨越“人工娛樂(lè)”,真正觸及了人工智能,具有了我們期待的模樣。很多人形容它是一個(gè)真正的“六邊形AI戰(zhàn)士”——不僅能聊天、搜索、翻譯,撰寫(xiě)詩(shī)詞、論文和代碼也不在話下,還能開(kāi)發(fā)小游戲、作答美國(guó)高考題,甚至能做科研、當(dāng)醫(yī)生等。國(guó)外媒體評(píng)論稱(chēng),ChatGPT會(huì)成為科技行業(yè)的下一個(gè)顛覆者。GPT的英文全稱(chēng)為Generative Pre-trained 生成式預(yù)訓(xùn)練轉(zhuǎn)換器),是一種基于互聯(lián)網(wǎng)可用數(shù)據(jù)訓(xùn)練的文本生成深度學(xué)習(xí)模型。ChatGPT“脫胎”于OpenAI在2020年發(fā)布的GPT-3,任何外行都可以使用GPT-3,在幾分鐘內(nèi)提供示例,并獲得所需的文本輸出。GPT-3剛問(wèn)世時(shí)也引起了轟動(dòng)。它展示出了包括答題、翻譯、寫(xiě)作,甚至是數(shù)學(xué)計(jì)算和編寫(xiě)代碼等多種能力。由GPT-3達(dá)到了以假亂真的程度。在OpenAI的測(cè)試中,人類(lèi)評(píng)估人員也很難將GPT-3生成的新聞與人類(lèi)所寫(xiě)的新聞區(qū)分開(kāi)。GPT-3被認(rèn)為是當(dāng)時(shí)最強(qiáng)大的語(yǔ)言模型,但現(xiàn)在,ChatGPT模型似乎更強(qiáng)大。ChatGPT能進(jìn)行天馬行空的長(zhǎng)對(duì)話,可以回答問(wèn)題,還能根據(jù)人們的要求撰寫(xiě)各種書(shū)面材料,如商業(yè)計(jì)劃書(shū)、廣告宣傳材料、詩(shī)歌、笑話、計(jì)算機(jī)代碼和電影劇本等。簡(jiǎn)單來(lái)說(shuō),ChatGPT具備了類(lèi)人的邏輯、思考與溝通的能力,并且它的溝通能力在一些領(lǐng)域表現(xiàn)得相當(dāng)驚人,能與人進(jìn)行堪比專(zhuān)家級(jí)的對(duì)話。ChatGPT還能進(jìn)行文學(xué)創(chuàng)作。比如,給ChatGPT一個(gè)話題,它就可以寫(xiě)出小說(shuō)框架。當(dāng)用戶讓ChatGPT以“AI改變世界”為主題寫(xiě)一個(gè)小說(shuō)框架時(shí),ChatGPT清晰地給出了故事背景、主人公、故事情節(jié)和結(jié)局。如果一次沒(méi)有寫(xiě)完,ChatGPT還能在“提醒”之下,繼續(xù)寫(xiě)作,補(bǔ)充完整。ChatGPT已經(jīng)具備了一定的記憶能力,能夠進(jìn)行連續(xù)對(duì)話。有用戶在體驗(yàn)ChatGPT之后評(píng)價(jià)稱(chēng),ChatGPT的語(yǔ)言組織能力、文本水平、邏報(bào)、總結(jié)這些文字工作,都交給ChatGPT來(lái)輔助完成。普通的文本創(chuàng)作只是最基本的。ChatGPT還能給程序員編寫(xiě)的代碼找Bug。一些程序員在試用后表示,ChatGPT針對(duì)他們的技術(shù)問(wèn)題提供了非常詳細(xì)的解決方案,比一些搜索軟件的回答還要靠譜。美國(guó)代碼托管平臺(tái)Replit首席執(zhí)行官AmjadMasad在推特發(fā)文稱(chēng),ChatGPT是一個(gè)優(yōu)秀的“調(diào)試伙伴”,“它不僅解釋了錯(cuò)誤,而且能夠修復(fù)錯(cuò)誤,并解釋修復(fù)方法”。在商業(yè)邏輯方面,ChatGPT不僅非常了解自己的優(yōu)劣勢(shì),可以為自己進(jìn)行競(jìng)品分析、撰寫(xiě)營(yíng)銷(xiāo)報(bào)告,就連世界經(jīng)濟(jì)形勢(shì)也“了如指掌”,能答出自己的見(jiàn)解。ChatGPT還敢于質(zhì)疑不正確的前提和假設(shè),主動(dòng)承認(rèn)錯(cuò)誤以及一些無(wú)法回答的問(wèn)題,主動(dòng)拒絕不合理的問(wèn)題,提升了對(duì)用戶意圖的理解,提高了答題的準(zhǔn)確性。ChatGPT并不完美雖然ChatGPT模型與GPT-3模型相比,性能提高了一個(gè)層次,但ChatGPT依然有不完美的地方。實(shí)際上,ChatGPT和GPT-3類(lèi)似人類(lèi)的輸出和驚人的通用性只是優(yōu)秀技術(shù)的結(jié)果,而不是真正的“聰明”。不管是過(guò)去的GPT-3還是現(xiàn)在的ChatGPT,都會(huì)犯一些可笑的錯(cuò)誤,尤其是文化常識(shí)問(wèn)題、數(shù)學(xué)計(jì)算題等。而且,ChatGPT的回答往往是大段的,過(guò)于冗長(zhǎng),看似邏輯自洽,但有時(shí)卻是一本正經(jīng)地“忽悠”。這也是此類(lèi)方法難以避免的弊端,因?yàn)樗诒举|(zhì)上只是通過(guò)概率最大化不斷生成數(shù)據(jù)而已,而不是通過(guò)邏輯推理來(lái)生成回復(fù)。雖然這種創(chuàng)編在有些領(lǐng)域可能非常有用,很多游戲開(kāi)發(fā)者、科幻小說(shuō)家、美術(shù)工作者就經(jīng)常用AI來(lái)啟發(fā)自己的思路,但這對(duì)于需要準(zhǔn)確回答具體問(wèn)題的應(yīng)用場(chǎng)景來(lái)說(shuō)卻是硬傷。如果非專(zhuān)業(yè)人士無(wú)法分辨ChatGPT的答案的準(zhǔn)確性,極有可能會(huì)被嚴(yán)重誤導(dǎo)??梢韵胂?,一臺(tái)內(nèi)容創(chuàng)作成本接近于零,正確率約80%,對(duì)非專(zhuān)業(yè)人士的迷惑程度接近100%的巨型機(jī)器,用人類(lèi)寫(xiě)作者百萬(wàn)倍的產(chǎn)出速度接管所有的百科全書(shū)編撰工作,回答所有的知乎問(wèn)題,這對(duì)人們認(rèn)知的危害將是巨大的。為此,ChatGPT也遭到了一些機(jī)構(gòu)的封禁。比如,StackOverflow(一個(gè)與程序相關(guān)的IT技術(shù)問(wèn)答網(wǎng)站)暫時(shí)封禁ChatGPT的原因很簡(jiǎn)單,因?yàn)樗傻拇鸢刚_率太低,發(fā)布由ChatGPT創(chuàng)建的答案禁止使用ChatGPT和AI工具撰寫(xiě)學(xué)術(shù)論文。國(guó)際機(jī)器學(xué)習(xí)會(huì)議ICML認(rèn)為,ChatGPT這類(lèi)語(yǔ)言模型雖然代表了一種發(fā)展趨勢(shì),但隨之而來(lái)的是一些意想不到的后果以及難以解決的問(wèn)題。ICML表示,ChatGPT接受題難以找到負(fù)責(zé)的對(duì)象。ChatGPT除提供的結(jié)果不夠準(zhǔn)確外,還無(wú)法引用信息來(lái)源;它幾乎不知道2021年以后發(fā)生的事情。雖然它提供的結(jié)果通常足夠流暢,在高中甚至大學(xué)課堂上可以過(guò)關(guān),但無(wú)法像人類(lèi)專(zhuān)家的表述那樣,做到字斟句酌。人們似乎對(duì)智能的標(biāo)準(zhǔn)很低。如果某樣?xùn)|西看起來(lái)很聰明,我們就很容易自欺欺人地認(rèn)為它是聰明的。ChatGPT和GPT-3在這方面是一個(gè)巨大的飛躍,但它們?nèi)匀皇侨祟?lèi)制造出來(lái)的工具。由于當(dāng)前的ChatGPT只是基于2021年及之前的數(shù)據(jù)進(jìn)行訓(xùn)練的,加之使用的范圍不大,存在一些知識(shí)盲區(qū),或者是會(huì)出現(xiàn)一些對(duì)話的笑數(shù)據(jù)更新,ChatGPT將會(huì)以超出我們想象的速度進(jìn)化。2023年的決定性技術(shù)六邊形也好,不完美也罷,作為人工智能領(lǐng)域的現(xiàn)象級(jí)應(yīng)用,ChatGPT已經(jīng)登上了歷史舞臺(tái),開(kāi)始進(jìn)入甚至影響人們的生活。從硅谷科技巨頭,到一二級(jí)資本市場(chǎng),對(duì)其感興趣的人都在討論ChatGPT及AI技術(shù)的未來(lái)發(fā)展及所帶來(lái)的影響。其實(shí),ChatGPT上線之初,主要還是在AI行業(yè)和科技行業(yè)引起反響。2023年春節(jié)后,其熱度持續(xù)升溫;2023年2月,關(guān)于ChatGPT的重要消息明顯增多。人們發(fā)現(xiàn)ChatGPT可以輕松撰寫(xiě)文案、代碼,涉獵歷史、文化、科技等諸多領(lǐng)域,甚至通過(guò)了谷歌年薪為18.3萬(wàn)美元的編碼三級(jí)工程師崗位面試?;ヂ?lián)網(wǎng)上鋪天蓋地都是關(guān)于ChatGPT的信息。瑞銀集團(tuán)發(fā)布的報(bào)告顯示:2023年1月,ChatGPT平均每天有約1300萬(wàn)名獨(dú)立訪客,這一數(shù)量是2022年12月的兩倍。截至2023年1月末,ChatGPT月活用戶已突破1億人次。ChatGPT創(chuàng)造了新的用戶增長(zhǎng)速度紀(jì)錄——相比之下,也曾被稱(chēng)為火爆的Instagram,達(dá)到1億的用戶數(shù)用時(shí)兩年半。2023年2月2日,微軟宣布旗下所有產(chǎn)品全線整合ChatGPT。2月8日,由ChatGPT支持的新版Bing(必應(yīng))搜索引擎上線;3月,百度已提交注冊(cè)Chatflow等多個(gè)商標(biāo);英國(guó)《自然》雜志不再支持AI作者的論文;數(shù)字媒體公司Buzzfeed計(jì)劃使用OpenAI的AI技術(shù)來(lái)協(xié)助創(chuàng)作個(gè)性化內(nèi)容;美國(guó)賓夕法尼亞大學(xué)稱(chēng)ChatGPT能夠通過(guò)該校工商管理碩士專(zhuān)業(yè)課程的期末考試;OpenAI宣布開(kāi)發(fā)了一款名為“AI Classifier”的鑒別工具,目的是幫助用戶分辨文字是否由ChatGPTAI等生成。從資本市場(chǎng)來(lái)看,ChatGPT的火爆推動(dòng)了AI相關(guān)公司股價(jià)上漲。春節(jié)后的中國(guó)A股開(kāi)市第一周,ChatGPT、AIGC等概念表現(xiàn)活躍,相關(guān)個(gè)股連續(xù)上漲。Wind數(shù)據(jù)顯示:2月3日,ChatGPT指數(shù)上漲5.56%,周漲幅達(dá)30.18%。領(lǐng)漲的概念股包括賽為智能、海天瑞聲、云從科技、初靈信息和漢王科技等,周漲幅高達(dá)60%~70%。如漢王科技,盡管此前預(yù)告其2022年的凈利潤(rùn)預(yù)計(jì)為-1.4億元至-9800萬(wàn)元,但借著ChatGPT的概念,依舊不妨礙其出現(xiàn)連續(xù)漲停。一些上市公司積極回復(fù)投資者在相關(guān)領(lǐng)域的布局,如捷成股份表示,公司參股子公司世優(yōu)科技的虛擬數(shù)字人(以下簡(jiǎn)稱(chēng)“數(shù)字人”)已經(jīng)OpenAI訓(xùn)練數(shù)字人專(zhuān)有大腦形成個(gè)性化模型。百度宣布在3月召開(kāi)圍繞“文心一言”的新聞發(fā)布會(huì),阿里巴巴達(dá)摩院稱(chēng)正在研發(fā)類(lèi)ChatGPT的產(chǎn)品。據(jù)測(cè)算,基于1億名用戶,以每月20美元計(jì)算,ChatGPT年收入將超過(guò)200億美元。經(jīng)估算,ChatGPT在全球有超過(guò)10億名的潛在用戶,市場(chǎng)規(guī)模將超過(guò)2000億美元。ChatGPT的收費(fèi)模式如能成功,對(duì)于投資者而言,將是巨大的利潤(rùn)前景。如今,與ChatGPT概念相關(guān)的公司眾多。據(jù)CB Insights統(tǒng)計(jì)ChatGPT概念領(lǐng)域目前約有250家初創(chuàng)公司,其中51%的融資進(jìn)度在A輪使輪。2022年,ChatGPT和生成式AI(AIGC)領(lǐng)域“吸金”超過(guò)26億美元,共誕生6家獨(dú)角獸企業(yè),估值最高的就是290億美元的OpenAI。2023年2月10日,比爾·蓋茨在接受采訪時(shí)表示,像ChatGPT這樣的人工智能的興起,與互聯(lián)網(wǎng)的誕生或個(gè)人計(jì)算機(jī)的發(fā)展一樣重要。不同于元宇宙出現(xiàn)時(shí)帶來(lái)的概念炒作狂潮,ChatGPT才出現(xiàn)兩個(gè)月,已經(jīng)引發(fā)了關(guān)于人類(lèi)社會(huì)生產(chǎn)和生活的真正變革的話題潮,關(guān)鍵就在于這是一次人工智能技術(shù)真正走向智能化的突破與應(yīng)用。ChatGPT是如何煉成的ChatGPT看起來(lái)既強(qiáng)大又聰明,會(huì)創(chuàng)作,還會(huì)寫(xiě)代碼。它在多個(gè)方面的能力都遠(yuǎn)遠(yuǎn)超過(guò)了人們的預(yù)期。那么,ChatGPT的能力到底從何而來(lái)?出色的NLP模型強(qiáng)悍的功能背后,技術(shù)并不神秘。本質(zhì)上,ChatGPT是一個(gè)出色的NLP新模型。說(shuō)到NLP,大多數(shù)人先想到的是Alexa和Siri這樣的語(yǔ)音助手,因?yàn)镹LP的基礎(chǔ)功能就是讓機(jī)器理解人類(lèi)的輸入,但這只是技術(shù)的冰山一角。NLP是人工智能(AI)和機(jī)器學(xué)習(xí)(ML)的子集,專(zhuān)注于讓計(jì)算機(jī)處理和理解人類(lèi)語(yǔ)言。雖然語(yǔ)音是語(yǔ)言處理的一部分,但NLP最重要的進(jìn)步在于它對(duì)書(shū)面文本的分析能力。ChatGPT是一種基于Transformer模型的預(yù)訓(xùn)練語(yǔ)言模型。它通過(guò)龐大的文本語(yǔ)料庫(kù)進(jìn)行訓(xùn)練,學(xué)習(xí)自然語(yǔ)言的知識(shí)和語(yǔ)法規(guī)則。在被人們?cè)儐?wèn)時(shí),它通過(guò)對(duì)詢問(wèn)的分析和理解,生成回答。Transformer模型提供了一種并行計(jì)算的方法,使得ChatGPT能夠快速生成回答。Transformer模型又是什么呢?這就需要從NLP的技術(shù)發(fā)展歷程來(lái)模型出現(xiàn)以前,NLP領(lǐng)域的主流模型是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),再加入注意力機(jī)制(Attention)。循環(huán)神經(jīng)網(wǎng)絡(luò)模型的優(yōu)點(diǎn)是,能更好地處理有先后順序的數(shù)據(jù),如語(yǔ)言;而注意力機(jī)制就是讓AI擁有理解上下文的能力。但是,“RNN+Attention”模型會(huì)讓整個(gè)模型的處理速度變得非常慢,因?yàn)镽NN是一個(gè)詞接一個(gè)詞進(jìn)行處理的,并且,在處理較長(zhǎng)序列,如長(zhǎng)文章、書(shū)籍時(shí),存在模型不穩(wěn)定或者模型過(guò)早停止有效訓(xùn)練的問(wèn)題。2017年,谷歌大腦團(tuán)隊(duì)在神經(jīng)信息處理系統(tǒng)大會(huì)上發(fā)表了一篇名為AttentionisAllYouNeed(《自我注意力是你所需要的全部》)的論文,該論文首次提出了基于自我注意力機(jī)制(Self-attention)的變換器(Transformer)模型,并首次將其用于NLP。相較于此前的RNN模型,2017年提出的Transformer模型能夠同時(shí)進(jìn)行數(shù)據(jù)計(jì)算和模型訓(xùn)練,訓(xùn)練時(shí)長(zhǎng)更短,并且訓(xùn)練得出的模型可用語(yǔ)法解釋?zhuān)簿褪悄P途哂锌山忉屝?。這個(gè)最初的Transformer模型,一共有6500萬(wàn)個(gè)可調(diào)參數(shù)。谷歌大腦團(tuán)隊(duì)使用了多種公開(kāi)的語(yǔ)言數(shù)據(jù)集來(lái)訓(xùn)練這個(gè)最初的Transformer模型。這些語(yǔ)言數(shù)據(jù)集包括2014年英語(yǔ)—德語(yǔ)機(jī)器翻譯研討班(WMT)數(shù)據(jù)集(有450萬(wàn)組英德對(duì)應(yīng)句組),2014年英語(yǔ)—法語(yǔ)機(jī)器翻譯研討班數(shù)據(jù)集(有3600萬(wàn)組英法對(duì)應(yīng)句組),以及賓夕法尼亞大學(xué)樹(shù)庫(kù)語(yǔ)言數(shù)據(jù)集中的部分句組(分別取了庫(kù)中來(lái)自《華爾街日?qǐng)?bào)》的4萬(wàn)個(gè)句子,以及另外的1700萬(wàn)個(gè)句子)。而且,谷歌大腦團(tuán)隊(duì)在文中提供了模型的架構(gòu),任何人都可以用其搭建類(lèi)似架構(gòu)的模型,并結(jié)合自己手上的數(shù)據(jù)進(jìn)行訓(xùn)練。Transformer模型在翻譯準(zhǔn)確度、英語(yǔ)句子型。ChatGPT使用了Transformer模型的技術(shù)和思想,并在其基礎(chǔ)上進(jìn)行擴(kuò)展和改進(jìn),以更好地適用于語(yǔ)言生成任務(wù)。正是基于Transformer模型,ChatGPT才有了今天的成功。龐大的數(shù)據(jù)訓(xùn)練當(dāng)然,單有語(yǔ)言模型沒(méi)有數(shù)據(jù),是“巧婦難為無(wú)米之炊”。因此,基于Transformer模型,ChatGPT的開(kāi)發(fā)者們開(kāi)展了大量的數(shù)據(jù)訓(xùn)練。在ChatGPT出現(xiàn)以前,OpenAI已經(jīng)推出了GPT-1、GPT-2、GPT-3。雖然前幾代聲量不大,但模型都是極大的。GPT-1具有1.17億個(gè)參數(shù),OpenAI使用了經(jīng)典的大型書(shū)籍文本數(shù)據(jù)集進(jìn)行模型預(yù)訓(xùn)練。該數(shù)據(jù)集包含超過(guò)7000本從未出版的書(shū)稿,涵蓋冒險(xiǎn)、奇幻等類(lèi)別。在預(yù)訓(xùn)練之后,OpenAI針對(duì)問(wèn)答、文本相似性評(píng)估、語(yǔ)義蘊(yùn)含判定及文本分類(lèi)這四種語(yǔ)言場(chǎng)景、使用不同的特定數(shù)據(jù)集對(duì)模型進(jìn)一步訓(xùn)練。最終形成的模型在這四種語(yǔ)言場(chǎng)景下都取得了比基礎(chǔ)Transformer模型更優(yōu)的結(jié)果,成為新的業(yè)內(nèi)第一。2019年,OpenAI公布了一個(gè)具有15億個(gè)參數(shù)的模型:GPT-2。該模型架構(gòu)與GPT-1原理相同,主要區(qū)別是GPT-2的規(guī)模更大。不出意料,GPT-2模型刷新了大語(yǔ)言模型在多項(xiàng)語(yǔ)言場(chǎng)景下的評(píng)分紀(jì)錄。而GPT-3的整個(gè)神經(jīng)網(wǎng)絡(luò)更是達(dá)到了驚人的1750億個(gè)參數(shù)。除規(guī)模大了整整兩個(gè)數(shù)量級(jí)外,GPT-3與GPT-2的模型架構(gòu)沒(méi)有本質(zhì)區(qū)別。不過(guò),就是在如此龐大的數(shù)據(jù)訓(xùn)練下,GPT-3模型已經(jīng)可以根據(jù)簡(jiǎn)單的提示自動(dòng)生成完整的文從字順的長(zhǎng)文章,讓人幾乎不敢相信這是機(jī)器的作品。GPT-3還會(huì)寫(xiě)程序代碼、創(chuàng)作菜譜等幾乎所有的文本創(chuàng)作類(lèi)任務(wù)。從GPT-1到GPT-2,再到GPT-3,盡管ChatGPT的相關(guān)數(shù)據(jù)并未被公開(kāi),但可以想象,ChatGPT的訓(xùn)練數(shù)據(jù)只會(huì)更多。集優(yōu)勢(shì)之大成特別值得一提的是,ChatGPT與GPT-3是有所不同的。2022年3月,ChatGPT的開(kāi)發(fā)公司OpenAI發(fā)表了論文Raining Language Models FollowInstructionswithHumanFeedback(《結(jié)合人類(lèi)反饋信息來(lái)訓(xùn)練語(yǔ)言模型使其能理解指令》),并推出了ChatGPT所使用的——基于GPT-3模型并進(jìn)行了微調(diào)的InstructGPT模型。在InstructGPT的模型訓(xùn)練中,加入了人類(lèi)的評(píng)價(jià)和反饋數(shù)據(jù),而不僅僅是事先準(zhǔn)備好的數(shù)據(jù)集。也就是說(shuō),區(qū)別于GPT-3通過(guò)海量學(xué)習(xí)數(shù)據(jù)進(jìn)行訓(xùn)練,在ChatGPT中,人類(lèi)對(duì)結(jié)果的反饋成了AI學(xué)習(xí)過(guò)程中的一部分。在GPT-3公測(cè)期間,用戶提供了大量的對(duì)話和提示語(yǔ)數(shù)據(jù);而OpenAI公司內(nèi)部的數(shù)據(jù)標(biāo)記團(tuán)隊(duì)也生成了不少的人工標(biāo)記數(shù)據(jù)集。這些標(biāo)注過(guò)的數(shù)據(jù),可以幫助模型在直接學(xué)習(xí)數(shù)據(jù)的同時(shí)學(xué)習(xí)人類(lèi)對(duì)這些數(shù)據(jù)的標(biāo)記。于是,OpenAI就利用了這些數(shù)據(jù)對(duì)GPT-3所采用的監(jiān)督式訓(xùn)練進(jìn)行了微調(diào)。隨后,OpenAI收集了微調(diào)過(guò)的模型生成的答案樣本。一般來(lái)說(shuō),對(duì)于每一條提示語(yǔ),模型都可以給出無(wú)數(shù)個(gè)答案,而人們一般只想看到一個(gè)答案,模型需要對(duì)這些答案進(jìn)行排序,并選出最優(yōu)的。所以,數(shù)據(jù)標(biāo)記團(tuán)隊(duì)在這一步對(duì)所有可能的答案進(jìn)行人工打分排序,并選出最符合人類(lèi)習(xí)慣的答案。這些人工打分的結(jié)果可以進(jìn)一步建立獎(jiǎng)勵(lì)模型——自動(dòng)給語(yǔ)言模型獎(jiǎng)勵(lì)反饋,達(dá)到鼓勵(lì)語(yǔ)言模型給出好的答案、抑制給出不好的答案的目的,幫助模型自動(dòng)尋出最優(yōu)答案。最后,該團(tuán)隊(duì)使用獎(jiǎng)勵(lì)模型和更多的標(biāo)注過(guò)的數(shù)據(jù)繼續(xù)優(yōu)化微調(diào)過(guò)的語(yǔ)言模型,并且進(jìn)行迭代,最終得到的模型就是InstructGPT。簡(jiǎn)單來(lái)說(shuō),OpenAI于2020年發(fā)布的GPT-3,讓計(jì)算機(jī)第一次擁有了惟妙惟肖地模仿人類(lèi)“說(shuō)話”的能力。但是,當(dāng)時(shí)的GPT-3的觀點(diǎn)和邏輯常常出現(xiàn)錯(cuò)誤和混亂,OpenAI因此引入了人類(lèi)監(jiān)督員,專(zhuān)門(mén)“教”AI如何更好地回答人類(lèi)提出的問(wèn)題。當(dāng)AI的回答符合人類(lèi)評(píng)價(jià)標(biāo)準(zhǔn)時(shí),就打高分,否則就打低分。這使得AI能夠按照人類(lèi)價(jià)值觀優(yōu)化數(shù)據(jù)和參數(shù)。集合了優(yōu)勢(shì)之大成,ChatGPT果然展示出了前所未有的功能,一舉成為AI領(lǐng)域的現(xiàn)象級(jí)應(yīng)用?!癈hatGPT+”無(wú)所不能ChatGPT問(wèn)世不到兩個(gè)月就吸引了無(wú)數(shù)人的目光,它基于大型語(yǔ)言訓(xùn)練模型給出的結(jié)果幾乎橫掃人工智能界。ChatGPT的熱度,讓人們感受到了AI帶來(lái)的便利,很快就衍生出了“ChatGPT+”效應(yīng)。疊加“魔法”的ChatGPT所謂的“ChatGPT+”效應(yīng),其實(shí)就是ChatGPT模型和其他人工智能程序的“組合拳”。其中一個(gè)例子就是WolframAlpha和ChatGPT的結(jié)合。WolframAlpha問(wèn)答系統(tǒng)由“Wolfram語(yǔ)言之父”史蒂芬·沃爾夫勒姆開(kāi)發(fā),在沃爾夫勒姆看來(lái),世界是可計(jì)算的。因此,他試圖做的是:只要你能描述出來(lái)想要什么,然后計(jì)算機(jī)盡量去理解意思,并盡最大努力去執(zhí)行。為了完成這一目標(biāo),沃爾夫勒姆創(chuàng)造了以他自己名字命名的Wolfram語(yǔ)言和計(jì)算知識(shí)搜索引擎WolframAlpha。2023年1月9日,沃爾夫勒姆發(fā)表了一篇文章,比較了ChatGPT和十四歲的WolframAlpha問(wèn)答系統(tǒng),想讓兩者結(jié)合起來(lái)。要知道,雖然ChatGPT在創(chuàng)作文本上表現(xiàn)出了驚人的能力,但其數(shù)學(xué)能力實(shí)在是“拉胯”,連小學(xué)生都會(huì)的“雞兔同籠”問(wèn)題和簡(jiǎn)單的加減乘除都可能算錯(cuò)。而Wolfram Alpha問(wèn)答系統(tǒng)恰巧是理工科“神器ChatGPT和WolframAlpha問(wèn)答系統(tǒng)的結(jié)合,能實(shí)現(xiàn)完美互補(bǔ)。WolframAlpha于2009年5月18日正式發(fā)布,其底層運(yùn)算和數(shù)據(jù)處理工作是通過(guò)在后臺(tái)運(yùn)行的Mathematica實(shí)現(xiàn)的。因?yàn)镸athematica支持幾何、數(shù)值及符號(hào)式計(jì)算,并且具有強(qiáng)大的數(shù)學(xué)以及科技圖形圖像的可視化功能,所以Wolfram Alpha能夠回答多種多樣的數(shù)學(xué)問(wèn)題,并將答以清晰美觀的圖形化方式顯示給用戶。這種計(jì)算知識(shí)引擎為蘋(píng)果的數(shù)字助理Siri奠定了堅(jiān)實(shí)的基礎(chǔ)。Wolfram Alpha本就具有強(qiáng)大的結(jié)構(gòu)化計(jì)算能力,而且也能理解然語(yǔ)言。比如,如果我們問(wèn)ChatGPT:從芝加哥到東京有多遠(yuǎn)?ChatGPT也許并不能給我們一個(gè)精確的答案,因?yàn)镃hatGPT的答案來(lái)源于訓(xùn)練中就要注意到芝加哥和東京之間的明確距離,當(dāng)然還可能答錯(cuò)。而即便答對(duì),只掌握這種簡(jiǎn)單的解決方法還不夠,它需要一種實(shí)際的算法。但Wolfram Alpha卻能充分利用其結(jié)構(gòu)化、高精準(zhǔn)的知識(shí)將某事化為精確計(jì)算??梢哉f(shuō),ChatGPT與WolframAlpha的結(jié)合,成就了“ChatGPT+”。讓“ChatGPT+”飛起來(lái)“ChatGPT+”效應(yīng),向很多在探索AIGC商業(yè)化落地的企業(yè)提供了參考和借鑒。有的用戶把ChatGPT與Stable Diffusion(AI文生圖工具)結(jié)合使用,即先要求ChatGPT生成隨機(jī)的藝術(shù)提示詞(prompt),然后把prompt輸入Stable Diffusion,再生成一幅藝術(shù)性很強(qiáng)的畫(huà)作。還有用提出“ChatGPT+WebGPT”,WebGPT是OpenAI公布的另一個(gè)版本的GPT,可以通過(guò)查詢搜索引擎和匯總查詢到的信息來(lái)回答問(wèn)題,包括對(duì)相關(guān)來(lái)源的注釋。我們可以把WebGPT理解為高階版的網(wǎng)頁(yè)爬蟲(chóng),從互聯(lián)網(wǎng)上摘取信息來(lái)回答問(wèn)題,并提供相應(yīng)的出處。“ChatGPT+WebGPT”產(chǎn)生的結(jié)果信息可以實(shí)時(shí)更新,對(duì)于事實(shí)真假的判斷更為準(zhǔn)確。微軟CEO納德拉透露,計(jì)劃將ChatGPT、Dall-E等人工智能工具整合進(jìn)微軟旗下的產(chǎn)品中,包括Office全家桶、Azure云服務(wù)、Teams聊天程序等。ChatGPT已整合進(jìn)入搜索引擎Bing,為用戶呈現(xiàn)更完整的信息并附加信息來(lái)源,同時(shí)借助更強(qiáng)大的自然語(yǔ)言處理系統(tǒng)識(shí)別關(guān)鍵字,提供更精準(zhǔn)和個(gè)性化的相關(guān)內(nèi)容推薦。在Office全家桶中,NLP技術(shù)將允許用戶使用更靈活和智能的方式檢索內(nèi)容,并幫助用戶快速生成個(gè)性化文本,帶來(lái)辦公體驗(yàn)的智能升級(jí)。而依托OpenAI在辦公領(lǐng)域的強(qiáng)大生態(tài),ChatGPT則有望得到快速發(fā)展,加速實(shí)現(xiàn)對(duì)話式AI、AIGC的商業(yè)化落地??梢灶A(yù)見(jiàn),“ChatGPT+”還將給現(xiàn)有的產(chǎn)品和服務(wù)帶來(lái)更多新玩法和新體驗(yàn),人工智能的應(yīng)用也將步入一個(gè)全新的階段。AI生成大流行2022年,是人工智能生成內(nèi)容(AIGC)爆火“出圈”的一年,從AI生成繪畫(huà)到AI生成代碼,再到AI創(chuàng)作的文藝作品,人們驚嘆于AI生成的內(nèi)容,因?yàn)檫@已經(jīng)不輸于人類(lèi)創(chuàng)作的水平。而2022年末誕生的ChatGPT更是把AIGC推向一個(gè)新的高潮。美國(guó)《科學(xué)》雜志發(fā)布的2022年度科學(xué)十大突破中,AIGC作為人工智能領(lǐng)域的重要突破赫然在列。Gartner將AlGC列為2022年五大影響力技術(shù)之一。《麻省理工科技評(píng)論》也將AlGC列為2022年十大突破性技術(shù)之一,甚至將AIGC稱(chēng)為Al領(lǐng)域過(guò)去十年最具前景的進(jìn)展。AIGC爆火“出圈”什么是AIGC?實(shí)際上,AIGC是一個(gè)組合詞:AI+GC,意思是用人工智能生產(chǎn)內(nèi)容(AIGeneratedContent)。從內(nèi)容創(chuàng)作方式來(lái)看,我們?cè)?jīng)聽(tīng)到的大多是PGC和UGC。其中,PGC是指專(zhuān)業(yè)內(nèi)容生產(chǎn)者來(lái)生產(chǎn)內(nèi)容。比如,一個(gè)研究并制作出高質(zhì)量科技評(píng)測(cè)視頻的網(wǎng)站,就可以被稱(chēng)為PGC。在互聯(lián)網(wǎng)時(shí)代,PGC在向大眾傳播信息方面發(fā)揮了重要作用。UGC是指用戶生成內(nèi)容,這些內(nèi)容不是由專(zhuān)業(yè)內(nèi)容生產(chǎn)者制作的,而是由普通用戶自行制作的。比如,在社交媒體上發(fā)布的照片、評(píng)論和視頻等就屬于UGC內(nèi)容。在移動(dòng)互聯(lián)網(wǎng)時(shí)代,UGC成了主流的內(nèi)容生產(chǎn)方式?,F(xiàn)在,AIGC正在以迅雷之勢(shì)成為繼PGC和UGC之后新型的內(nèi)容創(chuàng)作方式。要知道,不管是PGC還是UGC,都是以人為主體進(jìn)行內(nèi)容生成和創(chuàng)作的,而AIGC內(nèi)容的制作方從人或機(jī)構(gòu)變成了AI。其實(shí)AIGC的概念并非在2022年才出現(xiàn)。此前,類(lèi)似于微軟“小冰”等人工智能,作詩(shī)、寫(xiě)作、創(chuàng)作歌曲等產(chǎn)品生產(chǎn)就屬于AIGC域。但直到2022年,隨著一幅AI繪畫(huà)的獲獎(jiǎng),AIGC開(kāi)始集中爆發(fā)。2022年8月,在美國(guó)科羅拉多州舉辦的數(shù)字藝術(shù)家競(jìng)賽中,一幅名為《太空歌劇院》的畫(huà)作獲得數(shù)字藝術(shù)類(lèi)別冠軍。這一畫(huà)作由AI具M(jìn)idjourney完成:畫(huà)面上,幾位演員穿著華美戲服,站在舞臺(tái)上表演,黑暗中的觀眾席上方出現(xiàn)一個(gè)巨大圓窗,似乎能看到另一個(gè)未知世界的存在。這一AI作品,在世界范圍內(nèi)引發(fā)熱烈討論,“AI畫(huà)作拿一等獎(jiǎng)惹怒人類(lèi)藝術(shù)家”的話題很快登上熱搜,僅單日閱讀量就超過(guò)了1.1億人次。2022年10月,StabilityAl獲得約1億美元融資,估值高達(dá)10億美元,躋身獨(dú)角獸公司行列。Stability Al發(fā)布的開(kāi)源模型Stable Diffusion,可以根據(jù)用戶輸入的文字描述自動(dòng)生成圖像,即文生圖(Text-to-Image,T2I)。StableDiffusion、Dall-E2、MidJourney等可以生成圖片的AIGC模型引爆了AI作畫(huà)領(lǐng)域。AI作畫(huà)風(fēng)行一時(shí),標(biāo)志著人工智能向藝術(shù)領(lǐng)域滲透。在AIGC圖像生成火爆的同時(shí),ChatGPT橫空出世,與人類(lèi)“對(duì)答如流”,將人機(jī)對(duì)話推向新的高度。體驗(yàn)過(guò)的用戶紛紛被ChatGPT強(qiáng)大的功能折服,它不僅可以輕松與人類(lèi)進(jìn)行各個(gè)領(lǐng)域的對(duì)話,還能理解各式各樣的需求,無(wú)論是寫(xiě)代碼還是創(chuàng)作小說(shuō),甚至給推特的發(fā)展提建議、質(zhì)疑不正確的假設(shè)、拒絕不合理的要求等??梢哉f(shuō),2022年后,AIGC正式進(jìn)入發(fā)展的快車(chē)道。現(xiàn)在,全球各大科技企業(yè)都在積極擁抱AIGC,不斷推出相關(guān)的技術(shù)、平臺(tái)和應(yīng)用。AIGC大展身手無(wú)論是火遍全網(wǎng)的AI繪畫(huà),還是快速吸引用戶的ChatGPT,都屬于AIGC這一概念,AIGC不僅在圖像生成、文本生成領(lǐng)域大展身手,在短視頻、動(dòng)畫(huà)、音樂(lè)等領(lǐng)域同樣有非常廣闊的前景。首先,圖像生成是AIGC目前發(fā)展勢(shì)頭最猛、落地產(chǎn)品更多的領(lǐng)域。根據(jù)使用場(chǎng)景,可分為圖像編輯和端到端圖像生成。圖像編輯包括圖像屬性編輯和圖像內(nèi)容編輯。端到端圖像生成包括基于圖像生成,如基于草圖生成完整圖像,根據(jù)特定屬性生成圖像等,以及多模態(tài)轉(zhuǎn)換,如根據(jù)文字生成圖像等。典型的產(chǎn)品或算法模型包括EditGAN、Deepfake、Dall-E、Midjourney、StableDiffusion、“文心·一格”等。其次就是AI文本生成。AI文本生成是AIGC中發(fā)展最早的一部分技術(shù)。根據(jù)使用場(chǎng)景,可分為非交互式文本生成和交互式文本生成。非交互式文本生成包括內(nèi)容續(xù)寫(xiě)、摘要/標(biāo)題生成、文本風(fēng)格遷移、整段文本生成、圖像生成文字描述等功能。交互式文本生成包括聊天機(jī)器人、文本交互游戲等功能。典型的產(chǎn)品或算法模型有JasperAI、Copy.ai、彩云小夢(mèng)、AIDungeon、ChatGPT等。AI視頻生成可分為視頻編輯,如畫(huà)質(zhì)修復(fù)、視頻特效、視頻換臉等,以及視頻自動(dòng)剪輯和端到端視頻生成,如文字生成視頻等。谷歌旗下的文字生成視頻AI系統(tǒng)Phenaki就是一個(gè)典型應(yīng)用。雖然Phenaki生成的視頻畫(huà)質(zhì)還比較差,但時(shí)長(zhǎng)2分鐘的內(nèi)容已經(jīng)涉及多個(gè)場(chǎng)景、不同主題的變換。正如Phenaki官網(wǎng)所展示的一段視頻,其根據(jù)一段由200個(gè)單詞構(gòu)成的提示詞,生成了一段關(guān)于未來(lái)科幻世界的視頻。隨著AI頻的連接與日俱增,短視頻平臺(tái)的內(nèi)容池里,除傳統(tǒng)的UGC和PGCAIGC將占更高的比例,且流量號(hào)召力不容小覷。AI音頻生成中的部分技術(shù)已經(jīng)較為成熟,被應(yīng)用于多種C端產(chǎn)品中。音頻生成可分為語(yǔ)音合成(Text-to-speech,TTS)和樂(lè)曲生成兩類(lèi)。其中,TTS具有語(yǔ)音客服、有聲讀物制作、智能配音等功能。樂(lè)曲特定樂(lè)曲。典型的產(chǎn)品或算法模型有DeepMusic、WaveNet、DeepVoice、MusicAutoBot等。此外,AI生成還包括代碼生成、游戲生成、3D生成等。今天,AI生成已經(jīng)步入了春天,可以預(yù)見(jiàn),作為數(shù)字內(nèi)容的新生產(chǎn)方式,AIGC的滲透率還將逐步提升,應(yīng)用場(chǎng)景日益豐富,包括游戲、動(dòng)漫、傳媒等行業(yè)。根據(jù)Gartner預(yù)測(cè),到2025年,人工智能生成數(shù)據(jù)占比將達(dá)到10%。2022年9月,紅杉資本發(fā)布的文章GenerativeAI:ACreativeNewWorld的分析則顯示,AIGC有潛力產(chǎn)生數(shù)萬(wàn)億美元的經(jīng)濟(jì)價(jià)值。內(nèi)容生產(chǎn)的全新變革如果說(shuō)AI推薦算法是內(nèi)容分發(fā)的強(qiáng)大引擎,那么,AIGC就是數(shù)據(jù)與內(nèi)容生產(chǎn)的強(qiáng)大引擎。傳統(tǒng)創(chuàng)作中,創(chuàng)作主體人類(lèi)往往被認(rèn)為是權(quán)威的代言者,是靈感的所有者。事實(shí)上,正是因?yàn)槿祟?lèi)激進(jìn)的創(chuàng)造力、非理性的原創(chuàng)性,甚至是毫無(wú)邏輯的慵懶,而非頑固的邏輯,才使得到目前為止,機(jī)器仍然難以模仿人的這些特質(zhì),使得創(chuàng)造性生產(chǎn)仍然是人類(lèi)的專(zhuān)屬。但今天,隨著AIGC的出現(xiàn)與發(fā)展,創(chuàng)作主體的屬人特性被沖擊,藝術(shù)創(chuàng)作不再是人的專(zhuān)屬。即便是模仿式創(chuàng)造,AI對(duì)藝術(shù)作品形式風(fēng)格的可模仿能力的出現(xiàn),都使創(chuàng)作者這一角色的創(chuàng)作不再是人的專(zhuān)利。AIGC還朝著效率和品質(zhì)更高、成本更低的方向發(fā)展。從社交媒體到游戲、從廣告到建筑、從編碼到平面設(shè)計(jì)、從產(chǎn)品設(shè)計(jì)到法律、從營(yíng)銷(xiāo)到售后等各個(gè)需要人類(lèi)知識(shí)創(chuàng)造的行業(yè)都可能被AIGC所影響和變革。數(shù)字經(jīng)濟(jì)和人工智能發(fā)展所需的海量數(shù)據(jù)也能通過(guò)AlGC技術(shù)生成、合成出來(lái),即合成數(shù)據(jù)。今天,AIGC正在掀起一場(chǎng)內(nèi)容生產(chǎn)的革命。在內(nèi)容需求旺盛的當(dāng)下,AIGC所帶來(lái)的內(nèi)容生產(chǎn)方式變革引起了內(nèi)容消費(fèi)模式的變化。比如,Al繪畫(huà)可以提高美術(shù)素材的生產(chǎn)效率,在游戲、數(shù)字藏品領(lǐng)域初步得以應(yīng)用。再如,火遍全網(wǎng)的ChatGPT正是典型的文本生成式AlGC。ChatGPT不僅能夠滿足與人類(lèi)進(jìn)行對(duì)話的基本功能,還可以駕馭各種風(fēng)格的文務(wù)的完成程度也大大超出預(yù)期。概念上似乎更廣泛的AIGC看起來(lái)沒(méi)有ChatGPT那么火爆,其核心原因還在于兩者之間的差異。盡管AIGC的概念更寬泛,但目前的技術(shù)更多的只是側(cè)重于語(yǔ)意的圖像化理解與生成,這與ChatGPT基于神經(jīng)網(wǎng)絡(luò)的類(lèi)人智能化邏輯有所差異。相比較而言,ChatGPT是人類(lèi)真正期待的人工智能的樣子,即具備類(lèi)人溝通能力,并且借助于大數(shù)據(jù)的信息整合成為人類(lèi)強(qiáng)大的助手。ChatGPT讓我們討論已久、期待已久的人工智能有了可觸感,無(wú)論它的技術(shù)是不是最先進(jìn)的,但是它所呈現(xiàn)的模樣是符合大家期待的。至于未來(lái),將發(fā)展成AIGC包含ChatGPT,還是ChatGPT以更快速的迭代與商業(yè)化應(yīng)用取代AIGC的概念,仍不好下定論。無(wú)論這些技術(shù)的概念在未來(lái)會(huì)如何定義,都意味著,在未來(lái),人類(lèi)社會(huì)一切有規(guī)律性、規(guī)則性的工作,將被ChatGPT或者比ChatGPT更進(jìn)一步的AIGC所取代,并且一些創(chuàng)造性工作會(huì)加速進(jìn)入人機(jī)交互時(shí)代。第2章通用AI,奇點(diǎn)將近一個(gè)世界,兩套智能智能的起源46億年前,地球誕生。6億年后,在早期的海洋中出現(xiàn)了最早的生命,生物開(kāi)始了由原核生物向真核生物的復(fù)雜而漫長(zhǎng)的演化。6億年前,埃迪卡拉紀(jì),地球上出現(xiàn)了多細(xì)胞的埃迪卡拉生物群,原始的腔腸動(dòng)物在埃迪卡拉紀(jì)的海洋中浮游著??刂扑鼈冞\(yùn)動(dòng)的,是其體內(nèi)一群特殊的細(xì)胞——神經(jīng)元。不同于那些主要與附近的細(xì)胞形成各種組織結(jié)構(gòu)的同類(lèi),神經(jīng)元從胞體上抽出細(xì)長(zhǎng)的神經(jīng)纖維,與另一個(gè)神經(jīng)元的神經(jīng)纖維相會(huì)。這些神經(jīng)纖維中,負(fù)責(zé)接收并傳入信息的“樹(shù)突”(dendrite)占了大多數(shù),而負(fù)責(zé)輸出信息的“軸突”(axon)則只有一條(但可分叉)。當(dāng)樹(shù)突接收大于興奮閾值的信息后,整個(gè)神經(jīng)元就將如同燈泡被點(diǎn)亮一般,爆發(fā)出一個(gè)短促但極為明顯的“動(dòng)作電位”(actionpotential),動(dòng)作電位會(huì)在近乎瞬間就沿著細(xì)胞膜傳遍整個(gè)神經(jīng)元——包括遠(yuǎn)離胞體的神經(jīng)纖維末端。之后,上一個(gè)神經(jīng)元的軸突和下一個(gè)神經(jīng)元的樹(shù)突之間名為“突觸”(synapse)的末端結(jié)構(gòu)會(huì)被電信號(hào)激活,“神經(jīng)遞質(zhì)”(neurotransmitter)隨即被突觸前膜釋放,用以在兩個(gè)神經(jīng)元間傳遞信息,并且能依種類(lèi)不同,對(duì)下一個(gè)神經(jīng)元起到興奮或抑制的不同作用。這些最早的神經(jīng)元,憑著自身的結(jié)構(gòu)特點(diǎn),組成了一張分布于腔腸動(dòng)物全身的網(wǎng)絡(luò)。就是這樣一張看起來(lái)頗為簡(jiǎn)陋的神經(jīng)元網(wǎng)絡(luò),成為日后所有神經(jīng)系統(tǒng)的基本結(jié)構(gòu)。2000上。700萬(wàn)年前,在非洲某個(gè)地方,出現(xiàn)了第一批用雙腳站立的“猿”。200萬(wàn)年前,非洲東部出現(xiàn)了另一個(gè)類(lèi)人物種,就是我們所說(shuō)的“能人”。這個(gè)物種的特別之處在于其成員可以制作簡(jiǎn)單的石質(zhì)工具。在這之后,漫長(zhǎng)又短暫的150萬(wàn)年中,狹義“智能”在他們那大概只有現(xiàn)代智人一半大的腦子里誕生發(fā)展。他們開(kāi)始改進(jìn)手中的石器,甚至嘗試著“馴服”狂暴的烈焰,隨著自然選擇和基因突變的雙重作用,他們后代的腦容量越來(lái)越大,直到“直立人”出現(xiàn)。根據(jù)古生物學(xué)的研究,“直立人”與現(xiàn)代人類(lèi)個(gè)頭相當(dāng),其腦容量也和我們相差無(wú)幾。他們制作的石質(zhì)工具比“能人”更加精細(xì)復(fù)雜,即“智人”。20萬(wàn)年前,現(xiàn)代“智人”的大腦出現(xiàn)了飛躍性的發(fā)展,對(duì)直接生存意的能耗——人腦重量只占體重總量的2%~3%,但能耗卻占了20%。然來(lái)對(duì)各種信息進(jìn)行深度的抽象加工和整理儲(chǔ)存。自此,人類(lèi)的智能進(jìn)自然進(jìn)化的桎梏。人類(lèi)智能的第一個(gè)發(fā)端是對(duì)物質(zhì)形態(tài)的轉(zhuǎn)化。遠(yuǎn)古時(shí)期,人類(lèi)對(duì)物質(zhì)的轉(zhuǎn)化是極其簡(jiǎn)單的。首先是從低級(jí)而又單一的物質(zhì)幾何形狀的轉(zhuǎn)化開(kāi)始,如把石塊打磨成尖銳或厚鈍的石質(zhì)手斧。猿人用它襲擊野獸、削尖木棒、挖掘植物塊根,把它當(dāng)成一種“萬(wàn)能”的工具使用。發(fā)明了弓箭。再到新石器時(shí)代,人類(lèi)學(xué)會(huì)了在石器上鑿孔,發(fā)明了石人腦,使人腦向智能實(shí)體邁近了一步。人類(lèi)智能的第二個(gè)發(fā)端是對(duì)能量的轉(zhuǎn)化。原始人類(lèi)對(duì)“火”及與自身獸,人工取火方法的掌握標(biāo)志著“火”作為一種自然力真正被人們所利用。當(dāng)“火”這種自然力開(kāi)始為人所用時(shí),也進(jìn)一步促進(jìn)了人體和大腦的發(fā)育,正如恩格斯所指出的——摩擦生火第一次使人支配了一種自然力,從而最終把人同動(dòng)物界分開(kāi)。對(duì)火的利用又令原始人類(lèi)學(xué)會(huì)了燒制陶器,制陶技術(shù)使古代材料技術(shù)與材料加工技術(shù)得到了重大發(fā)展。使人類(lèi)對(duì)材料的加工第一次超出了僅僅改變幾何形狀的范圍,開(kāi)始改變材料的物理、化學(xué)屬性。此外,制陶技術(shù)的發(fā)展,又為冶金技術(shù)的產(chǎn)生奠定了基礎(chǔ)。化過(guò)程中,人們所創(chuàng)造的石斧、取火器具、陶器等物質(zhì)成果和物質(zhì)手因此,人們?cè)趶氖挛镔|(zhì)形態(tài)和能量轉(zhuǎn)化的同時(shí),必然要伴隨著信息的轉(zhuǎn)化。對(duì)信息的轉(zhuǎn)化使人類(lèi)創(chuàng)造了語(yǔ)言,人們?cè)谖镔|(zhì)轉(zhuǎn)化的過(guò)程中把共同的需要和感受,以及內(nèi)化在勞動(dòng)過(guò)程和勞動(dòng)成果中的人與人、人與自然的相互關(guān)系和信息,彼此進(jìn)行不斷的傳授,形成了某種“共識(shí)”,并以某種特定的音節(jié)表示不同的共識(shí)內(nèi)容。般性概念的能力,并能通過(guò)語(yǔ)言將其進(jìn)行精確的描述、交流,甚至學(xué)體其他功能的發(fā)展是密不可分的。位于人類(lèi)大腦皮層左前部的布羅卡氏區(qū)控制語(yǔ)言的產(chǎn)生功能,后面的韋尼克區(qū)主管語(yǔ)言的接收功能,大腦右側(cè)區(qū)域通過(guò)胼胝體接收左側(cè)區(qū)域的信號(hào),綜合完成更為高級(jí)的如欣賞音樂(lè)、藝術(shù)和方向定位等功能。胼胝體大約有2億條神經(jīng)纖維通過(guò),對(duì)人腦左右半球的信息傳播起著極為重要的作用。語(yǔ)言的本質(zhì),就是大腦中的一個(gè)“器官”。但就是因?yàn)檫@個(gè)腦結(jié)構(gòu)的上的“想象共同體”出現(xiàn)了,人類(lèi)的社會(huì)行為隨之超越了靈長(zhǎng)類(lèi)本能的部的文明與城邦終于誕生在西亞的兩河流域。從人類(lèi)智能到人工智能物質(zhì)形態(tài)、能量和信息的轉(zhuǎn)換和發(fā)端,既構(gòu)成了人類(lèi)智能的起源,又開(kāi)創(chuàng)了人類(lèi)智能活動(dòng)對(duì)物質(zhì)轉(zhuǎn)化的整體雛形。自認(rèn)知革命、農(nóng)業(yè)革命和工業(yè)革命發(fā)生以來(lái),幾千年來(lái)人類(lèi)的全部活動(dòng)表明,人類(lèi)認(rèn)識(shí)自然、改造自然的對(duì)象無(wú)非是三類(lèi)最基本的東西:物質(zhì)、能量、信息。迄今,人類(lèi)掌握的主要技術(shù)都是在材料技術(shù)、能源技術(shù)、信息技術(shù)的基礎(chǔ)上發(fā)展起來(lái)的。隨著這三個(gè)基本領(lǐng)域技術(shù)的不斷發(fā)展,人類(lèi)智能活動(dòng)對(duì)物質(zhì)的轉(zhuǎn)化方式及轉(zhuǎn)化成果也不斷從單一要素向復(fù)合要素轉(zhuǎn)化。蒸汽機(jī)的制造和使用,是人類(lèi)對(duì)物質(zhì)和能量?jī)纱笠氐膹?fù)合轉(zhuǎn)化;電子計(jì)算機(jī)的制造和使用,是人類(lèi)對(duì)物質(zhì)、能量和信息三大要素的綜合轉(zhuǎn)化;而今天人們對(duì)人工智能的研究,則可以被理解為人類(lèi)將物質(zhì)、能量、信息及人類(lèi)智能四者合一的轉(zhuǎn)化。1950年,阿蘭·圖靈發(fā)表論文《計(jì)算機(jī)器與智能》,提出了機(jī)器能否思考的問(wèn)題,為人工智能的誕生埋下了伏筆。1957年,第一個(gè)機(jī)器學(xué)習(xí)項(xiàng)目啟動(dòng),標(biāo)志著人工智能作為一門(mén)學(xué)科的誕生。通過(guò)神經(jīng)元理論的啟發(fā),人工神經(jīng)網(wǎng)絡(luò)作為一種重要的人工智能算法被提出,并在之后的幾十年內(nèi)被不斷完善。與人腦的天然神經(jīng)網(wǎng)絡(luò)類(lèi)似,人工神經(jīng)網(wǎng)絡(luò)也將虛擬的“神經(jīng)元”作為基本的運(yùn)算單位,并將其如大腦皮層中的神經(jīng)元一樣,進(jìn)行了功能上的分層。但具體到連接模式和工作原理上,二者依然有著諸多不同,所以并不能簡(jiǎn)單地將二者等同視之。在經(jīng)過(guò)無(wú)數(shù)的反復(fù)和波折后,21世紀(jì)的人工智能發(fā)展進(jìn)入了一個(gè)嶄新的階段,新一代神經(jīng)網(wǎng)絡(luò)算法在學(xué)習(xí)任務(wù)中表現(xiàn)出了驚人的性能。各種圖像和音頻識(shí)別軟件的準(zhǔn)確率越來(lái)越高,語(yǔ)言加工程序的智能程度也與日俱增。于是,人類(lèi)智能這種無(wú)止境的延伸,一方面借助于數(shù)字化的技術(shù)改變著、轉(zhuǎn)化著整個(gè)自然界,試圖構(gòu)建一個(gè)萬(wàn)物互聯(lián)互通的時(shí)代;另一方面也創(chuàng)造了一種新的智能形式,那就是機(jī)器智能。什么是智能的本質(zhì)從人類(lèi)智能到人工智能,智能的本質(zhì)是什么?我們知道,人類(lèi)智能主要與人腦的聯(lián)絡(luò)皮層有關(guān),這并不直接關(guān)聯(lián)感覺(jué)和運(yùn)動(dòng)的大腦皮層,在一般動(dòng)物腦中所占的面積相對(duì)較小;而在人的大腦里,海量的聯(lián)絡(luò)皮層神經(jīng)元成為搭建人類(lèi)靈魂棲所的磚石。人類(lèi)的語(yǔ)言、陳述性記憶、工作記憶等能力遠(yuǎn)勝于其他動(dòng)物,都與聯(lián)絡(luò)皮層有著極其密切的關(guān)系。而我們的大腦,終生都縮在顱腔之中,僅能感知外部傳來(lái)的電信號(hào)和化學(xué)信號(hào)。也就是說(shuō),智能的本質(zhì),就是這樣一套通過(guò)有限的輸入信號(hào)來(lái)歸納、學(xué)習(xí)并重建外部世界特征的復(fù)雜“算法”。從這個(gè)角度上看,作為抽象概念的“智能”,確實(shí)已經(jīng)很接近笛卡兒所謂的“精神”了,只不過(guò)它依然需要將自己銘刻在具體的物質(zhì)載體上——集成電路。這也意味著,人工智能作為一種智能,理論上遲早可以運(yùn)行名為“自我意識(shí)”的算法。雖然有觀點(diǎn)認(rèn)為人工智能永遠(yuǎn)無(wú)法超越人腦,因?yàn)槿祟?lèi)自己都不知道人腦是如何運(yùn)作的。但事實(shí)是,人類(lèi)迭代人工智能算法的速度要遠(yuǎn)遠(yuǎn)快于DNA工智能想在智能上超越人類(lèi),根本不需要理解人腦是如何運(yùn)作的。人類(lèi)智能和人工智能是今天世界上同時(shí)存在的兩套智能,實(shí)際上,人工智能的“思考模式”與人類(lèi)的思考模式完全不同。相比于基本元件運(yùn)算速度緩慢、結(jié)構(gòu)編碼存在大量不可修改的原始本能、后天自塑能力有限的人類(lèi)智能來(lái)說(shuō),人工智能雖然尚處于蹣跚學(xué)步的發(fā)展初期,但未來(lái)的發(fā)展?jié)摿s遠(yuǎn)遠(yuǎn)大于人類(lèi)智能。事實(shí)上,包括AlphaGo在內(nèi)的人工智能已經(jīng)證明,對(duì)確定目標(biāo)的問(wèn)題,機(jī)器一定會(huì)超越人類(lèi)。20年后,基于深度學(xué)習(xí)的人工智能及其“后代”會(huì)在很多任務(wù)上擊敗人類(lèi)。但在很多任務(wù)上尤其是靈感類(lèi)的創(chuàng)造力方面,人類(lèi)會(huì)比機(jī)器更擅長(zhǎng)。在未來(lái),更可能出現(xiàn)的情況,或許是我們?nèi)祟?lèi)著力于尋求人類(lèi)智能與人工智能的良性共生,而不是糾結(jié)于人類(lèi)智能與人工智能孰強(qiáng)孰弱,或者人工智能會(huì)不會(huì)代替人類(lèi)智能成為這個(gè)世界的主角。今天,ChatGPT的出現(xiàn),讓人們真正感受到了人工智能的力量,ChatGPT不同于過(guò)去任何一個(gè)人工智能產(chǎn)品,ChatGPT在大多數(shù)任務(wù)上的表現(xiàn)都不輸于甚至超越人類(lèi),或許這也向人們展示了一個(gè)道理——不是只有人類(lèi)才是智能的黃金標(biāo)桿。從狹義AI到通用AI由于AI是一個(gè)廣泛的概念,因此會(huì)有許多不同種類(lèi)或者形式的AI。而基于AI的能力不同,我們可以把AI歸為三大類(lèi),分別是狹義AI(ANI)、通用AI(AGI)和超級(jí)AI(ASI)。當(dāng)前的AI世界到目前為止,我們所接觸的AI產(chǎn)品大都還是ANI。簡(jiǎn)單來(lái)說(shuō),ANI就是一種被編程來(lái)執(zhí)行單一任務(wù)的人工智能——無(wú)論是預(yù)報(bào)天氣、下棋,還是分析原始數(shù)據(jù)以撰寫(xiě)新聞報(bào)道。ANI也就是所謂的弱人工智能。值得一提的是,雖然有的人工智能能夠在國(guó)際象棋中擊敗世界象棋冠軍,如AlphaGo,但這是它唯一能做的事情,如果你要求AlphaGo找出在硬盤(pán)上存儲(chǔ)數(shù)據(jù)的更好方法,它就會(huì)茫然無(wú)措。我們的手機(jī)就是一個(gè)小型ANI工廠。當(dāng)我們使用地圖應(yīng)用程序?qū)Ш?、查看天氣、與Siri交談或進(jìn)行許多其他的日?;顒?dòng)時(shí),我們都在使用ANI。我們常用的電子郵箱垃圾郵件過(guò)濾器是一種經(jīng)典的ANI,它擁有加載關(guān)于如何判斷什么是垃圾郵件、什么不是垃圾郵件的智能,然后可以隨著我們的特定偏好獲得經(jīng)驗(yàn),幫我們過(guò)濾掉垃圾郵件。在我們的網(wǎng)購(gòu)背后,也有ANI的工作。比如,當(dāng)你在電商網(wǎng)站上搜索產(chǎn)品,然后卻在另一個(gè)網(wǎng)站上看到它是“為你推薦”的產(chǎn)品時(shí),會(huì)覺(jué)得毛骨悚然。而邏輯就是一個(gè)個(gè)ANI系統(tǒng)網(wǎng)絡(luò),它們共同工作,相互告知你是誰(shuí),你喜歡什么,然后使用這些信息來(lái)決定向你展示什么。一些電商平臺(tái)常常在主頁(yè)顯示“買(mǎi)了這個(gè)的人也買(mǎi)了……”,這也是一個(gè)ANI系統(tǒng),它從數(shù)百萬(wàn)名顧客的行為中收集信息,并綜合這些信息,巧妙地向你推銷(xiāo),這樣你就會(huì)買(mǎi)更多的東西。ANI人類(lèi)計(jì)算者完成特定的任務(wù)。而艾倫·圖靈等數(shù)學(xué)家則認(rèn)為,我們應(yīng)該制造通用計(jì)算機(jī),我們可以對(duì)其編程,從而完成所有的任務(wù)。所有的計(jì)算機(jī)都滿足圖靈設(shè)想的通用形式,我們稱(chēng)其為“通用圖靈機(jī)”。只要使用正確的軟件,現(xiàn)在的計(jì)算機(jī)幾乎可以執(zhí)行任何任務(wù)。用定制化的解決方案,如專(zhuān)用芯片,可以更快、更節(jié)能地完成特定任務(wù),但更多時(shí)候,人們還是更喜歡使用低成本、便捷的通用計(jì)算機(jī)。這也是今天AI即將出現(xiàn)的類(lèi)似的轉(zhuǎn)變——人們希望AGI能夠出現(xiàn),它與人類(lèi)更類(lèi)似,能夠?qū)缀跛械臇|西進(jìn)行學(xué)習(xí),并且可以執(zhí)行多項(xiàng)任務(wù)。通用AI和超級(jí)AI與ANI只能執(zhí)行單一任務(wù)不同,AGI是指在不特定編碼知識(shí)與應(yīng)用看,ANI與AGI是同一類(lèi)東西,都只是一種不太成熟和復(fù)雜的實(shí)現(xiàn),但事實(shí)并非如此。AGI將擁有在事務(wù)中推理、計(jì)劃、解決問(wèn)題、抽象思輕松地完成所有這些事情。當(dāng)然,AGI并非全知全能。與任何其他智能存在一樣,根據(jù)所要解決的問(wèn)題,它需要學(xué)習(xí)不同的知識(shí)內(nèi)容。比如,負(fù)責(zé)尋找致癌基因的算法不需要識(shí)別面部的能力;而當(dāng)同一個(gè)算法被要求在一大群人中找出十幾張臉時(shí),它就不需要了解任何有關(guān)基因的知識(shí)。AGI的實(shí)現(xiàn)僅僅意味著單個(gè)算法可以做多件事情,而并不意味著它可以同時(shí)做所有的事情。值得一提的是,ASI又與AGI不同。ASI不僅要具備人類(lèi)的某些能力,還要有知覺(jué),有自我意識(shí),可以獨(dú)立思考并解決問(wèn)題。雖然兩個(gè)概念似乎都對(duì)應(yīng)著人工智能解決問(wèn)題的能力,但AGI更像是無(wú)所不能的計(jì)算機(jī),ASI則超越了技術(shù)的屬性成為“穿著鋼鐵俠戰(zhàn)甲的人類(lèi)”。牛津大學(xué)哲學(xué)家和領(lǐng)先的人工智能思想家尼克·博斯特羅姆就將ASI定義為“一種幾乎在所有領(lǐng)域都比最優(yōu)秀的人類(lèi)更聰明的智能,包括科學(xué)創(chuàng)造力、一般智慧和社交技能”。如何實(shí)現(xiàn)通用AI自人工智能誕生以來(lái),科學(xué)家們就在努力實(shí)現(xiàn)AGI,具體可以分為兩個(gè)路徑。第一個(gè)路徑就是讓計(jì)算機(jī)在某些具體任務(wù)上超過(guò)人類(lèi),如下圍棋、檢測(cè)醫(yī)學(xué)圖像中的癌細(xì)胞。如果計(jì)算機(jī)在執(zhí)行一些困難任務(wù)時(shí)的表現(xiàn)能夠超過(guò)人類(lèi),那么計(jì)算機(jī)最終就有可能在所有的任務(wù)中都超越人類(lèi)。通過(guò)這種方式來(lái)實(shí)現(xiàn)AGI,AI系統(tǒng)的工作原理以及計(jì)算機(jī)是否靈活就無(wú)關(guān)緊要了。唯一重要的是,這樣的人工智能計(jì)算機(jī)在執(zhí)行特定任務(wù)時(shí)比其他人工智能計(jì)算機(jī)更強(qiáng)大,并最終超越最優(yōu)秀的人類(lèi)。如果最強(qiáng)的計(jì)算機(jī)圍棋棋手在世界上僅僅位列第二名,那么它就不會(huì)登上媒體頭條,甚至可能會(huì)被視為失敗者。但是,計(jì)算機(jī)圍棋棋手擊敗世界上頂尖的人類(lèi)棋手就會(huì)被視為一個(gè)重要的進(jìn)步。第二個(gè)路徑是重點(diǎn)關(guān)注AI的靈活性。通過(guò)這種方式,人工智能就不必具備比人類(lèi)更強(qiáng)的性能。科學(xué)家的目標(biāo)就變成了創(chuàng)造可以做各種事情并且可以將從某個(gè)任務(wù)中學(xué)到的東西應(yīng)用于另一個(gè)任務(wù)的機(jī)器。比如,AIGC就遵循了這樣的路徑。有關(guān)AIGC技術(shù)方面的進(jìn)展主要表現(xiàn)在三個(gè)方面:一個(gè)是圖像生成,即以Dall-E2、StableDiffusion為代表的擴(kuò)散模型;一個(gè)是NLP,即基于GPT-3.5的ChatGPT;還有一個(gè)就是代碼生成,如基于CodeX的Copilot?;邶嫶蟮臄?shù)據(jù)集,ChatGPT得以擁有更好的語(yǔ)言理解能力,這意味著它可以更像一個(gè)通用的任務(wù)助理,能夠與不同行業(yè)結(jié)合,衍生出很多的應(yīng)用場(chǎng)景??梢哉f(shuō),ChatGPT已經(jīng)為通用AI打開(kāi)了一扇大門(mén)。ChatGPT還引入了人類(lèi)監(jiān)督員,專(zhuān)門(mén)“教”AI如何更好地回答人類(lèi)的問(wèn)題,這使得AI能夠按照人類(lèi)價(jià)值觀優(yōu)化數(shù)據(jù)和參數(shù)。在互聯(lián)網(wǎng)中,只要涉及文本生成和對(duì)話,都能夠被ChatGPT“洗一遍”,這使得ChatGPT能達(dá)到一個(gè)接近于自然的人類(lèi)語(yǔ)言對(duì)話的效果。以自動(dòng)駕駛為例,目前的自動(dòng)駕駛系統(tǒng)還是ANI的,與人的交互也是比較機(jī)械的。比如,前面有一輛車(chē),按照規(guī)則,它可能無(wú)法正確判斷什么時(shí)候該繞行。而ChatGPT等人工智能的迭代,會(huì)讓機(jī)器更接近人的思維模式,學(xué)習(xí)人的駕駛行為,帶領(lǐng)自動(dòng)駕駛進(jìn)入“2.0時(shí)代”。通用AI初具雛形雖然過(guò)去人們對(duì)AGI總有各種抽象的想法,但如今,隨著圖像生成、代碼生成、自然語(yǔ)言處理等AI生成技術(shù)的發(fā)展,AGI似乎已經(jīng)走到了一個(gè)重要的十字路口——生成式AI了圖文創(chuàng)作、代碼生成、游戲、廣告、藝術(shù)平面設(shè)計(jì)等應(yīng)用。ChatGPT爆火,更是推動(dòng)以多模態(tài)預(yù)訓(xùn)練大模型、生成式AI為代表的AI技術(shù)來(lái)到規(guī)?;耙沟钠纥c(diǎn),人類(lèi)對(duì)AGI的想象開(kāi)始具象起來(lái)。ChatGPT的通用性按照是否能夠執(zhí)行多項(xiàng)任務(wù)的標(biāo)準(zhǔn)來(lái)看,ChatGPT已經(jīng)具備了AGI的特性——ChatGPT被訓(xùn)練來(lái)回答各種類(lèi)型的問(wèn)題,并且適用于多種應(yīng)用場(chǎng)景,可以同時(shí)完成多個(gè)任務(wù),如問(wèn)答、對(duì)話生成、文本生成等。這說(shuō)明,它不僅僅是針對(duì)某一特定任務(wù)進(jìn)行訓(xùn)練的,而是具有通用的語(yǔ)言處理能力。因此,我們也可以把ChatGPT認(rèn)為是一種AGI模型。ChatGPT為AI的發(fā)展構(gòu)建了一個(gè)完善的底層應(yīng)用系統(tǒng)。這就類(lèi)似于計(jì)算機(jī)的操作系統(tǒng),計(jì)算機(jī)的操作系統(tǒng)是計(jì)算機(jī)的核心部分,在資源管理、進(jìn)程管理、文件管理等方面都起到了非常重要的作用。在資源管理上,操作系統(tǒng)負(fù)責(zé)管理計(jì)算機(jī)的硬件資源,如內(nèi)存、處理器、磁盤(pán)等。它分配和管理這些資源,使得多個(gè)程序可以共享資源并且高效運(yùn)行。在進(jìn)程管理上,操作系統(tǒng)管理計(jì)算機(jī)上運(yùn)行的程序,控制它們的執(zhí)行順序和分配資源,它還維護(hù)程序之間的通信,以及處理程序間的并發(fā)問(wèn)題。在文件管理上,操作系統(tǒng)則提供了一組標(biāo)準(zhǔn)的文件系統(tǒng),可以方便用戶管理和存儲(chǔ)文件。Windows操作系統(tǒng)和iOS操作系統(tǒng)是目前兩種主流的移動(dòng)操作系統(tǒng),而ChatGPT的誕生,也為AI應(yīng)用提供了技術(shù)底座。雖然ChatGPT是一個(gè)語(yǔ)言模型,但與人對(duì)話只是ChatGPT的表皮,其真正的作用,是我們能夠基于ChatGPT這個(gè)開(kāi)源的人工智能系統(tǒng)平臺(tái),開(kāi)放接口來(lái)做一些二次應(yīng)用。微軟已將ChatGPT與搜索引擎Bing結(jié)合。盡管以往的搜索引擎可以用來(lái)查詢導(dǎo)航和基本事實(shí)之類(lèi)的信息,但是對(duì)于更復(fù)雜的查詢,如“能否推薦馬爾代夫的五天旅游行程”,一般的搜索引擎往往都沒(méi)有結(jié)果,只是提供相關(guān)信息的匯總,需要人們自己在匯總的信息中尋找結(jié)果。但是人們需要查詢的往往是這類(lèi)問(wèn)題的結(jié)果——回答這類(lèi)問(wèn)題正是ChatGPT的強(qiáng)項(xiàng)。有了ChatGPT助力的Bing,將在頁(yè)面右側(cè)的框中顯示基于ChatGPT的結(jié)果。除了新版Bing,微軟還為Edge瀏覽器推出了兩項(xiàng)新的AI增強(qiáng)功能——“聊天”和“撰寫(xiě)”。這些功能將嵌入Edge的側(cè)邊欄。“聊天”允許用戶總結(jié)他們正在查看的網(wǎng)頁(yè)或文檔,并就其內(nèi)容提出問(wèn)題。而“撰寫(xiě)”則可以充當(dāng)寫(xiě)作助手,根據(jù)一些開(kāi)始提示,幫助生成從電子郵件到社交媒體帖子的文本。總體來(lái)說(shuō),ChatGPT為AI應(yīng)用提供了通用的技術(shù)底座,而基于ChatGPT系統(tǒng)做出的二次應(yīng)用,也正是ChatGPT作為一個(gè)AGI模型的迷人之處。大模型路線的勝利除能夠執(zhí)行多項(xiàng)任務(wù)以及二次應(yīng)用外,更重要的是,ChatGPT的成功證明了大模型路線的有效性,這直接打開(kāi)了AGI發(fā)展的大門(mén),讓AI終于完成了從0到1的突破,開(kāi)啟真正的AI時(shí)代。ChatGPT的成功,根本在于技術(shù)路徑的成功。在OpenAI的GPT模型之前,人們?cè)谔幚鞱LP時(shí),用的都是RNN,然后加入注意力機(jī)制。所謂的注意力機(jī)制,就是將人的感知方式、注意力的行為應(yīng)用在機(jī)器上,讓機(jī)器學(xué)會(huì)去感知數(shù)據(jù)中的重要和不重要的部分。比如,當(dāng)我們讓AI識(shí)別一張動(dòng)物圖片時(shí),最應(yīng)該關(guān)注的地方就是圖片中動(dòng)物的面部特征,包括耳朵、眼睛、鼻子、嘴巴,而不用太關(guān)注圖片背景中的一些信息,注意力機(jī)制的核心在于希望機(jī)器能在眾多信息中注意到對(duì)當(dāng)前任務(wù)更關(guān)鍵的信息,而對(duì)于其他的非關(guān)鍵信息就不需要太多的注意力側(cè)重。換言之,注意力機(jī)制讓AI擁有了理解的能力。但“RNN+Attention”使模型的處理速度非常慢。這個(gè)只有Attention的Transformer模型不再是逐詞處理,而是逐序列處理,可以并行計(jì)算,所以計(jì)算速度大大加快,讓訓(xùn)練大模型、超大模型、巨大模型、超巨大模型成為可能。于是,OpenAI開(kāi)發(fā)了GPT,其目標(biāo)只有一個(gè),就是預(yù)測(cè)“下一個(gè)單詞”。如果說(shuō)過(guò)去只是遮蓋掉句子中的一個(gè)詞,讓AI根據(jù)上下文“猜出”那一個(gè)詞,進(jìn)行完形填空,那么GPT要做的,就是要“猜出”后面一堆的詞,甚至形成一篇通順的文章。事實(shí)證明,基于Transformer模型和龐大的數(shù)據(jù)集這一路徑,GPT做到了。特別值得一提的是,在GPT誕生的同期,還有一種火爆的語(yǔ)言模型,即BERT。BERT是谷歌基于Transformer做的語(yǔ)言模型,是一種雙向的語(yǔ)言模型,通過(guò)預(yù)測(cè)屏蔽子詞進(jìn)行訓(xùn)練——先將句子中的部分子詞屏蔽,再令模型去預(yù)測(cè)被屏蔽的子詞,這種訓(xùn)練方式在語(yǔ)句級(jí)的語(yǔ)義分析中取得了極好的效果。BERT模型還使用了一種特別的訓(xùn)練方式——預(yù)訓(xùn)練,再微調(diào),這種方式可以使一個(gè)模型適用于多個(gè)應(yīng)用場(chǎng)景。這使得BERT刷新了11項(xiàng)NLP任務(wù)處理的紀(jì)錄,引發(fā)了眾多AI研究者的跟隨。面對(duì)BERT的火爆,OpenAI依然堅(jiān)持做生成式模型,而不是去做理解,于是就有了后來(lái)的GPT-3。從GPT-1到GPT-3,OpenAI用了兩年多的時(shí)間,以“大力出奇跡”的辦法,證明了大模型的可行性,參數(shù)從1.17億飆升至1750億,也似乎證明了參數(shù)越大,AI能力越強(qiáng)。因此,在GPT-3成功后,包括谷歌在內(nèi),都在競(jìng)相追逐做大模型,參數(shù)高達(dá)驚人的萬(wàn)億甚至10萬(wàn)億規(guī)模,掀起了一場(chǎng)參數(shù)競(jìng)賽。但這個(gè)時(shí)候,反而是GPT系列的開(kāi)發(fā)者冷靜了下來(lái),沒(méi)有再推高參數(shù),而是又用了近兩年時(shí)間,花費(fèi)重金,用人工標(biāo)注大量數(shù)據(jù),將人類(lèi)反饋和強(qiáng)化學(xué)習(xí)引入大模型,讓GPT系列能夠按照人類(lèi)價(jià)值觀優(yōu)化數(shù)據(jù)和參數(shù)??梢哉f(shuō),作為一種AGI,ChatGPT的成功更是一種工程上的成功,證明了大模型路線的勝利。大模型落地之困雖然基于大模型技術(shù)路線的AI生成的快速發(fā)展讓人們看到了AGI的希望,但實(shí)際上,當(dāng)前的AI生成依然不是根本性的突破。我們已經(jīng)知道,今天的AI生成之所以能如此靈活,就在于其龐大的訓(xùn)練數(shù)據(jù)集。也就是說(shuō),如果沒(méi)有根本性的創(chuàng)新,AGI就可能會(huì)從更大規(guī)模的模型中產(chǎn)生。ChatGPT就是將海量的數(shù)據(jù)與表達(dá)能力很強(qiáng)的Transformer模型結(jié)合,從而對(duì)自然語(yǔ)言進(jìn)行了一個(gè)深度建模。盡管ChatGPT的相關(guān)數(shù)據(jù)并未被公開(kāi),但其上一代GPT-3的整個(gè)神經(jīng)網(wǎng)絡(luò)就已經(jīng)有1750億個(gè)參數(shù)了。雖然越來(lái)越大的模型確實(shí)讓AGI性能很強(qiáng),但龐大的模型也帶來(lái)了一些問(wèn)題:一方面,世界上可能沒(méi)有足夠的可用計(jì)算資源支撐AGI規(guī)模最大化。隨著數(shù)據(jù)的爆發(fā)和算力的高速發(fā)展,一個(gè)高能量的世界正在誕生,而與算力同時(shí)提升的,還有對(duì)電力的需求,畢竟,發(fā)展算力是件高耗能的事情。以GPT-3為例,GPT-3的每次訓(xùn)練都要消耗巨量算力,需用掉約19萬(wàn)度電力、產(chǎn)生85萬(wàn)噸二氧化碳,可謂“耗電怪獸”。僅從量的方面看,根據(jù)不完全統(tǒng)計(jì),2020年全球發(fā)電量中,有5%左右用于計(jì)算能力消耗,而這一數(shù)字到2030年將有可能提高為15%~25%。也就是于計(jì)算產(chǎn)業(yè)來(lái)說(shuō),電力成本也是除芯片成本之外的核心成本。另一方面,在一些重要的任務(wù)上,大模型可能根本無(wú)法在規(guī)模上擴(kuò)展,因?yàn)樵跊](méi)有認(rèn)知模型和常識(shí)的情況下,大模型難以進(jìn)行推理。Bard是谷歌版ChatGPT,而谷歌在發(fā)布Bard時(shí),就在首個(gè)在線演示視頻中犯了一個(gè)事實(shí)性錯(cuò)誤:Bard回答了一個(gè)關(guān)于詹姆斯·韋伯太空望遠(yuǎn)鏡新發(fā)現(xiàn)的問(wèn)題,稱(chēng)它“拍攝了太陽(yáng)系外行星的第一批照片”。這是不正確的。有史以來(lái)第一張關(guān)于太陽(yáng)系以外的行星,也就是系外行星的照片,是在2004年由智利的甚大射電望遠(yuǎn)鏡拍攝的。一位天文學(xué)家指出,這一問(wèn)題可能是因?yàn)槿斯ぶ悄苷`解了“美國(guó)國(guó)家航空航天局(Nasa)低估了歷史的含糊不清的新聞稿”。谷歌Bard所犯的錯(cuò)誤也強(qiáng)調(diào)了由人工智能驅(qū)動(dòng)的搜索的一個(gè)更大的問(wèn)題,即人工智能可以自信地犯事實(shí)錯(cuò)誤并傳播錯(cuò)誤信息——它們并不“理解”自己轉(zhuǎn)述的信息,而是根據(jù)概率進(jìn)行猜測(cè)。實(shí)際上,不僅僅是谷歌,微軟也承認(rèn)ChatGPT基于聊天的服務(wù)也面臨類(lèi)似的挑戰(zhàn)——如果模型只是學(xué)會(huì)了語(yǔ)法和語(yǔ)義,但是在語(yǔ)用或常識(shí)推理方面失敗了,那么我們可能根本就無(wú)法獲得可信任的AGI。奇點(diǎn)隱現(xiàn),未來(lái)已來(lái)在數(shù)學(xué)中,“奇點(diǎn)”(singularity)被用于描述正常的規(guī)則不再適用的類(lèi)似漸近線的情況。在物理學(xué)中,奇點(diǎn)則被用來(lái)描述一種現(xiàn)象,如一個(gè)無(wú)限小、致密的黑洞,或者在大爆炸之前被擠壓到的那個(gè)臨界點(diǎn),同樣是通常的規(guī)則不再適用的情況。1993年,弗諾·文格(VernorVinge)寫(xiě)了一篇文章,他將“奇點(diǎn)”這個(gè)詞用于未來(lái)我們的智能技術(shù)超過(guò)我們自己的那一刻——對(duì)他來(lái)說(shuō),在那一刻之后,我們所有的生活將被永遠(yuǎn)改變,正常規(guī)則將不再適用?,F(xiàn)在,隨著ChatGPT的爆發(fā),我們似乎已經(jīng)站在了技術(shù)奇點(diǎn)的前夜。AI超越人類(lèi)只是時(shí)間問(wèn)題事實(shí)上,AI最大的特點(diǎn)就在于,它不屬于某一特定行業(yè)的顛覆性技術(shù),是互聯(lián)網(wǎng)領(lǐng)域的一次變革,同時(shí)還是作為一項(xiàng)通用技術(shù)成為支撐整個(gè)產(chǎn)業(yè)結(jié)構(gòu)和經(jīng)濟(jì)生態(tài)變遷的重要工具之一,它的能量可以投射在幾乎所有行業(yè)領(lǐng)域中,促進(jìn)其產(chǎn)業(yè)形式轉(zhuǎn)換,為全球經(jīng)濟(jì)增長(zhǎng)和發(fā)展提供新的動(dòng)能。自古暨今,從來(lái)沒(méi)有哪項(xiàng)技術(shù)能夠像人工智能一樣引發(fā)人類(lèi)無(wú)限的暢想。由于AI不是一項(xiàng)單一的技術(shù),其涵蓋面極其廣泛,而“智能”二字所代表的意義又幾乎可以代替所有的人類(lèi)活動(dòng),即使是僅僅停留在人工層面的智能技術(shù),可以做的事情也大大超過(guò)人們的想象。事實(shí)上,AI已經(jīng)覆蓋了我們生活的方方面面。從垃圾郵件過(guò)濾器到叫車(chē)軟件,我們?nèi)粘4蜷_(kāi)的新聞是人工智能做出的算法推薦;網(wǎng)上購(gòu)物時(shí),首頁(yè)上顯示的是AI推薦的用戶最有可能感興趣、最有可能購(gòu)買(mǎi)的商品;從操作越來(lái)越簡(jiǎn)化的自動(dòng)駕駛交通工具,到日常生活中的面部識(shí)別上下班打卡制度……有的我們深有所感,有的則悄無(wú)聲息浸潤(rùn)在社會(huì)運(yùn)轉(zhuǎn)的瑣碎日常中。而當(dāng)前我們所經(jīng)歷的一切,都還處于ANI階段,即我們生活中所有的AI產(chǎn)品還只能執(zhí)行單一任務(wù)。但ChatGPT的出現(xiàn)與爆發(fā),卻將AI推向了一個(gè)真正的應(yīng)用快車(chē)道。雖然當(dāng)前的時(shí)代已經(jīng)因?yàn)锳I有了極大的改變,但ANI產(chǎn)品依然有許多局限性及“不智能”之處。比如,在ChatGPT出現(xiàn)之前,我們與人工智能客服根本無(wú)法愉快地聊天,更談不上正常解決問(wèn)題了。但ChatGPT卻具備了類(lèi)人的邏輯能力,而我們當(dāng)前與它的對(duì)話,都還只是其停留于2021年數(shù)據(jù)更新的階段。更何況,許多重復(fù)性的語(yǔ)言文字工作,其實(shí)根本不需要運(yùn)用復(fù)雜的邏輯思考或頂層決策判斷。比如,接聽(tīng)電話或者處理郵件,幫助客戶訂旅館、訂餐的語(yǔ)言文字工作,根據(jù)固定格式把數(shù)據(jù)、信息填入合同、財(cái)報(bào)、市場(chǎng)分析報(bào)告、事實(shí)性新聞報(bào)道內(nèi),在現(xiàn)有文字材料里提煉大綱、梳理要點(diǎn),將會(huì)議的實(shí)時(shí)文字記錄提煉成會(huì)議簡(jiǎn)報(bào),撰寫(xiě)一些流程性、程式化文章等。這些都是可以基于ChatGPT或其他大模型產(chǎn)品應(yīng)用的工作場(chǎng)景。不僅如此,根據(jù)用戶所給出的特定指令,或者用戶的消費(fèi)行為數(shù)據(jù),在預(yù)訂酒店的時(shí)候,ChatGPT就能根據(jù)用戶的偏好與實(shí)際情況,包最優(yōu)結(jié)果。總體來(lái)說(shuō),當(dāng)前,ChatGPT已經(jīng)讓我們看到了它的創(chuàng)造性——無(wú)論是AI對(duì)話、AI寫(xiě)文章還是AI作畫(huà),大規(guī)模預(yù)訓(xùn)練模型固有的非確定性、發(fā)散性、天馬行空的特點(diǎn),恰好可以成為激發(fā)人類(lèi)靈感的好幫手。未故事路線的電影編劇工作,需要極大豐富視覺(jué)感受的游戲場(chǎng)景設(shè)計(jì)工作,或許都將充滿ChatGPT的身影。李開(kāi)復(fù)曾經(jīng)提過(guò)一個(gè)觀點(diǎn)——思考不超過(guò)5秒的工作,在未來(lái)一定會(huì)被AI取代。現(xiàn)在來(lái)看,在某些領(lǐng)域,ChatGPT已遠(yuǎn)遠(yuǎn)超過(guò)“思考5秒”這個(gè)標(biāo)準(zhǔn)了,并且,隨著它的持續(xù)進(jìn)化,加上它強(qiáng)大的機(jī)器學(xué)習(xí)能力,以及在與人類(lèi)互動(dòng)過(guò)程中的快速學(xué)習(xí)與進(jìn)化。在人類(lèi)社會(huì)所有具有規(guī)律與規(guī)則的工作領(lǐng)域中,AI取代與超越我們只是時(shí)間問(wèn)題。技術(shù)奇點(diǎn)的前夜人類(lèi)的進(jìn)步正在隨著時(shí)間的推移越來(lái)越快——這是未來(lái)學(xué)家雷·庫(kù)茲韋爾所說(shuō)的人類(lèi)歷史的加速回報(bào)定律(Law of Returns)。發(fā)生這種情況是因?yàn)楦冗M(jìn)的社會(huì)有能力比欠發(fā)達(dá)的社會(huì)進(jìn)步更快。19世紀(jì)的人類(lèi)比15世紀(jì)的人類(lèi)知道得更多,技術(shù)也更好,因此,19世紀(jì)的人類(lèi)取得的進(jìn)步比15世紀(jì)的要大得多。比如,在1985年上映的電影《回到未來(lái)》中,“過(guò)去”發(fā)生在1955年,當(dāng)男主人公回到1955如果這部電影是在今天拍攝的,“過(guò)去”發(fā)生在1993年,或許是另一番景象——失去移動(dòng)互聯(lián)網(wǎng)會(huì)令我們更加不適應(yīng),更加與1993不入。這是因?yàn)?993年至2023年的進(jìn)步速度高于1955年至1985速度,前者是一個(gè)更先進(jìn)的世界——最近30年發(fā)生的變化比之前30多得多。雷·庫(kù)茲韋爾說(shuō):“在前幾萬(wàn)年,科技增長(zhǎng)的速度緩慢到一代人看不到明顯的結(jié)果;在最近一百年,一個(gè)人一生內(nèi)至少可以看到一次科技的巨大進(jìn)步;而從21世紀(jì)開(kāi)始,每三到五年就會(huì)發(fā)生與此前人類(lèi)有史以來(lái)科技進(jìn)步的成果總和類(lèi)似的變化。”總而言之,由于加速回報(bào)定律,雷·庫(kù)茲韋爾認(rèn)為,21世紀(jì)將取得是20世紀(jì)的1000倍的進(jìn)步。事實(shí)的確如此,科技進(jìn)步的速度甚至已超出個(gè)人的理解能力極限,而誕生于科技迅速更迭時(shí)代的ChatGPT更是具有無(wú)限的潛力。2016年9月,AlphaGo打敗歐洲圍棋冠軍之后,多位行業(yè)專(zhuān)家都認(rèn)為AlphaGo要進(jìn)一步打敗世界冠軍李世石希望不大。但后來(lái)的結(jié)果是,僅僅6個(gè)月后,AlphaGo就輕易打敗了李世石,并且在輸了一場(chǎng)之后再無(wú)敗績(jī),這種進(jìn)化速度讓人瞠目結(jié)舌?,F(xiàn)在,AlphaGo的進(jìn)化速度或許會(huì)在ChatGPT的身上再次上演。ChatGPT是基于OpenAI的GPT-3.5的模型創(chuàng)建的。自2018年開(kāi)始,GPT-1、GPT-2、GPT-3的參數(shù)分別為1.17億、15億、1750億。這是一個(gè)指數(shù)級(jí)的增長(zhǎng),可以想象,將在不久之后誕生的GPT-4性能還會(huì)更加強(qiáng)大。雖然現(xiàn)階段的ChatGPT有諸多局限性,還不是一款完美的AI產(chǎn)品,但不能否認(rèn)ChatGPT的重要意義——人類(lèi)社會(huì)討論了多年的人工智能,終于向設(shè)想中的人工智能模樣發(fā)展了。奇點(diǎn)隱現(xiàn),而未來(lái)已來(lái)。正如有著“硅谷精神之父”之稱(chēng)的凱文·凱利(Kevin 對(duì)ChatGPT的評(píng)價(jià):從第一個(gè)聊天機(jī)器人(ELIZA,1964年)誕生到出現(xiàn)真正有效的聊天機(jī)器人(ChatGPT,2022年)只用了58年。所以,我們不要認(rèn)為距離近視野就一定清晰,同時(shí)也不要認(rèn)為距離遠(yuǎn)就一定不可能。ChatGPT所引發(fā)的人工智能時(shí)代序幕已經(jīng)被正式拉開(kāi),未來(lái)將超出我們的想象。第3ChatGPT商業(yè)激戰(zhàn)OpenAI:從非營(yíng)利組織,到獨(dú)角獸公司ChatGPT一夜躥紅,使其母公司OpenAI備受關(guān)注。實(shí)際上,在ChatGPT問(wèn)世前,OpenAI還處于虧損狀態(tài)。2022年,OpenAI凈虧損5.4億美元。并且隨著用戶增多,算力成本增加,損失還可能擴(kuò)大。OpenAI聯(lián)合創(chuàng)始人兼CEO山姆·阿爾特曼于2022年12月,在推特上回應(yīng)馬斯克提出的成本問(wèn)題時(shí)稱(chēng),ChatGPT每次的對(duì)話要花費(fèi)幾美分。然而,ChatGPT的爆紅一下子打破了OpenAI虧損的僵局,展現(xiàn)出了極大的商業(yè)化潛力,OpenAI的市場(chǎng)估值也隨之暴漲,高至290億美元,比2021年的140億美元估值翻了一番,比七年前的估值則高了近300倍?!癈hatGPT之父”的傳奇人生ChatGPT的成功,離不開(kāi)山姆·阿爾特曼。阿爾特曼被很多媒體形容為“年度出圈人物”,同時(shí)被稱(chēng)為“ChatGPT之父”。1985年4月22日,阿爾特曼出生于美國(guó)伊利諾伊州芝加哥,在密蘇里州圣路易斯長(zhǎng)大。阿爾特曼從小就展示出在計(jì)算機(jī)方面的天賦。8歲時(shí),阿爾特曼就有了一臺(tái)個(gè)人計(jì)算機(jī),并對(duì)編程產(chǎn)生了濃厚的興趣。他還拆解過(guò)一部蘋(píng)果Macintosh,這臺(tái)計(jì)算機(jī)成為他與世界的重要連接。比如,他發(fā)現(xiàn)美國(guó)在線服務(wù)的聊天室對(duì)信息獲取和社交具有顛覆性的創(chuàng)新。高中畢業(yè)后,阿爾特曼進(jìn)入斯坦福大學(xué),讀計(jì)算機(jī)專(zhuān)業(yè)。他不愿專(zhuān)心讀書(shū),一心想要?jiǎng)?chuàng)業(yè)。大學(xué)二年級(jí)時(shí),阿爾特曼和同學(xué)一起創(chuàng)立了Loopt——一個(gè)與朋友分享地理位置信息的手機(jī)應(yīng)用。2005年,阿爾特曼和同學(xué)成功地成了第一批進(jìn)駐YCombinator(簡(jiǎn)稱(chēng)YC,美國(guó)著名創(chuàng)業(yè)孵化器)的創(chuàng)業(yè)團(tuán)隊(duì),后來(lái)他選擇輟學(xué),全身心投入Loopt。當(dāng)時(shí),基于地理位置的服務(wù)非常熱門(mén),阿爾特曼幸運(yùn)地獲得紅杉資本的投資,四年間拿到了五輪融資,一共籌集了3910萬(wàn)美元。然而,Loopt一直未能吸引足夠多的消費(fèi)者。2009年10月,阿爾特曼以4300萬(wàn)美元的價(jià)格出售Loopt,他由此得到了500萬(wàn)美元的回報(bào)。阿爾特曼并沒(méi)有馬上啟動(dòng)下一次創(chuàng)業(yè),而是休息了一年多。在那一年里,阿爾特曼學(xué)習(xí)了很多領(lǐng)域的知識(shí),如核工影響。2011年,阿爾特曼開(kāi)始在YC兼職。他創(chuàng)立了一個(gè)小型風(fēng)投基金Hydrazine 募集而來(lái)的基金的75%都投向了YC的公司。事實(shí)證明,阿爾特曼善于投資。比如,阿爾特曼曾領(lǐng)投了Reddit這個(gè)長(zhǎng)期混亂無(wú)序的公司的B輪融資,并擔(dān)任過(guò)8天的CEO,然后請(qǐng)回了Reddit的創(chuàng)始人任CEO。由于YC孵化項(xiàng)目的高成功率,阿爾特曼的策略大獲成功。僅僅四年,HydrazineCapital的市值就翻了10倍。2014年,阿爾特曼被任命為YC繼創(chuàng)始人保羅·格雷厄姆之后第二任董事長(zhǎng),成為硅谷知名人物。阿爾特曼同時(shí)是OpenDoor、Postmates、RapidAPI等多家公司的董事會(huì)成員或顧問(wèn),他曾幫助這些公司獲得數(shù)千萬(wàn)美元的投資,并在幫助它們成功上市方面發(fā)揮了重要作用。阿爾特曼還是卡內(nèi)基梅隆大學(xué)高級(jí)研究員,并發(fā)表過(guò)多篇有關(guān)科技創(chuàng)新和創(chuàng)業(yè)的文章。阿爾特曼在創(chuàng)業(yè)、投資和科技領(lǐng)域都有著豐富的經(jīng)驗(yàn),并因其出色的才能而備受贊譽(yù)。2015年,阿爾特曼入選了《福布斯》“30位30歲以下風(fēng)險(xiǎn)投資人”榜單。也是在這一年,阿爾特曼與特斯拉的CEO馬斯克聯(lián)合創(chuàng)辦了非營(yíng)利組織——OpenAI。成立非營(yíng)利組織很少有人能想到,今天的獨(dú)角獸公司OpenAI一開(kāi)始只是一個(gè)非營(yíng)利組織。而OpenAI的成立,充滿了戲劇性。2014年,谷歌以6億美元收購(gòu)DeepMind,后者是首家最有可能率先開(kāi)發(fā)出通用AI的公司。馬斯克曾說(shuō),如果人類(lèi)開(kāi)發(fā)的人工智能產(chǎn)生了偏差,將會(huì)出現(xiàn)一個(gè)永生的超級(jí)強(qiáng)大的“獨(dú)裁者”。也就是說(shuō),如果DeepMind成功了,可能會(huì)壟斷這項(xiàng)技術(shù)。因此,馬斯克等人認(rèn)為,需要組建一個(gè)與谷歌競(jìng)爭(zhēng)的實(shí)驗(yàn)室,于是,非營(yíng)利組織OpenAI誕生了。2015年12月,募集了10億美元資金的OpenAI在美國(guó)舊金山成立,主要贊助者有特斯拉的創(chuàng)始人馬斯克、全球在線支付平臺(tái)PayPal的聯(lián)合創(chuàng)始人彼得·蒂爾、Linkedin的創(chuàng)始人里德·霍夫曼、YC總裁阿爾特曼、Stripe的CTO布羅克曼,以及一些機(jī)構(gòu)如YC Research、阿爾特曼創(chuàng)立的基金會(huì)、印度IT外包公司Infosys及亞馬遜網(wǎng)頁(yè)服務(wù)。而OpenAI成立的使命就是實(shí)現(xiàn)通用AI,打造一個(gè)具備人的心智、具有學(xué)習(xí)和推理能力的機(jī)器系統(tǒng)。成立以來(lái),OpenAI一直從事AI基礎(chǔ)研究,然而,很快,OpenAI的創(chuàng)立者們發(fā)現(xiàn),單有想要造福人類(lèi)的理想遠(yuǎn)遠(yuǎn)不夠——保
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 摩托機(jī)車(chē)基本知識(shí)培訓(xùn)課件
- 攝影機(jī)器基礎(chǔ)知識(shí)培訓(xùn)課件
- 攝影師基本知識(shí)培訓(xùn)內(nèi)容課件
- 塑鋼窗技術(shù)試題及答案
- 2025餐館轉(zhuǎn)讓經(jīng)營(yíng)合同示例
- 2025年高二【數(shù)學(xué)(人教A版)】?jī)蓷l直線的交點(diǎn)坐標(biāo)-學(xué)習(xí)任務(wù)單
- 公司財(cái)務(wù)知識(shí)培訓(xùn)宣傳稿課件
- 大數(shù)據(jù)行業(yè)編程面試題及答案解析
- 2025終止房屋租賃合同通知模板
- 2025茶葉銷(xiāo)售合同范文
- 邢臺(tái)2025年河北邢臺(tái)學(xué)院高層次人才引進(jìn)100人筆試歷年參考題庫(kù)附帶答案詳解
- 透水磚改瀝青施工方案
- 南京科遠(yuǎn)KD200變頻器使用手冊(cè)
- 副校長(zhǎng)申請(qǐng)書(shū)
- 一飛再飛(2024年貴州中考語(yǔ)文試卷記敘文閱讀試題)
- 應(yīng)急通信網(wǎng)絡(luò)建設(shè)方案
- 八段錦考試題及答案
- DB11-T 806-2022 地面輻射供暖技術(shù)規(guī)范
- 純英文初三數(shù)學(xué)試卷
- 壓縮空氣流量及管徑計(jì)算
- 起重吊裝作業(yè)安全培訓(xùn)題庫(kù)
評(píng)論
0/150
提交評(píng)論