《生成式人工智能基礎(chǔ)與實(shí)戰(zhàn)》教學(xué)案例 1.全球大模型全景洞察_第1頁
《生成式人工智能基礎(chǔ)與實(shí)戰(zhàn)》教學(xué)案例 1.全球大模型全景洞察_第2頁
《生成式人工智能基礎(chǔ)與實(shí)戰(zhàn)》教學(xué)案例 1.全球大模型全景洞察_第3頁
《生成式人工智能基礎(chǔ)與實(shí)戰(zhàn)》教學(xué)案例 1.全球大模型全景洞察_第4頁
《生成式人工智能基礎(chǔ)與實(shí)戰(zhàn)》教學(xué)案例 1.全球大模型全景洞察_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

全球大模型全景洞察【案例背景】當(dāng)下數(shù)字化浪潮中,全球大模型領(lǐng)域迅猛發(fā)展,自2018年OpenAI和Google推出相關(guān)模型開啟自然語言處理新篇章后,GPT系列不斷進(jìn)化拓展應(yīng)用邊界。市場數(shù)據(jù)顯示全球及中國該領(lǐng)域規(guī)模增長驚人、潛力巨大。大模型依托大數(shù)據(jù)、算力與算法融合,已廣泛滲透多行業(yè)重塑格局。本案例對(duì)其全景洞察,剖析現(xiàn)狀、梳理脈絡(luò)、研判趨勢,為讀者一個(gè)集中了解國內(nèi)外大模型的機(jī)會(huì)?!景咐龍?zhí)行過程】一、了解國外的大模型產(chǎn)品1.ChatGPTChatGPT是一種由OpenAI訓(xùn)練的大語言模型(見圖1)。它是基于Transformer架構(gòu),經(jīng)過大量文本數(shù)據(jù)訓(xùn)練而成,能夠生成自然、流暢的語言,并具備回答問題、生成文本、語言翻譯等多種功能ChatGPT的應(yīng)用范圍廣泛,可以用于客服、問答系統(tǒng)、對(duì)話生成、文本生成等領(lǐng)域。它能夠理解人類語言,并能夠回答各種問題,提供相關(guān)的知識(shí)和信息。與其他聊天機(jī)器人相比,ChatGPT具備更強(qiáng)的語言理解和生成能力,能夠更自然地與人類交流,并且能夠更好地適應(yīng)不同的領(lǐng)域和場景。ChatGPT的訓(xùn)練數(shù)據(jù)來自互聯(lián)網(wǎng)上的大量文本,因此,它能夠涵蓋多種語言風(fēng)格和文化背景。圖1ChatGPT圖2.GeminiGemini是谷歌發(fā)布的大模型,它能夠同時(shí)處理多種類型的數(shù)據(jù)和任務(wù),覆蓋文本、圖像、音頻、視頻等多個(gè)領(lǐng)域(如圖2)。Gemini采用了全新的架構(gòu),將多模態(tài)編碼器和多模態(tài)解碼器兩個(gè)主要組件結(jié)合在一起,以提供最佳結(jié)果Gemini包括三種不同規(guī)模的模型:GeminiUltra、GeminiPro和GeminiNano,適用于不同任務(wù)和設(shè)備。2023年12月6日,Gemini的初始版本已在Bard中提供,開發(fā)人員版本可通過GoogleCloud的API獲得。Gemini可以應(yīng)用于Bard和Pixel8Pro智能手機(jī)。Gemini的應(yīng)用范圍廣泛,包括問題回答、摘要生成、翻譯、字幕生成、情感分析等任務(wù)。然而,由于其復(fù)雜性和黑箱性質(zhì),Gemini的可解釋性仍然是一個(gè)挑戰(zhàn)。圖2Gemini圖3.Sora2024年2月16日,OpenAI再次震撼全球科技界,發(fā)布了名為Sora的文本生成視頻大模型(如圖3),只需輸入文本就能自動(dòng)生成視頻。這一技術(shù)的誕生,不僅標(biāo)志著人工智能在視頻生成領(lǐng)域的重大突破,更引發(fā)了關(guān)于人工智能發(fā)展對(duì)人類未來影響的深刻思考。隨著Sora的發(fā)布,人工智能似乎正式踏入了通用人工智能(AGI:ArtificialGeneralIntelligence)的時(shí)代。AGI是指能夠像人類一樣進(jìn)行各種智能活動(dòng)的機(jī)器智能,包括理解語言、識(shí)別圖像、進(jìn)行復(fù)雜推理等。Sora大模型能夠直接輸出長達(dá)60秒的視頻,并且視頻中包含了高度細(xì)致的背景、復(fù)雜的多角度鏡頭,以及富有情感的多個(gè)角色。這種能力已經(jīng)超越了簡單的圖像或文本生成,開始觸及視頻這一更加復(fù)雜和動(dòng)態(tài)的媒介。這意味著人工智能不僅在處理靜態(tài)信息上越來越強(qiáng)大,而且在動(dòng)態(tài)內(nèi)容的創(chuàng)造上也展現(xiàn)出了驚人的潛力。圖3Sora下圖是Sora根據(jù)文本自動(dòng)生成的視頻畫面,一位戴著墨鏡、穿著皮衣的時(shí)尚女子走在雨后夜晚的東京市區(qū)街道上,抹了鮮艷唇彩的唇角微微翹起,即便戴著墨鏡也能看到她的微笑,地面的積水映出了她的身影和燈紅酒綠的霓虹燈,熱鬧非凡的唐人街正在進(jìn)行舞龍表演,熙熙攘攘的人群目光都聚焦在躍動(dòng)的彩龍身上,整個(gè)環(huán)境的喜慶氛圍仿佛令人身臨其境。(如圖4所示)圖4Sora生成的圖4.OpenAIo32024年12月20日,OpenAI發(fā)布推理模型o3(見圖5),無論在軟件工程、編寫代碼,還是競賽數(shù)學(xué)、掌握人類博士級(jí)別的自然科學(xué)知識(shí)能力方面,o3都達(dá)到了很高的水平。圖5OpenAI發(fā)布推理模型o3二、了解國內(nèi)的大模型產(chǎn)品國內(nèi)大模型產(chǎn)品具體見表1:表1國內(nèi)大模型產(chǎn)品1.DeepSeek(深度求索)2024年12月26日,杭州一家名為“深度求索”(DeepSeek)的中國初創(chuàng)公司,發(fā)布了全新一代大模型DeepSeek-V3(如圖6)。在多個(gè)基準(zhǔn)測試中,DeepSeek-V3的性能均超越了其他開源模型,甚至與頂尖的閉源大模型GPT-4o不相上下,尤其在數(shù)學(xué)推理上,DeepSeek-V3更是遙遙領(lǐng)先。DeepSeek-V3以多項(xiàng)開創(chuàng)性技術(shù),大幅提升了模型的性能和訓(xùn)練效率。DeepSeek-V3在性能比肩GPT4o的同時(shí),研發(fā)卻只花了558萬美元,訓(xùn)練成本不到后者的二十分之一。因?yàn)楸憩F(xiàn)太過優(yōu)越,DeepSeek在硅谷被譽(yù)為“來自東方的神秘力量”。2025年1月20日,DeepSeek-R1正式發(fā)布,擁有卓越的性能,在數(shù)學(xué)、代碼和推理任務(wù)上可與OpenAIo1媲美。圖6DeepSeek2.通義千問通義千問是阿里云推出的一個(gè)超大規(guī)模的語言模型,它具備多輪對(duì)話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持的能力(見圖7)。通義千問這個(gè)名字有“通義”和“千問”兩層含義,“通義”表示這個(gè)模型能夠理解各種語言的含義,“千問”則表示這個(gè)模型能夠回答各種問題。通義千問基于深度學(xué)習(xí)技術(shù),通過對(duì)大量文本數(shù)據(jù)進(jìn)行訓(xùn)練,從而具備了強(qiáng)大的語言理解和生成能力。它能夠理解自然語言,并能夠生成自然語言文本同時(shí),通義千問還具備多模態(tài)理解能力,能夠處理圖像、音頻等多種類型的數(shù)據(jù)。通義千問的應(yīng)用范圍非常廣泛,可以應(yīng)用于智能客服、智能家居、移動(dòng)應(yīng)用等多個(gè)領(lǐng)域。它可以與用戶進(jìn)行自然語言交互,幫助用戶解決各種問題,同時(shí),通義千問還可以與各種設(shè)備和應(yīng)用進(jìn)行集成,為用戶提供更加便捷的服務(wù)。圖7通義千問3.字節(jié)跳動(dòng)豆包豆包是字節(jié)跳動(dòng)基于云雀模型開發(fā)的AI(見圖8),能理解你的需求并生成高質(zhì)量回應(yīng)。它知識(shí)儲(chǔ)備豐富,涵蓋歷史、科學(xué)、技術(shù)等眾多領(lǐng)域,無論是日常問題咨詢,還是深入學(xué)術(shù)探討,都能提供準(zhǔn)確全面的信息。同時(shí),具備出色的文本創(chuàng)作能力,能撰寫故事、詩歌、文案等各類體裁。并且擅長語言交互,交流自然流暢,就像身邊的知心伙伴,耐心傾聽并給予恰當(dāng)反饋。圖8豆包4.文心一言文心一言是由百度研發(fā)的知識(shí)增強(qiáng)大模型,能夠與人對(duì)話互動(dòng)、回答問題、協(xié)助創(chuàng)作,高效便捷地幫助人們獲取信息、知識(shí)和靈感文心一言基于飛槳深度學(xué)習(xí)平臺(tái)和文心知識(shí)增強(qiáng)大模型,持續(xù)從海量數(shù)據(jù)和大規(guī)模知識(shí)中融合學(xué)習(xí),具備知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)的技術(shù)特色(見圖9)。文心一言具有廣泛的應(yīng)用場景,例如智能客服、智能家居、移動(dòng)應(yīng)用等領(lǐng)域。圖9文心一言【案例結(jié)論】全球大模型發(fā)展呈現(xiàn)蓬勃態(tài)勢,國外以O(shè)penAI、谷歌為代表的科技巨頭憑借先發(fā)優(yōu)勢和雄厚資源,在技術(shù)創(chuàng)新和應(yīng)用拓展上成果斐然,不斷推出具有開創(chuàng)性的大模型產(chǎn)品,引領(lǐng)行業(yè)發(fā)展方向。國內(nèi)企業(yè)也奮起直追,在開源大模型領(lǐng)域,DeepSeek等初創(chuàng)公司憑借技術(shù)創(chuàng)新實(shí)現(xiàn)性能突破;通義千問、豆包、文心一言等大模型產(chǎn)品,各具特色,在不同應(yīng)用場景中展現(xiàn)出強(qiáng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論