




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
教育部辦公廳2024年發(fā)布的《關于加強中小學人工智能教育的通知》明確提出,要通過人工智能課程培養(yǎng)學生的創(chuàng)新精神與問題解決能力。然而,在中小學推進人工智能實踐教學的過程中,算力匱乏始終是制約課程開展的關鍵瓶頸。商業(yè)云服務高昂的成本、外網(wǎng)連接的不確定性以及學生終端性能的局限性,使得許多學校在人工智能實驗教學中只能停留在淺層體驗階段。為突破這一瓶頸,筆者設計了一套基于算力支持的單元課程,幫助學生理解人工智能技術的核心原理和應用邏輯。下面,筆者以單元的最后一課《Embedding和文本分類》為例,辨析本地算力服務器在中小學人工智能課堂中的價值與意義。核心內(nèi)容設計:讓計算機讀懂文字人類通過字詞的排列組合理解語義,而計算機同樣需要用各種算法提取出文字特征來理解文本。早期人們通過統(tǒng)計詞頻來分析文本的特征,現(xiàn)在常用詞嵌入技術,其流程是先將字詞轉(zhuǎn)換為多個數(shù)值的列表(數(shù)學上的向量)(如下頁圖1),在經(jīng)過深度學習模型訓練后,語義相近的詞數(shù)值也更加相近。以常見的詞嵌入模型為例,訓練一個包含10萬詞匯的Word2Vec模型需要進行數(shù)百萬次矩陣運算;而基于Transformer架構(gòu)的現(xiàn)代語言模型(如GPT-3等),其參數(shù)規(guī)模已達1750億(175B)甚至更大,也需要將字詞從文本轉(zhuǎn)為數(shù)字向量,再判斷可能的輸出詞,其單次推理就需要調(diào)用數(shù)以億計的參數(shù)。這些計算任務遠超普通教學終端的處理能力,因此,強大的算力支持變得至關重要,只有具備足夠的計算能力,才能讓計算機快速處理海量文本數(shù)據(jù),真正實現(xiàn)從“能讀”到“會懂'的跨越。本課是“人工智能跨學科項目入門”單元的總結(jié)課,本單元涵蓋機器學習基礎、感知機、神經(jīng)網(wǎng)絡等核心概念(如圖2),并通過實踐項目幫助學生設計解決實際問題的智能應用。學生已具備一定的機器學習知識,熟悉詞嵌入和向量比較原理,但尚未將文本向量化與分類模型訓練結(jié)合。學生熟悉OpenHydra平臺和Jupyter編輯器,可完成復雜模型訓練任務并分析報錯原因?;谝陨峡紤],確認本課教學目標如下。信息意識:培養(yǎng)對人工智能技術的敏感性和認知能力,理解詞嵌入和文本分類的技術原理及其在實際問題中的應用價值。計算思維:通過調(diào)用預訓練模型和優(yōu)化本地數(shù)據(jù)集,培養(yǎng)分析問題、設計算法、優(yōu)化模型的能力,提升邏輯推理和問題解決能力。數(shù)字化學習與創(chuàng)新:借助本地算力平臺和編程環(huán)境,能夠高效完成文本分類任務,自主探索機器學習算法,培養(yǎng)技術實踐能力和創(chuàng)新能力。信息社會責任:通過解決校園管理中的實際問題,理解人工智能技術的社會意義,培養(yǎng)技術倫理意識和社會責任感。硬件配置與本地算力教學平臺針對上述問題,筆者所在學??苿?chuàng)團隊采購了算力服務器,在其基礎上部署了校本算力管理平臺,不僅解決了算力匱乏的問題,還極大地提升了教學效率。1.硬件算力服務器專為處理復雜的計算任務而設計,它通常配備高性能的GPU(圖形處理單元),如筆者所在學校配置的算力服務器配有兩張TeslaT4顯卡,擁有32GB顯存,這些GPU能夠加速深度學習和機器學習算法的訓練過程,使學生能夠在短時間內(nèi)完成復雜的計算任務。服務器操作系統(tǒng)一般選擇Linux系統(tǒng),也有配備Windows系統(tǒng)的工作站可供選擇,適合初學者和對特定軟件有需求的用戶。在預算范圍方面,根據(jù)市場調(diào)研和實際需求,中小學校部署一套能滿足課堂深度學習教學的本地算力服務器的預算通常在2萬元至5萬元之間。2.OpenHydra平臺的優(yōu)勢在擁有硬件后,還需安裝特定軟件以實現(xiàn)算力分割功能,才能支持多個小組同時開展人工智能實驗。算力分割允許多個用戶或任務共享同一物理計算資源,而不會相互干擾,每個虛擬計算單元可以獨立運行不同計算任務,實現(xiàn)資源高效利用和任務并行處理。平臺中教師管理頁面如圖3所示。圖1查看文本及其1024維度的詞向量表示圖2“人工智能跨學科項目入門”單元設計框架除算力分割功能外,平臺還支持常規(guī)教學模塊與課程資源模塊。學生可以在瀏覽器中訪問平臺,點擊創(chuàng)建容器開始實驗(如圖4)。每個賬號擁有獨立的編程環(huán)境與文件目錄,也可為多人小組分配同一個賬號進行協(xié)作實驗。在傳統(tǒng)教學模式下,教師需在不同設備上配置實驗環(huán)境,耗時費力且容易出現(xiàn)兼容問題,而容器化技術實現(xiàn)了“一次配置,多次使用”,顯著提升了教學效率。教學過程與活動設計1.課題導入與情境創(chuàng)設課堂伊始,教師通過校園管理中的真實場景導人:校長信箱每月收到數(shù)百條學生反饋,涵蓋食堂、課程、宿舍等多個領域。接著,提出問題“如何讓計算機自動理解這些文本并精準分類”,通過課前收集的待分類數(shù)據(jù)集,讓學生直觀感受文本分類技術的應用價值。2.預訓練模型調(diào)用(1)詞嵌入原理講解教師先通過動畫演示詞嵌入原理,結(jié)合物理中向量運算類比解釋語義運算(如\"國王-男人+女人≈女王\"),讓學生體驗向量運算的邏輯,再使用可視化工具展示字詞之間的相關性,幫助學生理解語義相近的詞在向量空間中的位置關系。在隨后的實踐活動中,學生通過調(diào)用互聯(lián)網(wǎng)上的預訓練模型,對校長信箱文本數(shù)據(jù)進行向量化與文本分類,學生能夠在文件目錄中看到簡單分類后的結(jié)果(如下頁圖5)。在這一過程中,本地算力服務器發(fā)揮了關鍵作用:上百條文本的向量化過程原本需要數(shù)十分鐘,如今在學生的瀏覽器上僅需數(shù)秒即可完成,讓學生能夠?qū)崟r觀察到運算圖3教師管理頁面圖4學生在編程環(huán)境中訪問教師上傳的公共學習資源多層感知機(MLP)和1sec.ago鑫尾花數(shù)集因其樣本。在中、斷、分類問題eML單,一了多入門級機器學習數(shù)圓基于果物的K近鄰分類.ipy..1sec.ago尾花的三個品種進行識別,驗證多層感知機(MLP)的分類性能。圓樸素貝葉斯和天氣預報.p..1sec.ago圓支持向量機(SVM)和手.1sec.ago1)實驗資源·data/iris.csv2)實驗目的·通過自主探究,可以理解多層感知機的基本原理,知道多層感知機可以運用鳶尾花分類任務:·通過使用BaseML搭建多層感知機分類器,掌握搭建多層感知機分類器的基礎代碼:·通過對模型參數(shù)的調(diào)整,能夠解釋重點參數(shù)的含義以及對于模型效果的作用。3)實驗內(nèi)容0實驗一:使用多層感知機搭建并訓練鳶尾花分類模型寸SimpleO01Python3(ipykernel)↓ldleMode:CommandLn1,Col1多層感知機(MLP)和尾花分類.ipynb1(2)實踐操作結(jié)果結(jié)果。3.模型的二次優(yōu)化雖然通過調(diào)用現(xiàn)成模型能夠獲取分類結(jié)果,但仍存在分類錯誤的問題。如“一鳴”便利店實際開設位置在食堂附近,但對于互聯(lián)網(wǎng)上的模型,詞庫中并不存在該建筑的地理位置信息,有關“一鳴”的建議就被隨機分到了“食堂”“寢室”等任意分類方向,此時就需要手動標注數(shù)據(jù),生成一個本地化的數(shù)據(jù)集。經(jīng)過了“自動生成類別”的操作,再對上圖中的標簽進行微調(diào),之后就可以將數(shù)據(jù)投入機器學習模型,讓其再次分類(如圖6),得到一個更加準確的機器學習模型。為了讓學生快速回憶起機器學習的相關訓練流程,教師在公共課程文件夾中提供了“常見機器學習分類方法及其程序?qū)崿F(xiàn)”的資源,每個程序文件中都包含了完整的算法講解與實際情境。資源目錄如下:①多層感知機(MLP)和鳶尾花分類;②基于果物的K近鄰分類;③樸素貝葉斯和天氣預報;④支持向量機(SVM)和手勢分類(關鍵點檢測)。學生兩人一小組,每組自行選擇一種機器學習方法進行學習,在學習完簡單案例后,替換代碼與數(shù)據(jù)集,用機器學習的算法完成文本數(shù)據(jù)的分類。4.展示分享在課堂最后,在教師提供的資源支架下,大部分小組能訓練出一個機器學習模型,在程序中看到新模型的分類效果。教師邀請部分小組展示分類模型應用情況,分享模型優(yōu)化策略。課后反思:中小學人工智能教學的算力困境與突破算力是人工智能教育的底層支撐,但中小學校長期面臨算力匱乏的困境。筆者曾嘗試使用云端平臺進行模型訓練,但由于并發(fā)限制和網(wǎng)絡波動,學生經(jīng)常無法完成實驗。這種“時斷時續(xù)”的教學體驗嚴重限制了課程開展的深度與廣度。本地算力支持下的課堂教學能高效訓練模型,在結(jié)合適當?shù)乃懔芾砥脚_后,還能擁有如下優(yōu)勢:教師統(tǒng)一分發(fā)賬號,免去注冊與登錄流程,保障學生學習文件歸屬與連續(xù)性;虛擬助教提供個性化指導;豐富的公共課程與數(shù)據(jù)集助力學生自主學習跨學科內(nèi)容。許多中小學教師對算力部署存在顧慮,認為其
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)院信息化方案專家論證會
- 醫(yī)學檢驗市場分析
- 語文新課標解讀講座
- 醫(yī)學答辯題庫及答案
- 醫(yī)學影像技術發(fā)展研究
- 野草的題目及答案
- 汽車銷售管理制度及流程
- 醫(yī)院科室運營管理
- 循環(huán)內(nèi)科題庫及答案
- 醫(yī)學生職業(yè)發(fā)展路徑探析
- 信息系統(tǒng)招標打分表
- 2024年輔警考試公基常識300題(附解析)
- 2024年江蘇蘇州市相城國有資本投資有限公司招聘筆試參考題庫含答案解析
- CorelDRAW實例教程(CorelDRAW 2020)全套教學課件
- 《低鈉血癥的中國專家共識2023》解讀
- 儲能技術在電氣化鐵路中的應用
- 傷口感染的護理處理
- 騎手安全培訓課件
- 消防員心理培訓課件
- 保險理賠收款委托書
- 扣件式鋼管腳手架施工方案(完整版本)
評論
0/150
提交評論