2025面向AI研發(fā)語(yǔ)言模型訓(xùn)練的可解釋性分析與驗(yàn)證

上傳人：1*** IP屬地：山西上傳時(shí)間：2025-09-04 格式：PPTX 頁(yè)數(shù)：63 大?。?.75MB 積分：18 舉報(bào) 版權(quán)申訴

2025面向AI研發(fā)語(yǔ)言模型訓(xùn)練的可解釋性分析與驗(yàn)證_第2頁(yè)

2025面向AI研發(fā)語(yǔ)言模型訓(xùn)練的可解釋性分析與驗(yàn)證_第3頁(yè)

2025面向AI研發(fā)語(yǔ)言模型訓(xùn)練的可解釋性分析與驗(yàn)證_第4頁(yè)

2025面向AI研發(fā)語(yǔ)言模型訓(xùn)練的可解釋性分析與驗(yàn)證_第5頁(yè)

已閱讀5頁(yè)，還剩58頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

面向AI研發(fā)語(yǔ)言模型訓(xùn)練的可解釋性分析與驗(yàn)證2025設(shè)計(jì)編程測(cè)試調(diào)試

2EMNLP’23,

ISSTA’24基于語(yǔ)言模型的代碼編輯

3FSE’23,

FSE’21,ISSTA’20基于語(yǔ)言模型的測(cè)試生成LLMOptimized

testinitializationand

mutationRAG

4TSE’19,

ASE’18,

ICSE’

5基于語(yǔ)言模型的代碼調(diào)試（調(diào)試過(guò)程生成）訓(xùn)練數(shù)據(jù)開(kāi)發(fā)過(guò)程倉(cāng)庫(kù)代碼模型IDE訓(xùn)練軟件工程語(yǔ)言模型的“套路”清洗

6訓(xùn)練部署訓(xùn)練數(shù)據(jù)開(kāi)發(fā)過(guò)程倉(cāng)庫(kù)代碼模型IDE訓(xùn)練軟件工程語(yǔ)言模型的“套路”清洗訓(xùn)練部署模型為什么會(huì)有這樣的預(yù)測(cè)？模型的預(yù)測(cè)是如何形成的？我們?nèi)绻m正和調(diào)整模型預(yù)測(cè)？

7訓(xùn)練數(shù)據(jù)開(kāi)發(fā)過(guò)程倉(cāng)庫(kù)代碼模型IDE訓(xùn)練軟件工程語(yǔ)言模型的“套路”清洗訓(xùn)練部署SE

for(AI

for

SE)基礎(chǔ)框架訓(xùn)練樣本歸因表征歸因仿真驗(yàn)證(數(shù)字孿生)

8案例研究：交互式代碼編輯(CoEdPilot)CoEdPilot:

Recommending

Code

Edits

with

Learned

Prior

EditRelevance,

Project-wise

Awareness,

and

Interactive

Nature(ISSTA

2024).

9編輯定位研究工作案例：代碼編輯工具CoEdPilotCoEdPilot:

Recommending

Code

Edits

with

Learned

Prior

EditRelevance,

Project-wise

Awareness,

and

Interactive

Nature(ISSTA

2024).

10編輯生成研究工作案例：代碼編輯工具CoEdPilotCoEdPilot:

Recommending

Code

Edits

with

Learned

Prior

EditRelevance,

Project-wise

Awareness,

and

Interactive

Nature(ISSTA

2024).

11下一輪編輯定位

12滑動(dòng)窗口（編輯前）testing:

added

name

matcher

andsanitizerThe

matcher

responsible

for

sanitizing

anduniquing

the

test

and

benchmark

names

andthus

…commit消息前編輯（已經(jīng)發(fā)生的編輯）基本想法

13testing:

added

name

matcher

andsanitizerThe

matcher

responsible

for

sanitizing

anduniquing

the

test

and

benchmark

names

andthus

…commit消息前編輯（已經(jīng)發(fā)生的編輯）基本想法

14滑動(dòng)窗口（編輯后）代碼編輯的基本設(shè)計(jì)想法模型任務(wù)分解：

15協(xié)同編輯評(píng)估模型依賴分析模型編輯生成模型反饋設(shè)計(jì)：反饋信息增量預(yù)測(cè)和矯正一體化代碼編輯的基本設(shè)計(jì)想法模型任務(wù)分解：

16協(xié)同編輯評(píng)估模型依賴分析模型編輯生成模型反饋設(shè)計(jì)：反饋信息增量預(yù)測(cè)和矯正一體化代碼編輯的基本設(shè)計(jì)想法模型任務(wù)分解：

17協(xié)同編輯評(píng)估模型依賴分析模型編輯生成模型反饋設(shè)計(jì)：反饋信息增量預(yù)測(cè)和矯正一體化步驟1:協(xié)同編輯評(píng)估Code

ACode

BCodeBertdepDep

ReasonDependency

AnalyzerCodeBertSemanticRelvanceCode

ACode

BCo-changePredication

18步驟2:編輯位置預(yù)測(cè)(指令微調(diào))Replace

19Keep步驟3:編輯內(nèi)容生成(指令微調(diào))

20反饋設(shè)計(jì)

21實(shí)驗(yàn)結(jié)果：編輯位置數(shù)據(jù)集收集

22實(shí)驗(yàn)結(jié)果：編輯內(nèi)容數(shù)據(jù)集收集

23實(shí)驗(yàn)結(jié)果：反饋效果數(shù)據(jù)集收集

24訓(xùn)練數(shù)據(jù)開(kāi)發(fā)過(guò)程倉(cāng)庫(kù)代碼模型IDE訓(xùn)練軟件工程語(yǔ)言模型清洗訓(xùn)練部署SE

for(AI

for

SE)基礎(chǔ)框架訓(xùn)練樣本歸因表征歸因仿真驗(yàn)證(數(shù)字孿生)

25哪些訓(xùn)練數(shù)據(jù)影響了這次預(yù)測(cè)?訓(xùn)練數(shù)據(jù)集代碼模型Koh,

Pang

Wei,

and

Percy

Liang.

"Understandingblack-box

predictions

viainfluence

functions."

International

conference

machine

learning.

PMLR,

2017.定義：給定一個(gè)訓(xùn)練樣本??,如果我們對(duì)??提權(quán)或者降權(quán)?，那么訓(xùn)練模型會(huì)發(fā)生什么變化?

26哪些訓(xùn)練數(shù)據(jù)影響了這次預(yù)測(cè)?訓(xùn)練數(shù)據(jù)集代碼模型Koh,

Pang

Wei,

and

Percy

Liang.

"Understandingblack-box

predictions

viainfluence

functions."

International

conference

machine

learning.

PMLR,

2017.定義：給定一個(gè)訓(xùn)練樣本??,如果我們對(duì)??提權(quán)或者降權(quán)?，那么訓(xùn)練模型會(huì)發(fā)生什么變化?擬合測(cè)試樣本的方向

27擬合訓(xùn)練樣本的方向所有樣本的交互效應(yīng)改進(jìn)方法Liu,

Ruofan,

Yun

Lin,

al.

"Debugging

and

explaining

metriclearningapproaches:

influence

function

based

perspective."

NeurIPS’22.基本想法：給定模型?0，我們生成多個(gè)變異模型?1,?2,…,??,來(lái)預(yù)估擬合一個(gè)訓(xùn)練樣

本??和一個(gè)測(cè)試樣本??的方向協(xié)同效應(yīng)Empirical

Influence

Function

28哪些訓(xùn)練數(shù)據(jù)影響了這次預(yù)測(cè)?訓(xùn)練數(shù)據(jù)集代碼模型Koh,

Pang

Wei,

and

Percy

Liang.

"Understandingblack-box

predictions

viainfluence

functions."

International

conference

machine

learning.

PMLR,

2017.定義：給定一個(gè)訓(xùn)練樣本??,如果我們對(duì)??提權(quán)或者降權(quán)?，那么訓(xùn)練模型會(huì)發(fā)生什么變化?擬合測(cè)試樣本的方向擬合訓(xùn)練樣本的方向所有樣本的交互效應(yīng)

29將影響函數(shù)應(yīng)用于代碼編輯生成任務(wù)有益訓(xùn)練樣本相關(guān)度分析

30有害訓(xùn)練樣本相關(guān)度分析編輯模型的預(yù)測(cè)分析到的相關(guān)樣本

31編輯定位模型的預(yù)測(cè)訓(xùn)練樣本歸因

32編輯定位模型的預(yù)測(cè)

33訓(xùn)練樣本歸因訓(xùn)練樣本會(huì)“打架”代碼替換代碼刪除+新增代碼替換代碼刪除+新增訓(xùn)練樣本會(huì)“打架”普遍“打架”現(xiàn)象:過(guò)長(zhǎng)Commit

Message帶來(lái)過(guò)多沖突

36訓(xùn)練數(shù)據(jù)集代碼模型標(biāo)注清洗編程代碼訓(xùn)練數(shù)據(jù)分析與定位

37代碼數(shù)據(jù)重標(biāo)注代碼訓(xùn)練數(shù)據(jù)合并訓(xùn)練數(shù)據(jù)開(kāi)發(fā)過(guò)程倉(cāng)庫(kù)代碼模型IDE訓(xùn)練軟件工程語(yǔ)言模型清洗訓(xùn)練部署SE

for(AI

for

SE)基礎(chǔ)框架訓(xùn)練樣本歸因表征歸因仿真驗(yàn)證(數(shù)字孿生)

38深度學(xué)習(xí)即表征學(xué)習(xí)

39可視化的表征空間

40可視化的表征空間Yang,

Xianglin,

Yun

Lin,

etal.

"DeepDebugger:

Interactive

Time-TravellingDebugging

Approach

for

Deep

Classifiers."

FSE.

2023.Yang,

Xianglin,

Yun

Lin,

al.

"Deepvisualinsight:

Time-travelling

visualizationforspatio-temporal

causality

deep

classification

training."

AAAI

2022.

41訓(xùn)練過(guò)程中噪音樣本表征運(yùn)動(dòng)e1e2e3e4e5代碼表征分析（搜索任務(wù)）CodeRepresentation

43Natural

Language

RepresentationMRR:

0.31高層語(yǔ)義編輯距離token編輯距離ATACGAAAG…

44………高層語(yǔ)義編輯距離（代碼-代碼）def

max_version(self):data

self.version_downloadsif

not

data:return

None,

0return

max(data.items(),

key=lamda

item:

item[1])def

min_version(self):data

self.version_downloadsif

not

data:return

(None,

0)return

min(data.items(),

key=lamda

item:

item[1])表征相似度：0.912

45高層語(yǔ)義編輯距離（代碼-代碼）def

max_version(self):data

self.version_downloadsif

not

data:return

None,

0return

max(data.items(),

key=lamda

item:

item[1])def

min_version(self):data

self.version_downloadsif

not

data:return

(None,

0)return

min(data.items(),

key=lamda

item:

item[1])

46高層語(yǔ)義編輯距離（代碼-代碼）def

max_version(self):data

self.version_downloadsif

not

data:return

None,

0return

max(data.items(),

key=lamda

item:

item[1])def

min_version(self):data

self.version_downloadsif

not

data:return

(None,

0)return

min(data.items(),

key=lamda

item:

item[1])

47高層語(yǔ)義編輯距離（代碼-代碼）

48高層語(yǔ)義編輯距離（代碼-代碼）MRR:0.38

49加入表征對(duì)齊預(yù)訓(xùn)練任務(wù)（對(duì)比學(xué)習(xí)）MRR:0.50

(+0.12)訓(xùn)練數(shù)據(jù)開(kāi)發(fā)過(guò)程倉(cāng)庫(kù)代碼模型IDE訓(xùn)練軟件工程語(yǔ)言模型清洗訓(xùn)練部署SE

for(AI

for

SE)基礎(chǔ)框架訓(xùn)練樣本歸因表征歸因仿真驗(yàn)證(數(shù)字孿生)

50基本想法：從提交歷史重現(xiàn)“當(dāng)年的”開(kāi)發(fā)過(guò)程代碼提交賦能預(yù)估準(zhǔn)確率生產(chǎn)力

51實(shí)驗(yàn)從項(xiàng)目舊版本commit開(kāi)始（一個(gè)commit可視為若干次編輯的集合），初始未完成編輯集合=所有編輯，初始先前編輯集合為空模擬的程序員作出第一個(gè)編輯，并輸入commit

message作為模型的用戶描述檢查是否有未完成的編輯。若無(wú)，流程結(jié)束驗(yàn)證編輯行定位器返回的編輯位置是否與真實(shí)的編輯位置匹配。如果有匹配的位置，從中選擇一個(gè)編輯位置繼續(xù)進(jìn)行。根據(jù)生成的編輯內(nèi)容最高的BLEU4分?jǐn)?shù)評(píng)估生成的編輯質(zhì)量。如果BLEU

分?jǐn)?shù)介于50

到

100，則用戶會(huì)在推薦內(nèi)容基礎(chǔ)上進(jìn)行手動(dòng)修改。如果沒(méi)有匹配，從未完成的編輯集合中選擇下一個(gè)編輯位置。如果BLEU4分?jǐn)?shù)小于50，則用戶會(huì)拒絕推薦內(nèi)容，手動(dòng)編輯。如果BLEU4分?jǐn)?shù)等于100，則用戶直接接受推薦內(nèi)容，無(wú)需手動(dòng)編輯。將此次完成的編輯從未完成編輯集合中移除，并加入到先前編輯集合中

53定義用戶查看Locator推薦的單個(gè)位置所

人人文庫(kù)> 全部分類> 專業(yè)文獻(xiàn) > 工程機(jī)械

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

中文字字幕乱码视频,亚洲av无码乱码在线观看富二代,亚洲乱妇亚洲乱妇xinglu,亚洲日韩乱码中文无码蜜桃臀,亚洲精品无码久久久久久久

2025面向AI研發(fā)語(yǔ)言模型訓(xùn)練的可解釋性分析與驗(yàn)證

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

中文字字幕乱码视频,亚洲av无码乱码在线观看富二代,亚洲乱妇亚洲乱妇xinglu,亚洲日韩乱码中文无码蜜桃臀,亚洲精品无码久久久久久久

2025面向AI研發(fā)語(yǔ)言模型訓(xùn)練的可解釋性分析與驗(yàn)證

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔