人機(jī)交互的數(shù)據(jù)庫搭建過程
截至數(shù)據(jù)庫發(fā)布當(dāng)天,徐明團(tuán)隊(duì)用7個(gè)月時(shí)間得到了4132個(gè)單元過程數(shù)據(jù)。“超過某些國際知名數(shù)據(jù)庫10年的數(shù)據(jù)搜集量。”徐明說。
效率之所以高,是因?yàn)閳F(tuán)隊(duì)利用國內(nèi)AI基礎(chǔ)模型,開發(fā)了專門適用天工數(shù)據(jù)庫建設(shè)的大語言模型應(yīng)用工具,在數(shù)據(jù)庫搭建過程中實(shí)現(xiàn)人機(jī)交互。
AI提升數(shù)據(jù)檢索效率。徐明團(tuán)隊(duì)成員、清華大學(xué)環(huán)境學(xué)院助理研究員齊劍川以對二氧化碳的檢索舉例說:“如果沒有大語言模型應(yīng)用工具,團(tuán)隊(duì)在檢索二氧化碳時(shí),可能需要輸入‘二氧化碳’‘CO2’‘carbon dioxide’等其不同語言和形式的名稱,才能檢索完備。而在大語言模型工具的幫助下,我們只需輸入上述名稱中的任何一個(gè),就能把想找的所有內(nèi)容檢索出來,大幅提升了效率。”
AI提升數(shù)據(jù)檢驗(yàn)效率。徐明介紹,每名團(tuán)隊(duì)專家按照預(yù)先制定的標(biāo)準(zhǔn)搜集數(shù)據(jù)后,會(huì)有另外兩名專家對數(shù)據(jù)質(zhì)量進(jìn)行交叉檢驗(yàn)。同時(shí),大語言模型應(yīng)用工具作為第三名“專家”可查找出其檢驗(yàn)?zāi)芰Ψ秶鷥?nèi)的問題。
齊劍川表示,大語言模型應(yīng)用工具可以將團(tuán)隊(duì)成員搜集的單元過程數(shù)據(jù)自動(dòng)轉(zhuǎn)換成搭建數(shù)據(jù)庫所需的ILCD數(shù)據(jù)格式,進(jìn)一步提升數(shù)據(jù)庫建設(shè)效率。
“我們還在不斷升級(jí)大語言模型應(yīng)用,擴(kuò)展人機(jī)交互邊界,目標(biāo)是把重復(fù)性、機(jī)械性的勞動(dòng)都交給機(jī)器來做,讓團(tuán)隊(duì)專家專注于貢獻(xiàn)增量知識(shí)。”齊劍川說。
本`文-內(nèi).容.來.自:中`國^碳`排*放*交^易^網(wǎng) ta np ai fan g.com
產(chǎn)品碳足跡不以排放主體而以產(chǎn)品為抓手來衡量減排水平
【版權(quán)聲明】本網(wǎng)為公益類網(wǎng)站,本網(wǎng)站刊載的所有內(nèi)容,均已署名來源和作者,僅供訪問者個(gè)人學(xué)習(xí)、研究或欣賞之用,如有侵權(quán)請權(quán)利人予以告知,本站將立即做刪除處理(QQ:51999076)。