日韩毛片在线视频-日韩毛片在线影视-日韩美aaa特级毛片-日韩美a一级毛片-久久夜夜操妹子-久久夜夜肉肉热热日日

快速發(fā)布求購 登錄 注冊
行業(yè)資訊行業(yè)財報市場標(biāo)準(zhǔn)研發(fā)新品會議盤點政策本站速遞

深圳先進(jìn)院科研團(tuán)隊在大模型AI芯片設(shè)計領(lǐng)域取得突破

研發(fā)快訊 2025年04月16日 13:27:22來源:中國科學(xué)院深圳先進(jìn)技術(shù)研究院 7040
摘要研究成功攻克人工智能大語言模型(LLM)在資源受限邊緣設(shè)備部署的核心難題,為智能機器人、便攜設(shè)備等場景的實時AI應(yīng)用提供了創(chuàng)新解決方案。

  【儀表網(wǎng) 研發(fā)快訊】近日,中國科學(xué)院深圳先進(jìn)技術(shù)研究院醫(yī)學(xué)成像全國重點實驗室、醫(yī)工所醫(yī)學(xué)人工智能研究中心黃明強團(tuán)隊在大模型AI芯片領(lǐng)域取得重要進(jìn)展,其研究成果在電路與系統(tǒng)領(lǐng)域頂級期刊IEEE Transactions on Circuits and Systems I: Regular Papers上在線發(fā)表,論文題目為"EdgeLLM: A Highly Efficient CPU-FPGA Heterogeneous Edge Accelerator for Large Language Models"。該研究成功攻克人工智能大語言模型(LLM)在資源受限邊緣設(shè)備部署的核心難題,為智能機器人、便攜設(shè)備等場景的實時AI應(yīng)用提供了創(chuàng)新解決方案。
 
  自2017年以來,Transformer算法在自然語言處理和計算機視覺(CV)研究領(lǐng)域迅速成為人工智能領(lǐng)域的主導(dǎo)力量。通過引入自注意力機制,Transformer改變了傳統(tǒng)的序列建模方法,不再依賴卷積神經(jīng)網(wǎng)絡(luò)或循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取和序列處理。這一創(chuàng)新不僅增強了模型的并行化能力,使得大規(guī)模模型的訓(xùn)練成為可能,還顯著提升了模型性能。在Transformer取得成功之后,研究人員開始探索更大的模型,這些模型通常擁有數(shù)百億甚至更多的參數(shù),被稱為“大語言模型”。大語言模型不僅增強了人工智能的語言處理能力,還推動了AI更廣泛的技術(shù)進(jìn)步,為教育、娛樂、醫(yī)療和商業(yè)等行業(yè)帶來了革命性的變革。
 
  但是大語言模型在資源受限的端側(cè)系統(tǒng)部署仍存在較大的困難。首先,大語言模型計算量龐大以及內(nèi)存訪問需求極高。現(xiàn)有解決方案通常將這些權(quán)重參數(shù)量化為INT4格式。然而,為了確保計算精度,模型中的激活函數(shù)仍然保持FP16格式。因此,在前饋神經(jīng)網(wǎng)絡(luò)(FFN)層中,系統(tǒng)需要支持FP16INT4格式的矩陣乘法。另一方面,在多頭注意力(MHA)模塊中,KV緩存作為激活數(shù)據(jù)動態(tài)生成,因此涉及KV緩存的矩陣乘法需要FP16FP16格式。因此,設(shè)計混合精度計算單元以加速LLM變得尤為重要。我們分析了前饋網(wǎng)絡(luò)(FFN)和多頭注意力(MHA)的計算需求,提出了高效率的混合精度計算單元以及組脈動陣列架構(gòu)。此外,我們還提出了對數(shù)尺度結(jié)構(gòu)化稀疏性和塊級量化方法,以在硬件效率和算法精度之間取得平衡。
 
  此外,在大語言模型中,定義計算流程的算子圖極其復(fù)雜,包含數(shù)百甚至數(shù)千個以復(fù)雜方式相互連接的算子,確保從一個算子到另一個算子的過渡無縫且高效成為了一項重大挑戰(zhàn)。該團(tuán)隊分析了大語言模型中的編譯需求,設(shè)計了一種統(tǒng)一且通用的數(shù)據(jù)格式,適用于所有算子和AI算法中的高維張量結(jié)構(gòu),使系統(tǒng)能夠快速執(zhí)行算子操作而無需任何數(shù)據(jù)重排。隨后,開發(fā)了端到端的編譯方案,其中動態(tài)編譯用于處理不同輸入token長度,指令流水線策略用于減少延遲。該方案能夠動態(tài)編譯所有算子,并將整個模型映射到CPU-FPGA異構(gòu)系統(tǒng)上。
 
  最終,整個設(shè)計成功部署在AMDXilinx VCU128 FPGA上。與GPU相比,該系統(tǒng)的吞吐量提高了1.91倍,能效提高了7.55倍;與最先進(jìn)的FPGA加速器FlightLLM相比,整體性能提升了10%到24%。該成果有望應(yīng)用于新一代具身智能機器人、手機AI大模型等應(yīng)用場景中。
 
  中國科學(xué)院深圳先進(jìn)技術(shù)研究院黃明強研究員為第一作者,南方科技大學(xué)深港微電子學(xué)院為合作單位。該研究得到了醫(yī)學(xué)成像科學(xué)與技術(shù)系統(tǒng)全國重點實驗室、科技創(chuàng)新-2030重大科技項目的資助。

我要評論
文明上網(wǎng),理性發(fā)言。(您還可以輸入200個字符)

所有評論僅代表網(wǎng)友意見,與本站立場無關(guān)。

延伸閱讀
版權(quán)與免責(zé)聲明
  • 凡本網(wǎng)注明"來源:儀表網(wǎng)"的所有作品,版權(quán)均屬于儀表網(wǎng),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來源:儀表網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
  • 本網(wǎng)轉(zhuǎn)載并注明自其它來源的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內(nèi)容的真實性,不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品來源,并自負(fù)版權(quán)等法律責(zé)任。
  • 如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
  • 合作、投稿、轉(zhuǎn)載授權(quán)等相關(guān)事宜,請聯(lián)系本網(wǎng)。聯(lián)系電話:0571-87759945,QQ:1103027433。
廣告招商
今日換一換
新發(fā)產(chǎn)品更多+

客服熱線:0571-87759942

采購熱線:0571-87759942

媒體合作:0571-87759945

  • 儀表站APP
  • 微信公眾號
  • 儀表網(wǎng)小程序
  • 儀表網(wǎng)抖音號
Copyright ybzhan.cn    All Rights Reserved   法律顧問:浙江天冊律師事務(wù)所 賈熙明律師   儀表網(wǎng)-儀器儀表行業(yè)“互聯(lián)網(wǎng)+”服務(wù)平臺
意見反饋
我知道了
主站蜘蛛池模板: 超级h荡的辣文小说乱bh | 一级毛片在线播放免费 | 五月综合激情久久婷婷 | 日韩精品一| www永久免费视频 | 日韩久草视频 | 日批在线 | 亚洲久热 | 青草草在线视频 | 免费观看成人羞羞视频网站观看 | 青春草视频在线免费观看 | 色在线视频免费 | 成人网网址 | 五月婷婷在线观看 | 10周岁女全身裸无打码免费 | 污污视频网站免费 | 免费乱理伦片手机在线观看 | 第一页在线播放 | 波多野结衣一区二区 | 小明免费看视频 | 国产精品页| 全免费毛片在线播放 | 日韩在线aⅴ免费视频 | 老湿影院在线免费观看 | 欧美成人vr18sexvr | 欧美三级欧美成人高清www | 手机看片久久高清国产日韩 | 91精品久久久久久久久中文字幕 | 天天黄视频 | 国产成人精品日本亚洲11 | 久久在现 | 成年人污视频 | 成人资源在线 | 又黄又爽视频在线观看 | 永久免费看www色视频 | 久久久亚洲国产精品主播 | 日韩欧美91 | 中文字幕一区2区3区 | 国产激爽大片高清在线观看 | 欧美日本道免费二区三区 | 午夜视频精品 |