国产综合久久久久-狠狠色噜噜狠狠狠狠av-国产女人乱人伦精品一区二区-亚洲a∨国产av综合av下载-爱做久久久久久

首頁 > 期刊 > 自然科學與工程技術 > 信息科技 > 電子信息科學綜合 > 計算機工程與科學 > 3D-MMA:基于3D集成電路的矩陣乘加速結構 【正文】

3D-MMA:基于3D集成電路的矩陣乘加速結構

王吉軍; 郝子宇; 李宏亮 江南計算技術研究所; 江蘇無錫214083
  • 3d集成電路
  • 矩陣乘
  • 分塊算法
  • 性能模型

摘要:脈動陣列結構規整、吞吐量大,適合矩陣乘算法,廣泛用于設計高性能卷積、矩陣乘加速結構。在深亞微米工藝下,通過增大陣列規模來提升芯片計算性能,會導致頻率下降、功耗劇增等問題。因此,結合3D集成電路技術,提出了一種將平面脈動陣列結構映射到3D集成電路上的雙精度浮點矩陣乘加速結構3D-MMA。首先,設計了針對該結構的分塊映射調度算法,提升矩陣乘計算效率;其次,提出了基于3D-MMA的加速系統,構建了3D-MMA的性能模型,并對其設計空間進行探索;最后,評估了該結構實現代價,并同已有先進加速器進行對比分析。實驗結果表明,訪存帶寬為160 GB/s時,采用4層16×16脈動陣列的堆疊結構時,3D-MMA計算峰值性能達3 TFLOPS,效率達99%,且實現代價小于二維實現。在相同工藝下,同線性陣列加速器及K40 GPU相比,3D-MMA的性能是后者的1.36及1.92倍,而面積遠小于后者。探索了3D集成電路在高性能矩陣乘加速器設計中的優勢,對未來進一步提升高性能計算平臺性能具有一定的參考價值。

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

投稿咨詢 文秘咨詢

計算機工程與科學

  • 預計1-3個月 預計審稿周期
  • 0.79 影響因子
  • 計算機 快捷分類
  • 月刊 出版周期

主管單位:國防科技大學;主辦單位:國防科技大學計算機學院

我們提供的服務

服務流程: 確定期刊 支付定金 完成服務 支付尾款 在線咨詢
主站蜘蛛池模板: 国内少妇高清露脸精品视频| 免费国产精品视频在线| 国产美女视频国产视视频| 又色又爽又黄还免费毛片96下载| 亚洲国产果冻传媒av在线观看| 久久精品国产最新地址| 欧美v国产v亚洲v日韩九九| 久久精品成人免费国产片| 狠狠色噜噜狠狠狠8888米奇 | 国产精品福利一区二区| 国产成人午夜福利免费无码r | 中文字幕日本人妻久久久免费| 国产精品久久久久一区二区三区| 久久精品蜜芽亚洲国产av| 久久香蕉国产线看观看怡红院妓院| 日日碰狠狠躁久久躁96avv| 国产成人精品白浆久久69| 国产精品无码av无码| 日本高清无卡码一区二区久久| 无码aⅴ精品一区二区三区浪潮| 天天摸天天做天天爽水多| 精品无码午夜福利电影片| 久久久久久久久久久久中文字幕 | 日日躁夜夜躁狠狠躁| 国产精品毛片a∨一区二区三区 | 人人妻人人澡人人爽精品日本| 丰满少妇被猛烈进入| 亚洲愉拍自拍欧美精品| 国产午夜福利在线观看红一片| 国产熟妇与子伦hd| 巨熟乳波霸若妻在线播放| 欧美激情综合五月色丁香| 国产精品盗摄!偷窥盗摄| a毛片免费全部播放| 337p日本欧洲亚洲大胆张筱雨| 成人福利视频| 日韩超碰人人爽人人做人人添 | 少妇特黄a片一区二区三区| 伊人久久大香线蕉av一区二区 | 已婚少妇美妙人妻系列| 国产精品久久久久蜜芽|