AMD 推出自家首款小語言模型“Llama-135m”

天天見聞 2024-10-11 文化閱讀: 45

摘要: IT之家 9 月 29 日消息，AMD 在 Huggingface 平台公布了自家首款“小語言模型”AMD-Llama-135m，該模型具有推測解碼功能，擁有 6700 億個 token，采用 Apache 2.0 開源許可，IT之家附模型地址如下（點此訪問）。

IT之家 9 月 29 日消息，AMD 在 Huggingface 平台公布了自家首款“小語言模型”AMD-Llama-135m，該模型具有推測解碼功能，擁有 6700 億個 token，采用 Apache 2.0 開源許可，IT之家附模型地址如下（點此訪問）。

據介紹，這款模型主打“推測解碼”能力，其基本原理是使用小型草稿模型生成一組候選 token，然後由更大的目标模型進行驗證。這種方法允許每次前向傳遞生成多個 token，而不會影響性能，從而顯著減少 RAM 占用，實現效率提升。

AMD 表示，這款模型在四個 AMD Instinct MI250 節點訓練了六天，其“編程專用版本”變體 AMD-Llama-135m-code 則額外耗費了四天時間進行微調。

你可能想看：

電腦缺少XINPUT1_3.dll的解決方法，一鍵快速搞定XINPUT1_3.dll文件

如果你的電腦缺少XINPUT1_3.dll，很可能會導緻一些程序無法正常啟動。為了解決這個問題，并恢複程序的正常使用，下面列舉五種高效的修複方法幫助你解決XINPUT1_3.dll文件的缺失問題。這樣...

壹号顯卡 OneXGPU 2 首發 AMD RX 7800M：配備 Navi 32 GPU

IT之家 8 月 17 日消息，OnexPlayer 壹号掌機将推出一款外置顯卡，名為“OneXGPU 2”，首發搭載 AMD RX 7800M。

專業解讀：AMDFM2+ 7650k顯卡性能分析

在選擇一款顯卡時，了解其性能是非常重要的。今天我們将對AMDFM2+ 7650k顯卡進行性能分析，幫助大家更好地了解這款顯卡的特點和優勢。首先，讓我們來了解一下AMDFM2+ 7650k顯卡的基本參...

幹貨｜Marshall靜脈酒精消融：從技術提出到臨床實踐

六、VOM酒精消融臨床研究結果目前關于VOM酒精消融的大型臨床研究為數不多，其中較重要的是VENUS-AF研究（VOM酒精消融對初次消融的持續性房顫患者的作用）。51.3%；P實現二尖瓣周圍阻滞的VO...

它究竟有什麼魅力？引得市委書記在央視《對話》上親自打Call？

這次則是“被”推上央視的，東莞市委書記在節目上談及“城市創新牽引力”話題時，竟然隆重推薦慕思，為它打call。好奇心驅使下，我專門看了看2月27日的央視《對話》欄目。頗有意思的是，在這期《對話》節目中...

tags: amd 科技新聞

天天見聞