| 談天說地主旨 ﹝請按主旨作出回應﹞ | 寄件者 | 傳送日期
|
| [#1] AI 將不需要大量記憶體 Google 發表 TurboQuant 壓縮技術 記憶體加價潮或可 Google 最新發表 TurboQuant 記憶體壓縮技術,大幅降低人工智能運算所需硬件資源,觸發市場對儲存設備需求大減恐慌。美股儲存晶片類股股價周三應聲暴跌,惟多間華爾街投行看好效率提升將帶動更大規模應用,呼籲投資者趁機吸納。 壓縮技術效能驚人 Google 發表名為 TurboQuant 記憶體壓縮演算法,市場憂慮儲存硬件長期需求會大幅減少,觸發相關資產拋售潮。Google 團隊指出 TurboQuant 可在不影響準確度下,將大型語言模型執行時佔用快取記憶體減少最少 6 倍。開發團隊成功將鍵值快取無損壓縮至 3-bit,利用 Gemma 及 Mistral 等開源模型測試時,發現在 Nvidia H100 顯示卡上運作效能對比未量化 32-bit 方案最高提升 8 倍。目前人工智能軍備競賽極度依賴硬件規模擴張,任何削減實體記憶體採購量技術進步,均足以令估值偏高晶片類股面臨沉重沽壓。此項新技術將於下月 ICLR 2026 大會上正式發表。 科技界譽為神級突破 美股儲存晶片類股周三集體下挫,SanDisk 股價一度大跌 6.5%,Micron 亦跌 4%,Western Digital 與 Seagate 分別跌逾 4% 及 5%。市場情緒尾市略為平復,SanDisk 及 Micron 收市均跌逾 3.4%,Seagate 收跌 2.6%,Western Digital 跌幅收窄至 1.6%。當日儲存晶片與硬件供應鏈指數收報 113.03 點,原文出自 unwire.hk, 盤中曾低見 109 點。 投資機構從更長遠經濟學角度重新評估 TurboQuant 影響。Morgan Stanley 分析報告指出,TurboQuant 只作用於推理階段鍵值快取,完全不影響模型訓練任務,亦不影響模型權重佔用高頻寬記憶體(HBM)。Morgan Stanley 引用「傑文斯悖論」(Jevons Paradox)解釋,技術效率提升往往降低使用成本,從而激發更龐大總需求。TurboQuant 大幅降低單次查詢服務成本,能讓原本只能在雲端昂貴伺服器上運作模型遷移至本地,有效降低人工智能規模化部署門檻。投行總結效率提升將重塑人工智能部署成本曲線,對算力與記憶體硬件長期影響呈現「中性偏正面」訊號。 資料來源:Tom’s Hardware 原文出自 unwire.hk |
vestbar 58.xxx.xxx.222 |
2026-03-27 09:20 | |
|
|
|||
| [#2] AI 將不需要大量記憶體 Google 發表 TurboQuant 壓縮技術 記憶體加價潮或可 有跟開美股的就知呢三隻升都顛左 Seagate Western Digital Sandisk 光 就接力上, 無懼打仗 |
Chia 58.xxx.xxx.223 |
2026-03-27 09:24 |
| [#3] AI 將不需要大量記憶體 Google 發表 TurboQuant 壓縮技術 記憶體加價潮或可 https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/ seems to be KV cache compression only... 最後修改時間: 2026-03-27 15:06:30 |
iku000 46.xxx.xxx.7 |
2026-03-27 14:50 |
| 按照傳送日期顯示: |