金十數據3月3日訊,近日,聯想集團宣佈基於聯想問天WA7780 G3服務器,在行業內首次實現單機部署DeepSeek-R1/V3 671B大模型,以低於行業公認1TGB顯存(實際768GB)承載100併發用戶流暢體驗。據聯想實測數據顯示,在512 token標準測試環境下,該系統可支持100個併發用戶持續獲得每秒10 token的穩定輸出,首token響應時間壓縮至30秒內。
聯想AI服務器首次實現本地部署DeepSeek滿血大模型低於1TB,支持100併發
金十數據3月3日訊,近日,聯想集團宣佈基於聯想問天WA7780 G3服務器,在行業內首次實現單機部署DeepSeek-R1/V3 671B大模型,以低於行業公認1TGB顯存(實際768GB)承載100併發用戶流暢體驗。據聯想實測數據顯示,在512 token標準測試環境下,該系統可支持100個併發用戶持續獲得每秒10 token的穩定輸出,首token響應時間壓縮至30秒內。