vllm/csrc/quantization/fp8 at ecdb462c2493cf9fd095e624cdfd8d62842e2097 - vllm

mirror of https://github.com/wassname/vllm.git synced 2026-07-01 16:38:30 +08:00

Files

T

Varun Sundar Rabindranath b5241e41d9 [ Kernel ] FP8 Dynamic-Per-Token Quant Kernel (#6511 )

Co-authored-by: Varun Sundar Rabindranath <varun@neuralmagic.com>

2024-07-18 01:38:35 +00:00

2024-05-22 07:18:41 +00:00

2024-05-22 07:18:41 +00:00

common.cu

2024-07-18 01:38:35 +00:00

fp8_marlin.cu

2024-07-03 17:38:00 +00:00