vllm/csrc/quantization/gptq_marlin at 2385b60d8300ce730ae67d9ea945f06de9ec4e21 - vllm

mirror of https://github.com/wassname/vllm.git synced 2026-07-03 17:17:01 +08:00

Files

T

ElizaWszola b00b33d77e [Model][Quantization] HQQ support through Marlin kernel expansion (#9766 )

Signed-off-by: ElizaWszola <eliza@neuralmagic.com>

2024-11-19 13:31:12 -08:00

awq_marlin_repack.cu

2024-10-03 22:55:25 -04:00

gptq_marlin_repack.cu

2024-10-03 22:55:25 -04:00

gptq_marlin.cu

2024-11-19 13:31:12 -08:00

marlin_dtypes.cuh

2024-07-21 19:41:42 -04:00

marlin.cuh

2024-07-21 19:41:42 -04:00