pomelk1n
/

RuadaptQwen2.5-32B-instruct-4-bit-AWQ-GEMM

Text Generation

4-bit precision

Model card Files Files and versions Community

pomelk1n commited on Nov 20, 2024

Commit

d4ffe59

·

verified ·

1 Parent(s): f588d07

Update README.md

Files changed (1) hide show

README.md +0 -2

README.md CHANGED Viewed

@@ -18,8 +18,6 @@ tags:
 Эта модель является квантизированной версией [RuadaptQwen2.5-32B-instruct](https://huggingface.co/msu-rcc-lair/RuadaptQwen2.5-32B-instruct), выполненной с использованием метода **Activation-aware Weight Quantization (AWQ)** и с помощью ядра **GEMM**.
-**AWQ (Activation-aware Weight Quantization)** — это метод квантизации весов моделей глубокого обучения, который сохраняет важные веса, основываясь на анализе активаций. Благодаря этому подходу достигается высокая точность даже при снижении разрядности до 4 бит.
 ## Конфигурация квантизации
 ```json

 Эта модель является квантизированной версией [RuadaptQwen2.5-32B-instruct](https://huggingface.co/msu-rcc-lair/RuadaptQwen2.5-32B-instruct), выполненной с использованием метода **Activation-aware Weight Quantization (AWQ)** и с помощью ядра **GEMM**.
 ## Конфигурация квантизации
 ```json