grapevine-AI commited on
Commit
1f3e430
·
verified ·
1 Parent(s): a5d9c3a

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +29 -3
README.md CHANGED
@@ -1,3 +1,29 @@
1
- ---
2
- license: apache-2.0
3
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: apache-2.0
3
+ ---
4
+ # What is this?
5
+ 投機的デコードに活用できるQwen2.5-Coderの超小型モデル[Qwen2.5-Coder-0.5B-Instruct](https://huggingface.co/Qwen/Qwen2.5-Coder-0.5B-Instruct)を日本語imatrixで量子化したものです。
6
+
7
+ # imatrix dataset
8
+ 日本語能力を重視し、日本語が多量に含まれる[TFMC/imatrix-dataset-for-japanese-llm](https://huggingface.co/datasets/TFMC/imatrix-dataset-for-japanese-llm)データセットを使用しました。<br>
9
+ なお、imatrixの算出においてはf32精度のモデルを使用しました。これは、本来の数値精度であるbf16でのimatrix計算に現行のCUDA版llama.cppが対応していないためです。
10
+
11
+ # Chat template
12
+ ```
13
+ <|im_start|>system
14
+ ここにSystem Promptを書きます。<|im_end|>
15
+ <|im_start|>user
16
+ ここにMessageを書きます。<|im_end|>
17
+ <|im_start|>assistant
18
+
19
+
20
+ ```
21
+
22
+ # Environment
23
+ Windows版llama.cpp-b4170およびllama.cpp-b3472同時リリースのconvert-hf-to-gguf.pyを使用して量子化作業を実施しました。
24
+
25
+ # License
26
+ Apache 2.0
27
+
28
+ # Developer
29
+ Alibaba Cloud