Create README.md
Browse files
README.md
ADDED
@@ -0,0 +1,66 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
license: mit
|
3 |
+
---
|
4 |
+
|
5 |
+
# bge-m3.gguf
|
6 |
+
|
7 |
+
```py
|
8 |
+
import torch
|
9 |
+
from llama_cpp import Llama
|
10 |
+
from sentence_transformers import SentenceTransformer
|
11 |
+
from scipy.spatial.distance import cosine
|
12 |
+
|
13 |
+
model = SentenceTransformer(
|
14 |
+
"BAAI/bge-m3",
|
15 |
+
model_kwargs={"torch_dtype": torch.float16}
|
16 |
+
)
|
17 |
+
llm = Llama.from_pretrained(
|
18 |
+
"mykor/bge-m3.gguf",
|
19 |
+
filename="bge-m3-567M-F16.gguf",
|
20 |
+
embedding=True,
|
21 |
+
verbose=False,
|
22 |
+
)
|
23 |
+
|
24 |
+
text = """μμΈ λ¬λ μ΄κΉ¨λ₯Ό λ°λΌμ λ€μ μ λ¬Όμ΄κ°λ μ€λμ λ
|
25 |
+
λ°€μ΄ μ‘°μ©ν λλ₯Ό μμΌλ©΄ 무λμ Έκ°λ λ μμ΄λ²λ¦΄ μ μμ΄
|
26 |
+
μ λ°λ μ€λμ ν¬λ§ μμ λ΄μΌμ ꡬλ¦μ λ리μ°κ³
|
27 |
+
λ€μ κΉμ μ μ λΉ μ Έλ€μ΄, κ·Έλ μ μν μ°μ΅μΈ κ²μ²λΌ
|
28 |
+
|
29 |
+
μ§λ¦¬μ§λ μκ³ λλ₯Ό μ²λ°©νλ λ§μ½μ΄λΌλ λ§
|
30 |
+
νμ λκ°μ 맀μΌμ λ΄μ±μ΄ λμ΄ λ΄μΌμ μ΄μ§λ¬μ΄ 무λλ¨λ €
|
31 |
+
|
32 |
+
μ°λΌλ¦° λ μ μ°λΌλ¦° λλ₯Ό μΌν€μ§ λͺ»ν΄ λ±μ΄λ΄κ³ μΆμλ λ°€
|
33 |
+
μλ―Έλ μμ΄ κ±΄λ¨ μμ μ λ§, μΆλ½μ ν₯ν΄ μ¬λΌκ°λ λ λ§λ€μ΄
|
34 |
+
κ·Έλ¦¬μ΄ λ μ λλ¦¬μ΄ λ§μ΄ μλ¦λ€μ λ λ λ€μ λ§μΉ ν κΉ λ΄
|
35 |
+
μμ΄λ²λ¦΄κ², λμ κ°κ³
|
36 |
+
|
37 |
+
ν©μ΄μ Έ μ¬λΌμ§ λ―ν κ·Έλ ν무νκ³ μ λ¬ν κ½λ§μΈ
|
38 |
+
λͺ¨μ§κ² λ΄λ¦° λλ¬Όμ μ 겨 νΌμ§ λͺ»νκ³ λ©μΆ°μμ§λ§
|
39 |
+
μ°¨λμ°¬ μ² κΈΈ μμ λμ¬ λμκ° λ°©ν₯μ λͺ¨λ₯Ό λΏμ΄μΌ
|
40 |
+
λ΄κ° κ·Έλ λ μμ κ·Έλ¬λͺ¨μ λ μΌμ κ½ ν λ΄μΌμ λΉμΆκ² ν΄μ€
|
41 |
+
|
42 |
+
λ©λ§λ₯Έ κ½μμ΄ μ½μ§ λͺ»ν μ€λμ κ°νΌλ₯Ό κ½μμ
|
43 |
+
λ μ΄μ κ·Έλ μ½μ§ λͺ»νλ λλ κ·Έμ μ€λμ λμ 맀λ¬λ¦΄ λΏ
|
44 |
+
|
45 |
+
μ°¬λν λ μ μ°¬λν κ·Έλ μ°¨λ§ λΉμΆμ§ λͺ»νκ³ μ€λ¬μ Έκ°λ λ―
|
46 |
+
μ¬μ₯μ λμ§μ΄λ΄ νκ» μ리μ³λ κ²°λ§μ ν₯ν΄ μΆλ½νλ μ°λ¦¬κ° μμ΄
|
47 |
+
κ·Έλ¦¬μ΄ λ μ λλ¦¬μ΄ λ§μ΄ λ΄μΌμ‘°μ°¨ νλ½νμ§ μλλ€ ν΄λ
|
48 |
+
μμ§ μμκ², λ λ κ°λ λ κΉμ§
|
49 |
+
|
50 |
+
νΌμ΄λκ³ νΌμ΄λλ μλ€μ΄λ²λ¦¬λ μ¬νμ΄λ κ½
|
51 |
+
μ§μ΄μ Έλ§ κ°λ κ·Έλμ μνμ΄ λ§μ§λ§μ ν₯ν΄ κ½μ νΌμλ΄κ³ μμ΄
|
52 |
+
κ³ λ§μ μ΄, λ―Έμνμ΄, μμμ κ°λ νμ κ½λ€λ°κ³Ό
|
53 |
+
λλ₯Ό λ λκ°λ κ±Έ
|
54 |
+
|
55 |
+
μ¬μ€μ λλ μμμ, μ΄μκ°κ³ μΆμ΄, λ°λ €λλ μ λ§μ 묻ν μ¬λΌμ§λ
|
56 |
+
μν μ€λκ³Ό λλ €μ΄ λ΄μΌ κ·Έ μ¬μ΄μ μ΄λμ λ€κ° λ€μ΄μμ΄
|
57 |
+
μ°λΌλ¦° λ μ μ°¬λν λ€κ° λ΄κ² μ΄μμμ΄μ€μ κ·Έμ κ³ λ§λ€κ³
|
58 |
+
μμ§ μμκ² μμν"""
|
59 |
+
embed1 = model.encode(text)
|
60 |
+
embed2 = llm.embed(text)
|
61 |
+
print(cosine(embed1, embed2))
|
62 |
+
```
|
63 |
+
|
64 |
+
```sh
|
65 |
+
2.879617546280855e-05
|
66 |
+
```
|