second-state
/

All-MiniLM-L6-v2-Embedding-GGUF

Feature Extraction

sentence-transformers

sentence-similarity

Inference Endpoints

Model card Files Files and versions Community

juntaoyuan commited on May 1, 2024

Commit

544f204

·

verified ·

1 Parent(s): b2a6536

Update README.md

Files changed (1) hide show

README.md +3 -1

README.md CHANGED Viewed

@@ -32,13 +32,15 @@ tags:
 - Context size: `384`
 - Run as LlamaEdge service
   ```bash
   wasmedge --dir .:. --nn-preload default:GGML:AUTO:all-MiniLM-L6-v2-ggml-model-f16.gguf \
     llama-api-server.wasm \
     --prompt-template llama-2-chat \
-    --ctx-size 384 \
     --model-name all-MiniLM-L6-v2
   ```

 - Context size: `384`
+- Vector size: `256`
 - Run as LlamaEdge service
   ```bash
   wasmedge --dir .:. --nn-preload default:GGML:AUTO:all-MiniLM-L6-v2-ggml-model-f16.gguf \
     llama-api-server.wasm \
     --prompt-template llama-2-chat \
+    --ctx-size 256 \
     --model-name all-MiniLM-L6-v2
   ```