Spaces:

k2-fsa
/

text-to-speech

Running

App Files Files Community

csukuangfj commited on 3 days ago

Commit

85a7cc4

1 Parent(s): c6ae40d

add kokoro

Browse files

Files changed (2) hide show

model.py +46 -0
requirements.txt +1 -1

model.py CHANGED Viewed

@@ -119,6 +119,51 @@ def _get_vits_ljs(repo_id: str, speed: float) -> sherpa_onnx.OfflineTts:
     return tts
 @lru_cache(maxsize=10)
 def _get_vits_piper(repo_id: str, speed: float) -> sherpa_onnx.OfflineTts:
     data_dir = "/tmp/espeak-ng-data"
@@ -548,6 +593,7 @@ chinese_models = {
 }
 english_models = {
     "csukuangfj/vits-piper-en_US-glados|1 speaker": _get_vits_piper,
     "csukuangfj/vits-piper-en_GB-southern_english_male-medium|8 speakers": _get_vits_piper,
     "csukuangfj/vits-piper-en_GB-southern_english_female-medium|6 speakers": _get_vits_piper,

     return tts
+@lru_cache(maxsize=10)
+def _get_kokoro(repo_id: str, speed: float) -> sherpa_onnx.OfflineTts:
+    assert repo_id in ("csukuangfj/kokoro-en-v0_19",)
+    data_dir = "/tmp/espeak-ng-data"
+    repo_id = repo_id.split("|")[0]
+    model = get_file(
+        repo_id=repo_id,
+        filename="model.onnx",
+        subfolder=".",
+    )
+    tokens = get_file(
+        repo_id=repo_id,
+        filename="tokens.txt",
+        subfolder=".",
+    )
+    voices = get_file(
+        repo_id=repo_id,
+        filename="voices.bin",
+        subfolder=".",
+    )
+    tts_config = sherpa_onnx.OfflineTtsConfig(
+        model=sherpa_onnx.OfflineTtsModelConfig(
+            kokoro=sherpa_onnx.OfflineTtsKokoroModelConfig(
+                model=model,
+                voices=voices,
+                tokens=tokens,
+                data_dir=data_dir,
+                length_scale=1.0 / speed,
+            ),
+            provider="cpu",
+            debug=True,
+            num_threads=2,
+        ),
+        max_num_sentences=1,
+    )
+    tts = sherpa_onnx.OfflineTts(tts_config)
+    return tts
 @lru_cache(maxsize=10)
 def _get_vits_piper(repo_id: str, speed: float) -> sherpa_onnx.OfflineTts:
     data_dir = "/tmp/espeak-ng-data"
 }
 english_models = {
+    "csukuangfj/kokoro-en-v0_19": _get_kokoro | 11,
     "csukuangfj/vits-piper-en_US-glados|1 speaker": _get_vits_piper,
     "csukuangfj/vits-piper-en_GB-southern_english_male-medium|8 speakers": _get_vits_piper,
     "csukuangfj/vits-piper-en_GB-southern_english_female-medium|6 speakers": _get_vits_piper,

requirements.txt CHANGED Viewed

@@ -1,4 +1,4 @@
-https://huggingface.co/csukuangfj/sherpa-onnx-wheels/resolve/main/cpu/1.10.37/sherpa_onnx-1.10.37-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl
 #sherpa-onnx>=1.10.37
 soundfile

+https://huggingface.co/csukuangfj/sherpa-onnx-wheels/resolve/main/cpu/1.10.39/sherpa_onnx-1.10.39-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl
 #sherpa-onnx>=1.10.37
 soundfile