README.md · AkitoP/GPT-SoVITS-JA-H at 5b9d124393fba6abdbd3db7c17695c1253cf874b

metadata

license: apache-2.0

✨ 概要: このモデルは　OfficialのPretrained GPT Modelを基に、約650時間分のHシーンボイス（喘ぎ声を除く）でFinetuneされたモデルです。このモデルは、一般的な日本語能力と特定の「そういう」シーンの読み上げ能力において顕著な向上を達成していたと思います。

🔧 トレーニング詳細:

🖥️ ハードウェア: RTX-4090 x 1

⏳ トレーニング時間: 16時間

🔄 エポック数: DPOなしで15エポック、DPOありで2エポック

📈 今後の計画: https://huggingface.co/AkitoP/GPT-SoVITS-JA-ProsodyControl_model　での日本語特化版GPT-SoVITSにおけるFinetune作業も予定しています。この作業を通じて、モデルのさらなる改善を目指します。

🎯 目標: このモデルを用いることで、より自然で感情的な読み上げが可能となり、特に「そういう」シーンにおけるパフォーマンスが大きく向上することを目指しています。

✨ 概要：这个模型是基于官方预训练的GPT模型，通过大约650小时的H场景声音（除去喘息声）进行Fine-tune得到的。我们认为，这个模型在通用日语能力和特定“那种”场景的朗读能力方面都有显著的提升。

🔧 训练详情：

🖥️ 硬件：RTX-4090 x 1

⏳ 训练时间：16小时

🔄 迭代次数：无DPO训练15个epoch，使用DPO训练2个epoch

📈 未来计划：也计划在https://huggingface.co/AkitoP/GPT-SoVITS-JA-ProsodyControl_model 进行针对日语的GPT-SoVITS特化版本的Fine-tune工作。通过这项工作，我们旨在进一步改善模型。

🎯 目标：使用这个模型，我们的目标是实现更自然、更富有情感的朗读能力，特别是在“那种”场景下，大幅提升性能。