neavo/keyword_gacha_base_multilingual

通过针对性的预训练，本系列模型：
- 对 轻小说、游戏脚本、漫画脚本 等故事性文本内容具有极好的理解能力
- 特别是 剑与魔法、超能力战斗、异世界冒险 等常见的 ACG 题材的故事内容
AND NSFW IS OK
支持多种语言
- 目前已针对以下语言进行了预训练：中文、英文、日文、韩文
- 未来计划针对以下语言进行预训练：俄文
目前我们提供以下预训练模型：

模型	版本	说明
keyword_gacha_base_multilingual	20241212	基础模型
keyword_gacha_ner_multilingual	20241212	预训练实体识别模型

在 Base 模型的基础上，使用了大约 50000 条合成语料进行 NER 任务的微调
与人工校对的实体词语表进行对比，可以达到 90%-95% 的实际准确率
- 与 KeywordGacha 搭配使用时
- 实际任务环境中的实测数据，并非预设测试集上的 F1 Score 这类理论上的指标
训练参数如下：
- Batch Size : 48
- Gradient Accumulation Steps : 2
- Total Batch Size : 96
- Learing Rate : 1e-5
- Maximum Sequence Length : 256
- Optimizer : ademamix_8bit
- Warnup Ratio : 0.1
- Train Precision : bf16
- Max Train Epochs : 20
使用说明
- 待补充