千问提交第一版,14layers,使用 alpaca 英文数据集 + 中文数据集进行 distill + sft