docs: update README
Browse files
README.md
CHANGED
@@ -2,6 +2,8 @@
|
|
2 |
license: apache-2.0
|
3 |
language:
|
4 |
- ru
|
|
|
|
|
5 |
datasets:
|
6 |
- d0rj/OpenOrca-ru
|
7 |
- d0rj/dolphin-ru
|
@@ -16,7 +18,7 @@ inference:
|
|
16 |
top_k: 3
|
17 |
repetition_penalty: 1.2
|
18 |
temperature: 1.07
|
19 |
-
max_new_tokens:
|
20 |
widget:
|
21 |
- text: <SC6>Ты - помощник ИИ. Тебе дадут задание. Ты должен дать подробный и длинный ответ. Придумай сказку про красную лягушку<extra_id_0>
|
22 |
example_title: Сочинить
|
@@ -30,7 +32,9 @@ widget:
|
|
30 |
|
31 |
> 🚧 WIP, still training...
|
32 |
|
33 |
-
Модель, обучаемая на инструктивном датасете. Пока что инструкциям следует не
|
|
|
|
|
34 |
|
35 |
## Usage
|
36 |
|
@@ -48,4 +52,10 @@ pipe('<SC6>Придумай сказку про красную лягушку<ex
|
|
48 |
|
49 |
Пока что можно следить за обучением [здесь на WandB](https://wandb.ai/d0rj/fred-t5-instruct).
|
50 |
|
|
|
|
|
|
|
|
|
|
|
|
|
51 |
Учится в Kaggle на одной P100. Медленно, но верно (лосс падает, а большего мне и не надо).
|
|
|
2 |
license: apache-2.0
|
3 |
language:
|
4 |
- ru
|
5 |
+
tags:
|
6 |
+
- instruct
|
7 |
datasets:
|
8 |
- d0rj/OpenOrca-ru
|
9 |
- d0rj/dolphin-ru
|
|
|
18 |
top_k: 3
|
19 |
repetition_penalty: 1.2
|
20 |
temperature: 1.07
|
21 |
+
max_new_tokens: 250
|
22 |
widget:
|
23 |
- text: <SC6>Ты - помощник ИИ. Тебе дадут задание. Ты должен дать подробный и длинный ответ. Придумай сказку про красную лягушку<extra_id_0>
|
24 |
example_title: Сочинить
|
|
|
32 |
|
33 |
> 🚧 WIP, still training...
|
34 |
|
35 |
+
Модель, обучаемая на инструктивном датасете. Пока что инструкциям следует не очень.
|
36 |
+
|
37 |
+
Веса лежат вместе с состоянием оптимизатора, шедулера и Trainer'а.
|
38 |
|
39 |
## Usage
|
40 |
|
|
|
52 |
|
53 |
Пока что можно следить за обучением [здесь на WandB](https://wandb.ai/d0rj/fred-t5-instruct).
|
54 |
|
55 |
+
### Data
|
56 |
+
|
57 |
+
Сконкатенировано из разных переведённых инструктивных датасетов. Всего 7506075 примеров system_prompt-question-answer.
|
58 |
+
|
59 |
+
### Resources
|
60 |
+
|
61 |
Учится в Kaggle на одной P100. Медленно, но верно (лосс падает, а большего мне и не надо).
|