jujbob commited on
Commit
4bc24d3
·
verified ·
1 Parent(s): 4a07ea9

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +8 -18
README.md CHANGED
@@ -9,30 +9,30 @@ tags: []
9
  </a>
10
 
11
  # Update!
12
- * [2024.12.12] 추가설명: 저희는 KMMLU, KoBEST, LogicKor 등 벤치 관련 학습/테스트/유사 데이터를 전혀 사용하지 않았습니다. 저런거 증강해가 쓰까서 학습하면 SOTA 성능 근접하게 나옵니다 모델위에 해보세요!
13
  * [2024.12.06] Bllossom-5B 모델 최초 업데이트!
14
 
15
 
16
- # Bllossom [Inference-Code-Link](https://drive.google.com/file/d/1AoxfoV0TSN-pGdc9fa3dRv3-NLZknHlJ/view?usp=sharing) [Tuning-Code-Link](https://drive.google.com/file/d/1AoxfoV0TSN-pGdc9fa3dRv3-NLZknHlJ/view?usp=sharing)
17
 
18
  ```bash
19
  저희 Bllossom 팀에서 llama3.2-3B 기반의 한국어-영어 언어모델 Bllossom-AICA-5B를 공개합니다.
20
  이번 Bllossom-AICA는 다음과 같은 특징을 보입니다.
21
- - 일반 언어모델, 시각-언어모델 양방향으로 활용이 가능한 최초의 llama기반 3B확장 모델입니다. (코랩 무료 GPU에서 사용가능한 유일한 한국어)
22
  - 이미지를 넣으면 시각-언어모델, 넣지 않으면 언어모델로 작동하며 시각-언어, 그냥 언어모델 양방향모두 학습 및 추론이 가능합니다.
23
- - 시각 정보의 이해를 바탕으로 언어모델의 성능이 대폭 향상되었습니다. (정성평가 기준 Bllossom-3.2-3B모델 대비 15%이상)
24
  - 한국어 OCR, 표, 그래프 해석에 최적화 되어있습니다.
25
  - 외부지식에 대한 선택적 추론 기능이 학습되었습니다. RAG를 활용할 때 질문과 관련 없는 오류가 섞인 정보의 경우 모델 스스로 활용하지 않습니다.
26
 
27
  해당 모델에 활용된 데이터는 다음과 같습니다.
28
- - Huggingface에 공개된 한국어 사전학습 데이터를 거의 모두 활용해 Full tuning 했습니다.
29
  - AI-Hub, KISTI AI데이터, Huggingface에 공개된 거의 모든 한국어 시각-언어 관련 학습데이터를 활용해 시각-언어모델 사전학습을 했습니다. (다 나열하기 너무 많아요...)
30
  - 저희 연구실에서 자체 제작한 한국어 Document 관련 시각-언어 Instruction Tuning데이터를 활용했습니다.
31
 
32
  언제나 그랬듯 해당 모델은 상업적 이용이 가능합니다.
33
 
34
  1. Bllossom-AICA의 외부지식 지식추론 기능은 COLING2025에 발표될 예정입니다.
35
- 2. 좋은 언어모델 계속 업데이트 하겠습니다!! 한국어 강화를위해 공동 연구하실분(특히논문) 언제든 환영합니다!!
36
  ```
37
 
38
  ```bash
@@ -47,16 +47,6 @@ We, the Bllossom team, are pleased to announce the release of Bllossom-Vision, a
47
 
48
  ## Demo Video
49
 
50
- <div style="display: flex; justify-content: space-between;">
51
- <!-- 첫 번째 컬럼 -->
52
- <div style="width: 49%;">
53
- <a>
54
- <img src="https://github.com/lhsstn/lhsstn/blob/main/x-llava_dem.gif?raw=true" style="width: 100%; height: auto;">
55
- </a>
56
- <p style="text-align: center;">Bllossom-V Demo</p>
57
- </div>
58
- </div>
59
-
60
  <div style="display: flex; justify-content: space-between;">
61
  <!-- 두 번째 컬럼 -->
62
  <div style="width: 100%;">
@@ -67,9 +57,9 @@ We, the Bllossom team, are pleased to announce the release of Bllossom-Vision, a
67
  </div>
68
  </div>
69
 
70
- **[YouTube Tutorial](https://youtu.be/4lAUVwTN608)**
71
 
72
- ## LogicKor Score
 
73
  | Category | Single turn | Multi turn |
74
  |---|---|---|
75
  | 추론(Reasoning) | 6.57 | 5.29 |
 
9
  </a>
10
 
11
  # Update!
12
+ * [2024.12.12] 추가설명: KMMLU, KoBEST, LogicKor 등 벤치 관련 학습/테스트/유사 데이터를 전혀 사용하지 않았습니다. 벤치데이터 증강해가 쓰까서 학습하면 SOTA 성능 근접하게 나옵니다 모델위에 해보세요!
13
  * [2024.12.06] Bllossom-5B 모델 최초 업데이트!
14
 
15
 
16
+ # Bllossom [추론코드예제](https://drive.google.com/file/d/1AoxfoV0TSN-pGdc9fa3dRv3-NLZknHlJ/view?usp=sharing) | [학습코드예제](https://drive.google.com/file/d/1E_fYV-tUhl1LExm2piaIhvXfuOcNaZmP/view?usp=sharing) | [튜토리얼 영상](https://youtu.be/4lAUVwTN608)
17
 
18
  ```bash
19
  저희 Bllossom 팀에서 llama3.2-3B 기반의 한국어-영어 언어모델 Bllossom-AICA-5B를 공개합니다.
20
  이번 Bllossom-AICA는 다음과 같은 특징을 보입니다.
21
+ - 일반 언어모델, 시각-언어모델 양방향으로 활용이 가능한 최초의 llama기반 3B확장 모델입니다. (코랩 무료 GPU에서 사용가능한 유일한 시각-언어 한국어 )
22
  - 이미지를 넣으면 시각-언어모델, 넣지 않으면 언어모델로 작동하며 시각-언어, 그냥 언어모델 양방향모두 학습 및 추론이 가능합니다.
23
+ - 시각 정보의 이해를 바탕으로 언어모델의 성능이 대폭 향상되었습니다. (정성평가 기준 Bllossom-3.2-3B모델 대비 20%이상)
24
  - 한국어 OCR, 표, 그래프 해석에 최적화 되어있습니다.
25
  - 외부지식에 대한 선택적 추론 기능이 학습되었습니다. RAG를 활용할 때 질문과 관련 없는 오류가 섞인 정보의 경우 모델 스스로 활용하지 않습니다.
26
 
27
  해당 모델에 활용된 데이터는 다음과 같습니다.
28
+ - Huggingface에 공개된 한국어 LLM 사전학습 데이터를 거의 모두 활용해 Full tuning 했습니다.
29
  - AI-Hub, KISTI AI데이터, Huggingface에 공개된 거의 모든 한국어 시각-언어 관련 학습데이터를 활용해 시각-언어모델 사전학습을 했습니다. (다 나열하기 너무 많아요...)
30
  - 저희 연구실에서 자체 제작한 한국어 Document 관련 시각-언어 Instruction Tuning데이터를 활용했습니다.
31
 
32
  언제나 그랬듯 해당 모델은 상업적 이용이 가능합니다.
33
 
34
  1. Bllossom-AICA의 외부지식 지식추론 기능은 COLING2025에 발표될 예정입니다.
35
+ 2. 3B기반 모델이 이정도면 8B기반 모델은 어느정도인지 궁금하지 않으세요? 좋은 언어모델 계속 업데이트 하겠습니다!!
36
  ```
37
 
38
  ```bash
 
47
 
48
  ## Demo Video
49
 
 
 
 
 
 
 
 
 
 
 
50
  <div style="display: flex; justify-content: space-between;">
51
  <!-- 두 번째 컬럼 -->
52
  <div style="width: 100%;">
 
57
  </div>
58
  </div>
59
 
 
60
 
61
+ ## LogicKor Score
62
+ *(LogicKor 관련 데이터 추가학습하면 8점 후반까지도 나옵니다... 필요하신분은 추가 학습해보세요.)
63
  | Category | Single turn | Multi turn |
64
  |---|---|---|
65
  | 추론(Reasoning) | 6.57 | 5.29 |