β± ν΄λΉ λͺ¨λΈμμ LlaMA3.2 1Bλ₯Ό Foundation λͺ¨λΈλ‘ νλ νκ΅μ΄ λ° νκ΅μ λ€μν
λ¬Ένμ μ μ©ν μ μλλ‘ νκΈ° μν΄
κ°λ° λμμΌλ©° μ체 μ μν 53κ° μμμ νκ΅μ΄ λ°μ΄ν°λ₯Ό νμ©νμ¬ νκ΅ μ¬ν κ°μΉμ
λ¬Ένλ₯Ό μ΄ν΄νλ λͺ¨λΈ μ λλ€. Thanks for ktdsβ
V0.2 Epoch=2
βΆ λͺ¨λΈ μ€λͺ
- λͺ¨λΈλͺ λ° μ£ΌμκΈ°λ₯: ν΄λΉ λͺ¨λΈμμ LlaMA3.2 1B λͺ¨λΈμ κΈ°λ°μΌλ‘ SFT λ°©μμΌλ‘ νμΈνλλ λͺ¨λΈμ λλ€. νκ΅μ΄μ νκ΅μ λ€μν λ¬Ένμ λ§₯λ½μ μ΄ν΄νλλ‘ μ€κ³λμμΌλ©° β¨β¨, μ체 μ μν 53κ° μμμ νκ΅μ΄ λ°μ΄ν°λ₯Ό νμ©ν΄ νκ΅ μ¬νμ κ°μΉμ λ¬Ένλ₯Ό λ°μν©λλ€. μ£Όμ κΈ°λ₯μΌλ‘λ ν μ€νΈ μμ±, λν μΆλ‘ , λ¬Έμ μμ½, μ§μμλ΅, κ°μ λΆμ λ° μμ°μ΄ μ²λ¦¬ κ΄λ ¨ λ€μν μμ μ μ§μνλ©°, νμ© λΆμΌλ λ²λ₯ , μ¬λ¬΄, κ³Όν, κ΅μ‘, λΉμ¦λμ€, λ¬Έν μ°κ΅¬ λ± λ€μν λΆμΌμμ μμ©λ μ μμ΅λλ€.
- λͺ¨λΈ μν€ν μ²: ν΄λΉ λͺ¨λΈμ LlaMA3.2 1B λͺ¨λΈμ κΈ°λ°μΌλ‘, νλΌλ―Έν° μλ 10μ΅ κ°(1B)λ‘ κ΅¬μ±λ κ³ μ±λ₯ μΈμ΄ λͺ¨λΈμ λλ€. μ΄ λͺ¨λΈμLlaMA3.2 1Bλ₯Ό νμ΄λ°μ΄μ λͺ¨λΈλ‘ μΌμ, SFT(μ§λ λ―ΈμΈ μ‘°μ ) λ°©μμ ν΅ν΄ νκ΅μ΄μ νκ΅ λ¬Ένμ νΉνλ μ±λ₯μ λ°ννλλ‘ νλ ¨λμμ΅λλ€. LlaMA3.2 1Bμ κ²½λνλ ꡬ쑰λ λΉ λ₯Έ μΆλ‘ μλμ λ©λͺ¨λ¦¬ ν¨μ¨μ±μ 보μ₯νλ©°, λ€μν μμ°μ΄ μ²λ¦¬ μμ μ μ ν©νκ² μ΅μ νλμ΄ μμ΅λλ€. μ΄ μν€ν μ²λ ν μ€νΈ μμ±, μ§μμλ΅, λ¬Έμ μμ½, κ°μ λΆμκ³Ό κ°μ λ€μν μμ μμ νμν μ±λ₯μ 보μ¬μ€λλ€.
β· νμ΅ λ°μ΄ν°
- ν΄λΉ λͺ¨λΈμμ μ체 κ°λ°ν μ΄ 3.6GB ν¬κΈ°μ λ°μ΄ν°λ₯Ό λ°νμΌλ‘ νμ΅λμμ΅λλ€. λͺ¨λ 233λ§ κ±΄μ QnA, μμ½, λΆλ₯ λ± λ°μ΄ν°λ₯Ό ν¬ν¨νλ©°, κ·Έ μ€ 133λ§ κ±΄μ 53κ° μμμ κ°κ΄μ λ¬Έμ λ‘ κ΅¬μ±λμμ΅λλ€. μ΄ μμμλ νκ΅μ¬, μ¬ν, μ¬λ¬΄, λ²λ₯ , μΈλ¬΄, μν, μλ¬Ό, 물리, νν λ±μ΄ ν¬ν¨λλ©°, Chain of Thought λ°©μμΌλ‘ νμ΅λμμ΅λλ€. λν 130λ§ κ±΄μ μ£Όκ΄μ λ¬Έμ λ νκ΅μ¬, μ¬λ¬΄, λ²λ₯ , μΈλ¬΄, μν λ± 38κ° μμμ κ±Έμ³ νμ΅λμμ΅λλ€. νμ΅ λ°μ΄ν° μ€ νκ΅μ μ¬ν κ°μΉμ μΈκ°μ κ°μ μ μ΄ν΄νκ³ μ§μν μ¬νμ λ°λΌ μΆλ ₯ν μ μλ λ°μ΄ν°λ₯Ό νμ΅νμμ΅λλ€.
- νμ΅ Instruction Datasets Format:
{"prompt": "prompt text", "completion": "ideal generated text"}
βΈ μ¬μ© μ¬λ‘
ν΄λΉ λͺ¨λΈμ λ€μν μμ© λΆμΌμμ μ¬μ©λ μ μμ΅λλ€. μλ₯Ό λ€μ΄:
- κ΅μ‘ λΆμΌ: μμ¬, μν, κ³Όν λ± λ€μν νμ΅ μλ£μ λν μ§μμλ΅ λ° μ€λͺ μμ±.
- λΉμ¦λμ€: λ²λ₯ , μ¬λ¬΄, μΈλ¬΄ κ΄λ ¨ μ§μμ λν λ΅λ³ μ 곡 λ° λ¬Έμ μμ½.
- μ°κ΅¬ λ° λ¬Έν: νκ΅ μ¬νμ λ¬Ένμ λ§μΆ μμ°μ΄ μ²λ¦¬ μμ , κ°μ λΆμ, λ¬Έμ μμ± λ° λ²μ.
- κ³ κ° μλΉμ€: μ¬μ©μμμ λν μμ± λ° λ§μΆ€ν μλ΅ μ 곡.
- μ΄ λͺ¨λΈμ λ€μν μμ°μ΄ μ²λ¦¬ μμ μμ λμ νμ©λλ₯Ό κ°μ§λλ€.
βΉ νκ³ ββ
- ν΄λΉ λͺ¨λΈμ νκ΅μ΄μ νκ΅ λ¬Ένμ νΉνλμ΄ μμΌλ, νΉμ μμ(μ: μ΅μ κ΅μ μλ£, μ λ¬Έ λΆμΌ)μ λ°μ΄ν° λΆμ‘±μΌλ‘ μΈν΄ λ€λ₯Έ μΈμ΄ λλ λ¬Ένμ λν μλ΅μ μ νμ±μ΄ λ¨μ΄μ§ μ μμ΅λλ€. λν, 볡μ‘ν λ Όλ¦¬μ μ¬κ³ λ₯Ό μꡬνλ λ¬Έμ μ λν΄ μ νλ μΆλ‘ λ₯λ ₯μ λ³΄μΌ μ μμΌλ©°, νΈν₯λ λ°μ΄ν°κ° ν¬ν¨λ κ²½μ° νΈν₯λ μλ΅μ΄ μμ±λ κ°λ₯μ±λ μ‘΄μ¬ν©λλ€.
βΊ μ¬μ© λ°©λ²
from transformers import AutoModel, AutoTokenizer
base_model = "SEOKDONG/llama3.2_1B_korean_v0.2_sft_by_aidx"
model = AutoModelForCausalLM.from_pretrained(base_LLM_model)
tokenizer = AutoTokenizer.from_pretrained(base_LLM_model)
from tqdm import tqdm
for i in tqdm(range(0,1)): #len(answer_list))):
input_text = """
λΉμ μ AI λΉμμ
λλ€. λ€μ μ§λ¬Έμ λ§λ λ΅λ³μ κ³ λ₯΄μΈμ. λ΅λ³μ 1,2,3,4 μ€μ νλλ§ μ ννμΈμ.
λ€μ μ€ νμνλ¬Όμ μΌμ’
μΌλ‘, ν¬λλΉμ μ΄μ€ κ²°ν©μΌλ‘ ꡬμ±λμ΄ μμΌλ©° μμ£Ό μ¬μ©λλ μ€νμ μ±λΆμ 무μμΈκ°?
μ νμ§: 1. μ
λ£°λ‘μ€μ€ 2. μλΉ 3. λ
Ήλ§ 4. κΈλ¦¬μ½κ² λ΅λ³:"""
inputs = tokenizer(input_text, return_tensors="pt")
inputs = inputs.to("cuda:0")
# 3. λͺ¨λΈμ μ¬μ©ν μΆλ‘
with torch.no_grad():
outputs = model.generate(**inputs, max_length=1024,temperature=0.1, do_sample=True, repetition_penalty=1.10)
# 4. κ²°κ³Ό λμ½λ©
result = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(result.split("λ΅λ³:")[1].strip())
κ²°κ³Ό: '2. μλΉμ
λλ€. μλΉμ ν¬λλΉμ΄ λ κ°μ μ΄μ€ κ²°ν©μΌλ‘ μ΄λ£¨μ΄μ§ ννλ‘ μ‘΄μ¬νλ©°, μ£Όλ‘ μ€νμ μ£Όμ μ±λΆμΌλ‘ μ¬μ©λ©λλ€.
μ
λ£°λ‘μ€μ€λ λ¨λ°±μ§, λ
Ήλ§μ μλ¬Όμ± λ¨λ°±μ§, κΈλ¦¬μ½κ²μ μ§λ°©κ³Ό κ΄λ ¨λ λ¨λ°±μ§λ‘, λͺ¨λ μ€νμ μ±λΆμ΄ μλλλ€. λ°λΌμ μ λ΅μ 2μ
λλ€.'
- Downloads last month
- 155
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social
visibility and check back later, or deploy to Inference Endpoints (dedicated)
instead.