Cly's picture

1 1

Cly

Akikaaa

AI & ML interests

None yet

Recent Activity

updated a model 2 days ago

Akikaaa/ppo-LunarLander-v2

new activity 7 days ago

Qwen/Qwen2.5-0.5B-Instruct:Does this model apply SFT or SFT+RL during post-training?

View all activity

Organizations

None yet

models 1

Akikaaa/ppo-LunarLander-v2

Reinforcement Learning • Updated 2 days ago • 2

datasets

None public yet