Huaijie Wang's picture

2 1

Huaijie Wang

jwhj

·

AI & ML interests

None yet

Recent Activity

updated a dataset 6 days ago

jwhj/OREO-Qwen2.5-Math-1.5B-Train

commented a paper 6 days ago

Offline Reinforcement Learning for LLM Multi-Step Reasoning

updated a model 9 days ago

jwhj/Qwen2.5-Math-1.5B-OREO-Value

View all activity

Organizations

None yet

jwhj's activity

updated a dataset 6 days ago

jwhj/OREO-Qwen2.5-Math-1.5B-Train

Viewer • Updated 6 days ago • 150k • 10

commented a paper 6 days ago

Offline Reinforcement Learning for LLM Multi-Step Reasoning

Paper • 2412.16145 • Published 17 days ago • 37 •

updated 2 models 9 days ago

jwhj/Qwen2.5-Math-1.5B-OREO-Value

Updated 9 days ago • 90 • 1

jwhj/Qwen2.5-Math-1.5B-OREO

Updated 9 days ago • 38

commented a paper 11 days ago

Offline Reinforcement Learning for LLM Multi-Step Reasoning

Paper • 2412.16145 • Published 17 days ago • 37 •

upvoted a paper 14 days ago

Offline Reinforcement Learning for LLM Multi-Step Reasoning

Paper • 2412.16145 • Published 17 days ago • 37

authored a paper 14 days ago

Offline Reinforcement Learning for LLM Multi-Step Reasoning

Paper • 2412.16145 • Published 17 days ago • 37

updated a model 27 days ago

jwhj/Qwen2.5-Math-1.5B-SFT

Text Generation • Updated 27 days ago • 349

authored a paper about 1 year ago

BitNet: Scaling 1-bit Transformers for Large Language Models

Paper • 2310.11453 • Published Oct 17, 2023 • 96