28 31 65

Di Zhang

di-zhang-fdu

https://scholar.google.com/citations?user=vxAO250AAAAJ&hl=en

AI & ML interests

AI4Chem, LLM, Green LLM

Recent Activity

authored a paper 4 days ago

ConceptMaster: Multi-Concept Video Customization on Diffusion Transformer Models Without Test-Time Tuning

updated a dataset 7 days ago

di-zhang-fdu/MATH12000

upvoted a paper 8 days ago

REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models

View all activity

Organizations

Posts 21

Post

1253

News! ChemVLM Codes Opensource Now! https://github.com/AI4Chem/ChemVlm

Post

2614

LLaMA-O1-PRM and LLaMA-O1-Reinforcement will release in this weekend.
We have implemented a novel Reinforcement finetune(RFT) pipeline that taught models learning reasoning and reward labeling without human annotation.

View all posts

Collections 2

Papers 7

models 1

di-zhang-fdu/OpenLongCoT-Base-Gemma2-2B

Updated Oct 29, 2024 • 12 • 8

datasets 35

Di Zhang

AI & ML interests

Recent Activity

Organizations

Posts 21

Collections 2

SimpleBerry/LLaMA-O1-Supervised-1129

SimpleBerry/LLaMA-O1-Base-1127

SimpleBerry/OpenLongCoT-Pretrain-1202

SimpleBerry/OpenLongCoT-SFT

YeungNLP/firefly-train-1.1M

stingning/ultrachat

Open-Orca/OpenOrca

Vezora/Tested-143k-Python-Alpaca

Papers 7

models 1

di-zhang-fdu/OpenLongCoT-Base-Gemma2-2B

datasets 35

di-zhang-fdu/MATH12000

di-zhang-fdu/OpenLongCoT-prm-rectify

di-zhang-fdu/AIME_1983_2024

di-zhang-fdu/UltraChat-200k

di-zhang-fdu/OpenLongCoT-Pretrain-v2-filtered

di-zhang-fdu/OpenLongCoT-Pretrain-v2

di-zhang-fdu/OpenLongCoT-SFT-v2

di-zhang-fdu/OpenLongCoT-SFT-v2-filtered

di-zhang-fdu/OpenLongCoT-SFT-problems-v2

di-zhang-fdu/llama_o1_offline_training_data_v1

Di Zhang

AI & ML interests

Recent Activity

Organizations

Posts 21

Collections 2

Papers 7

models 1

datasets 35 Sort: Recently updated

datasets 35