Manoj's picture

2 1 20

Manoj

Manoj21k

·

Manoj21k

AI & ML interests

None yet

Organizations

None yet

Manoj21k's activity

upvoted a paper 11 months ago

Back to Basics: Revisiting REINFORCE Style Optimization for Learning from Human Feedback in LLMs

Paper • 2402.14740 • Published Feb 22, 2024 • 13