K's picture

1 6 9

K

cyk1337

·

AI & ML interests

Large language models.

Organizations

cyk1337's activity

upvoted a paper 3 months ago

MA-RLHF: Reinforcement Learning from Human Feedback with Macro Actions

Paper • 2410.02743 • Published Oct 3, 2024 • 7

upvoted a paper 7 months ago

Tokenization Falling Short: The Curse of Tokenization

Paper • 2406.11687 • Published Jun 17, 2024 • 15

upvoted 4 papers 10 months ago

StarCoder 2 and The Stack v2: The Next Generation

Paper • 2402.19173 • Published Feb 29, 2024 • 136

Tool-Augmented Reward Modeling

Paper • 2310.01045 • Published Oct 2, 2023 • 2

HumanEval-XL: A Multilingual Code Generation Benchmark for Cross-lingual Natural Language Generalization

Paper • 2402.16694 • Published Feb 26, 2024 • 2

ERNIE-Code: Beyond English-Centric Cross-lingual Pretraining for Programming Languages

Paper • 2212.06742 • Published Dec 13, 2022 • 2