3 8

Jason Weston

spermwhale

AI & ML interests

None yet

Recent Activity

authored a paper 20 days ago

Byte Latent Transformer: Patches Scale Better Than Tokens

authored a paper 27 days ago

Training Large Language Models to Reason in a Continuous Latent Space

authored a paper about 2 months ago

Adaptive Decoding via Latent Preference Optimization

View all activity

Organizations

None yet

spermwhale's activity

authored a paper 20 days ago

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published 24 days ago • 82

authored a paper 27 days ago

Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published 28 days ago • 66

authored a paper about 2 months ago

Adaptive Decoding via Latent Preference Optimization

Paper • 2411.09661 • Published Nov 14, 2024 • 10

authored a paper 3 months ago

Thinking LLMs: General Instruction Following with Thought Generation

Paper • 2410.10630 • Published Oct 14, 2024 • 18

authored a paper 4 months ago

Source2Synth: Synthetic Data Generation and Curation Grounded in Real Data Sources

Paper • 2409.08239 • Published Sep 12, 2024 • 16

authored 2 papers 5 months ago

Better Alignment with Instruction Back-and-Forth Translation

Paper • 2408.04614 • Published Aug 8, 2024 • 14

Self-Taught Evaluators

Paper • 2408.02666 • Published Aug 5, 2024 • 27

upvoted a paper 5 months ago

Meta-Rewarding Language Models: Self-Improving Alignment with LLM-as-a-Meta-Judge

Paper • 2407.19594 • Published Jul 28, 2024 • 20

authored a paper 8 months ago

Iterative Reasoning Preference Optimization

Paper • 2404.19733 • Published Apr 30, 2024 • 47

authored 2 papers 10 months ago

Reverse Training to Nurse the Reversal Curse

Paper • 2403.13799 • Published Mar 20, 2024 • 13

Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM

Paper • 2403.07816 • Published Mar 12, 2024 • 39

commented 3 papers 12 months ago

authored a paper 12 months ago

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18, 2024 • 145

upvoted a paper about 1 year ago

System 2 Attention (is something you might need too)

Paper • 2311.11829 • Published Nov 20, 2023 • 39

authored a paper about 1 year ago

System 2 Attention (is something you might need too)

Paper • 2311.11829 • Published Nov 20, 2023 • 39

upvoted a paper about 1 year ago

The ART of LLM Refinement: Ask, Refine, and Trust

Paper • 2311.07961 • Published Nov 14, 2023 • 10

authored a paper about 1 year ago

The ART of LLM Refinement: Ask, Refine, and Trust

Paper • 2311.07961 • Published Nov 14, 2023 • 10

upvoted a paper about 1 year ago

Branch-Solve-Merge Improves Large Language Model Evaluation and Generation

Paper • 2310.15123 • Published Oct 23, 2023 • 7