Lize Pirenne

Inversta

Pangasius

AI & ML interests

LLMs, RL

Recent Activity

upvoted a paper about 17 hours ago

Evolving Deeper LLM Thinking

upvoted a paper about 17 hours ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

upvoted a paper about 17 hours ago

Tensor Product Attention Is All You Need

View all activity

Organizations

None yet

Inversta's activity

upvoted 3 papers about 17 hours ago

upvoted 3 papers 8 days ago

rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking

Paper • 2501.04519 • Published 13 days ago • 237

REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models

Paper • 2501.03262 • Published 17 days ago • 83

Cosmos World Foundation Model Platform for Physical AI

Paper • 2501.03575 • Published 14 days ago • 64

upvoted 8 papers 15 days ago

Offline Reinforcement Learning for LLM Multi-Step Reasoning

Paper • 2412.16145 • Published Dec 20, 2024 • 38

LongBench v2: Towards Deeper Understanding and Reasoning on Realistic Long-context Multitasks

Paper • 2412.15204 • Published Dec 19, 2024 • 33

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 340

Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference

Paper • 2412.13663 • Published Dec 18, 2024 • 125

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 89

Multimodal Latent Language Modeling with Next-Token Diffusion

Paper • 2412.08635 • Published Dec 11, 2024 • 44

Phi-4 Technical Report

Paper • 2412.08905 • Published Dec 12, 2024 • 104

EXAONE 3.5: Series of Large Language Models for Real-world Use Cases

Paper • 2412.04862 • Published Dec 6, 2024 • 50

upvoted 4 papers about 2 months ago

Video Depth without Video Models

Paper • 2411.19189 • Published Nov 28, 2024 • 34

ROICtrl: Boosting Instance Control for Visual Generation

Paper • 2411.17949 • Published Nov 27, 2024 • 82

Enhancing the Reasoning Ability of Multimodal Large Language Models via Mixed Preference Optimization

Paper • 2411.10442 • Published Nov 15, 2024 • 71

SageAttention2 Technical Report: Accurate 4 Bit Attention for Plug-and-play Inference Acceleration

Paper • 2411.10958 • Published Nov 17, 2024 • 52

upvoted 2 papers 2 months ago

SymDPO: Boosting In-Context Learning of Large Multimodal Models with Symbol Demonstration Direct Preference Optimization

Paper • 2411.11909 • Published Nov 17, 2024 • 20

RedPajama: an Open Dataset for Training Large Language Models

Paper • 2411.12372 • Published Nov 19, 2024 • 48