15 524 230

Taufiq Dwi Purnomo

taufiqdp

https://taufiqdp.com

AI & ML interests

SLM, VLM

Recent Activity

upvoted a paper 2 days ago

2 OLMo 2 Furious

upvoted a paper 3 days ago

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

upvoted a paper 6 days ago

HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs

View all activity

Organizations

taufiqdp's activity

upvoted a paper 2 days ago

2 OLMo 2 Furious

Paper • 2501.00656 • Published 5 days ago • 12

upvoted a paper 3 days ago

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

Paper • 2501.00958 • Published 4 days ago • 75

upvoted 2 papers 6 days ago

HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs

Paper • 2412.18925 • Published 12 days ago • 86

1.58-bit FLUX

Paper • 2412.18653 • Published 12 days ago • 66

upvoted a paper 12 days ago

OpenAI o1 System Card

Paper • 2412.16720 • Published 16 days ago • 29

upvoted 2 papers 14 days ago

MixLLM: LLM Quantization with Global Mixed-precision between Output-features and Highly-efficient System Design

Paper • 2412.14590 • Published 18 days ago • 13

Parallelized Autoregressive Visual Generation

Paper • 2412.15119 • Published 18 days ago • 49

upvoted a paper 16 days ago

Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference

Paper • 2412.13663 • Published 19 days ago • 116

upvoted a paper 17 days ago

Qwen2.5 Technical Report

Paper • 2412.15115 • Published 18 days ago • 335

upvoted a paper 20 days ago

Apollo: An Exploration of Video Understanding in Large Multimodal Models

Paper • 2412.10360 • Published 24 days ago • 136

upvoted a paper 24 days ago

Phi-4 Technical Report

Paper • 2412.08905 • Published 25 days ago • 96

upvoted a paper 25 days ago

POINTS1.5: Building a Vision-Language Model towards Real World Applications

Paper • 2412.08443 • Published 26 days ago • 38

upvoted a paper 26 days ago

ProcessBench: Identifying Process Errors in Mathematical Reasoning

Paper • 2412.06559 • Published 28 days ago • 72

upvoted 2 papers 27 days ago

CompCap: Improving Multimodal Large Language Models with Composite Captions

Paper • 2412.05243 • Published about 1 month ago • 18

APOLLO: SGD-like Memory, AdamW-level Performance

Paper • 2412.05270 • Published about 1 month ago • 38

upvoted 3 papers about 1 month ago

NVILA: Efficient Frontier Visual Language Models

Paper • 2412.04468 • Published Dec 5, 2024 • 57

Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion

Paper • 2412.04424 • Published Dec 5, 2024 • 59

PaliGemma 2: A Family of Versatile VLMs for Transfer

Paper • 2412.03555 • Published Dec 4, 2024 • 121

upvoted a collection about 1 month ago

PaliGemma 2 Release

Collection

Vision-Language Models available in multiple 3B, 10B and 28B variants. • 23 items • Updated 24 days ago • 123

upvoted a paper about 1 month ago

Puzzle: Distillation-Based NAS for Inference-Optimized LLMs

Paper • 2411.19146 • Published Nov 28, 2024 • 13