JailbreakBench

company

https://jailbreakbench.github.io/

AI & ML interests

None defined yet.

JailbreakBench's activity

MaksymAndriushchenko

updated a dataset 4 months ago

JailbreakBench/JBB-Behaviors

Viewer • Updated Sep 26, 2024 • 500 • 2.63k • 35

dedeswim

authored 4 papers 5 months ago

Evading Black-box Classifiers Without Breaking Eggs

Paper • 2306.02895 • Published Jun 5, 2023

JailbreakBench: An Open Robustness Benchmark for Jailbreaking Large Language Models

Paper • 2404.01318 • Published Mar 28, 2024

Dataset and Lessons Learned from the 2024 SaTML LLM Capture-the-Flag Competition

Paper • 2406.07954 • Published Jun 12, 2024 • 2

AgentDojo: A Dynamic Environment to Evaluate Attacks and Defenses for LLM Agents

Paper • 2406.13352 • Published Jun 19, 2024

MaksymAndriushchenko

authored 2 papers 9 months ago

JailbreakBench: An Open Robustness Benchmark for Jailbreaking Large Language Models

Paper • 2404.01318 • Published Mar 28, 2024

Layer-wise Linear Mode Connectivity

Paper • 2307.06966 • Published Jul 13, 2023

MaksymAndriushchenko

authored 2 papers over 1 year ago

A Modern Look at the Relationship between Sharpness and Generalization

Paper • 2302.07011 • Published Feb 14, 2023

SGD with Large Step Sizes Learns Sparse Features

Paper • 2210.05337 • Published Oct 11, 2022