kangmintong

Mintong Kang kangmintong

Achievements

AI-secure/DecodingTrust AI-secure/DecodingTrust Public

A Comprehensive Assessment of Trustworthiness in GPT Models

Python 314 61
AI-secure/Certified-Fairness AI-secure/Certified-Fairness Public

[NeurIPS 2022] Code for Certifying Some Distributional Fairness with Subpopulation Decomposition

Python 5
DiffAttack DiffAttack Public

[NeurIPS 2023] Codes for DiffAttack: Evasion Attacks Against Diffusion-Based Adversarial Purification

Python 40 1
C-RAG C-RAG Public

[ICML 2024] Codes for C-RAG: Certified Generation Risks for Retrieval-Augmented Language Models

Python 18 2
R-2-Guard R-2-Guard Public

[ICLR 2025] Code implementation of R^2-Guard: Robust Reasoning Enabled LLM Guardrail via Knowledge-Enhanced Logical Reasoning

Python 23
AdvWave AdvWave Public

[ICLR 2025] Codes for AdvWave: Stealthy Adversarial Jailbreak Attack against Large Audio-Language Models

Python 9 1