Sunbelt Computer Software

KODI: A Korean Diffusion Model for Bilingual Text-to-Image Generation and Cultural Fidelity

KODI is a diffusion model that generates high-quality Korean cultural images from Korean text prompts. It uses a Korean CLIP-based text encoder to better understand Korean prompts and generate culturally appropriate images.

📦 Installation

git clone https://github.com/TeamLab/kodi.git
cd kodi
pip install -r requirements.txt

📊 Datasets and Benchmarks

Korean Cultural Dataset (KCD)

Our Korean cultural training dataset is located at:

korean-cultural-dataset/

This dataset contains Korean cultural images with corresponding Korean text descriptions.

MC-K Evaluation Benchmark

The Korean cultural evaluation benchmark MC-K is available at:

evaluation/benchmark/

This benchmark is used for evaluating cultural appropriateness and Korean language understanding.

🔧 Usage

1. Model Training

# Train KODI with Korean Cultural Dataset (KCD)
python training/train_kodi.py --config training/configs/kodi.py

2. Image Generation

# Generate images with evaluation dataset
python evaluation/generate_eval_images.py

3. Model Evaluation

# Evaluate with MC-K benchmark using KC-CLIP
python evaluation/evaluate_by_kcclip.py

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
evaluation		evaluation
korean-cultural-dataset		korean-cultural-dataset
model-weights/kodi		model-weights/kodi
training		training
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Model	Type	Location	Description
KODI	LoRA Weights	`model-weights/kodi/`	Korean cultural diffusion model (included in repository)
KC-CLIP KO	Evaluator	letgoofthepizza/kc-clip-ko	Korean cultural CLIP model (Korean)
KC-CLIP EN	Evaluator	letgoofthepizza/kc-clip-en	Korean cultural CLIP model (English)

Sunbelt Computer Software

PL/B Language Development and Support

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

KODI: A Korean Diffusion Model for Bilingual Text-to-Image Generation and Cultural Fidelity

📦 Installation

📊 Datasets and Benchmarks

Korean Cultural Dataset (KCD)

MC-K Evaluation Benchmark

🔧 Usage

1. Model Training

2. Image Generation

3. Model Evaluation

🤗 Model Weights

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Sunbelt Computer Software

PL/B Language Development and Support

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

KODI: A Korean Diffusion Model for Bilingual Text-to-Image Generation and Cultural Fidelity

📦 Installation

📊 Datasets and Benchmarks

Korean Cultural Dataset (KCD)

MC-K Evaluation Benchmark

🔧 Usage

1. Model Training

2. Image Generation

3. Model Evaluation

🤗 Model Weights

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages