Iron-Bound

Iron-Bound Iron-Bound

🤖 ML engineer.

Pinned Loading

triton_blocks triton_blocks Public

Code blocks for writing triton kernels
ao ao Public

Forked from pytorch/ao

Native PyTorch library for quantization and sparsity

Python
ring-attention ring-attention Public

Forked from gpu-mode/ring-attention

Optimized kernels for ring-attention [WIP]

Jupyter Notebook 2
zhuzilin/ring-flash-attention zhuzilin/ring-flash-attention Public

Ring attention implementation with flash attention

Python 1k 99
llm.c llm.c Public

Forked from karpathy/llm.c

LLM training in simple, raw C/CUDA

Cuda
PufferAI/PufferLib PufferAI/PufferLib Public

Puffing up reinforcement learning

C 6.1k 515