Archives

All the articles I've archived.

2025 ⁹

December ¹

matmul

1 Dec, 2025

Creating a cuda kernel for image processing

November ⁴

2D Workloads

22 Nov, 2025

Creating a cuda kernel for image processing
Fused Softmax::P3::Cuda Kernel

Updated: 18 Nov, 2025

Creating a cuda kernel for fused softmax
Fused Softmax::P2::Triton optimization

9 Nov, 2025

Debugging triton kernel optimization issue
Fused Softmax::P1::Naive & Triton Implementation

2 Nov, 2025

Implementing Softmax on Torch and Triton version

October ³

Vector Addition::P4::Optimizing

26 Oct, 2025

Optimizing Cuda vector addition kernels to match Triton & Torch
Vector Addition::P3::Benchmarking

12 Oct, 2025

Benchmarking vector addition kernels in Cuda, Triton & Torch
Vector Addition::P2::Cuda Kernel

5 Oct, 2025

Investing vector addition kernel in Cuda

September ¹

Vector Addition::P1::Triton Kernel

28 Sep, 2025

Investing vector addition kernel in Triton