Tagged with

optimization

Explore technical articles related to optimization. Find in-depth analysis, tutorials, and insights.

Articles Found

Articles Related to optimization

Best Resources for Learning CUDA Matrix Multiplication Optimization

June 3, 2026

An honest roundup of the resources I actually recommend for learning CUDA matrix multiplication optimization — from naive kernels to near-cuBLAS. Compares siboehm, Lei Mao, Salykova, NVIDIA docs, and one of my own deep dives, with explicit guidance on which to read first.

cuda gpu-computing matrix-multiplication optimization sgemm gemm cublas cutlass roundup resources

June 3, 2026

CUDA Matrix Multiplication Optimization: From Naive to Near-cuBLAS

April 7, 2026

Step-by-step CUDA matrix multiplication optimization with 9 interactive visualizations. From naive kernels through shared memory tiling to near-cuBLAS speeds.

cuda gpu-computing matrix-multiplication optimization shared-memory memory-coalescing tiling performance deep-learning hpc

April 7, 2026

Numerical Sensitivity: Why FP16 Breaks NAdam

January 8, 2026

Visual exploration of floating-point arithmetic and numerical stability. Learn why NAdam fails in FP16 and how machine epsilon affects deep learning.

Numerical Computing Mixed Precision Optimization Deep Learning NAdam FP16 BF16 Training

January 8, 2026

Quantization Deep Dive: From FP32 to INT4

January 9, 2025

Master neural network quantization with interactive visualizations. Explore QAT, PTQ, GPTQ, AWQ, and SmoothQuant methods for efficient model deployment.

Quantization Model Compression INT8 INT4 GPTQ AWQ Deep Learning Optimization LLM Deployment

January 9, 2025

C++ Compilation Process: From Source Code to Object Files

January 9, 2024

How C++ compilers transform source code through preprocessing, parsing, optimization, and code generation. Interactive visualizations included.

C++Compilation Compilers Assembly Optimization GCC Clang Systems Programming

January 9, 2024