PyTorch
megatron-lm
nvidia
llama 2
kvcache