Tag: local AI

AI & Emerging Technology Storage

Running Llama 3.1 70B on RTX 3090 via NVMe-to-GPU

Post author By Rafael
Post date February 22, 2026

Learn how to run Llama 3.1 70B on an RTX 3090 using NVMe-to-GPU technology, bypassing the CPU for efficient local AI inference.

Tags large language models, Llama 3.1, local AI, NVMe-to-GPU, RTX 3090

AI & Emerging Technology Cloud

ggml.ai Joins Hugging Face: A New Era for Local AI

Post author By Rafael
Post date February 20, 2026

ggml.ai’s partnership with Hugging Face marks a pivotal moment for local AI development, enhancing sustainability and community support.

Tags Hugging Face, llama.cpp, local AI, Machine Learning, open-source