~/aboneto.dev/categoria/Rag

#Rag

posts:1 last_update:2026-05-15 avg_read:~4min

// all posts — ordered by date desc

[01] 15·May·2026

Fine-tuning vs. RAG: Quando Cada Um Tem ROI Real em Produção

Já vimos como reduzir o custo de inferência usando modelos open-weight como o Qwen 3.5 no artigo Reduzindo o custo em produção: Qwen 3.5 na AWS vs APIs Comerciais. Mas quando você tem o custo base sob controle, enfrenta outro problema: como dar ao modelo conhecimento específico da sua empresa.

~4min