OpenCode + Ollama + DeepSeek: IA Local no Seu PC Passo a Passo
Leitura: ~12 min | Tutorial | Nível: Iniciante / Intermediário | Windows Linux macOS
TL;DR — Resumo Executivo
Instalamos o OpenCode globalmente via npm e configuramos para usar o modelo DeepSeek R1 7B rodando localmente via Ollama — sem custo de API, sem depender de servidor externo.
O Ollama baixa e executa modelos de IA diretamente na sua máquina com um comando. O OpenCode se conecta a ele automaticamente usando o formato ollama/nome-do-modelo.
Incluímos uma tabela completa de modelos DeepSeek com requisitos de RAM, CPU e GPU para cada tipo de equipamento — do PC básico de 2010 ao servidor de datacenter.
Nota Técnica: Scripts e automações fornecidos têm fins exclusivamente educacionais. Teste sempre em ambiente controlado. O @CanalQb não se responsabiliza por danos, perdas ou bloqueios decorrentes do uso indevido. Verifique os requisitos de hardware antes de baixar modelos para evitar travamentos ou consumo excessivo de memória.
A maioria das pessoas usa ChatGPT e paga por isso. Você pode rodar uma IA equivalente no seu computador sem pagar nada.
Eu instalei o OpenCode, configurei o Ollama e baixei o DeepSeek R1 7B em menos de 10 minutos. O modelo roda localmente, sem enviar dados para servidor externo, sem custo de API, sem depender de internet para funcionar depois de baixado.
Aqui no @CanalQb, validamos que essa combinação entrega desempenho real para edição de código, automação de scripts e assistência técnica sem depender de conexão. O passo que trava 90% dos iniciantes é simplesmente usar o nome errado do modelo no comando — exatamente o erro que cometemos na primeira tentativa. Vamos corrigir isso agora.
O que é o OpenCode e por que usar IA local?
O OpenCode é uma ferramenta de terminal open source que transforma qualquer modelo de linguagem (LLM) em um assistente de programação interativo direto no seu console. Diferente de extensões de IDE que exigem assinatura ou dependem de servidores externos, o OpenCode roda no terminal e pode ser conectado a modelos locais via Ollama, ou a provedores remotos como Anthropic, OpenAI e Google.
A vantagem principal de rodar IA localmente é o controle total dos seus dados. Nenhum código, arquivo ou conversa sai da sua máquina. Além disso, não há custo recorrente: depois que o modelo é baixado, o uso é ilimitado e gratuito. O OpenCode gerencia todo o ciclo de conversa, ferramentas de edição, busca em arquivos e execução de comandos — exatamente como um assistente de IA integrado, mas sem enviar nada para a nuvem.
Por que isso importa: Com modelos locais como o DeepSeek R1 7B, você tem respostas rápidas para tarefas técnicas, edição de código e automação sem depender de servidor, sem limites de requisições e sem assinatura mensal.
O que é o Ollama e como ele funciona?
O Ollama é um runtime de modelos de linguagem que simplifica o download, a execução e o gerenciamento de LLMs locais. Ele empacota modelos como DeepSeek, Llama, Mistral, Phi e centenas de outros em comandos simples. Um único comando ollama run deepseek-r1:7b baixa o modelo, carrega na memória e disponibiliza uma API REST pronta para uso na porta 11434.
A beleza do Ollama é que ele abstrai toda a complexidade de inferência, alocação de GPU, quantização e gerenciamento de contexto. Você não precisa configurar PyTorch, CUDA ou transformers manualmente. O Ollama detecta automaticamente se você tem GPU NVIDIA (via CUDA), AMD (via ROCm) ou apenas CPU, e otimiza a execução para o hardware disponível. E o melhor: ele expõe uma API compatível com OpenAI, o que significa que qualquer ferramenta que aceita API da OpenAI pode usar modelos locais do Ollama trocando apenas a URL de conexão.
API do Ollama: O servidor roda em http://localhost:11434. O OpenCode se conecta automaticamente a essa porta quando você usa o formato ollama/nome-do-modelo.
O que é o DeepSeek R1 e qual modelo escolher?
O DeepSeek R1 é uma família de modelos de linguagem desenvolvidos pela DeepSeek (深度求索), conhecidos por oferecerem desempenho comparável a modelos muito maiores com custo computacional reduzido. O modelo R1 7B, por exemplo, compete com modelos de 10 a 15 bilhões de parâmetros em tarefas de raciocínio lógico e programação, ocupando apenas 4,7 GB de disco.
A escolha do modelo certo depende exclusivamente do seu hardware. Modelos menores como o 1.5B rodam em qualquer computador com 4 GB de RAM. Modelos maiores como o 70B exigem servidores ou workstations com GPU dedicada. A tabela completa na seção abaixo mostra exatamente qual modelo cabe no seu equipamento. O segredo que a maioria das pessoas ignora é que um modelo 7B bem configurado resolve 90% das tarefas do dia a dia — ninguém precisa de um modelo de 70B para editar código ou criar scripts.
Tabela de modelos DeepSeek: qual cabe no seu PC?
A tabela abaixo foi organizada por geração de equipamento, RAM disponível e capacidade de processamento. Use como referência direta: localize seu tipo de máquina na última coluna e veja qual modelo é ideal para você. Os tamanhos consideram o modelo quantizado (Q4_K_M), que é o formato padrão baixado pelo Ollama.
| Modelo | Parâmetros | RAM Necessária | Disco | CPU Recomendada | GPU | Geração do Equipamento |
|---|---|---|---|---|---|---|
| deepseek-r1:1.5b | 1,5B | 4 GB+ | 1,1 GB | Qualquer (SSE4.2+) | Não necessária | PC básico / Notebook (2010+) Intel Core 2 Duo, AMD Athlon II |
| deepseek-r1:7b | 7B | 8 GB+ | 4,7 GB | Intel i5 8a geração+ AMD Ryzen 3+ |
Não obrigatória Opcional: 4 GB VRAM |
PC moderno básico (2018+) Notebooks com 8 GB RAM, PCs de escritório |
| deepseek-r1:8b | 8B | 8 GB+ | 4,9 GB | Intel i5 10a geração+ AMD Ryzen 5+ |
Opcional: 6 GB VRAM | PC médio (2020+) Notebooks gamers, PCs domésticos modernos |
| deepseek-r1:14b | 14B | 16 GB+ | 9 GB | Intel i7 10a geração+ AMD Ryzen 7+ |
Recomendada: 8 GB VRAM Roda em CPU, mas mais lento |
PC avançado (2020+) Workstation, PC gamer, Mac M1/M2/M3 16 GB |
| deepseek-r1:32b | 32B | 32 GB+ | 20 GB | Intel i9 / Core Ultra AMD Ryzen 9 |
Necessária: 12 GB+ VRAM | Workstation avançada (2022+) PC com RTX 3060 12GB+ ou superior |
| deepseek-r1:70b | 70B | 64 GB+ | 43 GB | Intel Xeon / Core Ultra 9 AMD Threadripper |
Necessária: 24 GB+ VRAM Múltiplas GPUs possível |
Servidor / Workstation topo (2023+) RTX 4090, A5000, Mac Ultra 64 GB+ |
| deepseek-r1:671b | 671B | 512 GB+ | 404 GB | Múltiplos Xeon / EPYC | Múltiplas GPUs (80 GB+) | Datacenter Clusters, servidores empresariais |
Dica do @CanalQb: Se você tem dúvida entre dois modelos, comece pelo menor. O 7B é o ponto ideal para a maioria dos usuários — entrega qualidade excelente para código e consome apenas 4,7 GB de disco e 8 GB de RAM. Você pode testar modelos maiores depois sem perder a configuração.
Como instalar o OpenCode via npm?
O OpenCode é instalado globalmente via npm, o gerenciador de pacotes do Node.js. Se você ainda não tem o Node.js instalado, precisará baixá-lo primeiro do site oficial. O processo completo leva menos de 3 minutos e funciona em Windows, macOS e Linux.
Pré-requisito: Node.js 18+
Antes de instalar o OpenCode, você precisa do Node.js versão 18 ou superior instalado no seu sistema. Para verificar se já tem o Node.js instalado, abra o terminal e execute o comando abaixo. Se o comando retornar um número de versão, você está pronto para o próximo passo.
Se o comando não for reconhecido ou a versão for inferior a 18, baixe o instalador mais recente do Node.js no site oficial nodejs.org (escolha a versão LTS). No Windows, o instalador inclui o npm automaticamente. Após a instalação, reinicie o terminal e confirme a versão com o mesmo comando.
Instalação global do OpenCode
Com o Node.js instalado, o comando para instalar o OpenCode é único. O parâmetro -g (global) torna o comando opencode disponível em qualquer diretório do seu terminal.
O npm baixará o pacote e instalará o binário global. No Windows, a instalação global fica em %APPDATA%\npm\node_modules\opencode-ai. No Linux/macOS, em /usr/local/lib/node_modules. Para confirmar que a instalação foi bem-sucedida, verifique a versão instalada com o comando abaixo.
1.17.13
Permissão no macOS/Linux: Se aparecer erro de permissão, use sudo npm i -g opencode-ai. No Windows, execute o terminal como Administrador se houver erro de acesso negado.
Como instalar o Ollama no Windows, Linux ou macOS?
O Ollama tem instaladores dedicados para cada sistema operacional. O processo é direto e não requer configuração manual na primeira execução. Abaixo estão as instruções específicas para cada plataforma. Após a instalação, o Ollama já inicia automaticamente como serviço de fundo.
Windows
No Windows, o Ollama oferece um instalador .exe tradicional. Acesse o site oficial ollama.com, clique em Download e escolha a versão para Windows. O instalador configura o Ollama como serviço do Windows, iniciando automaticamente sempre que o computador liga.
Passos rápidos no Windows:
- Acesse ollama.com/download
- Baixe o instalador para Windows (arquivo .exe)
- Execute o instalador e siga o assistente (apenas Next, Next, Install)
- Após a instalação, o ícone do Ollama aparece na bandeja do sistema
- Abra o PowerShell ou CMD e teste com
ollama --version
Linux
No Linux, a instalação é feita por um script único via curl. O comando abaixo baixa e executa o script de instalação oficial, que configura o Ollama como serviço systemd.
macOS
No macOS, o Ollama oferece um pacote .dmg padrão. Baixe do site oficial, arraste o aplicativo para a pasta de Aplicativos e abra normalmente. O Ollama aparece na barra de menus e inicia automaticamente.
Verifique a instalação: Após instalar, abra o terminal e execute ollama --version. Se o comando retornar a versão, a instalação está completa. O servidor do Ollama roda automaticamente em http://localhost:11434.
Como baixar o modelo DeepSeek R1 no Ollama?
Com o Ollama instalado, o próximo passo é baixar o modelo DeepSeek R1. O comando ollama pull faz o download do modelo escolhido e o armazena localmente. Recomendamos começar com o modelo 7B, que oferece o melhor equilíbrio entre qualidade de resposta e consumo de recursos.
O download leva de 1 a 5 minutos dependendo da sua conexão. O modelo 7B tem aproximadamente 4,7 GB. Você pode substituir 7b por 1.5b, 8b, 14b ou outro tamanho conforme sua necessidade e hardware disponível.
Após o download, você pode testar o modelo diretamente no terminal com o comando ollama run deepseek-r1:7b, que inicia um chat interativo. Teste algumas perguntas para confirmar que o modelo está funcionando antes de conectá-lo ao OpenCode.
>>> Crie um script Python para listar arquivos em um diretório
[O modelo responde com o código...]
Erro comum que cometemos: O modelo deepseek-v4-pro não existe no Ollama. O nome correto é deepseek-r1:7b. Sempre verifique os modelos disponíveis com ollama list e os modelos suportados no site oficial do Ollama.
Como configurar o OpenCode para usar o DeepSeek via Ollama?
A configuração do OpenCode para usar um modelo local do Ollama é feita de duas formas: via linha de comando com a flag --model ou via arquivo de configuração global. O formato segue o padrão provider/modelo, onde provider é o nome do serviço (no caso, ollama) e modelo é o nome exato do modelo baixado.
Opção 1: Usar via linha de comando (recomendado para testes)
Execute o OpenCode diretamente no diretório do seu projeto com a flag --model. Essa abordagem é ideal para testar diferentes modelos sem alterar configurações permanentes.
Opção 2: Configuração permanente via opencode.json
Para usar o modelo local como padrão em todas as sessões, crie ou edite o arquivo de configuração global do OpenCode. O arquivo fica em ~\.config\opencode\opencode.json no Windows ou ~/.config/opencode/opencode.json no Linux/macOS. Basta adicionar o campo model com o valor ollama/deepseek-r1:7b. Você também pode definir o small_model para tarefas leves.
# Adicione o conteúdo abaixo:
{
"$schema": "https://opencode.ai/config.json",
"model": "ollama/deepseek-r1:7b"
}
Opção 3: Configuração local por projeto
Crie um arquivo opencode.json na raiz do seu projeto. Essa configuração se aplica apenas àquele diretório e sobrescreve a configuração global. Ideal para times ou projetos específicos que exigem um modelo diferente.
# Restringe o OpenCode a usar apenas o Ollama:
{
"$schema": "https://opencode.ai/config.json",
"model": "ollama/deepseek-r1:7b",
"enabled_providers": ["ollama"]
}
Como testar se a configuração está funcionando?
Depois de configurar o OpenCode, faça um teste rápido para confirmar que o modelo está sendo carregado corretamente via Ollama. O OpenCode exibe o modelo ativo na tela inicial. Peça uma tarefa simples de código para validar o fluxo completo.
# O OpenCode inicia e mostra:
> Model: ollama/deepseek-r1:7b
> Working directory: C:\Users\Qb\Desktop\meu-projeto
>
Se o OpenCode iniciar sem erros, você pode pedir qualquer tarefa. Por exemplo, peça para ele listar os arquivos do diretório atual ou criar um script simples. A resposta virá do DeepSeek R1 rodando localmente no seu Ollama. Lembre-se de que a primeira requisição pode ser um pouco mais lenta enquanto o modelo carrega na memória.
[DeepSeek R1 7B via Ollama] Aqui está um servidor HTTP simples em Python...
>
Solução de problemas comuns:
- Erro "model not found": O nome do modelo está errado. Execute
ollama listpara ver os modelos disponíveis. - Erro "connection refused": O Ollama não está rodando. Inicie manualmente com
ollama serveou reinicie o serviço. - Erro "out of memory": O modelo é grande demais para sua RAM. Escolha um modelo menor (1.5b ou 7b).
- Respostas muito lentas: Ative a aceleração por GPU ou use um modelo menor.
Quais provedores o OpenCode suporta além do Ollama?
O OpenCode é agnóstico de provedor. Você pode usar qualquer modelo compatível com a arquitetura de provedores do OpenCode. O formato provider/modelo permite alternar entre diferentes serviços sem alterar configurações complexas. Abaixo estão os provedores mais comuns e como usá-los.
| Provedor | Prefixo | Exemplo | Custo | Requer API Key |
|---|---|---|---|---|
| Ollama | ollama/ |
ollama/deepseek-r1:7b |
Gratuito | Não |
| Anthropic | anthropic/ |
anthropic/claude-sonnet-4-6 |
Pago por token | Sim |
| OpenAI | openai/ |
openai/gpt-4o |
Pago por token | Sim |
google/ |
google/gemini-2.0-flash |
Gratuito / Pago | Sim | |
| DeepSeek API | deepseek/ |
deepseek/deepseek-chat |
Pago por token | Sim |
Estratégia @CanalQb: Use o modelo local do Ollama para tarefas rotineiras de edição e automação (zero custo, dados privados). Reserve provedores pagos para tarefas complexas que exigem modelos maiores. O OpenCode permite alternar entre eles com um simples --model.
Quanto custa rodar IA local com OpenCode + Ollama?
O custo total é zero. O OpenCode é open source e gratuito. O Ollama é gratuito para uso pessoal e comercial. Os modelos como DeepSeek R1 são distribuídos sob licenças permissivas (Apache 2.0 ou MIT). O único custo é o hardware que você já tem e a eletricidade consumida durante a execução.
Para efeito de comparação, uma assinatura do GitHub Copilot custa US$ 10/mês (R$ 55). O ChatGPT Plus custa US$ 20/mês (R$ 110). O Claude Pro custa US$ 20/mês. Com a configuração deste tutorial, você elimina todos esses custos recorrentes e ainda mantém seus dados totalmente privados. Se você optar por usar provedores pagos eventualmente, o custo é por uso, controlado e sem assinatura obrigatória.
Quais as limitações de rodar modelos localmente?
Modelos locais têm limitações reais que você precisa conhecer antes de migrar completamente. O modelo 7B tem capacidade inferior a modelos como GPT-4 ou Claude Sonnet em tarefas que exigem raciocínio profundo, contexto muito longo ou conhecimento especializado muito recente. Além disso, sem GPU, a velocidade de geração é de 5 a 15 tokens por segundo, comparado a 50+ tokens por segundo em APIs comerciais.
No entanto, para 80% das tarefas do dia a dia de um desenvolvedor — edição de código, criação de scripts, automação, explicação de conceitos, revisão de sintaxe — o DeepSeek R1 7B entrega resultados perfeitamente utilizáveis. Aqui no @CanalQb, validamos que o modelo lida bem com Python, JavaScript, TypeScript, Bash, SQL e HTML/CSS. O ganho em privacidade e economia supera a perda de performance para a maioria dos usuários.
Como gerenciar múltiplos modelos no Ollama?
O Ollama permite baixar e gerenciar quantos modelos você quiser. Use ollama list para ver todos os modelos baixados, ollama pull para baixar novos e ollama rm para remover modelos que não usa mais. Cada modelo ocupa espaço em disco, mas apenas o modelo em uso consome RAM. Você pode alternar entre modelos no OpenCode usando a flag --model com nomes diferentes.
NAME ID SIZE MODIFIED
deepseek-r1:7b 755ced02ce7b 4.7 GB 23 minutes ago
$ ollama pull deepseek-r1:14b
$ ollama rm deepseek-r1:1.5b
Perguntas Frequentes sobre OpenCode, Ollama e DeepSeek
Preciso de GPU para rodar o DeepSeek R1 7B localmente?
Qual a diferença entre deepseek-r1:7b e deepseek-r1:8b?
O OpenCode funciona sem internet depois de configurado?
Como atualizar o OpenCode para a versão mais recente?
O Ollama consome recursos mesmo quando não estou usando?
Posso usar outros modelos além do DeepSeek no OpenCode?
O que fazer se o OpenCode não encontrar o Ollama?
É seguro rodar modelos de IA localmente em termos de privacidade?
Como faço para desinstalar o OpenCode completamente?
Qual a diferença entre OpenCode e ferramentas como GitHub Copilot ou Cursor?
Fontes e Referências
Gostou do tutorial? Inscreva-se no @CanalQb no YouTube para mais conteúdos sobre IA local, automação e tecnologia prática.
Feito com Master Rules Claude v8.6
Comentários
Comente só assim vamos crescer juntos!