Formulário de contato

Nome

E-mail *

Mensagem *

Imagem

OpenCode + Ollama + DeepSeek: IA Local no Seu PC Passo a Passo

OpenCode + Ollama + DeepSeek: IA Local no Seu PC Passo a Passo

Publicado por em


@CanalQb no YouTube


@CanalQb

OpenCode + Ollama + DeepSeek: IA Local no Seu PC Passo a Passo


Leitura: ~12 min | Tutorial | Nível: Iniciante / Intermediário | Windows Linux macOS

TL;DR — Resumo Executivo

Instalamos o OpenCode globalmente via npm e configuramos para usar o modelo DeepSeek R1 7B rodando localmente via Ollama — sem custo de API, sem depender de servidor externo.

O Ollama baixa e executa modelos de IA diretamente na sua máquina com um comando. O OpenCode se conecta a ele automaticamente usando o formato ollama/nome-do-modelo.

Incluímos uma tabela completa de modelos DeepSeek com requisitos de RAM, CPU e GPU para cada tipo de equipamento — do PC básico de 2010 ao servidor de datacenter.

Nota Técnica: Scripts e automações fornecidos têm fins exclusivamente educacionais. Teste sempre em ambiente controlado. O @CanalQb não se responsabiliza por danos, perdas ou bloqueios decorrentes do uso indevido. Verifique os requisitos de hardware antes de baixar modelos para evitar travamentos ou consumo excessivo de memória.

A maioria das pessoas usa ChatGPT e paga por isso. Você pode rodar uma IA equivalente no seu computador sem pagar nada.

Eu instalei o OpenCode, configurei o Ollama e baixei o DeepSeek R1 7B em menos de 10 minutos. O modelo roda localmente, sem enviar dados para servidor externo, sem custo de API, sem depender de internet para funcionar depois de baixado.

Aqui no @CanalQb, validamos que essa combinação entrega desempenho real para edição de código, automação de scripts e assistência técnica sem depender de conexão. O passo que trava 90% dos iniciantes é simplesmente usar o nome errado do modelo no comando — exatamente o erro que cometemos na primeira tentativa. Vamos corrigir isso agora.


O que é o OpenCode e por que usar IA local?

O OpenCode é uma ferramenta de terminal open source que transforma qualquer modelo de linguagem (LLM) em um assistente de programação interativo direto no seu console. Diferente de extensões de IDE que exigem assinatura ou dependem de servidores externos, o OpenCode roda no terminal e pode ser conectado a modelos locais via Ollama, ou a provedores remotos como Anthropic, OpenAI e Google.

A vantagem principal de rodar IA localmente é o controle total dos seus dados. Nenhum código, arquivo ou conversa sai da sua máquina. Além disso, não há custo recorrente: depois que o modelo é baixado, o uso é ilimitado e gratuito. O OpenCode gerencia todo o ciclo de conversa, ferramentas de edição, busca em arquivos e execução de comandos — exatamente como um assistente de IA integrado, mas sem enviar nada para a nuvem.

Por que isso importa: Com modelos locais como o DeepSeek R1 7B, você tem respostas rápidas para tarefas técnicas, edição de código e automação sem depender de servidor, sem limites de requisições e sem assinatura mensal.


O que é o Ollama e como ele funciona?

O Ollama é um runtime de modelos de linguagem que simplifica o download, a execução e o gerenciamento de LLMs locais. Ele empacota modelos como DeepSeek, Llama, Mistral, Phi e centenas de outros em comandos simples. Um único comando ollama run deepseek-r1:7b baixa o modelo, carrega na memória e disponibiliza uma API REST pronta para uso na porta 11434.

A beleza do Ollama é que ele abstrai toda a complexidade de inferência, alocação de GPU, quantização e gerenciamento de contexto. Você não precisa configurar PyTorch, CUDA ou transformers manualmente. O Ollama detecta automaticamente se você tem GPU NVIDIA (via CUDA), AMD (via ROCm) ou apenas CPU, e otimiza a execução para o hardware disponível. E o melhor: ele expõe uma API compatível com OpenAI, o que significa que qualquer ferramenta que aceita API da OpenAI pode usar modelos locais do Ollama trocando apenas a URL de conexão.

API do Ollama: O servidor roda em http://localhost:11434. O OpenCode se conecta automaticamente a essa porta quando você usa o formato ollama/nome-do-modelo.


O que é o DeepSeek R1 e qual modelo escolher?

O DeepSeek R1 é uma família de modelos de linguagem desenvolvidos pela DeepSeek (深度求索), conhecidos por oferecerem desempenho comparável a modelos muito maiores com custo computacional reduzido. O modelo R1 7B, por exemplo, compete com modelos de 10 a 15 bilhões de parâmetros em tarefas de raciocínio lógico e programação, ocupando apenas 4,7 GB de disco.

A escolha do modelo certo depende exclusivamente do seu hardware. Modelos menores como o 1.5B rodam em qualquer computador com 4 GB de RAM. Modelos maiores como o 70B exigem servidores ou workstations com GPU dedicada. A tabela completa na seção abaixo mostra exatamente qual modelo cabe no seu equipamento. O segredo que a maioria das pessoas ignora é que um modelo 7B bem configurado resolve 90% das tarefas do dia a dia — ninguém precisa de um modelo de 70B para editar código ou criar scripts.


Tabela de modelos DeepSeek: qual cabe no seu PC?

A tabela abaixo foi organizada por geração de equipamento, RAM disponível e capacidade de processamento. Use como referência direta: localize seu tipo de máquina na última coluna e veja qual modelo é ideal para você. Os tamanhos consideram o modelo quantizado (Q4_K_M), que é o formato padrão baixado pelo Ollama.

Modelo Parâmetros RAM Necessária Disco CPU Recomendada GPU Geração do Equipamento
deepseek-r1:1.5b 1,5B 4 GB+ 1,1 GB Qualquer (SSE4.2+) Não necessária PC básico / Notebook (2010+)
Intel Core 2 Duo, AMD Athlon II
deepseek-r1:7b 7B 8 GB+ 4,7 GB Intel i5 8a geração+
AMD Ryzen 3+
Não obrigatória
Opcional: 4 GB VRAM
PC moderno básico (2018+)
Notebooks com 8 GB RAM, PCs de escritório
deepseek-r1:8b 8B 8 GB+ 4,9 GB Intel i5 10a geração+
AMD Ryzen 5+
Opcional: 6 GB VRAM PC médio (2020+)
Notebooks gamers, PCs domésticos modernos
deepseek-r1:14b 14B 16 GB+ 9 GB Intel i7 10a geração+
AMD Ryzen 7+
Recomendada: 8 GB VRAM
Roda em CPU, mas mais lento
PC avançado (2020+)
Workstation, PC gamer, Mac M1/M2/M3 16 GB
deepseek-r1:32b 32B 32 GB+ 20 GB Intel i9 / Core Ultra
AMD Ryzen 9
Necessária: 12 GB+ VRAM Workstation avançada (2022+)
PC com RTX 3060 12GB+ ou superior
deepseek-r1:70b 70B 64 GB+ 43 GB Intel Xeon / Core Ultra 9
AMD Threadripper
Necessária: 24 GB+ VRAM
Múltiplas GPUs possível
Servidor / Workstation topo (2023+)
RTX 4090, A5000, Mac Ultra 64 GB+
deepseek-r1:671b 671B 512 GB+ 404 GB Múltiplos Xeon / EPYC Múltiplas GPUs (80 GB+) Datacenter
Clusters, servidores empresariais

Dica do @CanalQb: Se você tem dúvida entre dois modelos, comece pelo menor. O 7B é o ponto ideal para a maioria dos usuários — entrega qualidade excelente para código e consome apenas 4,7 GB de disco e 8 GB de RAM. Você pode testar modelos maiores depois sem perder a configuração.


Como instalar o OpenCode via npm?

O OpenCode é instalado globalmente via npm, o gerenciador de pacotes do Node.js. Se você ainda não tem o Node.js instalado, precisará baixá-lo primeiro do site oficial. O processo completo leva menos de 3 minutos e funciona em Windows, macOS e Linux.

Pré-requisito: Node.js 18+

Antes de instalar o OpenCode, você precisa do Node.js versão 18 ou superior instalado no seu sistema. Para verificar se já tem o Node.js instalado, abra o terminal e execute o comando abaixo. Se o comando retornar um número de versão, você está pronto para o próximo passo.

$ node --version

Se o comando não for reconhecido ou a versão for inferior a 18, baixe o instalador mais recente do Node.js no site oficial nodejs.org (escolha a versão LTS). No Windows, o instalador inclui o npm automaticamente. Após a instalação, reinicie o terminal e confirme a versão com o mesmo comando.

Instalação global do OpenCode

Com o Node.js instalado, o comando para instalar o OpenCode é único. O parâmetro -g (global) torna o comando opencode disponível em qualquer diretório do seu terminal.

$ npm i -g opencode-ai

O npm baixará o pacote e instalará o binário global. No Windows, a instalação global fica em %APPDATA%\npm\node_modules\opencode-ai. No Linux/macOS, em /usr/local/lib/node_modules. Para confirmar que a instalação foi bem-sucedida, verifique a versão instalada com o comando abaixo.

$ opencode --version
1.17.13

Permissão no macOS/Linux: Se aparecer erro de permissão, use sudo npm i -g opencode-ai. No Windows, execute o terminal como Administrador se houver erro de acesso negado.


Como instalar o Ollama no Windows, Linux ou macOS?

O Ollama tem instaladores dedicados para cada sistema operacional. O processo é direto e não requer configuração manual na primeira execução. Abaixo estão as instruções específicas para cada plataforma. Após a instalação, o Ollama já inicia automaticamente como serviço de fundo.

Windows

No Windows, o Ollama oferece um instalador .exe tradicional. Acesse o site oficial ollama.com, clique em Download e escolha a versão para Windows. O instalador configura o Ollama como serviço do Windows, iniciando automaticamente sempre que o computador liga.

Passos rápidos no Windows:

  • Acesse ollama.com/download
  • Baixe o instalador para Windows (arquivo .exe)
  • Execute o instalador e siga o assistente (apenas Next, Next, Install)
  • Após a instalação, o ícone do Ollama aparece na bandeja do sistema
  • Abra o PowerShell ou CMD e teste com ollama --version

Linux

No Linux, a instalação é feita por um script único via curl. O comando abaixo baixa e executa o script de instalação oficial, que configura o Ollama como serviço systemd.

$ curl -fsSL https://ollama.com/install.sh | sh

macOS

No macOS, o Ollama oferece um pacote .dmg padrão. Baixe do site oficial, arraste o aplicativo para a pasta de Aplicativos e abra normalmente. O Ollama aparece na barra de menus e inicia automaticamente.

Verifique a instalação: Após instalar, abra o terminal e execute ollama --version. Se o comando retornar a versão, a instalação está completa. O servidor do Ollama roda automaticamente em http://localhost:11434.


Como baixar o modelo DeepSeek R1 no Ollama?

Com o Ollama instalado, o próximo passo é baixar o modelo DeepSeek R1. O comando ollama pull faz o download do modelo escolhido e o armazena localmente. Recomendamos começar com o modelo 7B, que oferece o melhor equilíbrio entre qualidade de resposta e consumo de recursos.

$ ollama pull deepseek-r1:7b

O download leva de 1 a 5 minutos dependendo da sua conexão. O modelo 7B tem aproximadamente 4,7 GB. Você pode substituir 7b por 1.5b, 8b, 14b ou outro tamanho conforme sua necessidade e hardware disponível.

Após o download, você pode testar o modelo diretamente no terminal com o comando ollama run deepseek-r1:7b, que inicia um chat interativo. Teste algumas perguntas para confirmar que o modelo está funcionando antes de conectá-lo ao OpenCode.

$ ollama run deepseek-r1:7b
>>> Crie um script Python para listar arquivos em um diretório
[O modelo responde com o código...]

Erro comum que cometemos: O modelo deepseek-v4-pro não existe no Ollama. O nome correto é deepseek-r1:7b. Sempre verifique os modelos disponíveis com ollama list e os modelos suportados no site oficial do Ollama.


Como configurar o OpenCode para usar o DeepSeek via Ollama?

A configuração do OpenCode para usar um modelo local do Ollama é feita de duas formas: via linha de comando com a flag --model ou via arquivo de configuração global. O formato segue o padrão provider/modelo, onde provider é o nome do serviço (no caso, ollama) e modelo é o nome exato do modelo baixado.

Opção 1: Usar via linha de comando (recomendado para testes)

Execute o OpenCode diretamente no diretório do seu projeto com a flag --model. Essa abordagem é ideal para testar diferentes modelos sem alterar configurações permanentes.

$ opencode --model ollama/deepseek-r1:7b

Opção 2: Configuração permanente via opencode.json

Para usar o modelo local como padrão em todas as sessões, crie ou edite o arquivo de configuração global do OpenCode. O arquivo fica em ~\.config\opencode\opencode.json no Windows ou ~/.config/opencode/opencode.json no Linux/macOS. Basta adicionar o campo model com o valor ollama/deepseek-r1:7b. Você também pode definir o small_model para tarefas leves.

$ code ~\.config\opencode\opencode.json
# Adicione o conteúdo abaixo:
{
"$schema": "https://opencode.ai/config.json",
"model": "ollama/deepseek-r1:7b"
}

Opção 3: Configuração local por projeto

Crie um arquivo opencode.json na raiz do seu projeto. Essa configuração se aplica apenas àquele diretório e sobrescreve a configuração global. Ideal para times ou projetos específicos que exigem um modelo diferente.

$ code opencode.json
# Restringe o OpenCode a usar apenas o Ollama:
{
"$schema": "https://opencode.ai/config.json",
"model": "ollama/deepseek-r1:7b",
"enabled_providers": ["ollama"]
}

Como testar se a configuração está funcionando?

Depois de configurar o OpenCode, faça um teste rápido para confirmar que o modelo está sendo carregado corretamente via Ollama. O OpenCode exibe o modelo ativo na tela inicial. Peça uma tarefa simples de código para validar o fluxo completo.

$ opencode --model ollama/deepseek-r1:7b
# O OpenCode inicia e mostra:
> Model: ollama/deepseek-r1:7b
> Working directory: C:\Users\Qb\Desktop\meu-projeto
>

Se o OpenCode iniciar sem erros, você pode pedir qualquer tarefa. Por exemplo, peça para ele listar os arquivos do diretório atual ou criar um script simples. A resposta virá do DeepSeek R1 rodando localmente no seu Ollama. Lembre-se de que a primeira requisição pode ser um pouco mais lenta enquanto o modelo carrega na memória.

> crie um arquivo hello.py com um servidor HTTP simples
[DeepSeek R1 7B via Ollama] Aqui está um servidor HTTP simples em Python...
>

Solução de problemas comuns:

  • Erro "model not found": O nome do modelo está errado. Execute ollama list para ver os modelos disponíveis.
  • Erro "connection refused": O Ollama não está rodando. Inicie manualmente com ollama serve ou reinicie o serviço.
  • Erro "out of memory": O modelo é grande demais para sua RAM. Escolha um modelo menor (1.5b ou 7b).
  • Respostas muito lentas: Ative a aceleração por GPU ou use um modelo menor.

Quais provedores o OpenCode suporta além do Ollama?

O OpenCode é agnóstico de provedor. Você pode usar qualquer modelo compatível com a arquitetura de provedores do OpenCode. O formato provider/modelo permite alternar entre diferentes serviços sem alterar configurações complexas. Abaixo estão os provedores mais comuns e como usá-los.

Provedor Prefixo Exemplo Custo Requer API Key
Ollama ollama/ ollama/deepseek-r1:7b Gratuito Não
Anthropic anthropic/ anthropic/claude-sonnet-4-6 Pago por token Sim
OpenAI openai/ openai/gpt-4o Pago por token Sim
Google google/ google/gemini-2.0-flash Gratuito / Pago Sim
DeepSeek API deepseek/ deepseek/deepseek-chat Pago por token Sim

Estratégia @CanalQb: Use o modelo local do Ollama para tarefas rotineiras de edição e automação (zero custo, dados privados). Reserve provedores pagos para tarefas complexas que exigem modelos maiores. O OpenCode permite alternar entre eles com um simples --model.


Quanto custa rodar IA local com OpenCode + Ollama?

O custo total é zero. O OpenCode é open source e gratuito. O Ollama é gratuito para uso pessoal e comercial. Os modelos como DeepSeek R1 são distribuídos sob licenças permissivas (Apache 2.0 ou MIT). O único custo é o hardware que você já tem e a eletricidade consumida durante a execução.

Para efeito de comparação, uma assinatura do GitHub Copilot custa US$ 10/mês (R$ 55). O ChatGPT Plus custa US$ 20/mês (R$ 110). O Claude Pro custa US$ 20/mês. Com a configuração deste tutorial, você elimina todos esses custos recorrentes e ainda mantém seus dados totalmente privados. Se você optar por usar provedores pagos eventualmente, o custo é por uso, controlado e sem assinatura obrigatória.


Quais as limitações de rodar modelos localmente?

Modelos locais têm limitações reais que você precisa conhecer antes de migrar completamente. O modelo 7B tem capacidade inferior a modelos como GPT-4 ou Claude Sonnet em tarefas que exigem raciocínio profundo, contexto muito longo ou conhecimento especializado muito recente. Além disso, sem GPU, a velocidade de geração é de 5 a 15 tokens por segundo, comparado a 50+ tokens por segundo em APIs comerciais.

No entanto, para 80% das tarefas do dia a dia de um desenvolvedor — edição de código, criação de scripts, automação, explicação de conceitos, revisão de sintaxe — o DeepSeek R1 7B entrega resultados perfeitamente utilizáveis. Aqui no @CanalQb, validamos que o modelo lida bem com Python, JavaScript, TypeScript, Bash, SQL e HTML/CSS. O ganho em privacidade e economia supera a perda de performance para a maioria dos usuários.


Como gerenciar múltiplos modelos no Ollama?

O Ollama permite baixar e gerenciar quantos modelos você quiser. Use ollama list para ver todos os modelos baixados, ollama pull para baixar novos e ollama rm para remover modelos que não usa mais. Cada modelo ocupa espaço em disco, mas apenas o modelo em uso consome RAM. Você pode alternar entre modelos no OpenCode usando a flag --model com nomes diferentes.

$ ollama list
NAME ID SIZE MODIFIED
deepseek-r1:7b 755ced02ce7b 4.7 GB 23 minutes ago
$ ollama pull deepseek-r1:14b
$ ollama rm deepseek-r1:1.5b

Perguntas Frequentes sobre OpenCode, Ollama e DeepSeek


Gostou do tutorial? Inscreva-se no @CanalQb no YouTube para mais conteúdos sobre IA local, automação e tecnologia prática.

Feito com Master Rules Claude v8.6

Marcadores: deepseek IA Local linux macOS Node.js Ollama opencode terminal Tutorial Windows

© julho 01, 2026 CanalQb — Python, Scripts, Automação, Airdrops e Criptomoedas | Web3 e Tech na Prática

Comentários