Integração do DeepSeek R1 com o Cursor Editor
Visão geral
Este guia orienta a configuração de um assistente de codificação privado, integrando o modelo DeepSeek R1 Distilled Llama-8B com o editor Cursor. Essa configuração fornece assistência de código eficiente, mantendo seu código privado e seguro.
Pré-requisitos
Requisitos de hardware
Configuração recomendada:
- Mac com 16 GB de RAM
- GPU NVIDIA ou NPU Huawei Ascend
Requisitos mínimos:
- Máquina com 16 GB de RAM
Instalação
Passo 1: Instalar o software Gaia
Execute o seguinte comando para instalar o Gaia:
curl -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash
Etapa 2: Inicializar o modelo DeepSeek R1
Descarregar e inicializar o modelo DeepSeek R1 Distilled Llama-8B:
gaianet init --config https://raw.githubusercontent.com/GaiaNet-AI/node-configs/main/deepseek-r1-distill-llama-8b/config.json
Passo 3: Iniciar o modelo
Lançar o Gaia e executar o modelo:
início da gaianet
Após o arranque bem sucedido, receberá um URL HTTPS (por exemplo, https://NODE-ID.gaia.domains
).
Iniciamos o modelo DeepSeek R1 com uma janela de contexto de 8k por padrão. Se sua máquina tiver uma memória GPU maior (por exemplo, 64 GB), você pode aumentar o tamanho do contexto para 128k. Uma janela de contexto maior é particularmente útil em tarefas de codificação, pois precisamos compactar grandes arquivos de código-fonte em prompts para concluir tarefas complexas.
Configuração do cursor
- Abrir definições do Cursor
- Localizar a configuração do Backend LLM
- Configurar o seguinte:
- URL da API de base: URL HTTPS do seu nó Gaia
- Nome do modelo:
DeepSeek-R1-Distill-Llama-8B
- Chave da API: Certifique-se de que substitui
A SUA CHAVE_API VAI PARA AQUI
com o seu chave API própria. Para obter a sua própria chave API, siga este tutorial.
Dados técnicos
Caraterísticas do tempo de execução do WasmEdge
A implementação utiliza o WasmEdge, um tempo de execução baseado no WebAssembly, alojado pelo CNCF no âmbito da Linux Foundation, que oferece:
- Implementação ligeira (30MB)
- Não são necessárias dependências
- Funcionamento sem raízes
- Compatibilidade entre plataformas
- Isolamento da caixa de areia
- Suporte de modelos multimodais
- Integração nativa da nuvem
Janela de contexto
- Predefinição: janela de contexto de 8k
- Expansível até 128k com 64GB de memória GPU
- Janelas de contexto maiores permitem o processamento de ficheiros de código-fonte maiores