Saltar para o conteúdo principal
Versão: 2.0.0

Resolução de problemas

O sistema não consegue encontrar as bibliotecas CUDA

Às vezes, o kit de ferramentas CUDA é instalado em um local não padrão. A mensagem de erro aqui é frequentemente não ser capaz de encontrar libcu*12. Por exemplo, você pode ter CUDA instalado com sua configuração Python. O comando a seguir instalaria o CUDA no ambiente do Python.

sudo apt install python3-pip -y
pip3 install --upgrade fschat accelerate autoawq vllm

A maneira mais fácil de corrigir é simplesmente vincular essas bibliotecas CUDA não padrão ao local padrão, assim.

ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cublas/lib/libcublas.so.12 /usr/lib/libcublas.so.12
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cuda_runtime/lib/libcudart.so.12 /usr/lib/libcudart.so.12
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cublas/lib/libcublasLt.so.12 /usr/lib/libcublasLt.so.12

Falha na recuperação do instantâneo da coleção no Windows WSL

No Windows WSL, poderá ver este erro durante a execução gaianet init.

   * Import the Qdrant collection snapshot ...
The process may take a few minutes. Please wait ...
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Tokio task join error: task 1242 panicked"},"time":0.697784244}

Quando se olha para o ~/gaianet/log/init-qdrant.log poderá ver esta linha de erro

2024-05-20T07:24:52.900895Z ERROR qdrant::startup: Panic occurred in file /home/runner/.cargo/registry/src/index.crates.io-6f17d22bba15001f/cgroups-rs-0.3.4/src/memory.rs at line 587: called `Result::unwrap()` on an `Err` value: Error { kind: ReadFailed("/sys/fs/cgroup/memory.high"), cause: Some(Os { code: 2, kind: NotFound, message: "No such file or directory" }) }  

A solução é desativar o autoMemoryReclaim no WSL. Passo para ativar/desativar esta funcionalidade:

  1. Editar C:\Users<Your user name>.wslconfig
  2. Remover ou comentar autoMemoryReclaim em [experimental] secção.

Obrigado ao RoggeOhta por ter descoberto isto. Pode saber mais sobre o assunto aqui.

Falha ao iniciar o nó com uma mensagem de erro A porta 8080 está a ser utilizada. Sair ...

Poderá ver o seguinte erro quando executa início da gaianet.

gaianet start
[+] A verificar o ficheiro config.json ...

Já tem uma chave privada.
[+] Iniciando o servidor API do LlamaEdge ...

A porta 8080 está a ser utilizada. Sair ...

A solução é executar paragem da gaianet primeiro para matar todos os processos e, em seguida, executar início da gaianet para iniciar o nó.

Falha ao carregar a biblioteca: libgomp.so.1: não é possível abrir o ficheiro de objeto partilhado: No such file or diretory

No Windows WSL, poderá ver este erro ao executar curl -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash

* Gerar nó IS
[2024-07-02 17:50:55.175] [erro] carregamento falhou: caminho inválido, Código: 0x20
[2024-07-02 17:50:55.175] [erro] Falha ao carregar a biblioteca: libgomp.so.1: não é possível abrir o ficheiro de objeto partilhado: No such file or diretory
[2024-07-02 17:50:55.176] [erro] falha no carregamento: caminho inválido, Código: 0x20
[2024-07-02 17:50:55.176] [erro] Falha ao carregar a biblioteca: libgomp.so.1: não é possível abrir o ficheiro de objeto partilhado: No such file or diretory

O erro é causado pela falta de libgomp.so.1, uma biblioteca que deve ser instalada automaticamente no Ubuntu por padrão.

Para resolver este problema, é necessário instalar o libgomp.so.1 biblioteca.

sudo apt-get update
sudo apt-get install libgomp1

Se estiver a utilizar o CentOS, pode utilizar

yum install libgomp

Este problema foi corrigido em versão 0.2.2.

Falha ao remover a coleção predefinida

Failed to remove the default collection. {"status":{"error":"Service internal error: No such file or directory (os error 2)"},"time":0.050924542}

Normalmente, indica que a instância Qdrant não foi encerrada corretamente antes de tentar iniciá-la novamente com um novo instantâneo. A solução consiste em parar primeiro o nó GaiaNet.

paragem da gaianet

Em alternativa, pode eliminar manualmente os processos a partir do terminal ou no Monitor de atividade do SO.

sudo pkill -9 qdrant
sudo pkill -9 wasmedge
sudo pkill -9 frpc

Em seguida, pode executar gaianet init e depois início da gaianet novamente.

Erro de E/S do ficheiro

    * Importar o instantâneo da coleção Qdrant ...
O processo pode demorar alguns minutos. Please wait ...
* [Error] Failed to recover from the collection snapshot. Ocorreu um erro ao processar o campo `snapshot`: Erro de E/S do ficheiro: Operação não permitida (erro 1 do sistema operativo)

Normalmente, indica que a instância Qdrant não foi encerrada corretamente antes de tentar iniciá-la novamente com um novo instantâneo. A solução consiste em parar primeiro o nó GaiaNet.

paragem da gaianet

Em alternativa, pode eliminar manualmente os processos a partir do terminal ou no Monitor de atividade do SO.

sudo pkill -9 qdrant
sudo pkill -9 wasmedge
sudo pkill -9 frpc

Em seguida, pode executar gaianet init e depois início da gaianet novamente.

O erro "Falha ao abrir o ficheiro"

Aviso: Falha ao abrir o ficheiro 
Aviso: https://huggingface.co/datasets/max-id/gaianet-qdrant-snapshot/resolve
Aviso: /main/consensus/consensus.snapshot: Não existe tal ficheiro ou diretório
curl: (23) Falha ao escrever a saída para o destino

A razão para este tipo de erro é uma configuração incorrecta config.json ficheiro. A solução é apagar os comentários em config.json e voltar a executar o gaianet init comando.

O erro "Demasiados ficheiros abertos" no macOS

Durante a execução gaianet init para inicializar um novo nó no macOS, poderá encontrar um erro relacionado com a recuperação de instantâneos se o instantâneo contiver uma grande quantidade de texto. A mensagem de erro pode ser a seguinte:

 * [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Too many open files (os error 24)"},"time":1.574064833}
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Too many open files (os error 24)"},"time":1.574064833}

Este problema é causado pelo limite predefinido do descritor de ficheiro (FD) no macOS, que está definido para um valor relativamente baixo de 256.

Para resolver este problema, pode aumentar o limite de FD predefinido no seu sistema. Para o fazer, execute o seguinte comando:

ulimit -n 10000

Isso definirá temporariamente o limite de FD para 10.000. Em seguida, utilize gaianet init e início da gaianet comandos no MESMO terminal.

Permissão negada ao utilizar o script do instalador para instalar o WasmEdge

Durante a execução curl -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash para instalar o software do nó GaiaNet, pode deparar-se com o erro de permissão negada, especialmente ao instalar o tempo de execução do WasmEdge.

Este erro é causado pela falta de /tmp permissão de escrita. Pode utilizar --tmpdir para especificar onde pretende instalar o tempo de execução do WasmEdge. Tenha em atenção que terá de ter permissão escrita para o <YOUR_PATH> pasta.

curl -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash -s -- --tmpdir SEU_PATH

Este problema foi resolvido em versão 0.2.3.