Resolução de problemas
O sistema não consegue encontrar as bibliotecas CUDA
Às vezes, o kit de ferramentas CUDA é instalado em um local não padrão. A mensagem de erro aqui é frequentemente não ser capaz de encontrar libcu*12
. Por exemplo, você pode ter CUDA instalado com sua configuração Python. O comando a seguir instalaria o CUDA no ambiente do Python.
sudo apt install python3-pip -y
pip3 install --upgrade fschat accelerate autoawq vllm
A maneira mais fácil de corrigir é simplesmente vincular essas bibliotecas CUDA não padrão ao local padrão, assim.
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cublas/lib/libcublas.so.12 /usr/lib/libcublas.so.12
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cuda_runtime/lib/libcudart.so.12 /usr/lib/libcudart.so.12
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cublas/lib/libcublasLt.so.12 /usr/lib/libcublasLt.so.12
Falha na recuperação do instantâneo da coleção no Windows WSL
No Windows WSL, poderá ver este erro durante a execução gaianet init
.
* Import the Qdrant collection snapshot ...
The process may take a few minutes. Please wait ...
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Tokio task join error: task 1242 panicked"},"time":0.697784244}
Quando se olha para o ~/gaianet/log/init-qdrant.log
poderá ver esta linha de erro
2024-05-20T07:24:52.900895Z ERROR qdrant::startup: Panic occurred in file /home/runner/.cargo/registry/src/index.crates.io-6f17d22bba15001f/cgroups-rs-0.3.4/src/memory.rs at line 587: called `Result::unwrap()` on an `Err` value: Error { kind: ReadFailed("/sys/fs/cgroup/memory.high"), cause: Some(Os { code: 2, kind: NotFound, message: "No such file or directory" }) }
A solução é desativar o autoMemoryReclaim
no WSL. Passo para ativar/desativar esta funcionalidade:
- Editar
C:\Users<Your user name>.wslconfig
- Remover ou comentar
autoMemoryReclaim
em[experimental]
secção.
Obrigado ao RoggeOhta por ter descoberto isto. Pode saber mais sobre o assunto aqui.
Falha ao iniciar o nó com uma mensagem de erro A porta 8080 está a ser utilizada. Sair ...
Poderá ver o seguinte erro quando executa início da gaianet
.
gaianet start
[+] A verificar o ficheiro config.json ...
Já tem uma chave privada.
[+] Iniciando o servidor API do LlamaEdge ...
A porta 8080 está a ser utilizada. Sair ...
A solução é executar paragem da gaianet
primeiro para matar todos os processos e, em seguida, executar início da gaianet
para iniciar o nó.
Falha ao carregar a biblioteca: libgomp.so.1: não é possível abrir o ficheiro de objeto partilhado: No such file or diretory
No Windows WSL, poderá ver este erro ao executar curl -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash
* Gerar nó IS
[2024-07-02 17:50:55.175] [erro] carregamento falhou: caminho inválido, Código: 0x20
[2024-07-02 17:50:55.175] [erro] Falha ao carregar a biblioteca: libgomp.so.1: não é possível abrir o ficheiro de objeto partilhado: No such file or diretory
[2024-07-02 17:50:55.176] [erro] falha no carregamento: caminho inválido, Código: 0x20
[2024-07-02 17:50:55.176] [erro] Falha ao carregar a biblioteca: libgomp.so.1: não é possível abrir o ficheiro de objeto partilhado: No such file or diretory
O erro é causado pela falta de libgomp.so.1
, uma biblioteca que deve ser instalada automaticamente no Ubuntu por padrão.
Para resolver este problema, é necessário instalar o libgomp.so.1
biblioteca.
sudo apt-get update
sudo apt-get install libgomp1
Se estiver a utilizar o CentOS, pode utilizar
yum install libgomp
Este problema foi corrigido em versão 0.2.2
.
Falha ao remover a coleção predefinida
Failed to remove the default collection. {"status":{"error":"Service internal error: No such file or directory (os error 2)"},"time":0.050924542}
Normalmente, indica que a instância Qdrant não foi encerrada corretamente antes de tentar iniciá-la novamente com um novo instantâneo. A solução consiste em parar primeiro o nó GaiaNet.
paragem da gaianet
Em alternativa, pode eliminar manualmente os processos a partir do terminal ou no Monitor de atividade do SO.
sudo pkill -9 qdrant
sudo pkill -9 wasmedge
sudo pkill -9 frpc
Em seguida, pode executar gaianet init
e depois início da gaianet
novamente.
Erro de E/S do ficheiro
* Importar o instantâneo da coleção Qdrant ...
O processo pode demorar alguns minutos. Please wait ...
* [Error] Failed to recover from the collection snapshot. Ocorreu um erro ao processar o campo `snapshot`: Erro de E/S do ficheiro: Operação não permitida (erro 1 do sistema operativo)
Normalmente, indica que a instância Qdrant não foi encerrada corretamente antes de tentar iniciá-la novamente com um novo instantâneo. A solução consiste em parar primeiro o nó GaiaNet.
paragem da gaianet
Em alternativa, pode eliminar manualmente os processos a partir do terminal ou no Monitor de atividade do SO.
sudo pkill -9 qdrant
sudo pkill -9 wasmedge
sudo pkill -9 frpc
Em seguida, pode executar gaianet init
e depois início da gaianet
novamente.
O erro "Falha ao abrir o ficheiro"
Aviso: Falha ao abrir o ficheiro
Aviso: https://huggingface.co/datasets/max-id/gaianet-qdrant-snapshot/resolve
Aviso: /main/consensus/consensus.snapshot: Não existe tal ficheiro ou diretório
curl: (23) Falha ao escrever a saída para o destino
A razão para este tipo de erro é uma configuração incorrecta config.json
ficheiro. A solução é apagar os comentários em config.json
e voltar a executar o gaianet init
comando.
O erro "Demasiados ficheiros abertos" no macOS
Durante a execução gaianet init
para inicializar um novo nó no macOS, poderá encontrar um erro relacionado com a recuperação de instantâneos se o instantâneo contiver uma grande quantidade de texto. A mensagem de erro pode ser a seguinte:
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Too many open files (os error 24)"},"time":1.574064833}
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Too many open files (os error 24)"},"time":1.574064833}
Este problema é causado pelo limite predefinido do descritor de ficheiro (FD) no macOS, que está definido para um valor relativamente baixo de 256.
Para resolver este problema, pode aumentar o limite de FD predefinido no seu sistema. Para o fazer, execute o seguinte comando:
ulimit -n 10000
Isso definirá temporariamente o limite de FD para 10.000. Em seguida, utilize gaianet init
e início da gaianet
comandos no MESMO terminal.
Permissão negada ao utilizar o script do instalador para instalar o WasmEdge
Durante a execução curl -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash
para instalar o software do nó GaiaNet, pode deparar-se com o erro de permissão negada, especialmente ao instalar o tempo de execução do WasmEdge.
Este erro é causado pela falta de /tmp
permissão de escrita. Pode utilizar --tmpdir
para especificar onde pretende instalar o tempo de execução do WasmEdge. Tenha em atenção que terá de ter permissão escrita para o <YOUR_PATH>
pasta.
curl -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash -s -- --tmpdir SEU_PATH
Este problema foi resolvido em versão 0.2.3
.