Ir para o conteúdo

Acceleration e Runtime

O Koharu suporta múltiplos backends de runtime para que a mesma pipeline possa rodar em uma ampla gama de hardware.

CUDA em GPUs NVIDIA

CUDA é o backend principal de GPU em sistemas com hardware NVIDIA suportado.

  • O Koharu suporta GPUs NVIDIA com compute capability 7.5 ou superior
  • O Koharu empacota o CUDA toolkit 13.1

Na primeira execução, o Koharu extrai as bibliotecas dinâmicas necessárias para o diretório de dados do aplicativo.

Note

A acceleration CUDA depende de um driver NVIDIA recente. Se o driver não suportar CUDA 13.1, o Koharu faz fallback para CPU.

Metal em Apple Silicon

No macOS, o Koharu suporta acceleration Metal em sistemas Apple Silicon, como as famílias M1 e M2.

Vulkan no Windows e Linux

No Windows e no Linux, o Vulkan está disponível como um caminho alternativo de GPU para inferência de OCR e LLM quando CUDA ou Metal não estão disponíveis.

GPUs AMD e Intel podem se beneficiar do Vulkan, mas detection e inpainting ainda dependem de CUDA ou Metal.

Fallback para CPU

O Koharu sempre pode rodar em CPU quando a acceleration por GPU não está disponível ou quando você força explicitamente o modo CPU.

# macOS / Linux
koharu --cpu

# Windows
koharu.exe --cpu

Por que o fallback importa

O comportamento de fallback torna o Koharu utilizável em mais máquinas, mas muda o perfil de desempenho:

  • A inferência em GPU é muito mais rápida quando suportada
  • O modo CPU é mais compatível, mas pode ser substancialmente mais lento
  • LLMs locais menores geralmente são a melhor escolha em sistemas apenas com CPU

Para orientações sobre seleção de modelos, veja Modelos e Provedores.