Acceleration e Runtime¶

O Koharu suporta múltiplos backends de runtime para que a mesma pipeline possa rodar em uma ampla gama de hardware.

CUDA em GPUs NVIDIA¶

CUDA é o backend principal de GPU em sistemas com hardware NVIDIA suportado.

O Koharu suporta GPUs NVIDIA com compute capability 8.0 ou superior
O Koharu empacota o CUDA toolkit 13.0

Na primeira execução, o Koharu extrai as bibliotecas dinâmicas necessárias para o diretório de dados do aplicativo.

Note

A acceleration CUDA depende de um driver NVIDIA recente. Se o driver não suportar CUDA 13.0 ou superior, o Koharu faz fallback para CPU. O caminho CUDA do LLM local no Windows requer CUDA 13.1+.

Metal em Apple Silicon¶

No macOS, o Koharu suporta acceleration Metal em sistemas Apple Silicon, como as famílias M1 e M2.

Vulkan no Windows e Linux¶

No Windows e no Linux, o Vulkan está disponível como um caminho alternativo de GPU para inferência de OCR e LLM quando CUDA ou Metal não estão disponíveis.

GPUs AMD e Intel podem se beneficiar do Vulkan, mas detection e inpainting ainda dependem de CUDA ou Metal.

Fallback para CPU¶

O Koharu sempre pode rodar em CPU quando a acceleration por GPU não está disponível ou quando você força explicitamente o modo CPU.

# macOS / Linux
koharu --cpu

# Windows
koharu.exe --cpu

Por que o fallback importa¶

O comportamento de fallback torna o Koharu utilizável em mais máquinas, mas muda o perfil de desempenho:

A inferência em GPU é muito mais rápida quando suportada
O modo CPU é mais compatível, mas pode ser substancialmente mais lento
LLMs locais menores geralmente são a melhor escolha em sistemas apenas com CPU

Para orientações sobre seleção de modelos, veja Modelos e Provedores.