Artigos

Quanto custa um assistente de IA privado? Um guia transparente

«Quanto vai custar?» é a primeira pergunta certa, e a maioria dos fornecedores de IA esquiva-se a ela. Não lhe daremos uma tabela de preços falsa — a resposta honesta é que depende de algumas coisas específicas — mas podemos ser completamente transparentes sobre quais são essas coisas, para que possa dimensionar um assistente de IA privado com critério e evitar gastar a mais.

Pense em três rubricas

O custo total de um assistente de IA privado divide-se em três partes. Mantê-las separadas é a chave para compreender qualquer orçamento — o nosso ou o de quem quer que seja.

1. A construção pontual

Ligar o assistente aos seus documentos (o pipeline de RAG), afiná-lo para responder bem, e integrá-lo na forma como a sua equipa trabalha. É o grosso do custo inicial, e escala com o número de fontes de dados que tem e com o grau de polimento de que a experiência precisa. Um piloto focado sobre um conjunto de documentos é deliberadamente pequeno; um assistente em produção sobre muitos sistemas é mais.

2. Onde corre

Dois modelos, dois formatos de custo. O auto-alojamento na sua própria GPU ou numa alugada (p. ex. OVHcloud) é um custo de infraestrutura mensal previsível, mais pesado se precisar de respostas rápidas para muitos utilizadores. Uma API europeia alojada (p. ex. Mistral) não tem custo de hardware mas cobra por utilização — mais barata para começar, escalando com o volume. A escolha certa é um problema de contas que resolvemos consigo.

3. Suporte contínuo (opcional)

Mantê-lo atualizado, acrescentar documentos e melhorar as respostas ao longo do tempo. Opcional, mas a maioria das equipas quer uma avença leve para que o assistente continue útil em vez de envelhecer aos poucos.

O que faz subir ou descer o valor

  • Número e desarrumação das fontes de dados — documentos limpos e bem organizados custam menos a integrar.
  • Auto-alojado vs API europeia — hardware inicial contra pagamento por utilização.
  • Quantas pessoas o usam, com que rapidez tem de responder, e quão privado tem de ser o alojamento.
  • Se precisa de integrações (Odoo, o seu CRM, o seu armazém de ficheiros) ou de um assistente autónomo.
  • Quanta melhoria contínua quer após o lançamento.

Como gastar com critério

Comece pequeno e prove. Um piloto restrito sobre um conjunto de documentos valioso diz-lhe — de forma barata — se um assistente privado se paga na sua empresa, antes de se comprometer com uma construção em produção. É exatamente assim que sequenciamos: uma auditoria gratuita para encontrar o melhor primeiro caso, um pequeno piloto para o provar com os seus dados, e só depois uma construção em produção quando o valor estiver demonstrado.

Para um valor real para a sua situação, a auditoria gratuita de soberania e IA é a via mais rápida: conte-nos o seu caso de uso e voltaremos com um número concreto e delimitado — não um folheto.

Perguntas frequentes

Porque não publicam simplesmente um preço?
Porque um assistente privado para um conjunto de documentos e outro para uma centena são projetos diferentes, e um preço fixo seria enganadoramente alto ou silenciosamente inflacionado. Preferimos ser transparentes sobre os fatores de custo e dar-lhe um valor real e delimitado após uma auditoria curta e gratuita.
É mais barato auto-alojar ou uma API?
Depende do volume. Uma API europeia é mais barata para começar e escala com a utilização; o auto-alojamento tem um custo inicial mais alto mas um custo de operação previsível e o máximo de controlo. Para volumes baixos a moderados, a API ganha muitas vezes; para uso intenso e sensível, o auto-alojamento ganha com frequência.
Qual é a forma mais barata de começar?
Um piloto pequeno e de âmbito fixo sobre um caso de uso valioso. Prova o valor sobre os seus próprios dados por um custo modesto e conhecido antes de qualquer compromisso maior — e a auditoria que o delimita é gratuita.
Há custos contínuos?
Sim, de dois tipos: o alojamento sobre o qual corre, e o suporte opcional para o manter a melhorar. Ambos são previsíveis e acordados à partida — sem surpresas.
Todos os artigos

Conte-nos sobre o seu projeto.

Algumas linhas sobre a empresa e o desafio bastam para começar. Lemos cada mensagem e respondemos pessoalmente — em 24 horas.