⬜Consumo de Tokens

Saiba como funciona o consumo de Tokens no Chat com seu Agente AI

🔍 O que são tokens

Os tokens representam unidades de texto que o modelo de linguagem utiliza para processar e gerar respostas. Cada palavra, símbolo ou parte de uma palavra é transformada em tokens. Em média:

1 token ≈ 4 caracteres em português, ou aproximadamente ¾ de uma palavra.
Exemplo: A frase “Olá, tudo bem com você?” corresponde a cerca de 6 tokens.

O consumo total de tokens em uma interação depende do tamanho da entrada (prompt) e da resposta do modelo (output).

⚙️ Como o consumo é calculado no seu agente AI

Quando você faz uma pergunta ao seu agente, o modelo processa três partes principais do prompt:

Instruções base

Definidas pela nossa equipe.
Incluem orientações gerais sobre o segurança, comportamento e o tom do agente.
São sempre enviadas em toda requisição.

Instruções customizadas

Criadas por você (ou seu time).
Complementam as instruções base com regras específicas, como estilo de escrita, contexto de negócio ou políticas internas.
Também são enviadas a cada interação.

Contexto via RAG (Retrieval-Augmented Generation)

São os trechos de documentos, PDFs, vídeos, planilhas ou textos que o agente recupera automaticamente para responder à sua pergunta.
Apenas os trechos mais relevantes são enviados ao modelo, limitados a um número máximo de tokens configurado pelo sistema.

📊 Fórmula simplificada do consumo de tokens

Consumo total = Tokens das Instruções base

+ Tokens das Instruções customizadas

+ Tokens do Contexto RAG

+ Tokens da Pergunta do Usuário

+ Tokens da Resposta do Modelo

💬 Exemplo prático

Parte do Prompt

Tokens aproximados

Instruções base

1500

Instruções customizadas

400

Contexto RAG (trechos recuperados)

800

Pergunta do usuário

100

Resposta do modelo

600

Total estimado

3.400 tokens

💰 Impacto no custo

O custo total da interação é calculado com base na soma dos tokens de entrada (prompt) e saída (resposta). O preço por token depende do modelo utilizado (por exemplo: Gemini, GPT, etc).

🧩 Boas práticas para otimizar o uso

Mantenha as instruções customizadas objetivas.
Evite incluir arquivos muito extensos quando apenas partes são relevantes.
Prefira perguntas diretas e contextuais.
Atualize os documentos RAG para que o agente precise recuperar menos informações redundantes.

PreviousGerente de Comunidade NextFerramentas

Last updated 4 months ago

hashtag🔍 O que são tokens

hashtag⚙️ Como o consumo é calculado no seu agente AI

hashtag📊 Fórmula simplificada do consumo de tokens

hashtag💬 Exemplo prático

hashtag💰 Impacto no custo

hashtag🧩 Boas práticas para otimizar o uso