Robit
LLM Manager
WhatsApp Agent ·
ROBIT
Conectando...
Carregando...
Carregando providers...
Buscando configurações da API

Embedding para RAG

Escolha o provedor que gera os vetores semânticos usados na busca por similaridade.

Carregando...
Padrão
Gemini
Gemini
gemini-embedding-001
Grátis Recomendado

API do Google. 1.500 req/min no plano gratuito. Requer Gemini API Key.

Dims: 1536 500x mais generoso
Modelo Atual
gemini-embedding-001 único modelo
API Key
···· (Compartilhada com Gemini)
GEMINI_API_KEY ✓ lida do .env
Padrão
OpenAI
OpenAI
text-embedding-3-small
Pago por uso

Alta precisão semântica. Apenas 3 req/min grátis. ~$0.02/1M tokens.

Dims: 1536 $ Por uso
Modelo Atual
text-embedding-3-small em uso
Selecionar Modelo
API Key
···· (Compartilhada com OpenAI)
OPENAI_API_KEY ✓ lida do .env
Padrão
Ollama
Ollama
nomic-embed-text
100% Local Grátis

Roda totalmente local. Sem custo, sem limite. Requer Docker Ollama ativo.

Dims: 768 ∞ Ilimitado
Modelo Ollama
URL Ollama

No Docker? Use http://host.docker.internal:11434

API Key
Não necessária — rodando local

Transcription (Áudio → Texto)

Provider usado para transcrever áudios do WhatsApp antes de enviar ao LLM principal.

OpenAI Whisper
Padrão
OpenAI
OpenAI Whisper
whisper-1
Pago Principal atual

Melhor qualidade — 99 idiomas incluindo PT-BR. ~$0.006/min.

Modelos: whisper-1
Modelo Atual
whisper-1 único modelo
API Key
···· (Compartilhada com OpenAI)
OPENAI_API_KEY ✓ lida do .env
Padrão
Groq
Groq Whisper
whisper-large-v3-turbo
Grátis Fallback atual

Gratuito com rate limit. Quase igual ao Whisper-1 em qualidade. Ótimo fallback.

Modelos: whisper-large-v3-turbo · whisper-large-v3 · distil-whisper-large-v3-en
Modelo Atual
whisper-large-v3-turbo em uso
Selecionar Modelo
API Key
···· (Compartilhada com Groq)
GROQ_API_KEY ✓ lida do .env

Vision (Imagem → Texto)

Provider usado para interpretar imagens recebidas no WhatsApp antes de enviar ao LLM principal.

OpenAI Vision
Padrão
OpenAI
OpenAI Vision
gpt-4o
Pago Principal atual

Melhor qualidade de análise visual. gpt-4o-mini é opção mais econômica.

Modelos: gpt-4o · gpt-4o-mini
Modelo Atual
gpt-4o em uso
Selecionar Modelo
API Key
···· (Compartilhada com OpenAI)
OPENAI_API_KEY ✓ lida do .env
Padrão
Gemini
Google Gemini Vision
gemini-1.5-flash
Tier Grátis Fallback atual

Tier gratuito disponível. Suporta JPEG, PNG, WEBP e PDF. Ótimo fallback.

Modelos: gemini-1.5-flash · gemini-1.5-pro · gemini-2.0-flash
Modelo Atual
gemini-1.5-flash em uso
Selecionar Modelo
API Key
···· (Compartilhada com Gemini)
GEMINI_API_KEY ✓ lida do .env