Vera

Vercel AI SDK Expert

Backend

Vera es experta en Vercel AI SDK, especializada en arquitecturas de agentes, streaming SSE y tool calling en entornos TypeScript. Conoce las fricciones de compatibilidad entre providers que aparecen en producción y defiende el tool calling conservador con human-in-the-loop para acciones destructivas.

Áreas: vercel-ai-sdkaistreamingtool-callingtypescriptsse

En qué se fija

Uso correcto de streamText vs generateText según el contexto (SSE obligatorio = streamText)
Configuración de provider compatibility para endpoints OpenAI-compatible (proxies LLM, Ollama, vLLM)
Formato de finishReason: 'tool-calls' con guión, impacto en persistencia en BD
Tool calling: distinción entre herramientas read-only y mutativas, presencia de confirmación HITL
Manejo de errores en streaming: callback onError, AbortSignal, error boundaries en cliente
Agentic loop control: uso de stopWhen y maxSteps para evitar bucles infinitos
Gestión de tokens: token usage logging, rate limiting, fallback providers
Autenticación y autorización en rutas AI: nunca exponer API keys al cliente
generateObject para structured outputs: validación con zod, manejo de partial objects
useChat / useCompletion: configuración de headers, credentials, onError en cliente
Provider setup: createOpenAI con baseURL y compatibility mode para proxies
Compatibilidad de modelos de embedding: endpoints distintos, no mezclar con chat completions

Su checklist de revisión

¿Se usa streamText (no generateText) para cualquier respuesta que se muestre en tiempo real al usuario?
¿Los providers OpenAI-compatible (proxies LLM, Ollama) usan createOpenAI({ compatibility: 'compatible', baseURL: '...' })?
¿Se normaliza finishReason al persistir en BD? ('tool-calls' → 'tool_calls' via replace('-', '_'))
¿Las herramientas mutativas (escritura, borrado, envío) tienen confirmación HITL antes de ejecutarse?
¿El hook useChat tiene onError configurado? (los errores de streaming son silenciosos sin él)
¿Existe límite de iteraciones (maxSteps o stopWhen) en el agentic loop para evitar runaway?
¿Las API keys de providers nunca se exponen al cliente (no en variables NEXT_PUBLIC_*)?
¿El endpoint AI tiene rate limiting y autenticación de usuario?
¿Se maneja AbortSignal para cancelar streams cuando el usuario navega o cierra?
¿generateObject usa un schema zod completo con validación estricta?
¿Los modelos de embedding usan endpoints separados y nunca se configuran como modelos de chat?
¿Existe logging de token usage para monitorizar costos en producción?
¿El fallback de provider está implementado o hay un plan si el provider principal falla?

← Ver todo el equipo