Incidents
Detecção, ack, snooze, timeline, remediação e resolução
Runbooks
CRUD completo de planos de remediação
Analytics
MTTD, MTTR, trends, top resources, capacity, compliance
SLOs
Targets, error budget, burn rate e histórico
Federation
Status multi-cluster, correlações cross-tier
Health
Liveness e readiness probes
Base URL
A porta padrão é 8090 mas pode ser alterada via Helm (
--set apiPort=...) ou env var CHATCLI_API_PORT. Em produção, exponha atrás de um Ingress com TLS.Fluxo de uma requisição
Autenticação
Todas as requisições devem incluir o headerX-API-Key com uma chave válida:
Roles
viewer
Somente leitura. GET em todos os endpoints. Ideal para dashboards e ferramentas de observabilidade.
operator
Operação diária. GET + POST de ações (acknowledge, approve, reject). NOC, SRE e on-call.
admin
Acesso total. GET, POST, PUT, DELETE. CI/CD, automações privilegiadas e ferramentas de gestão.
Rate limiting
| Role | Limite | Janela |
|---|---|---|
viewer | 100 req | por minuto |
operator | 500 req | por minuto |
admin | 1000 req | por minuto |
Formato de resposta
Todas as respostas seguem o padrão Kubernetes-like:- Lista
- Recurso individual
- Erro
Códigos de erro
| Código | Significado | Quando acontece |
|---|---|---|
400 | Bad Request | Parâmetros ausentes ou mal formatados |
401 | Unauthorized | X-API-Key ausente ou inválida |
403 | Forbidden | Role insuficiente para a operação |
404 | Not Found | Recurso não existe |
409 | Conflict | Recurso já existe ou estado inválido para a operação |
429 | Too Many Requests | Rate limit excedido — veja Retry-After |
500 | Internal Server Error | Falha no operator — investigue logs |
Paginação
Endpoints que retornam listas suportam paginação via query parameters:Número da página (começa em 1)
Itens por página (máximo: 100)
metadata.totalCount para você calcular o número total de páginas.
Versionamento
A API utiliza versionamento via path (/api/v1/). Versões futuras serão adicionadas como /api/v2/ mantendo compatibilidade retroativa com v1.
Mudanças breaking-change só ocorrem entre versões maiores. Dentro de uma versão, apenas adições compatíveis (novos campos opcionais, novos endpoints) são publicadas.
Próximos passos
AIOps Platform — visão geral
Como a plataforma detecta, analisa e remedia incidentes
Operator Kubernetes
Deploy do operator, CRDs e configuração
Incident lifecycle
Fluxo completo: detecção → análise → remediação → resolução
AIOps em produção
Cookbook: setup completo com TLS, RBAC, notificações e SLOs