T2 - Arquitetura Técnica | CLI-x: O Terminal como Interface dos Agentes

2.1

Model Context Protocol (MCP): o padrão que conecta tudo

~35min

O protocolo aberto que define como agentes se conectam a ferramentas, dados e serviços externos.

O que é

MCP (Model Context Protocol) é um protocolo aberto criado pela Anthropic para padronizar a comunicação entre modelos de IA e ferramentas externas, eliminando integrações ad-hoc.

Por que aprender

MCP está se tornando o padrão da indústria. Entender o protocolo é fundamental para construir, conectar e depurar agentes CLI que interagem com o mundo real.

Conceitos-chave

Protocolo aberto, JSON-RPC, tool calling, interoperabilidade, padronização de interfaces.

O que é

A arquitetura MCP define os papéis de client (agente) e server (ferramenta), os protocolos de transporte (stdio, SSE, HTTP) e o formato das mensagens trocadas.

Por que aprender

Compreender a arquitetura permite debugar conexões, otimizar performance e construir servers MCP customizados.

Conceitos-chave

Client/server, stdio transport, SSE, HTTP streamable, JSON-RPC 2.0, handshake, capabilities.

O que é

Resources expõem dados (arquivos, APIs, bancos) e Tools expõem ações (executar, criar, modificar). Juntos, formam a interface completa entre agente e mundo externo.

Por que aprender

Saber quando usar Resources vs Tools é essencial para projetar servers MCP eficientes e ergonômicos.

Conceitos-chave

Resources URI, tool schemas, input validation, resource templates, tool annotations.

O que é

Prompts são templates reutilizáveis expostos pelo server, e Sampling permite que o server solicite completions ao LLM do client, habilitando fluxos bidirecionais.

Por que aprender

Prompts e Sampling desbloqueiam cenários avançados como agentes que delegam raciocínio e servers que orquestram sub-tarefas.

Conceitos-chave

Prompt templates, sampling request, createMessage, human-in-the-loop, bidirecionalidade.

O que é

O roadmap do MCP para 2026 inclui melhorias em escalabilidade, autenticação nativa, governança enterprise e suporte a cenários multi-tenant.

Por que aprender

Antecipar a evolução do protocolo permite tomar decisões arquiteturais que não ficarão obsoletas rapidamente.

Conceitos-chave

Streamable HTTP, OAuth 2.1, registry, elicitation, multi-tenancy, enterprise governance.

O que é

Docker MCP Gateway é a solução da Docker para gerenciar, distribuir e executar servers MCP como containers, com catálogo integrado e toolkit de desenvolvimento.

Por que aprender

Containers resolvem o problema de distribuição e isolamento de MCP servers, tornando o ecossistema mais seguro e reproduzível.

Conceitos-chave

Docker MCP Toolkit, MCP Catalog, gateway, container isolation, docker compose MCP.

2.2

Extensões, plugins e skills: a nova camada

~30min

Como CLIs de agentes expandem suas capacidades com extensões, plugins e skills - e por que cada abordagem é diferente.

O que é

O modelo de extensibilidade dos agentes CLI vai além de plugins tradicionais, incorporando prompts, MCP servers, hooks e comandos slash como mecanismos complementares.

Por que aprender

Entender as diferentes camadas de extensibilidade permite escolher o mecanismo certo para cada caso de uso.

Conceitos-chave

Extensibilidade multi-camada, plugins vs extensões, composabilidade, ciclo de vida de extensão.

O que é

O Gemini CLI oferece extensões via system prompts customizados, MCP servers configuráveis, comandos slash e hooks de lifecycle para personalizar o comportamento.

Por que aprender

Conhecer o ecossistema Gemini permite aproveitar um dos CLIs mais extensíveis do mercado para automação e produtividade.

Conceitos-chave

GEMINI.md, .gemini/settings.json, MCP config, slash commands, pre/post hooks.

O que é

Claude Code integra ferramentas via MCP servers configurados em settings, com suporte a permissões granulares e tool use nativo para extensão de capacidades.

Por que aprender

Claude Code é referência em integração MCP. Entender seus plugins permite construir workflows poderosos e seguros.

Conceitos-chave

CLAUDE.md, .mcp.json, permissions, tool use, allowed/denied tools, project settings.

O que é

SKILL.md é um padrão emergente para documentar capacidades, pré-condições e contratos de skills que agentes podem carregar e executar sob demanda.

Por que aprender

Skills bem documentadas são reutilizáveis e composáveis. SKILL.md torna explícito o que o agente pode esperar de cada capacidade.

Conceitos-chave

Skill contract, pré-condições, pós-condições, inputs/outputs, skill discovery, composição.

O que é

Catálogos e marketplaces centralizam a descoberta, distribuição e avaliação de extensões MCP, plugins e skills para agentes CLI.

Por que aprender

Saber onde encontrar e como avaliar extensões acelera a produtividade e reduz o risco de usar componentes inseguros.

Conceitos-chave

MCP Hub, Docker MCP Catalog, npm packages, GitHub registry, curadoria, trust scores.

O que é

Interoperabilidade é a capacidade de extensões funcionarem entre diferentes CLIs de agentes, graças ao MCP como camada comum de comunicação.

Por que aprender

Extensões interoperáveis maximizam o investimento em desenvolvimento e permitem migrar entre plataformas sem reescrever integrações.

Conceitos-chave

Cross-platform MCP, abstração de transporte, portabilidade, vendor lock-in, universal tools.

2.3

Sandboxing, segurança e governança

~35min

Como isolar, auditar e governar agentes que têm poder real sobre sistemas e dados.

O que é

Sandboxing é o isolamento de execução que limita o que um agente pode acessar e modificar, criando fronteiras de segurança entre o agente e o sistema.

Por que aprender

Agentes CLI executam código real. Sem sandboxing, um prompt injection pode comprometer todo o sistema do usuário.

Conceitos-chave

Isolamento de processo, blast radius, defense in depth, princípio do menor privilégio.

O que é

Diferentes modelos de sandbox oferecem níveis variados de isolamento: containers Docker, Linux namespaces, chroot, filesystem virtual e macOS sandbox-exec.

Por que aprender

Cada modelo tem trade-offs de segurança, performance e conveniência. Escolher errado pode ser tão ruim quanto não usar sandbox.

Conceitos-chave

Docker containers, Linux namespaces, seccomp, AppArmor, filesystem overlay, network isolation.

O que é

Políticas de execução definem regras declarativas sobre quais ações um agente pode realizar: quais ferramentas, quais diretórios, quais comandos são permitidos.

Por que aprender

Políticas bem definidas permitem dar autonomia ao agente sem abrir mão do controle, equilibrando produtividade e segurança.

Conceitos-chave

Allow/deny lists, permission scopes, tool restrictions, directory boundaries, command filtering.

O que é

Auditabilidade é a capacidade de rastrear todas as ações de um agente: quais ferramentas chamou, quais dados acessou, quais mudanças fez e por quê.

Por que aprender

Sem auditabilidade, é impossível debugar falhas, provar compliance ou entender por que um agente tomou determinada decisão.

Conceitos-chave

Audit logs, session recording, tool call traces, reprodutibilidade, structured logging.

O que é

Análise de vulnerabilidades reais descobertas em MCP servers, incluindo o caso do Anthropic Git MCP Server que permitia injeção de comandos via nomes de branch.

Por que aprender

Casos reais demonstram que segurança em MCP não é teórica. Mesmo vendors experientes cometem erros que podem ser explorados.

Conceitos-chave

Command injection, prompt injection via data, tool poisoning, CVE analysis, responsible disclosure.

O que é

Governança enterprise define como organizações controlam o uso de agentes CLI: quem pode usar quais ferramentas, com quais aprovações e sob quais políticas.

Por que aprender

Para adoção corporativa, agentes precisam de RBAC, compliance e trilhas de auditoria. Sem isso, ficam restritos a uso individual.

Conceitos-chave

RBAC, SOC2, GDPR, approval workflows, policy-as-code, centralized management, compliance reporting.

2.4

Autenticação, permissões e controle de acesso

~30min

Identidade, autenticação e autorização no contexto de agentes que agem em nome de humanos.

O que é

OAuth 2.1 e tokens são os mecanismos padrão para autenticar agentes CLI com serviços externos, permitindo acesso delegado sem expor credenciais do usuário.

Por que aprender

Todo agente que acessa APIs precisa se autenticar. OAuth é o padrão que o MCP está adotando nativamente.

Conceitos-chave

OAuth 2.1, device flow, access tokens, refresh tokens, API keys, bearer tokens.

O que é

Quando um agente executa ações, surge a questão: a ação é do agente ou do usuário? Essa distinção impacta auditoria, responsabilidade e controle de acesso.

Por que aprender

Confundir identidade do agente com a do usuário cria brechas de segurança e problemas de auditoria em ambientes corporativos.

Conceitos-chave

Agent identity, user delegation, impersonation, service accounts, attribution, non-repudiation.

O que é

Escopos e permissões definem granularmente o que um agente pode fazer: quais APIs acessar, quais operações executar, em quais recursos operar.

Por que aprender

O princípio do menor privilégio é a base de segurança. Agentes devem ter apenas as permissões mínimas necessárias para cada tarefa.

Conceitos-chave

Least privilege, OAuth scopes, fine-grained permissions, capability-based security, temporal scoping.

O que é

Secrets management é o gerenciamento seguro de credenciais, tokens e chaves que agentes precisam para acessar serviços, sem expô-los em logs ou contexto.

Por que aprender

Agentes processam tokens em seus contextos. Sem gestão adequada, secrets podem vazar em logs, outputs ou até em respostas do modelo.

Conceitos-chave

Vault, keychain, environment variables, secret rotation, credential injection, redaction.

O que é

Aprovação humana é o mecanismo que pausa a execução do agente e solicita confirmação do usuário antes de realizar ações destrutivas ou irreversíveis.

Por que aprender

Human-in-the-loop é a última linha de defesa. Saber quando exigir aprovação é crucial para equilibrar autonomia e segurança.

Conceitos-chave

Human-in-the-loop, approval gates, destructive action detection, confirmation prompts, auto-approve rules.

O que é

Integração com SSO corporativo permite que agentes CLI se autentiquem via Active Directory, SAML e OIDC, respeitando as políticas de identidade da organização.

Por que aprender

Empresas não adotam ferramentas fora do SSO. Integração corporativa é pré-requisito para deploy em escala.

Conceitos-chave

SSO, SAML 2.0, OIDC, Active Directory, SCIM provisioning, federated identity, group-based access.

2.5

Saída estruturada: JSON, schemas e introspecção

~30min

Como agentes produzem e consomem dados estruturados para integração confiável com pipelines e ferramentas.

O que é

JSON é o formato padrão para saída estruturada de agentes CLI, permitindo que outputs sejam parseados, validados e consumidos por outras ferramentas.

Por que aprender

Agentes que produzem apenas texto livre não compõem bem em pipelines. JSON transforma outputs em dados acionáveis.

Conceitos-chave

JSON output mode, structured output, --output-format json, jq integration, data pipeline.

O que é

Introspecção de schema permite que ferramentas e APIs descrevam seus inputs e outputs programaticamente, habilitando agentes a descobrir e usar ferramentas em runtime.

Por que aprender

Introspecção é o que permite a um agente usar uma ferramenta que nunca viu antes, baseando-se apenas na descrição do schema.

Conceitos-chave

JSON Schema, OpenAPI, tool descriptions, self-describing APIs, schema validation, type inference.

O que é

Discovery Service é o mecanismo pelo qual CLIs como gcloud/gws descobrem e montam comandos dinamicamente, consultando APIs de discovery em runtime.

Por que aprender

O padrão de discovery é um blueprint para como agentes podem expandir suas capacidades automaticamente ao descobrir novas ferramentas.

Conceitos-chave

Google Discovery API, runtime command generation, dynamic CLI, lazy loading, API surface discovery.

O que é

Dry-run é a capacidade de simular a execução de um comando ou ação sem efeitos colaterais, mostrando o que seria feito antes de realmente fazer.

Por que aprender

Dry-run é essencial para segurança e confiança. Permite revisar planos de execução antes de dar permissão ao agente.

Conceitos-chave

--dry-run, execution plan, preview mode, what-if analysis, diff preview, rollback plan.

O que é

Auto-paginação é o mecanismo que permite a agentes iterar automaticamente sobre resultados paginados de APIs, coletando todos os dados sem intervenção manual.

Por que aprender

APIs reais retornam dados paginados. Agentes precisam lidar com paginação de forma eficiente sem estourar contexto ou memória.

Conceitos-chave

Cursor pagination, page tokens, --limit, streaming results, context window management, lazy evaluation.

O que é

Validação e testes garantem que a saída estruturada de agentes e ferramentas está conforme o schema esperado, detectando erros antes que se propaguem.

Por que aprender

LLMs podem gerar JSON malformado ou com campos faltando. Validação automatizada é a rede de segurança para pipelines confiáveis.

Conceitos-chave

JSON Schema validation, contract testing, snapshot tests, output assertions, regression testing, Zod/Pydantic.

← Fundamentos CLI-Anything →