Model Context Protocol (MCP): o padrão que conecta tudo
O protocolo aberto que define como agentes se conectam a ferramentas, dados e serviços externos.
O que é
MCP (Model Context Protocol) é um protocolo aberto criado pela Anthropic para padronizar a comunicação entre modelos de IA e ferramentas externas, eliminando integrações ad-hoc.
Por que aprender
MCP está se tornando o padrão da indústria. Entender o protocolo é fundamental para construir, conectar e depurar agentes CLI que interagem com o mundo real.
Conceitos-chave
Protocolo aberto, JSON-RPC, tool calling, interoperabilidade, padronização de interfaces.
O que é
A arquitetura MCP define os papéis de client (agente) e server (ferramenta), os protocolos de transporte (stdio, SSE, HTTP) e o formato das mensagens trocadas.
Por que aprender
Compreender a arquitetura permite debugar conexões, otimizar performance e construir servers MCP customizados.
Conceitos-chave
Client/server, stdio transport, SSE, HTTP streamable, JSON-RPC 2.0, handshake, capabilities.
O que é
Resources expõem dados (arquivos, APIs, bancos) e Tools expõem ações (executar, criar, modificar). Juntos, formam a interface completa entre agente e mundo externo.
Por que aprender
Saber quando usar Resources vs Tools é essencial para projetar servers MCP eficientes e ergonômicos.
Conceitos-chave
Resources URI, tool schemas, input validation, resource templates, tool annotations.
O que é
Prompts são templates reutilizáveis expostos pelo server, e Sampling permite que o server solicite completions ao LLM do client, habilitando fluxos bidirecionais.
Por que aprender
Prompts e Sampling desbloqueiam cenários avançados como agentes que delegam raciocínio e servers que orquestram sub-tarefas.
Conceitos-chave
Prompt templates, sampling request, createMessage, human-in-the-loop, bidirecionalidade.
O que é
O roadmap do MCP para 2026 inclui melhorias em escalabilidade, autenticação nativa, governança enterprise e suporte a cenários multi-tenant.
Por que aprender
Antecipar a evolução do protocolo permite tomar decisões arquiteturais que não ficarão obsoletas rapidamente.
Conceitos-chave
Streamable HTTP, OAuth 2.1, registry, elicitation, multi-tenancy, enterprise governance.
O que é
Docker MCP Gateway é a solução da Docker para gerenciar, distribuir e executar servers MCP como containers, com catálogo integrado e toolkit de desenvolvimento.
Por que aprender
Containers resolvem o problema de distribuição e isolamento de MCP servers, tornando o ecossistema mais seguro e reproduzível.
Conceitos-chave
Docker MCP Toolkit, MCP Catalog, gateway, container isolation, docker compose MCP.
Extensões, plugins e skills: a nova camada
Como CLIs de agentes expandem suas capacidades com extensões, plugins e skills - e por que cada abordagem é diferente.
O que é
O modelo de extensibilidade dos agentes CLI vai além de plugins tradicionais, incorporando prompts, MCP servers, hooks e comandos slash como mecanismos complementares.
Por que aprender
Entender as diferentes camadas de extensibilidade permite escolher o mecanismo certo para cada caso de uso.
Conceitos-chave
Extensibilidade multi-camada, plugins vs extensões, composabilidade, ciclo de vida de extensão.
O que é
O Gemini CLI oferece extensões via system prompts customizados, MCP servers configuráveis, comandos slash e hooks de lifecycle para personalizar o comportamento.
Por que aprender
Conhecer o ecossistema Gemini permite aproveitar um dos CLIs mais extensíveis do mercado para automação e produtividade.
Conceitos-chave
GEMINI.md, .gemini/settings.json, MCP config, slash commands, pre/post hooks.
O que é
Claude Code integra ferramentas via MCP servers configurados em settings, com suporte a permissões granulares e tool use nativo para extensão de capacidades.
Por que aprender
Claude Code é referência em integração MCP. Entender seus plugins permite construir workflows poderosos e seguros.
Conceitos-chave
CLAUDE.md, .mcp.json, permissions, tool use, allowed/denied tools, project settings.
O que é
SKILL.md é um padrão emergente para documentar capacidades, pré-condições e contratos de skills que agentes podem carregar e executar sob demanda.
Por que aprender
Skills bem documentadas são reutilizáveis e composáveis. SKILL.md torna explícito o que o agente pode esperar de cada capacidade.
Conceitos-chave
Skill contract, pré-condições, pós-condições, inputs/outputs, skill discovery, composição.
O que é
Catálogos e marketplaces centralizam a descoberta, distribuição e avaliação de extensões MCP, plugins e skills para agentes CLI.
Por que aprender
Saber onde encontrar e como avaliar extensões acelera a produtividade e reduz o risco de usar componentes inseguros.
Conceitos-chave
MCP Hub, Docker MCP Catalog, npm packages, GitHub registry, curadoria, trust scores.
O que é
Interoperabilidade é a capacidade de extensões funcionarem entre diferentes CLIs de agentes, graças ao MCP como camada comum de comunicação.
Por que aprender
Extensões interoperáveis maximizam o investimento em desenvolvimento e permitem migrar entre plataformas sem reescrever integrações.
Conceitos-chave
Cross-platform MCP, abstração de transporte, portabilidade, vendor lock-in, universal tools.
Sandboxing, segurança e governança
Como isolar, auditar e governar agentes que têm poder real sobre sistemas e dados.
O que é
Sandboxing é o isolamento de execução que limita o que um agente pode acessar e modificar, criando fronteiras de segurança entre o agente e o sistema.
Por que aprender
Agentes CLI executam código real. Sem sandboxing, um prompt injection pode comprometer todo o sistema do usuário.
Conceitos-chave
Isolamento de processo, blast radius, defense in depth, princípio do menor privilégio.
O que é
Diferentes modelos de sandbox oferecem níveis variados de isolamento: containers Docker, Linux namespaces, chroot, filesystem virtual e macOS sandbox-exec.
Por que aprender
Cada modelo tem trade-offs de segurança, performance e conveniência. Escolher errado pode ser tão ruim quanto não usar sandbox.
Conceitos-chave
Docker containers, Linux namespaces, seccomp, AppArmor, filesystem overlay, network isolation.
O que é
Políticas de execução definem regras declarativas sobre quais ações um agente pode realizar: quais ferramentas, quais diretórios, quais comandos são permitidos.
Por que aprender
Políticas bem definidas permitem dar autonomia ao agente sem abrir mão do controle, equilibrando produtividade e segurança.
Conceitos-chave
Allow/deny lists, permission scopes, tool restrictions, directory boundaries, command filtering.
O que é
Auditabilidade é a capacidade de rastrear todas as ações de um agente: quais ferramentas chamou, quais dados acessou, quais mudanças fez e por quê.
Por que aprender
Sem auditabilidade, é impossível debugar falhas, provar compliance ou entender por que um agente tomou determinada decisão.
Conceitos-chave
Audit logs, session recording, tool call traces, reprodutibilidade, structured logging.
O que é
Análise de vulnerabilidades reais descobertas em MCP servers, incluindo o caso do Anthropic Git MCP Server que permitia injeção de comandos via nomes de branch.
Por que aprender
Casos reais demonstram que segurança em MCP não é teórica. Mesmo vendors experientes cometem erros que podem ser explorados.
Conceitos-chave
Command injection, prompt injection via data, tool poisoning, CVE analysis, responsible disclosure.
O que é
Governança enterprise define como organizações controlam o uso de agentes CLI: quem pode usar quais ferramentas, com quais aprovações e sob quais políticas.
Por que aprender
Para adoção corporativa, agentes precisam de RBAC, compliance e trilhas de auditoria. Sem isso, ficam restritos a uso individual.
Conceitos-chave
RBAC, SOC2, GDPR, approval workflows, policy-as-code, centralized management, compliance reporting.
Autenticação, permissões e controle de acesso
Identidade, autenticação e autorização no contexto de agentes que agem em nome de humanos.
O que é
OAuth 2.1 e tokens são os mecanismos padrão para autenticar agentes CLI com serviços externos, permitindo acesso delegado sem expor credenciais do usuário.
Por que aprender
Todo agente que acessa APIs precisa se autenticar. OAuth é o padrão que o MCP está adotando nativamente.
Conceitos-chave
OAuth 2.1, device flow, access tokens, refresh tokens, API keys, bearer tokens.
O que é
Quando um agente executa ações, surge a questão: a ação é do agente ou do usuário? Essa distinção impacta auditoria, responsabilidade e controle de acesso.
Por que aprender
Confundir identidade do agente com a do usuário cria brechas de segurança e problemas de auditoria em ambientes corporativos.
Conceitos-chave
Agent identity, user delegation, impersonation, service accounts, attribution, non-repudiation.
O que é
Escopos e permissões definem granularmente o que um agente pode fazer: quais APIs acessar, quais operações executar, em quais recursos operar.
Por que aprender
O princípio do menor privilégio é a base de segurança. Agentes devem ter apenas as permissões mínimas necessárias para cada tarefa.
Conceitos-chave
Least privilege, OAuth scopes, fine-grained permissions, capability-based security, temporal scoping.
O que é
Secrets management é o gerenciamento seguro de credenciais, tokens e chaves que agentes precisam para acessar serviços, sem expô-los em logs ou contexto.
Por que aprender
Agentes processam tokens em seus contextos. Sem gestão adequada, secrets podem vazar em logs, outputs ou até em respostas do modelo.
Conceitos-chave
Vault, keychain, environment variables, secret rotation, credential injection, redaction.
O que é
Aprovação humana é o mecanismo que pausa a execução do agente e solicita confirmação do usuário antes de realizar ações destrutivas ou irreversíveis.
Por que aprender
Human-in-the-loop é a última linha de defesa. Saber quando exigir aprovação é crucial para equilibrar autonomia e segurança.
Conceitos-chave
Human-in-the-loop, approval gates, destructive action detection, confirmation prompts, auto-approve rules.
O que é
Integração com SSO corporativo permite que agentes CLI se autentiquem via Active Directory, SAML e OIDC, respeitando as políticas de identidade da organização.
Por que aprender
Empresas não adotam ferramentas fora do SSO. Integração corporativa é pré-requisito para deploy em escala.
Conceitos-chave
SSO, SAML 2.0, OIDC, Active Directory, SCIM provisioning, federated identity, group-based access.
Saída estruturada: JSON, schemas e introspecção
Como agentes produzem e consomem dados estruturados para integração confiável com pipelines e ferramentas.
O que é
JSON é o formato padrão para saída estruturada de agentes CLI, permitindo que outputs sejam parseados, validados e consumidos por outras ferramentas.
Por que aprender
Agentes que produzem apenas texto livre não compõem bem em pipelines. JSON transforma outputs em dados acionáveis.
Conceitos-chave
JSON output mode, structured output, --output-format json, jq integration, data pipeline.
O que é
Introspecção de schema permite que ferramentas e APIs descrevam seus inputs e outputs programaticamente, habilitando agentes a descobrir e usar ferramentas em runtime.
Por que aprender
Introspecção é o que permite a um agente usar uma ferramenta que nunca viu antes, baseando-se apenas na descrição do schema.
Conceitos-chave
JSON Schema, OpenAPI, tool descriptions, self-describing APIs, schema validation, type inference.
O que é
Discovery Service é o mecanismo pelo qual CLIs como gcloud/gws descobrem e montam comandos dinamicamente, consultando APIs de discovery em runtime.
Por que aprender
O padrão de discovery é um blueprint para como agentes podem expandir suas capacidades automaticamente ao descobrir novas ferramentas.
Conceitos-chave
Google Discovery API, runtime command generation, dynamic CLI, lazy loading, API surface discovery.
O que é
Dry-run é a capacidade de simular a execução de um comando ou ação sem efeitos colaterais, mostrando o que seria feito antes de realmente fazer.
Por que aprender
Dry-run é essencial para segurança e confiança. Permite revisar planos de execução antes de dar permissão ao agente.
Conceitos-chave
--dry-run, execution plan, preview mode, what-if analysis, diff preview, rollback plan.
O que é
Auto-paginação é o mecanismo que permite a agentes iterar automaticamente sobre resultados paginados de APIs, coletando todos os dados sem intervenção manual.
Por que aprender
APIs reais retornam dados paginados. Agentes precisam lidar com paginação de forma eficiente sem estourar contexto ou memória.
Conceitos-chave
Cursor pagination, page tokens, --limit, streaming results, context window management, lazy evaluation.
O que é
Validação e testes garantem que a saída estruturada de agentes e ferramentas está conforme o schema esperado, detectando erros antes que se propaguem.
Por que aprender
LLMs podem gerar JSON malformado ou com campos faltando. Validação automatizada é a rede de segurança para pipelines confiáveis.
Conceitos-chave
JSON Schema validation, contract testing, snapshot tests, output assertions, regression testing, Zod/Pydantic.