Resumo
O Unity Catalog deu um salto conceitual fundamental no DAIS 2026: deixa de ser exclusivamente um sistema de registro para se tornar um tomador de decisões ativo em tempo de execução. Com centenas de milhares de agentes acessando dados empresariais, o Unity Catalog agora governa não apenas o acesso, mas o comportamento dos agentes, o contexto de negócio disponível para eles e a infraestrutura multinuvem onde operam.
Mais de 14.000 organizações utilizam o Unity Catalog para governança de dados e IA. As novidades do DAIS 2026 se organizam em três pilares: Controle, Contexto e Escolha.
Controle: Governança de IA para agentes
Unity AI Gateway é agora o núcleo de governança de IA dentro do Unity Catalog. Registra e governa modelos Databricks, modelos externos, serviços MCP, agentes e habilidades. As Políticas de Serviço Contextuais (Beta) aplicam controles em tempo de execução sobre o que a IA pode fazer em interações específicas.
O Governance Hub (Private Preview) oferece um centro de comando centralizado para que os administradores de dados monitorem a postura de governança, identifiquem riscos e escalem controles. As Políticas de Concessão ABAC (Beta para modelos) concedem permissões automaticamente através de modelos correspondentes.
Em breve em Preview: Atributos de Identidade para construir regras de acesso usando propriedades em tempo real de provedores de identidade, e Atributos de Contexto para aproveitar o contexto da solicitação (agente vs. aplicação). A Propagação de Etiquetas (Private Preview) leva automaticamente as etiquetas governadas através de transformações de dados.
Contexto: Semântica empresarial para agentes
O Unity Catalog Semantics fornece significado compartilhado para agentes e humanos através de três componentes:
Glossário (Preview em breve): Define conceitos e taxonomias autorizados, captura relações entre definições. O Genie Code redige e refina páginas, e aponta definições que divergem do uso real.
Domínios (Public Preview): Organiza ativos de dados e IA em categorias alinhadas com o negócio. Fornece aos agentes contexto relevante e delimitado em vez do catálogo completo. As sugestões impulsionadas por IA propõem domínios automaticamente.
Métricas (Aprimoradas): Define KPIs de negócio (receitas, churn, usuários ativos) como objetos governados e reutilizáveis. Relações multi-fact e cálculos de nível de detalhe em Dashboards (Public Preview). Materialização (Public Preview) pré-computa resultados para consultas mais rápidas. Importação do Power BI e Tableau (Beta).
Linhagem Externa (Generally Available): Estende a linhagem a sistemas de fonte upstream e relatórios BI downstream. Os pipelines do Lakeflow Connect registram a linhagem automaticamente.
Escolha: Infraestrutura aberta multi-ambiente
Namespace de quatro níveis: novo _metastore.catalog.schema.table para endereçar cada ativo em todo o patrimônio de dados. Governança multi-região chegará em breve em preview; multinuvem e multi-conta virão a seguir.
Recuperação de desastres gerenciada: Replica implantações críticas para regiões secundárias com capacidade de comutação em minutos. Requer o novo add-on Mission Critical.
Interoperabilidade multi-formato: Acesso externo a tabelas Delta gerenciadas (Public Preview), tipo FILE para governança de dados multimodais — PDFs, imagens, áudio, vídeo — (Beta), e tipos geoespaciais em Delta e Iceberg v3 (Generally Available).
Ecossistema OpenSharing: SecureConnect para conectividade cross-cloud sem cópia de dados, Global Distribution para replicação automática entre nuvens e regiões, e Genie Sharing para colaboração cross-organização em Genie Agents.
Pontos principais
- Unity Catalog evolui de sistema de registro a tomador de decisões em tempo de execução
- Governance Hub centralizado para monitoramento e gestão de riscos de governança
- Glossário, Domínios e Métricas para dar contexto semântico aos agentes
- Linhagem Externa GA: conecta dados desde fontes upstream até relatórios BI
- Namespace de quatro níveis para governança multinuvem coerente
- Tipo FILE para governança de PDFs, imagens, áudio e vídeo
- Tipos geoespaciais em Delta e Iceberg v3 disponíveis de forma geral
- Recuperação de desastres gerenciada com comutação em minutos
- SecureConnect para dados compartilhados cross-cloud sem duplicação
Por que importa?
Quando os agentes de IA operam de forma autônoma sobre dados empresariais, o modelo tradicional de governança — “quem pode acessar o quê?” — já não é suficiente. Os agentes não apenas acessam dados; os transformam, os combinam com contexto externo, tomam decisões baseadas neles e agem sobre sistemas de terceiros.
O Unity Catalog 2026 responde a essa realidade com governança de comportamento: não apenas “este agente pode ver esta tabela?” mas “o que este agente pode fazer com esses dados neste contexto?”. A adição de semântica empresarial (glossários, domínios, métricas) também aborda um dos problemas mais custosos dos agentes: as alucinações sobre o negócio. Um agente que não entende o que significa “receita recorrente mensal” no contexto da empresa falhará de formas previsíveis e difíceis de depurar.