Dados DAIS 2026

Unity Catalog: Governança em tempo real para a era agêntica

Unity Catalog evolui de sistema de registro a tomador de decisões ativo em tempo de execução, com semântica empresarial para agentes, multinuvem e suporte a dados multimodais.

Destaques

  • Unity Catalog evolui de sistema de registro a tomador de decisões em tempo de execução
  • Governance Hub centralizado para monitoramento e gestão de riscos de governança
  • Glossário, Domínios e Métricas para dar contexto semântico aos agentes
  • Linhagem Externa GA: conecta dados desde fontes upstream até relatórios BI
  • Namespace de quatro níveis para governança multinuvem coerente

Em números

14K+ Organizações usuárias
4 niveles Namespace hierárquico
Multi-nube Governança global
Unity Catalog
namespace hierárquico · 4 níveis
MULTI-CLOUD

Explorar o catálogo

Detalhes do nó selecionado

↑ Clique em qualquer nó da árvore

Controle de acesso Por coluna
Linhagem Automático
Etiquetas semânticas Glossário integrado
Alcance Multi-cloud
Análise completa

Resumo

O Unity Catalog deu um salto conceitual fundamental no DAIS 2026: deixa de ser exclusivamente um sistema de registro para se tornar um tomador de decisões ativo em tempo de execução. Com centenas de milhares de agentes acessando dados empresariais, o Unity Catalog agora governa não apenas o acesso, mas o comportamento dos agentes, o contexto de negócio disponível para eles e a infraestrutura multinuvem onde operam.

Mais de 14.000 organizações utilizam o Unity Catalog para governança de dados e IA. As novidades do DAIS 2026 se organizam em três pilares: Controle, Contexto e Escolha.

Controle: Governança de IA para agentes

Unity AI Gateway é agora o núcleo de governança de IA dentro do Unity Catalog. Registra e governa modelos Databricks, modelos externos, serviços MCP, agentes e habilidades. As Políticas de Serviço Contextuais (Beta) aplicam controles em tempo de execução sobre o que a IA pode fazer em interações específicas.

O Governance Hub (Private Preview) oferece um centro de comando centralizado para que os administradores de dados monitorem a postura de governança, identifiquem riscos e escalem controles. As Políticas de Concessão ABAC (Beta para modelos) concedem permissões automaticamente através de modelos correspondentes.

Em breve em Preview: Atributos de Identidade para construir regras de acesso usando propriedades em tempo real de provedores de identidade, e Atributos de Contexto para aproveitar o contexto da solicitação (agente vs. aplicação). A Propagação de Etiquetas (Private Preview) leva automaticamente as etiquetas governadas através de transformações de dados.

Contexto: Semântica empresarial para agentes

O Unity Catalog Semantics fornece significado compartilhado para agentes e humanos através de três componentes:

Glossário (Preview em breve): Define conceitos e taxonomias autorizados, captura relações entre definições. O Genie Code redige e refina páginas, e aponta definições que divergem do uso real.

Domínios (Public Preview): Organiza ativos de dados e IA em categorias alinhadas com o negócio. Fornece aos agentes contexto relevante e delimitado em vez do catálogo completo. As sugestões impulsionadas por IA propõem domínios automaticamente.

Métricas (Aprimoradas): Define KPIs de negócio (receitas, churn, usuários ativos) como objetos governados e reutilizáveis. Relações multi-fact e cálculos de nível de detalhe em Dashboards (Public Preview). Materialização (Public Preview) pré-computa resultados para consultas mais rápidas. Importação do Power BI e Tableau (Beta).

Linhagem Externa (Generally Available): Estende a linhagem a sistemas de fonte upstream e relatórios BI downstream. Os pipelines do Lakeflow Connect registram a linhagem automaticamente.

Escolha: Infraestrutura aberta multi-ambiente

Namespace de quatro níveis: novo _metastore.catalog.schema.table para endereçar cada ativo em todo o patrimônio de dados. Governança multi-região chegará em breve em preview; multinuvem e multi-conta virão a seguir.

Recuperação de desastres gerenciada: Replica implantações críticas para regiões secundárias com capacidade de comutação em minutos. Requer o novo add-on Mission Critical.

Interoperabilidade multi-formato: Acesso externo a tabelas Delta gerenciadas (Public Preview), tipo FILE para governança de dados multimodais — PDFs, imagens, áudio, vídeo — (Beta), e tipos geoespaciais em Delta e Iceberg v3 (Generally Available).

Ecossistema OpenSharing: SecureConnect para conectividade cross-cloud sem cópia de dados, Global Distribution para replicação automática entre nuvens e regiões, e Genie Sharing para colaboração cross-organização em Genie Agents.

Pontos principais

  • Unity Catalog evolui de sistema de registro a tomador de decisões em tempo de execução
  • Governance Hub centralizado para monitoramento e gestão de riscos de governança
  • Glossário, Domínios e Métricas para dar contexto semântico aos agentes
  • Linhagem Externa GA: conecta dados desde fontes upstream até relatórios BI
  • Namespace de quatro níveis para governança multinuvem coerente
  • Tipo FILE para governança de PDFs, imagens, áudio e vídeo
  • Tipos geoespaciais em Delta e Iceberg v3 disponíveis de forma geral
  • Recuperação de desastres gerenciada com comutação em minutos
  • SecureConnect para dados compartilhados cross-cloud sem duplicação

Por que importa?

Quando os agentes de IA operam de forma autônoma sobre dados empresariais, o modelo tradicional de governança — “quem pode acessar o quê?” — já não é suficiente. Os agentes não apenas acessam dados; os transformam, os combinam com contexto externo, tomam decisões baseadas neles e agem sobre sistemas de terceiros.

O Unity Catalog 2026 responde a essa realidade com governança de comportamento: não apenas “este agente pode ver esta tabela?” mas “o que este agente pode fazer com esses dados neste contexto?”. A adição de semântica empresarial (glossários, domínios, métricas) também aborda um dos problemas mais custosos dos agentes: as alucinações sobre o negócio. Um agente que não entende o que significa “receita recorrente mensal” no contexto da empresa falhará de formas previsíveis e difíceis de depurar.

Baseado em conteúdo oficial de Databricks Fonte oficial