Data clean rooms: qué son, cuáles existen y si tiene sentido adoptarlas en LATAM hoy

Una tecnología que resuelve un problema real, pero que llega a la región con una factura que la mayoría no puede pagar todavía

Cuando Mercado Libre quiere demostrarle a una marca de consumo masivo que sus anuncios en la plataforma realmente impactaron las ventas, enfrenta un problema clásico. Los datos de la marca y los datos de Mercado Libre no pueden mezclarse sin violar la privacidad de los usuarios ni arriesgar la confidencialidad comercial de ninguna de las partes. Las data clean rooms (DCRs) nacieron precisamente para resolver esa tensión. Son el entorno donde dos conjuntos de datos se cruzan sin que ninguna de las partes vea los datos crudos del otro.

La pregunta que importa en LATAM no es si las data clean rooms funcionan. Funcionan. La pregunta es si el ecosistema local tiene las condiciones para adoptarlas, y a qué costo.

Qué es una data clean room y cómo funciona

Una data clean room es un entorno tecnológico controlado donde dos o más partes pueden combinar sus conjuntos de datos de primera mano para ejecutar análisis sin que ninguna de ellas acceda a los datos en bruto de la otra. El resultado son insights compartidos, no datos compartidos.

Diagrama del proceso de colaboración de datos en una data clean room para publicidad programática

El proceso básico tiene tres componentes. Primero, cada parte carga sus datos en un entorno aislado. Segundo, el sistema aplica técnicas de privacidad para garantizar que los registros individuales no sean identificables. Las más comunes son la intersección de conjuntos privados (PSI), los entornos de ejecución de confianza (TEE) y la computación multipartita segura. Tercero, las consultas devuelven resultados agregados, nunca registros individuales.

El caso de uso más frecuente hoy es la medición closed-loop en retail media. Un anunciante quiere saber si sus impresiones en un retailer generaron compras reales. Sin una DCR, ese cruce es imposible sin ceder datos sensibles. Con una DCR, el retailer y la marca obtienen la métrica sin exponer nada.

Según el IAB, los usos actuales se concentran en tres áreas. La primera es protección de privacidad y cumplimiento regulatorio. La segunda, activación de audiencias. La tercera, en menor medida, medición avanzada como atribución y modelado de mix de medios.

Las plataformas que existen hoy

El mercado tiene varias opciones, cada una con un perfil diferente según quién la opera y qué ecosistema de datos mueve.

  • Amazon Marketing Cloud (AMC) es la DCR del ecosistema Amazon Ads. Permite a los anunciantes cruzar sus datos con las señales de Amazon (navegación, compra, búsqueda) usando consultas en SQL. Es gratuita para anunciantes activos en Amazon Ads, lo que la convierte en la puerta de entrada más accesible al modelo. Su limitación es que solo funciona dentro del walled garden de Amazon.
  • Google Ads Data Hub (ADH) opera sobre BigQuery y permite conectar datos de campañas de Google con datos propios del anunciante. Está orientado a medir efectividad de campañas en YouTube y la red de Google. Requiere capacidad técnica en SQL y familiaridad con el ecosistema de Google Cloud.
  • Meta Advanced Analytics es la solución de Meta para cruzar datos de anunciantes con señales de sus plataformas. La complejidad de configuración es comparable a la de ADH.
  • Habu, InfoSum y LiveRamp Clean Room son soluciones independientes que ofrecen interoperabilidad entre múltiples partes y múltiples ecosistemas. Son las que más se aproximan al modelo de DCR neutral, donde anunciante, publisher y retailer pueden colaborar sin depender de un walled garden específico. Su costo es el más alto del mercado.

La diferencia entre ambos tipos no es solo técnica, sino estratégica. AMC, ADH y Meta Analytics son DCRs propietarias de walled gardens. Habu, InfoSum y similares son DCRs independientes o neutras.

Por qué existen y qué problema resuelven

Las data clean rooms no son una innovación generada por eficiencia operativa. Son una respuesta a una presión regulatoria y técnica combinada. La reducción de señales de terceros (cookies, IDFAs), las leyes de privacidad como el GDPR en Europa y la LGPD en Brasil, y las restricciones impuestas por los propios sistemas operativos y navegadores redujeron drásticamente la capacidad de los anunciantes para medir campañas y de los publishers para activar audiencias con precisión.

En ese contexto, el first-party data se convirtió en el activo más valioso del ecosistema. El problema es que los datos de primera mano son, por definición, fragmentados. El retailer tiene datos de compra, el publisher tiene datos de navegación, la marca tiene datos de CRM. Para que esa inteligencia sea accionable, los tres necesitan colaborar. Las DCRs son la infraestructura técnica que hace posible esa colaboración sin que ninguna parte asuma un riesgo legal o competitivo.

El IAB Tech Lab estableció en julio de 2024 los primeros estándares de interoperabilidad para DCRs, formalizando el protocolo PAIR (Publisher Advertiser Identity Reconciliation). En julio de 2025 publicó la versión 1.1 del mismo protocolo. Esa estandarización es importante porque resuelve uno de los problemas históricos del sector, dado que cada plataforma operaba su propia versión incompatible.

El costo real de adoptar una data clean room

Aquí es donde el entusiasmo debe frenarse para el mercado latinoamericano.

Gráfico de costos de adopción de data clean rooms según IAB State of Data 2023

Según el IAB State of Data 2023, basado en encuestas a más de 200 tomadores de decisión en marcas, agencias y publishers, el 62 % de los usuarios de DCRs gastó un mínimo de $200,000 USD en la tecnología durante 2022. Un 23 % superó los $500,000 USD. Cuando se suman las herramientas complementarias que suelen operar junto con una DCR (CDPs, soluciones de identidad, plataformas de consentimiento), los costos compuestos anuales pueden superar los $2 millones de dólares.

A ese costo financiero se suma el costo humano. El 49 % de los usuarios de DCRs tiene seis o más empleados dedicados exclusivamente a la operación de la tecnología. El tiempo de implementación puede ir de varios meses a dos años.

El IAB es explícito al respecto. Esta estructura de costos genera una desventaja de mercado real para las agencias medianas, las marcas de tamaño medio y los publishers independientes que no tienen los recursos para invertir a esa escala. Esa advertencia, formulada pensando en el mercado estadounidense, aplica con más peso en LATAM.

LATAM hoy: las condiciones de adopción

El ecosistema latinoamericano está en una posición particular con respecto a las data clean rooms. Hay condiciones favorables y hay brechas que todavía no se han cerrado.

Entre las condiciones favorables está el crecimiento de retail media. Mercado Libre tiene una plataforma de retail media con capacidades de medición que incluyen colaboración de datos entre marcas y el ecosistema de la plataforma. Rappi también ha avanzado en esa dirección. Esas plataformas operan casos de uso que son funcionalmente equivalentes a una data clean room, aunque no siempre se nombren con ese término en la región.

La presión regulatoria también empuja hacia la adopción. Brasil tiene la LGPD activa con enforcement creciente. México avanza en la aplicación de su ley de protección de datos personales. Esas regulaciones aumentan el costo de manejar datos de forma no estructurada y hacen más atractiva la infraestructura que garantiza cumplimiento por diseño.

Las brechas son igualmente reales. La primera es técnica. Las DCRs requieren capacidad en SQL, ingeniería de datos e infraestructura cloud. Ese perfil es escaso en los equipos de marketing y ad ops de la región. La segunda es financiera. Los umbrales de inversión del mercado global no son alcanzables para la gran mayoría de anunciantes, agencias y publishers latinoamericanos. La tercera es de madurez de datos. Las DCRs solo generan valor cuando las partes que colaboran tienen datos de primera mano bien estructurados, con taxonomías compatibles y volúmenes suficientes. Esa madurez no es la norma en LATAM.

Quién puede adoptarlas hoy y quién debería esperar

La respuesta honesta es que en LATAM las DCRs son una tecnología para una minoría del mercado. Esa minoría tiene un perfil claro. La conforman los grandes retailers con plataformas de retail media propias, las marcas de consumo masivo con inversión publicitaria de ocho cifras anuales, las agencias de medios que manejan esas cuentas y necesitan demostrar atribución, y los publishers con volúmenes de datos de primera mano suficientemente grandes para que el cruce sea estadísticamente válido.

Para el resto del ecosistema (la agencia mediana, el publisher independiente, el anunciante de presupuesto acotado), la respuesta práctica es diferente. La prioridad es trabajar en los pasos que preceden a una DCR. Construir first-party data bien estructurado, implementar una CDP o una solución básica de gestión de datos propios, y entender los protocolos de consentimiento que hacen que ese dato sea activable. Sin esa base, una data clean room no tiene material con qué trabajar.

Próximos pasos

Si trabajas en una marca o agencia con inversión publicitaria significativa en retailers de LATAM, el punto de entrada más accesible es Amazon Marketing Cloud. No tiene costo adicional si ya eres anunciante activo en Amazon Ads, y permite familiarizarse con la lógica de consultas antes de evaluar soluciones independientes.

Si trabajas en un publisher o una agencia mediana, la prioridad no es la DCR. La prioridad es estructurar el first-party data que algún día irá a esa DCR. Un dato bien recolectado, con consentimiento documentado y taxonomía consistente, vale más hoy que una suscripción a una plataforma para la que todavía no hay insumo suficiente.

La tecnología existe. La infraestructura regional para usarla en escala todavía está en construcción.


Nota sobre los datos de este artículo: Los datos cuantitativos sobre costos y adopción de data clean rooms provienen del IAB State of Data 2023, cuya muestra corresponde a marcas, agencias y publishers en Estados Unidos. No existe un reporte equivalente con desglose verificado para América Latina en fuentes Nivel 1 al momento de publicación de este artículo.

Lecturas relacionadas