CustomerLake annonce-t-il la fin des CDP legacy ?

Résumer ce contenu avec :

Perplexity

ChatGPT

Claude

Grok

Mistral

CustomerLake veut déplacer le CDP dans le lakehouse, avec des agents IA capables d’analyser, décider et activer les campagnes. Le vrai sujet, c’est moins l’annonce que le changement de modèle marketing derrière ça : données unifiées, gouvernance, identité client et activation continue.

Qu’est-ce que CustomerLake ?

CustomerLake est le CDP agentique annoncé par Databricks, construit sur son architecture lakehouse et gouverné par Unity Catalog. Un CDP, pour faire simple, c’est une plateforme qui rassemble les données clients pour mieux segmenter, personnaliser et activer les campagnes. Agentique veut dire que des agents IA peuvent agir dessus, pas seulement afficher un dashboard ou générer une reco.

L’idée est assez claire : réunir les données clients, les modèles d’IA et les agents dans une même plateforme, au lieu de laisser les équipes marketing jongler entre un entrepôt de données, un outil de segmentation, une plateforme d’activation, un outil analytics et trois connecteurs qui cassent tous les deux mois.

Avec CustomerLake, Databricks entre franchement sur le marché martech. Ce n’est pas juste une petite extension produit. C’est le même mouvement qu’on a vu avec Lakewatch côté sécurité : les plateformes data ne veulent plus seulement stocker ou analyser. Elles veulent piloter l’action business.

Les briques annoncées couvrent les grands besoins d’une CDP moderne :

Entre nous, vous avez de la data partout, mais rien de vraiment clair ? Un expert data analytics engineering comme moi peut tout connecter. On attaque quand ?

Consolidation des données clients : Regrouper les données CRM, web, app, transactionnelles, support ou produit dans une base commune.
Résolution d’identité : Relier plusieurs identifiants à une même personne ou un même compte, par exemple email, cookie, user ID ou numéro client.
Création d’audiences : Construire des segments exploitables, comme les clients à risque de churn ou les acheteurs à forte valeur.
Automatisation des campagnes : Laisser des agents proposer ou déclencher des actions selon les signaux détectés.
Activation marketing et advertising : Envoyer les audiences vers les canaux comme l’email, le paid media, le CRM ou les plateformes publicitaires.

Unity Catalog joue un rôle central là-dedans. C’est la couche de gouvernance de Databricks. Elle sert à contrôler qui accède à quoi, quelles données sont fiables, quels modèles peuvent utiliser quelles tables, et ce que les agents ont réellement le droit de faire. Sans ça, une CDP agentique devient vite une machine à erreurs bien automatisées.

Le vrai changement, c’est que les mêmes modèles qui produisent des insights peuvent aussi déclencher l’activation. Dans une stack classique, l’analyse vit souvent dans un coin, et l’exécution marketing dans un autre. Ici, Databricks veut réduire cet écart.

Sur le papier, c’est puissant. Dans la vraie vie, je le vois souvent chez les clients, tout dépendra de la qualité de donnée, de l’identité et de la gouvernance. Si ces fondations sont bancales, l’IA ira juste plus vite dans la mauvaise direction.

Pourquoi parler de CDP agentique ?

On parle de CDP agentique parce que le modèle classique du CDP, la Customer Data Platform, devient trop lent. Trop lent pour un marketing qui doit réagir au comportement client en continu, pas trois jours plus tard, pas à la prochaine campagne du jeudi.

Un CDP legacy fonctionne souvent avec une logique de campagnes planifiées. On collecte les données, on les réconcilie comme on peut, on crée des segments, on exporte une audience vers un outil email, média ou CRM, puis on attend les résultats. Le problème, c’est que tout ça crée des délais. Et dans ces délais, le client a déjà changé d’avis.

Dans beaucoup d’organisations que je vois, les données restent cloisonnées. L’identité client est fragmentée entre le site, le CRM, l’app mobile, le support, les outils média. L’analyse se fait dans un système, l’activation dans un autre, la mesure ailleurs. Ça marche, mais c’est lourd. Et plus on ajoute d’outils, plus la chaîne devient fragile.

Le CDP agentique promet autre chose. Une boucle continue entre observation, compréhension, décision et action. L’agent observe un comportement, comprend le contexte, choisit une action, puis l’active sur le bon canal. Databricks défend clairement ce modèle avec CustomerLake : des agents capables d’analyser le comportement client, de prendre des décisions et d’agir à grande échelle. Leur promesse va jusqu’à une personnalisation permanente, formulée comme 1 billion times a day. C’est ambitieux, et c’est bien la promesse portée par Databricks.

Je reste prudent quand même. Le mot agentique peut vite devenir un mot-valise. Pour moi, le vrai critère n’est pas de dire “on a des agents”. Le vrai sujet, c’est de savoir si ces agents ont accès au bon contexte, aux bonnes données, à des règles de gouvernance solides, et à des canaux d’activation fiables.

Prenons un cas simple. Un client abandonne une catégorie de produit, revient via une publicité, consulte une offre, puis hésite. Dans un modèle legacy, il peut attendre la prochaine campagne hebdomadaire. Dans un modèle agentique, l’agent ajuste l’audience, le message ou la pression marketing sans attendre. C’est là que ça devient intéressant.

Critère	CDP legacy	CDP agentique
Logique de campagne	Campagnes planifiées, cycles fixes.	Décisions continues selon le comportement.
Accès à la donnée	Données souvent copiées, exportées, cloisonnées.	Accès direct au contexte client unifié.
Identité client	Identités fragmentées entre plusieurs outils.	Identité enrichie et mise à jour en continu.
Activation	Exports d’audience vers des plateformes externes.	Activation plus directe sur les canaux disponibles.
Rôle de l’IA	Aide à l’analyse ou au scoring.	Observation, décision et action automatisées.
Gouvernance	Contrôles répartis dans plusieurs systèmes.	Règles centralisées, à condition qu’elles soient bien conçues.

Comment l’identité client est-elle gérée ?

CustomerLake combine des règles, des agents et une marketplace d’identité pour transformer des enregistrements clients dispersés en profils plus complets et plus exploitables.

La résolution d’identité, dit simplement, c’est le fait de rattacher plusieurs signaux à une même personne, ou parfois à un même foyer quand c’est pertinent. On peut avoir un email, un identifiant publicitaire, une transaction en magasin, un comportement web, une donnée CRM, un événement dans une app, ou un signal venu d’un partenaire. Le vrai sujet, c’est de réconcilier tout ça proprement, sans raconter que c’est magique.

CustomerLake semble pousser une approche assez pragmatique. Les règles servent à cadrer les rapprochements. Par exemple, est-ce qu’un email identique suffit à fusionner deux profils ? Est-ce qu’un numéro de téléphone doit être confirmé par une transaction ? Est-ce qu’un foyer peut être déduit à partir d’une adresse postale ? Les agents, eux, peuvent aider à enrichir, vérifier, affiner ou proposer des rapprochements, mais ils doivent rester dans un cadre clair.

La partie intéressante, c’est aussi la marketplace d’identité intégrée. CustomerLake cite des partenaires comme Acxiom, Epsilon, LiveRamp, TransUnion et Adstra. Ces acteurs peuvent apporter des graphes d’identité, c’est-à-dire des bases qui relient différents identifiants entre eux, et des données complémentaires pour rendre les profils plus utiles.

Les règles évitent les fusions hasardeuses et définissent ce qui est acceptable.
Les agents accélèrent l’analyse, l’enrichissement et la correction des profils.
Les partenaires d’identité apportent des signaux externes pour compléter ce que l’entreprise possède déjà.

Mon point de vue terrain est assez simple. Chez les clients, l’identité est souvent le vrai chantier caché derrière les beaux dashboards. Si l’email est mal collecté, si le consentement n’est pas clair, si le CRM contient trois versions du même client, l’IA ne sauve pas le système. Elle peut accélérer, oui. Mais elle accélère aussi les erreurs si la base est mauvaise. Je l’ai vu plusieurs fois, surtout dans des organisations où le marketing, le e-commerce et le service client travaillent chacun avec leur propre vérité client.

Un CDP agentique n’a de valeur que si les agents savent à qui ils parlent et sur quelles données ils peuvent agir. Tout repose sur trois prérequis très concrets : la qualité des données, les règles d’unification, et la gouvernance des usages. Sans ça, on ne fait pas de l’intelligence client. On industrialise juste le flou.

Avec quels outils CustomerLake s’intègre ?

CustomerLake s’appuie sur un écosystème de partenaires ouvert pour ingérer, enrichir et activer les données vers les plateformes marketing et advertising que les équipes utilisent déjà. C’est important, parce qu’une CDP ne vit jamais seule dans son coin. Elle sert à faire circuler la donnée client au bon endroit, au bon moment, avec le bon niveau de contrôle.

Une équipe marketing a besoin d’envoyer des audiences, de recevoir des signaux comportementaux, de synchroniser des conversions, d’alimenter le CRM, l’emailing, la publicité, la personnalisation et la mesure. C’est là que le reverse ETL devient utile. Le reverse ETL, c’est simplement le mécanisme qui renvoie les données propres du lakehouse vers les outils opérationnels. Le lakehouse garde la donnée centrale, et les outils métiers l’utilisent sans recréer chacun leur propre vérité.

Dans les partenaires annoncés, on retrouve Adobe, Meta avec les audiences et la Conversions API, Acxiom, Epsilon, LiveRamp, The Trade Desk, Braze, Bloomreach, Iterable, Snapchat, Magnite, TransUnion, Adstra, Twilio, Integral Ad Science et Unity. Ce n’est pas juste une liste de logos. Ça dit surtout que CustomerLake veut se brancher à la fois sur l’activation média, l’identité, le messaging, la personnalisation et la mesure publicitaire.

Concrètement, une équipe peut créer une audience dans CustomerLake, puis l’activer dans Meta ou The Trade Desk. Elle peut alimenter Braze ou Iterable avec des segments et des attributs pour personnaliser les messages. Elle peut enrichir certains profils avec des partenaires d’identité comme LiveRamp, Acxiom, Epsilon, TransUnion ou Adstra. Elle peut aussi mieux mesurer, sécuriser ou contrôler certaines activations publicitaires selon les outils connectés, par exemple avec Integral Ad Science côté qualité média.

Je garde quand même une réserve très pratique. Une intégration native ne règle pas tout. Il faut regarder les fréquences de synchronisation, les limites API, les champs vraiment disponibles, la gestion du consentement, les erreurs de mapping et la réversibilité si vous voulez sortir un jour. J’ai vu des projets où le connecteur existait déjà, mais où 80 % du travail était dans le modèle de données et les règles métier. Le connecteur ouvre la porte, il ne fait pas le ménage dans la maison.

Qu’est-ce que ça change pour le marketing ?

Ça change le marketing assez profondément : on passe d’une logique de campagnes finies à une logique de décisions continues, pilotées par la donnée, l’IA et des agents capables d’agir. Avant, on préparait une audience, un message, un canal, une date d’envoi. Demain, une partie du marketing ressemblera plus à un système vivant, qui observe, décide, ajuste et apprend en continu.

C’est exactement la vision portée par Ali Ghodsi, cofondateur et CEO de Databricks. Les marketeurs doivent repenser leurs fondations, parce qu’ils vont devoir utiliser des agents IA en interne, mais aussi marketer vers des agents côté client. Un agent IA, c’est un logiciel capable d’exécuter des tâches avec un certain niveau d’autonomie : comparer des offres, résumer des options, recommander une décision, déclencher une action.

Si ces assistants deviennent des intermédiaires dans les parcours d’achat, le marketing ne parlera plus seulement à des humains devant un écran. Il parlera aussi à des systèmes qui filtrent, comparent et recommandent. Ça change la manière de structurer les offres, les contenus, les preuves, les prix, les données produit. Un agent ne se laisse pas séduire par une belle punchline. Il cherche des signaux fiables.

Les implications sont assez concrètes :

Une personnalisation 1:1 à grande échelle, avec des messages adaptés au contexte réel de chaque client.
Des campagnes qui s’ajustent en permanence, au lieu d’être figées pendant trois semaines.
Des audiences plus dynamiques, qui évoluent selon les comportements, les intentions et les signaux récents.
Une activation plus proche du temps réel, sans attendre un export ou une synchro manuelle.
Une meilleure exploitation du contexte client, parce que les données restent proches du lakehouse, là où elles vivent déjà.

Mais je mets une nuance importante. Une campagne infinie n’est pas forcément une bonne campagne. Si tout tourne tout le temps, sans limites, on peut vite fatiguer les clients, optimiser le mauvais indicateur ou créer une usine à gaz. Il faut des règles, des objectifs business clairs, des garde-fous de fréquence, une mesure fiable. Sinon, l’IA accélère juste le désordre.

À mon avis, le vrai bénéfice n’est pas de remplacer les équipes marketing par des agents. Le vrai bénéfice, c’est d’enlever les frictions entre data, insight et activation. Quand le marketing n’attend plus trois jours un export ou une segmentation, il peut tester plus vite, apprendre plus vite, corriger plus vite. J’ai vu ce blocage chez beaucoup de clients : les idées sont là, mais la donnée arrive trop tard.

CustomerLake est surtout un signal fort. Le CDP devient une couche d’orchestration intelligente dans le lakehouse, pas juste une base d’audiences.

Alors, faut-il déjà repenser votre CDP ?

CustomerLake montre clairement où va le marché : moins de silos, plus de gouvernance, plus d’activation directe depuis la donnée. Databricks pousse une vision où le lakehouse devient aussi le cœur marketing, avec des agents capables d’analyser, décider et activer. Je ne prendrais pas ça comme une promesse magique. Je le prendrais comme un signal sérieux. Si votre identité client est fragile, si vos audiences sont lentes à produire, si vos outils marketing vivent chacun dans leur coin, c’est le moment de regarder votre architecture. Le bénéfice pour vous est simple : gagner en vitesse, en cohérence et en personnalisation sans perdre le contrôle.

FAQ

Qu’est-ce que CustomerLake de Databricks ?
CustomerLake est un CDP agentique annoncé par Databricks. Il vise à réunir les données clients, les modèles d’IA, la résolution d’identité, la création d’audiences et l’activation marketing dans une plateforme construite sur le lakehouse Databricks et gouvernée par Unity Catalog.
Quelle est la différence entre un CDP classique et un CDP agentique ?
Un CDP classique fonctionne souvent avec des campagnes planifiées, des exports et des systèmes séparés. Un CDP agentique cherche à fonctionner en boucle continue : les agents analysent les comportements, prennent des décisions et activent les actions marketing avec plus de contexte et moins de délai.
Pourquoi Unity Catalog est important dans CustomerLake ?
Unity Catalog apporte la couche de gouvernance. C’est important parce que des agents IA qui utilisent des données clients doivent être cadrés : accès, qualité, cohérence, traçabilité et contrôle des usages. Sans gouvernance solide, l’activation automatisée peut vite devenir risquée.
Quels partenaires sont annoncés autour de CustomerLake ?
Databricks cite notamment Adobe, Meta, Acxiom, Epsilon, LiveRamp, The Trade Desk, Braze, Bloomreach, Iterable, Snapchat, Magnite, TransUnion, Adstra, Twilio, Integral Ad Science et Unity. L’objectif est de connecter CustomerLake à la stack marketing et advertising déjà en place.
CustomerLake remplace-t-il les équipes marketing ?
Non, l’intérêt n’est pas de remplacer les équipes. L’idée est plutôt de réduire les frictions entre la donnée, l’analyse et l’activation. Les marketeurs gardent les objectifs, les règles et la stratégie. Les agents peuvent aider à exécuter plus vite et à personnaliser plus finement.

A propos de l’auteur

Je suis Franck Scandolera, expert et formateur en tracking avancé server-side, Analytics Engineering, automatisation No/Low Code avec n8n, intégration de l’IA en entreprise et SEO/GEO. J’accompagne des équipes data, marketing et digitales sur des sujets très concrets : collecte fiable, gouvernance, activation, automatisation et mesure business. Je dirige l’agence webAnalyste et l’organisme Formations Analytics. J’ai travaillé avec des références comme Logis Hôtel, Yelloh Village, BazarChic, la Fédération Française de Football ou Texdecor. Si vous voulez remettre à plat votre stack data, IA ou marketing automation, contactez-moi.

Franck Scandolera

⭐ Data Analyst, Analytics Engineer et expert dans l’automatisation IA ⭐

Ref clients : Logis Hôtel, Yelloh Village, BazarChic, Fédération Football Français, Texdecor…

Mon terrain de jeu :

Data Analyst & Analytics engineering : tracking propre RGPD, entrepôt de données (GTM server, BigQuery…), modèles (dbt/Dataform), dashboards décisionnels (Looker, SQL, Python).
Automatisation IA des taches Data, Marketing, RH, compta etc : conception de workflows intelligents robustes (n8n, Make, App Script, scraping) connectés aux API de vos outils et LLM (OpenAI, Mistral, Claude…).
Engineering IA pour créer des applications et agent IA sur mesure : intégration de LLM (OpenAI, Mistral…), RAG, assistants métier, génération de documents complexes, APIs, backends Node.js/Python.

Qu’est-ce que CustomerLake ?

Pixels de suivi dans les emails comment être conforme CNIL ?

Votre martech stack est-elle vraiment utilisée ?