Log level-data: traitement continu ou en groupe?

Par Kate Dye
Mercredi le 2 septembre 2020

Les log-level data et les event-level data sont énormes. Aussi énorme que des terabytes par heure. Cela pourrait vous faire croire que la vitesse/rapidité de la livraison n’a pas d’importance ou même qu’elle n’est pas possible.

Cependant, plusieurs des cas d’utilisation qui ont mené des compagnies au log-level data bénéficie de données qui arrivent aussitôt qu’un event se produit.

Dans notre dernière publication, «Qu’est-ce que le log-level data?», nous avons parlé de la différence entre les données groupées et les données transmises en continu. Souvent, les logs sont traités en groupes, même s’ils ne sont pas cumulés Autrement, les données peuvent être transmises en temps réel, ce qui signifie qu’elles sont traitées dès leur arrivée et sont envoyées directement vers la base de données où elles sont destinées.

Log-Level Data Lengthy Batch Processing

Traitement en groupe

  • Les données sont collectées dans le temps
  • Une fois les données amassées, elles sont envoyées en traitement.
  • Le traitement en groupe est long et n’est pas fait pour les données urgentes.
Log-Level Data Quick Stream Processing

Traitement en diffusion continue

  • Les données circulent constamment
  • Les données sont traitées les unes après les autres.
  • Le traitement en continu est rapide et est fait pour l’information urgente

Quel est le meilleur mode de traitement?

Dans l’industrie de la publicité programmatique, les données se présentent sous forme de events sans fin. Le traitement en groupe nécessite que l’on stock les données, donc que l’on cesse de les amasser à un certain point pour commencer le traitement. Puis il faut passer au suivant tout en se souciant de ne pas piger dans plusieurs groupes. En revanche, le traitement en continu gère sans problème un flot infini de données, il évite les départs, arrêts et regroupements intermittents.

Le traitement par groupe fonctionne bien dans des situations où des résultats d’analyse en temps réel ne sont pas nécessaires et est souvent utilisé pour gérer des données qui proviennent de systèmes anciens.

Le traitement en continu est primordial pour transformer les données lourdes en données rapides où il est possible d’alimenter des outils d’analyse dès que le event se produit pour obtenir des connaissances et fonctionnalités en temps réel.

Le repérage de fraude en est un bon exemple. Grâce aux données immédiates, il est possible de détecter en temps réel des anomalies qui indiquent une fraude, et de l’arrêter avant qu’elle ne cause des dommages.

Est-ce que la fraicheur des données est importante?

Lorsque l’on choisi une technologie, il faut réfléchir à la baisse d’utilité que le temps d’attente peut engendrer, ou bien à la perte de «fraicheur» que les données peuvent subir.

Cherche-t-on de la créativité et des indicateurs de performance de stratégie de campagne dans un temps rapproché pour faire des ajustement «in-flight»? Ou désire-t-on visualiser le tout après la campagne? Si l’on vise à effectuer des ajustement dans l’immédiat, alors il est préférable de recevoir les données le plus rapidement possible.

Même «in-flight», il est plus utile de savoir qu’une stratégie surpasse les autres tôt dans la campagne, plutôt que de l’apprendre des jours plus tard alors que les dépenses ont été allouées.

Log Level Data Freshness & Usefullness

Dans certains cas, comme lorsqu’on livre des campagnes dans des environnements non sécurisés pour les marques et où les mauvaises publicités sont bannies, les données âgées engendre une perte d’utilité qui pourrait être prévenue plus tôt.

Il est très probable que dans certains cas, les données groupées ou retardées n’ont pas entrainer de perte d’utilité. Si l’on n’envisage pas de changer une stratégie ou un processus, et que l’on veuille charger mensuellement, il n’y a pas de bénéfice à retirer de données traitées en continu, il serait même utile d’avoir des donnée groupées quotidiennement.

Avec la mort imminente du cookie tier, il existe un nombre de cas d’utilisation et d’applications de l’usage du log-level data pour maximiser les campagnes et gérer les attributions. Ici, le traitement en diffusion continue des données constituerait un avantage considérable.

Découvrez nos solutions numériques

Contactez-nous pour planifier une démonstration en direct de nos plateformes avec l’un de nos experts dédiés.

Contactez l’un de nos experts

Si vous souhaitez en savoir plus sur la façon dont nous pouvons aider votre entreprise, contactez-nous!