Skip to content

Intégrations de stockage de fichiers

Cette page explique comment configurer la prise en charge de l’ingestion de données dans le cloud et synchroniser les données pertinentes de S3 vers Braze.

Fonctionnement

Vous pouvez utiliser Cloud Data Ingestion (CDI) for S3 pour intégrer directement un ou plusieurs compartiments S3 de votre compte AWS à Braze. Lorsque de nouveaux fichiers sont publiés sur S3, un message est envoyé à SQS et Braze Cloud Data Ingestion prend en charge ces nouveaux fichiers.

L’ingestion de données dans le nuage prend en charge les éléments suivants :

  • Fichiers JSON
  • fichiers CSV
  • Fichiers Parquet
  • Attribut, événement personnalisé, événement d’achat, suppression d’utilisateur et données de catalogue.

Conditions préalables

L’intégration nécessite les ressources suivantes :

  • Compartiment S3 pour le stockage des données
  • File d’attente SQS pour les notifications de nouveaux fichiers
  • Rôle IAM pour l’accès à Braze

Définitions AWS

Tout d’abord, définissez les termes utilisés dans le cadre de cette tâche.

Configuration de l’ingestion de données Cloud dans AWS

Étape 1 : Créer un compartiment source

Créez un compartiment S3 à usage général avec les paramètres par défaut dans votre compte AWS. Les compartiments S3 peuvent être réutilisés d’une synchronisation à l’autre, à condition que le dossier soit unique.

Les paramètres par défaut sont les suivants :

  • ACL désactivés
  • Bloquer tout accès public
  • Désactiver la gestion des versions des compartiments
  • Chiffrement SSE-S3
    • SSE-S3 est le seul type de cryptage côté serveur pris en charge. Le cryptage Amazon KMS n’est pas pris en charge.

Prenez note de la région dans laquelle vous avez créé le compartiment, car vous créerez une file d’attente SQS dans la même région à l’étape suivante.

Étape 2 : Créer une file d’attente SQS

Créez une file d’attente SQS pour suivre l’ajout d’objets dans le compartiment que vous avez créé. Utilisez pour l’instant les paramètres de configuration par défaut.

Une file d’attente SQS doit être unique au niveau mondial (par exemple, une seule peut être utilisée pour une synchronisation CDI et ne peut pas être réutilisée dans un autre espace de travail).

Veillez à noter l’ARN et l’URL du SQS, car vous les utiliserez fréquemment au cours de cette configuration.

Sélection de "Advanced" avec un exemple d'objet JSON pour définir qui peut accéder à une file d'attente.

Étape 3 : Configurer une politique d’accès

Pour configurer la politique d’accès, sélectionnez Options avancées.

Ajoutez la déclaration suivante à la politique d’accès de la file d’attente, en prenant soin de remplacer YOUR-BUCKET-NAME-HERE par le nom de votre compartiment, et YOUR-SQS-ARN par l’ARN de votre file d’attente SQS, et YOUR-AWS-ACCOUNT-ID par l’ID de votre compte AWS :

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
{
  "Sid": "braze-cdi-s3-sqs-publish",
  "Effect": "Allow",
  "Principal": {
    "Service": "s3.amazonaws.com"
  },
  "Action": "SQS:SendMessage",
  "Resource": "YOUR-SQS-ARN",
  "Condition": {
    "StringEquals": {
      "aws:SourceAccount": "YOUR-AWS-ACCOUNT-ID"
    },
    "ArnLike": {
      "aws:SourceArn": "arn:aws:s3:::YOUR-BUCKET-NAME-HERE"
    }
  }
} 

Étape 4 : Ajouter une notification d’événement au compartiment S3

  1. Dans le compartiment créé à l’étape 1, allez dans Propriétés > Notifications d’événements.
  2. Donnez un nom à la configuration. Vous pouvez également spécifier un préfixe ou un suffixe à cibler si vous souhaitez que seul un sous-ensemble de fichiers soit ingéré par Braze.
  3. Sous Destination, sélectionnez File d’attente SQS et indiquez l’ARN du SQS que vous avez créé à l’étape 2.

Étape 5 : Créer une politique IAM

Créez une politique IAM pour permettre à Braze d’interagir avec votre compartiment source. Pour commencer, connectez-vous à la console de gestion AWS en tant qu’administrateur de compte.

  1. Allez dans la section IAM de la console AWS, sélectionnez Politiques dans la barre de navigation, puis cliquez sur Créer une politique.

    Le bouton "Créer une politique" dans la console AWS.

  2. Ouvrez l’onglet JSON et saisissez l’extrait de code suivant dans la section Policy Document, en prenant soin de remplacer YOUR-BUCKET-NAME-HERE par le nom de votre compartiment et YOUR-SQS-ARN-HERE par le nom de votre file d’attente SQS :

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": ["s3:ListBucket", "s3:GetObjectAttributes", "s3:GetObject"],
            "Resource": ["arn:aws:s3:::YOUR-BUCKET-NAME-HERE"]
        },
        {
            "Effect": "Allow",
            "Action": ["s3:ListBucket", "s3:GetObjectAttributes", "s3:GetObject"],
            "Resource": ["arn:aws:s3:::YOUR-BUCKET-NAME-HERE/*"]
        },
        {
            "Effect": "Allow",
            "Action": [
                "sqs:DeleteMessage",
                "sqs:GetQueueUrl",
                "sqs:ReceiveMessage",
                "sqs:GetQueueAttributes"
            ],
            "Resource": "YOUR-SQS-ARN-HERE"
        }
    ]
}

3. Sélectionnez Réviser la politique lorsque vous avez terminé.

  1. Donnez un nom et une description à la politique, puis sélectionnez Créer une politique.

Exemple de politique nommée "nouveau-nom-de-la-politique".

Champ de description de la politique.

Étape 6 : Créer un rôle IAM

Pour terminer la configuration sur AWS, vous allez créer un rôle IAM et y associer la politique IAM de l’étape 4.

  1. Dans la même section IAM de la console où vous avez créé la politique IAM, allez dans Rôles > Créer un rôle.

Le bouton "Créer un rôle".

2. Copiez l’ID du compte AWS de Braze à partir de votre tableau de bord de Braze. Accédez à Cloud Data Ingestion, sélectionnez Create New Data Sync (Créer une nouvelle synchronisation de données), puis sélectionnez S3 Import (Importer S3). 3. Dans AWS, sélectionnez Another AWS Account (Autre compte AWS) comme type de sélecteur d’entité de confiance. Indiquez votre ID de compte Braze. Cochez la case Require external ID. 4. Dans Braze, accédez à Paramètres des données > Ingestion de données dans le cloud, sélectionnez Créer une nouvelle synchronisation de données, puis sélectionnez Importation S3 dans la section des sources de fichiers. 5. Copiez l’ID de compte généré automatiquement par Braze.

Credentials avec le champ Braze Account ID.

6. Dans AWS, collez l’ID du compte, puis sélectionnez Next.

Page S3 « Create Role (Créer un rôle) ». Cette page comporte des champs pour le nom du rôle, la description du rôle, les entités de confiance, les politiques et les restrictions d’autorisations.

7. Attachez la politique créée à l’étape 4 au rôle. Recherchez la police dans la barre de recherche et cochez la case à côté de la police pour la joindre. Sélectionnez Suivant lorsque vous avez terminé.

Rôle ARN avec le nouveau nom de politique sélectionné.

Donnez un nom et une description au rôle, puis sélectionnez Créer un rôle.

Un exemple de rôle nommé "nouveau-nom-de-rôle".

8. Prenez note de l’ARN du rôle que vous avez créé et de l’ID externe que vous avez généré, car vous en avez besoin pour créer l’intégration Cloud Data Ingestion.

Configuration de Cloud Data Ingestion dans Braze

  1. Pour créer une nouvelle intégration, accédez à Paramètres des données > Ingestion de données dans le cloud, sélectionnez Créer une nouvelle synchronisation de données, puis sélectionnez Importation S3 dans la section des sources de fichiers.
  2. Saisissez les informations issues du processus de configuration d’AWS pour créer une nouvelle synchronisation. Précisez les éléments suivants :
  • ARN du rôle
  • ID externe
  • URL SQS (doit être unique pour chaque nouvelle intégration)
  • Nom du compartiment
  • Chemin d’accès au dossier (facultatif, doit être unique pour toutes les synchronisations d’un espace de travail)
  • Région

Exemple d'identifiants de sécurité tels qu'affichés dans S3 pour créer une nouvelle synchronisation d'importation.

3. Donnez un nom à votre intégration et sélectionnez le type de données pour cette intégration.

Configuration des détails de synchronisation pour "cdi-s3-as-source-integration" avec les attributs de l'utilisateur comme type de données.

4. Ajoutez un e-mail de contact pour recevoir des notifications si la synchronisation est interrompue en raison de problèmes d’accès ou de permissions. Si vous le souhaitez, vous pouvez activer les notifications pour les erreurs au niveau de l’utilisateur et les réussites de synchronisation.

Configuration des préférences de notification des erreurs de synchronisation.

5. Enfin, sélectionnez Tester la connexion pour confirmer que Braze peut accéder à votre compartiment et répertorier les fichiers disponibles pour l’ingestion (mais pas les données contenues dans ces fichiers). Ensuite, enregistrez la synchronisation.

Une option pour tester la connexion avec un aperçu des données.

Formats de fichiers requis

Cloud Data Ingestion prend en charge les fichiers JSON, CSV et Parquet. Chaque fichier doit contenir une ou plusieurs des colonnes d’identifiants prises en charge et une colonne de charge utile sous forme de chaîne de caractères JSON.

Braze n’impose pas d’exigences supplémentaires en matière de noms de fichiers en plus de celles imposées par AWS. Les noms de fichiers doivent être uniques. Nous vous recommandons d’ajouter un horodatage pour garantir l’unicité.

Identifiants des utilisateurs

Votre fichier source peut contenir une ou plusieurs colonnes ou clés d’identification de l’utilisateur. Chaque ligne ne doit contenir qu’un seul identifiant, mais un fichier source peut avoir plusieurs types d’identifiants.

1
2
3
4
5
6
7
{"external_id":"s3-qa-0","payload":"{\"name\": \"GT896\", \"age\": 74, \"subscriber\": true, \"retention\": {\"previous_purchases\": 21, \"vip\": false}, \"last_visit\": \"2023-08-08T16:03:26.600803\"}"}
{"external_id":"s3-qa-1","payload":"{\"name\": \"HSCJC\", \"age\": 86, \"subscriber\": false, \"retention\": {\"previous_purchases\": 0, \"vip\": false}, \"last_visit\": \"2023-08-08T16:03:26.600824\"}"}
{"external_id":"s3-qa-2","payload":"{\"name\": \"YTMQZ\", \"age\": 43, \"subscriber\": false, \"retention\": {\"previous_purchases\": 23, \"vip\": true}, \"last_visit\": \"2023-08-08T16:03:26.600831\"}"}
{"external_id":"s3-qa-3","payload":"{\"name\": \"5P44M\", \"age\": 15, \"subscriber\": true, \"retention\": {\"previous_purchases\": 7, \"vip\": true}, \"last_visit\": \"2023-08-08T16:03:26.600838\"}"}
{"external_id":"s3-qa-4","payload":"{\"name\": \"WMYS7\", \"age\": 11, \"subscriber\": true, \"retention\": {\"previous_purchases\": 0, \"vip\": false}, \"last_visit\": \"2023-08-08T16:03:26.600844\"}"}
{"external_id":"s3-qa-5","payload":"{\"name\": \"KCBLK\", \"age\": 47, \"subscriber\": true, \"retention\": {\"previous_purchases\": 11, \"vip\": true}, \"last_visit\": \"2023-08-08T16:03:26.600850\"}"}
{"external_id":"s3-qa-6","payload":"{\"name\": \"T93MJ\", \"age\": 47, \"subscriber\": true, \"retention\": {\"previous_purchases\": 10, \"vip\": false}, \"last_visit\": \"2023-08-08T16:03:26.600856\"}"}
1
2
{"external_id":"s3-qa-0","payload":"{\"app_id\": \"YOUR_APP_ID\", \"name\": \"view-206\", \"time\": \"2024-04-02T14:34:08\", \"properties\": {\"bool_value\": false, \"preceding_event\": \"unsubscribe\", \"important_number\": 206}}"}
{"external_id":"s3-qa-1","payload":"{\"app_id\": \"YOUR_APP_ID\", \"name\": \"view-206\", \"time\": \"2024-04-02T14:34:08\", \"properties\": {\"bool_value\": false, \"preceding_event\": \"unsubscribe\", \"important_number\": 206}}"}
1
2
{"external_id":"s3-qa-0","payload":"{\"app_id\": \"YOUR_APP_ID\", \"product_id\": \"product-11\", \"currency\": \"BSD\", \"price\": 8.511527858335066, \"time\": \"2024-04-02T14:34:08\", \"quantity\": 19, \"properties\": {\"is_a_boolean\": true, \"important_number\": 40, \"preceding_event\": \"click\"}}"}
{"external_id":"s3-qa-1","payload":"{\"app_id\": \"YOUR_APP_ID\", \"product_id\": \"product-11\", \"currency\": \"BSD\", \"price\": 8.511527858335066, \"time\": \"2024-04-02T14:34:08\", \"quantity\": 19, \"properties\": {\"is_a_boolean\": true, \"important_number\": 40, \"preceding_event\": \"click\"}}"}
1
2
3
4
external_id,payload
s3-qa-load-0-d0daa196-cdf5-4a69-84ae-4797303aee75,"{""name"": ""SNXIM"", ""age"": 54, ""subscriber"": true, ""retention"": {""previous_purchases"": 19, ""vip"": true}, ""last_visit"": ""2023-08-08T16:03:26.598806""}"
s3-qa-load-1-d0daa196-cdf5-4a69-84ae-4797303aee75,"{""name"": ""0J747"", ""age"": 73, ""subscriber"": false, ""retention"": {""previous_purchases"": 22, ""vip"": false}, ""last_visit"": ""2023-08-08T16:03:26.598816""}"
s3-qa-load-2-d0daa196-cdf5-4a69-84ae-4797303aee75,"{""name"": ""EP1U0"", ""age"": 99, ""subscriber"": false, ""retention"": {""previous_purchases"": 23, ""vip"": false}, ""last_visit"": ""2023-08-08T16:03:26.598822""}"
1
2
3
ID,PAYLOAD,DELETED
85,"{""product_name"": ""Product 85"", ""price"": 85.85}",false
1,"{""product_name"": ""Product 1"", ""price"": 1.01}",true

Inclure une colonne facultative DELETED. Lorsque DELETED est true, cet élément de catalogue est supprimé du catalogue dans Braze. Voir Suppression d’éléments de catalogue.

Pour obtenir des exemples de tous les types de fichiers pris en charge, reportez-vous aux fichiers d’exemple figurant dans Braze-examples.

Suppression des données

Cloud Data Ingestion for S3 prend en charge la suppression d’utilisateurs et d’éléments de catalogue par le biais de téléchargements de fichiers. Utilisez des synchronisations et des formats de fichiers distincts pour chacun d’entre eux.

  • Suppression d’utilisateurs - Créez une synchronisation avec le type de données Supprimer des utilisateurs et téléchargez des données qui ne contiennent que des identifiants d’utilisateurs (pas de données utiles).
  • Suppression d’éléments du catalogue - Utilisez la synchronisation de votre catalogue existant et ajoutez une colonne deleted (ou DELETED) pour marquer les éléments à supprimer.

Suppression d’utilisateurs

Pour supprimer des profils utilisateurs dans Braze à l’aide de fichiers dans S3 :

  1. Créez une nouvelle synchronisation Cloud Data Ingestion (même configuration AWS et Braze que pour les autres synchronisations).
  2. Lors de la configuration de la synchronisation dans Braze, définissez le Type de données sur Supprimer des utilisateurs.
  3. Téléchargez dans votre compartiment S3 des fichiers qui ne contiennent que des colonnes d’identifiants d’utilisateurs. N’incluez pas de colonne PAYLOAD - la synchronisation échoue si la charge utile est présente, afin d’éviter les suppressions accidentelles.

Chaque ligne du fichier doit identifier exactement un utilisateur utilisant l’un des éléments suivants :

Identifiant Description
EXTERNAL_ID Correspond au site external_id utilisé dans Braze.
ALIAS_NAME et ALIAS_LABEL Ces deux colonnes permettent d’identifier l’utilisateur par son alias.
BRAZE_ID ID de l’utilisateur généré par Braze (uniquement pour les utilisateurs existants).

Exemple - JSON (suppression par l’utilisateur) :

{"external_id":"user-to-delete-001"}
{"external_id":"user-to-delete-002"}
{"braze_id":"braze-id-from-profile"}

Exemple - CSV (suppression par l’utilisateur) :

1
2
3
external_id
user-to-delete-001
user-to-delete-002

Lorsque la synchronisation s’exécute, Braze traite les nouveaux fichiers dans le compartiment et supprime les profils utilisateurs correspondants.

Suppression d’éléments du catalogue

Pour supprimer des éléments d’un catalogue à l’aide du stockage de fichiers :

  1. Utilisez la même synchronisation S3 que celle que vous utilisez pour synchroniser les données du catalogue (type de données Catalogues).
  2. Dans vos fichiers CSV ou JSON, ajoutez un élément facultatif deleted (ou DELETED).
  3. Définissez deleted sur true pour tout article de catalogue que vous souhaitez retirer du catalogue dans Braze.

Chaque ligne a encore besoin de ID et PAYLOAD. Pour les lignes marquées pour suppression, la charge utile peut être minimale ; Braze supprime l’élément par ID.

Exemple - JSON (suppression d’un élément de catalogue) :

{"id":"85","payload":"{\"product_name\": \"Product 85\", \"price\": 85.85}"}
{"id":"1","payload":"{\"product_name\": \"Product 1\", \"price\": 1.01}","deleted":true}

Exemple - CSV (suppression d’un article de catalogue) :

1
2
3
ID,PAYLOAD,DELETED
85,"{""product_name"": ""Product 85"", ""price"": 85.85}",false
1,"{""product_name"": ""Product 1"", ""price"": 1.01}",true

Lorsque la synchronisation s’exécute, les lignes avec deleted: true entraînent la suppression de l’article de catalogue correspondant dans Braze. Pour connaître le comportement complet de synchronisation et de suppression du catalogue, voir Synchronisation et suppression des données du catalogue.

Choses à savoir

  • Les fichiers ajoutés au compartiment S3 ne doivent pas dépasser 512 Mo. Les fichiers de plus de 512 Mo entraîneront une erreur et ne seront pas synchronisés sur Braze.
  • Bien qu’il n’y ait pas de limite supplémentaire au nombre de lignes par fichier, nous vous recommandons d’utiliser des fichiers plus petits pour améliorer la rapidité de vos synchronisations. Par exemple, l’ingestion d’un fichier de 500 Mo prendrait beaucoup plus de temps que celle de cinq fichiers distincts de 100 Mo.
  • Il n’y a pas de limite supplémentaire au nombre de fichiers téléchargés dans un temps donné.
  • Il n’est pas possible de passer des commandes dans ou entre les fichiers. Nous vous recommandons de mettre périodiquement les mises à jour en lots si vous surveillez les conditions de concurrence attendues.

Résolution des problèmes

Téléchargement de fichiers et traitement

CDI ne traitera que les fichiers ajoutés après la création de la synchronisation. Au cours de ce processus, Braze recherche de nouveaux fichiers à ajouter, ce qui déclenche un nouvel envoi déclenché à SQS. Cela déclenchera une nouvelle synchronisation pour traiter le nouveau fichier.

Vous pouvez utiliser des fichiers existants pour valider que Braze peut accéder à votre compartiment et détecter les fichiers à ingérer, mais ils ne sont pas synchronisés avec Braze. Pour que le CDI puisse les traiter, vous devez télécharger à nouveau sur S3 tous les fichiers existants que vous souhaitez synchroniser.

Gestion des erreurs de fichiers inattendues

Si vous observez un nombre élevé d’erreurs ou de fichiers échoués, il se peut qu’un autre processus ajoute des fichiers au compartiment S3 dans un dossier autre que le dossier cible pour CDI.

Lorsque des fichiers sont téléchargés dans le compartiment source mais pas dans le dossier source, CDI traite la notification SQS, mais n’entreprend aucune action sur le fichier, ce qui peut apparaître comme une erreur.

New Stuff!