Amazon S3에서 Snowflake로 데이터 전송하기
데이터가 현재 Amazon S3에 있는 경우, ELT(추출 로드 변환) 프로세스를 사용하여 Snowflake 또는 다른 관계형 데이터 웨어하우스로 데이터를 전송할 수 있습니다.
보다 구체적인 사용 사례가 있고 Braze가 커런츠 인스턴스를 서비스하기를 원하는 경우, Braze 계정 매니저에게 연락하여 Braze 데이터 전문가 서비스에 대해 문의하세요.
자동화된 로드 프로세스
이 자동화된 로드 프로세스는 데이터를 Snowflake로 옮기고, 이를 통해 Braze Looker 블록을 사용하여 Looker에서 해당 데이터를 시각화하여 캠페인, 캔버스 및 세그먼트에 대한 인사이트와 피드백을 도출할 수 있습니다.
Currents to S3 내보내기를 설정하고 라이브 이벤트 데이터를 수신하고 나면 다음 구성 요소를 구성하여 Snowflake에서 라이브 ELT 파이프라인을 구성할 수 있습니다:
AWS SQS 대기열 구성
자동 수집 Snowpipes는 S3에서 Snowpipes로 알림을 전송하기 위해 SQS 대기열을 사용합니다. 이 프로세스는 SQS를 구성한 후 Snowflake에서 관리합니다.
1단계: 외부 S3 스테이지 구성
데이터베이스의 테이블은 이 단계에서 생성됩니다.
Braze에서 커런츠를 설정할 때, 커런츠 파일이 S3 버킷에 따라갈 폴더 경로를 지정하세요. 여기서는 기본 폴더 경로인 currents
을 사용합니다.
그런 다음 나열된 순서대로 다음을 생성합니다:
-
AWS에서 조직의 보안 요구 사항에 따라 권한을 부여하여 원하는 S3 버킷에 대한 새 공개-비공개 키 페어를 생성합니다.
-
Snowflake에서 원하는 데이터베이스와 스키마를 만듭니다(다음 예제에서는
currents
및public
). -
Snowflake S3 스테이지를 생성합니다(
braze_data
):
1
2
3
4
5
CREATE OR REPLACE STAGE
currents.public.braze_data
url='s3://snowpipe-demo/'
credentials = (AWS_KEY_ID = '...' AWS_SECRET_KEY = '...' );
show stages;
다음으로 스테이지에 사용할 AVRO 파일 형식을 정의합니다.
1
2
3
4
CREATE FILE FORMAT
currents.public.currents_avro
type = 'avro'
compression = 'auto';
1
2
3
4
ALTER STAGE
currents.public.braze_data
SET
file_format = currents.public.currents_avro;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
CREATE OR REPLACE PIPE
pipe_users_messages_pushnotification_open
auto_ingest=true AS
COPY INTO
users_messages_pushnotification_open
FROM
(SELECT
$1:id::STRING,
$1:user_id::STRING,
$1:external_user_id::STRING,
$1:time::INT,
$1:timezone::STRING,
$1:app_id::STRING,
$1:campaign_id::STRING,
$1:campaign_name::STRING,
$1:message_variation_id::STRING,
$1:canvas_id::STRING,
$1:canvas_name::STRING,
$1:canvas_variation_id::STRING,
$1:canvas_step_id::STRING,
$1:canvas_step_message_variation_id::STRING,
$1:platform::STRING,
$1:os_version::STRING,
$1:device_model::STRING,
$1:send_id::STRING,
$1:device_id::STRING,
$1:button_action_type::STRING,
$1:button_string::STRING
FROM
@currents.public.braze_data/currents/dataexport.prod-01.S3.integration.INTEGRATION_ID_GOES_HERE/event_type=users.messages.pushnotification.Open/);
마지막으로 show pipes;
명령을 사용하여 SQS 정보를 표시합니다. 이 파이프는 자동 수집 파이프로 만들어졌기 때문에 SQS 큐의 이름은 NOTIFICATION_CHANNEL
이라는 새 열에 표시됩니다.
2단계: 버킷 이벤트 만들기
AWS에서 새 Snowflake 단계의 해당 버킷으로 이동합니다. 그런 다음 속성 탭에서 이벤트로 이동합니다.
필요에 따라 각 커런츠 데이터 세트(메시징, 사용자 행동) 또는 둘 다에 대해 새 이벤트를 생성합니다.
양식 하단(Snowflake의 알림 채널 열에서)에 있는 ARN과 개체 만들기 알림에 해당하는 상자를 선택합니다.
자동 인제스트 스노우파이프 구성
AWS SQS 구성이 올바른 테이블을 생성하도록 하려면 메시지 인게이지먼트 또는 메시징 이벤트, 사용자 또는 고객 행동 이벤트 또는 둘 다에 대한 커런츠 설명서에 명시된 다음 예제와 스키마를 사용하여 수신 데이터의 구조를 올바르게 정의해야 합니다.
Braze 커런츠는 특정 데이터 유형의 특정 필드를 통해 지속적으로 데이터를 로드하므로 Braze 커런츠 스키마에 따라 테이블을 구성하는 것이 중요합니다. 예를 들어 user_id
는 문자열로 로드되고 커런츠 데이터에서 user_id
로 호출됩니다.
커런츠 통합에 따라 설정해야 하는 이벤트가 다를 수 있습니다(예: 메시지 참여 또는 메시징 이벤트, 사용자 또는 고객 행동 이벤트). 이 프로세스의 일부 또는 전체에 대한 스크립트를 작성할 수도 있습니다.
먼저, 커런츠 스키마에서 다음 구조를 사용하여 지속적으로 로드할 INTO
테이블을 만듭니다.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
CREATE TABLE
users_behaviors_app_firstsession (
id STRING,
user_id STRING,
external_user_id STRING,
app_id STRING,
time INT,
session_id STRING,
gender STRING,
country STRING,
timezone STRING,
language STRING,
device_id STRING,
sdk_version STRING,
platform STRING,
os_version STRING,
device_model STRING
);
그런 다음 auto_ingest
파이프를 만들고 지정합니다:
- 로드할 테이블
- 다음 표를 로드하는 방법
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
CREATE OR REPLACE PIPE
pipe_users_behaviors_app_firstsession
auto_ingest=true AS
COPY INTO
users_behaviors_app_firstsession
FROM
(SELECT
$1:id::STRING,
$1:user_id::STRING,
$1:external_user_id::STRING,
$1:app_id::STRING,
$1:time::INT,
$1:session_id::STRING,
$1:gender::STRING,
$1:country::STRING,
$1:timezone::STRING,
$1:language::STRING,
$1:device_id::STRING,
$1:sdk_version::STRING,
$1:platform::STRING,
$1:os_version::STRING,
$1:device_model::STRING
FROM
@currents.public.braze_data/currents/dataexport.prod-01.S3.integration.INTEGRATION_ID_GOES_HERE/event_type=users.behaviors.app.FirstSession/);
모든 이벤트 유형에 대해 CREATE TABLE
및 CREATE PIPE
명령을 반복해야 합니다.
먼저, 커런츠 스키마에서 다음 구조를 사용하여 지속적으로 로드할 INTO
테이블을 만듭니다.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
CREATE TABLE
public_users_messages_pushnotification_open (
id STRING,
user_id STRING,
external_user_id STRING,
time INT,
timezone STRING,
app_id STRING,
campaign_id STRING,
campaign_name STRING,
message_variation_id STRING,
canvas_id STRING,
canvas_name STRING,
canvas_variation_id STRING,
canvas_step_id STRING,
canvas_step_message_variation_id STRING,
platform STRING,
os_version STRING,
device_model STRING,
send_id STRING,
device_id STRING,
button_action_type STRING,
button_string STRING
);
그런 다음 자동 연속 로드 파이프를 생성하고 지정합니다.
- 로드할 테이블
- 다음 표를 로드하는 방법
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
CREATE OR REPLACE PIPE
pipe_users_messages_pushnotification_open
auto_ingest=true AS
COPY INTO
users_messages_pushnotification_open
FROM
(SELECT
$1:id::STRING,
$1:user_id::STRING,
$1:external_user_id::STRING,
$1:time::INT,
$1:timezone::STRING,
$1:app_id::STRING,
$1:campaign_id::STRING,
$1:campaign_name::STRING,
$1:message_variation_id::STRING,
$1:canvas_id::STRING,
$1:canvas_name::STRING,
$1:canvas_variation_id::STRING,
$1:canvas_step_id::STRING,
$1:canvas_step_message_variation_id::STRING,
$1:platform::STRING,
$1:os_version::STRING,
$1:device_model::STRING,
$1:send_id::STRING,
$1:device_id::STRING,
$1:button_action_type::STRING,
$1:button_string::STRING
FROM
@currents.public.braze_data/currents/dataexport.prod-01.S3.integration.INTEGRATION_ID_GOES_HERE/event_type=users.messages.pushnotification.Open/);
모든 이벤트 유형에 대해 CREATE TABLE
및 CREATE PIPE
명령을 반복해야 합니다.
Braze 커런츠를 사용하여 수행할 수 있는 분석의 유형을 확인하려면 Looker 블록을 참조하세요.
궁금한 점이 있거나 이 과정을 안내받고 싶다면 Braze 계정 매니저에게 문의하세요.