Data Traveler
Tantum videmus quantum scimus

2022-06-30

Author: 98hyun

Published: 2022-07-02

Tags: 데이터분석 시각화 오피스

Share :


  B2B 영업에 필요한 B2B 데이터 및 모든 정보

hubsell에 Alexander Killeen가 쓴 글을 해석하며 중요한 부분을 적는다.

B2B


1. B2B 데이터로 이상적인 고객 프로파일(ICP), 수요 창출, 잠재 고객 발굴, 아웃바운드 영업, 분석을 할 수 있다. 

2. 회사가 있다면 산업과 규모, 지역 등의 정보. 또한, 맡은 회사의 거래처 직원의 직함 부서 재직기간같은 정보. 더해서 SNS, 이메일, 홈페이지 등이 새로운 정보가 될 수 있다.

3. 잠재 구매자를 효과적으로 타겟팅하고 참여시키기 위해 Account(계정 - 회사), Contact(연락 - 인적사항 같은), Engagement(상호작용), Intent(구매의도), Firmographic(사업체 대상의 ~ 직원 몇명인 회사의 데이터가 될 수도 있고 매출이 얼마인 정보가 될 수도 있는.), Demographic(인구통계 - 지역,성별,나이 등), Chronographic(연대기 - 트렌드), Technographic(서비스 - 어떤 기술들을 쓰는지 주시)

4. SNS, 웹사이트, Paid Vendor들이 데이터를 구하는 곳일 수 있다. 

5. 우리(회사)의 목표는 연락처를 잠재 고객으로 전환하고 최종적으로 영업으로 전환하는 것. 
demand : 블로그, 가이드 작성, 이메일 캠페인 실행, 소셜 미디어 활용, SEO 등과 같은 다양한 방법을 통해 수요를 알 수 있다.
lead : 이메일 마케팅, 콜드콜, 게이트 콘텐츠, 랜딩 페이지 등과 같은 수많은 리드 생성 방법을 통해 잠재고객으로 만들 수 있다. 
route : B2B 데이터는 잠재 고객의 출처, 구매 준비 상태, 위치 등과 같은 요인에 따라 잠재 고객의 경로 지정 방법을 결정하고 리드 스코어링 프로세스를 사용하여 정량화하여 추가 교육이 필요한지 또는 우리로부터 구매할 준비가 되었는지 확인한다.
scoring : 최종 준비 완료했을 때 hot lead인지 cool인지 warm인지 결정한다.

6. B2B데이터가 웹사이트에서 나와서 웹사이트 분석을 할 수도 있고, 마케팅 캠페인 데이터가 될 수 있다. 최종 결과가 나오면 ABM(계정 기반)전략을 통해 진행 할 수도 있고, 바로 영업할 수도 있다.

7. 최종 준비가 완료되었다고해도 linkedin 이나 SNS를 통해 filter에 filter를 거쳐서 주의하고 들어가면 첫 거래에 성사시킬지 파토가 날지 알 수 있다.


  Postgresql

postgresql은 15년정도 된 오픈소스 데이터베이스이다. oracle과 거의 유사하다. 이번에 이 을 공부하며 적은 내용을 가져왔다.

code


## 조작

1. 코드를 레이블로

case {variable} when {value} then {want} else {default} end (as alias) 

; 중요

2. text에서 특정 값 추출하기 

substring({variable} from '{order}') as {alias} 공식을 통해 작성. 

order에는 regex를 사용. * 사용 시 필요한 부분에 괄호 꼭 할 것.

* 정규표현식은 참고 https://hamait.tistory.com/342
- ([^/]*) 뜻 : 처음으로 /가 나오기 전까지
- ([^])

3. 날짜 current_date, current_timestamp
바로 사용하려면 해당 함수, 아니면 cast(value as type) as alias을 통한 사용
소수 계산을 위해서는 cast를 통해 double precision 형태로 바꿔주는게 필요하다.
또한 날짜 계산을 하려면 데이터 형태를 바꿔 더하거나 빼면 된다. 혹은 interval을 찾아볼 것.

4. null 대처 - coalesce(value,0)
거의 coalesce와 같이 쓰이는 것이 sign이다. 양수면 1, 음수면 -1, 나머지 0으로 한다.

5. 계산을 피하고 싶을 때 ex) 0으로 나눈다던가 
case 나 nullif를 통해 가능.

## 집약

1. 윈도우 함수는 집약 함수와 같이 사용이 가능하다.

-. row_number() 그대로, rank() 중복 허용x, dense_rank() 중복 허용
-. lag,lead
-. over(partition by or order by)
-. first_value, last_value

2. 윈도우 구간

-. rows between (unbounded,1,current row) preceding and 1 following

3. 세로/가로 기반 데이터를 가로/세로 기반으로 변환
max(case .. )를 통해서 세로-> 가로, cross join을 이용한 가로->세로

가로데이터 특징은 삽입하기 제일 쉽고 데이터 다룰 때 보통 저장을 그렇게 한다. 
세로데이터 특징은 분석하기 쉽다. 그래서 둘 다 필요하다.

4. cte
with {name} as () 구문을 통해 임시 테이블을 만들어 하는 것이 가독성이 좋다고 한다. 
현업에서는 테이블을 생성할 수 있는 권한이 없는 경우도 있기 때문에 알고 있으면 좋다. 

## 분석

### 매출 분석
1. z차트로 업적의 추이 확인
2. ABC분석으로 잘팔리는 상품 확인/ 팬차트로 매출증가율 확인
3. 히스토그램으로 구매가격대 확인

### 사용자 분석
1. rfm, 벤다이어그램, 구성비
2. 지속률과 정착률
3. MAU 

등이 있다.


  Excel 함수 및 팁

이번에 대학교에서 마케팅 애널리틱스 과목 중 컨조인트 분석과 MDS 분석을 엑셀로 진행했다.

해당 분석을 하기 위한 과정 중 계산에 대한 팁이 있어 정리하고자 글을 작성했다.

컨조인트 분석과 MDS 분석 또한 적는다.

Tip


1. 빠른 실행 도구 모음

단축키 alt를 이용하여 빠르게 수식복사, 값 복사 등을 통해 효율적으로 수식을 계산할 수 있다.

2. sumifs , ooo ifs 등 ifs

ifs는 여러 조건들을 실행시킬 수 있는 함수로 문법은 예로
sumifs(계산범위,조건범위1,조건값1,조건범위2,조건값2,..) 으로 사용 할 수 있다. 

* 만약 median 처럼 ifs가 없다면 median 안에 if를 넣어 진행 배열 값으로 수식을 완성 할 수 있다. ctrl+shift+enter를 통해 구현

3. 컨조인트 분석

소비자가 선택한 상품의 선호 순위나 선호 점수 또는 선호 선택을 통해 속성들의 효용가치를 추정하는 기법이다. 

설문지 조사 중 많이 사용 되며 numerical 변수에 대해서는 categorical 변수로 바꾸고 실제순위에 대해 회귀분석을 진행하여 효용가치를 알아낸다. 

순위는 역코딩으로 1이 가장 낮은 순위로 바꾸고 이때 회귀계수가 효용가치로 계수의 범위로 모든 categorical 수준에서의 순위도 알 수 있다. 

예를 들어

코카콜라인지 펩시인지 속성 하나, 병인지 캔인지 속성하나, 칼로리가 0인지 15인지 속성하나, 가격이 8인지 10인지 12인지를 조사하여 순위를 조사한 데이터가 있다. 그리고 회귀분석 결과 예측 수식이 다음과 같다. 

(Y 절편)=12.91666667
(코카콜라=1)=-2.333333333
(패키지=캔)=-1.333333333
(칼로리=15)=-4.666666667
(가격=12)=-5
(가격=10)=-1.75

이때 추정 식은 다음과 같다 

(Y절편)+(코카콜라=1)\*(-2.33333)+(패키지=캔)\*(-1.33333)+(칼로리=15)\*(-4.66667)+(가격=12)\*(-5)+(가격=10)\*(-1.75)

또한 해석은 

1) 펩시콜라보다 코카콜라의 순위를 -2.3 순위 낮게 한다. [펩시콜라 > 코카콜라]
2) 병보다 캔의 순위를 -1.3 순위 낮게 한다. [병 > 캔]
3) 칼로리가 0일때를 칼로리가 15일때보다 4.66 순위 높게 한다. [ 칼로리=0 > 칼로리=15]
4) 가격이 8일때는 가격이 12일때보다 5순위 높게 하고 가격이 8일때는 가격이 10일때보다 1.75 순위 높게한다. [가격=8 > 가격=10 > 가격=12]
5) 코카콜라vs 펩시 범위 2.3-0=2.3,
병vs 캔 범위 1.3-0=1.3,칼로리가 0vs 칼로리 15는 4.6-0=1.3, 가격이 8 vs 가격이 10 vs 가격이 12는 5-0=5 ( -1.5는 0과 -5 사이에 들어가서 제외 )으로 전체 속성 순위는 [가격 > 칼로리 > 펩시콜라 > 병] 이다.

4. MDS 분석법

케이스 간의 거리를 바탕으로 이들 간의 유사도 관계 구조를 시각적으로 표현하는 통계 데이터 분석기법이다. 

엑셀에서 하는 방법으로는

1) 제일 처음 선호/거리/특정 차원에 관한 순위에 대한 2차원 행렬(original rank)을 만든다.
2) plot에 표시하기 위한 속성에 대해서 x,y 좌표 이차원 데이터(twodims)를 만들어 초기화한다. 
3) 그 후 속성의 x,y 좌표 거리(유클리안이든, 맨해튼 거리든)를 계산하는 공식을 original rank와 같은 크기의 행렬(distances)데이터를 만든다. 그 후, distances 행렬도 순위로 바꿔 distances rank 행렬로 한다. 
4) 그 후 두 행렬(original과 distance)의 상관관계를 최대화 하는 twodims의 해를 찾는다.


  경쟁사분석

로그회귀는 변화의 움직임을 보고자 할 때 진행한다.

예를 들어, 경쟁사분석이다.

네 개(A,B,C,D) 브랜드에 대한 가격과 판매량에 대한 데이터가 있다면 (보통 전체적으로 집약되어있다. 하나의 상품에 대한 가격과 판매량 합 등.)

서로가 얼만큼 영향을 주고 있는지 데이터를 통해 알 수 있다.

이번 기말고사에서 공부한 내용을 공유하고자 한다.

Tip


## 1. 변환

회귀분석을 할 경우 변환을 심심찮게 하는데 그 중 로그변환과 관계를 보고자 한다. 

종속변수에 로그가 취해져있다면 독립변수에 level 변수(일반 변수)가 들어올 수 있고 혹은 로그 취해진 독립변수가 올 수 있다. 

첫번째 경우를 log-level, 두번째 경우를 log-log 모델이라고 한다. 

## 2. log가 취해졌을 때 와 level일 때 해석 

level은 아무 변환도 안된 기본 상태를 의미한다. 

첫번째 모델에서는 x(독립변수)가 얼만큼 증가할 때 ln(y)가 얼만큼 변하냐에 대한 해석으로 볼 수 있다. 
이때, x는 단순히 크기지만 y는 변화 % 다. 

두번째 모델에서는 ln(x)와 ln(y)의 관계인데, 똑같이 x의 변화%가 y의 변화%를 이끌어낸다는 것으로 해석하면 된다. 

level은 크기, log는 % 변화량으로 보면 된다. 

log와 level에 대한 변화에 대한 수학적 지식과 함께 본다면 이해가 훨씬 빠를 수 있다.
https://danbi-ncsoft.github.io/study/2018/08/07/logwithlevel.html
해당 링크를 참고해보면 좋을 것 같다.


Contact Form