본문 바로가기
Project

실전 프로젝트 정리 겸 대본 작성

by DAkimble 2024. 9. 21.

발표 순서: 0. 발표 및 대시보드 구조 설명 → 1. EDA → 2. BI → 3. 상품 지표 → 4. 고객 지표 → 5. 마케팅 인사이트 → 6. 느낀 점

 

발표 순서

1. EDA

2. BI

3. 상품 지표

4. 고객 지표

5. 마케팅 인사이트

6. 느낀 점

 

1. EDA 

 1) 컬럼 삭제 및 결측치 처리

  • (결측치 보여주며)원본 데이터셋에 결측치는 전체 65,280행 중 Item Class 8285개, Item Number 40개 등이 있었다.
  • Invoice Date: 2018년 3월, 2019년 데이터 삭제 ← 2018년 3월은 21일 까지만 있어서 이상치로 봄. 2017년 9월에 큰 매출상승이 있었으며 그 때부터 18년 2월 까지의 매출변화에 집중하기로.
  • 이에 따라 Sales Price와 Discount Amount의 결측치들이 자동 처리되었으며 Sales Quantity의 음수값 1행도 처리.
  • Item Class는 NULL값과 오타 등이 많으며 우리가 만든 범주, 브랜드 컬럼 등으로 대체 가능하여 삭제
  • Item number: 이 번호가 같은데 Item 이름이 다른 경우들은 각각의 Item 이름을 기준으로 Number 수정
  • (이외 ERD에서 가로 친)Datekey: Invoice Date와 배치 외에 모든 행의 값이 동일하며 발표에서 쓰기에 의미가 모호함
  • Order Number는 Invoice Number와 동일하게 Custkey에게 귀속되지만 Invoice Number가 송장 날짜에 따라 변하는 반면 Order Number는 송장 날짜가 달라도 Item이 같으면 대략적으로 같다. 하지만 우리에게 더 필요한 속성을 날짜 별로 더 세세하게 나뉘어지는 Invoice Number로 봐서 대체 
  • Promised Delivery Date: 정작 Delivery Date가 없으며 (Promised Delivery Date가 Invoice Date보다 빠른 이상치가 8,968개나 되고)4,643개의 행만이 Promised Delivery Date가 Invoice Date보다 느린데 그 차이의 평균은 1.64일, 중간값은 1로 짧은 경우가 많아 효용이 크지 않다 판단.
  • Line Number: 주문서 내 여러 상품의 순서를 나타내지만 사용하지 않아서 삭제

 

2) 이상치 처리 

(여기 까지 길어도 약 1:30 내로 줄이기)

  • List Price(정가): 0인 경우 295행 삭제. 프로모션이나 번들 제공 등 여러 이유가 가능하나, 각각의 이유가 불명이라 마케팅에 이용하기 어려우며 할인율 계산에 어려움이 있기 때문
  • U/M: 하이픈값 1행. 해당 제품과 같은 이름, 고유번호인 것과 동일하게 EA로 변경

 

3) 컬럼 추가

  • 원본 데이터셋은 ERD에서 보듯 고객이나 품목의 특징과 관련된 컬럼은 거의 없고 판매와 매출과 관련된 정보가 대부분이다. 하지만 고객과 달리 품목에는 함축된 여러가지 정보가 있었다. 따라서 우리는 범주와 브랜드 컬럼을 만들어 품목을 더욱 입체적으로 분석했다. 
  • 먼저 Category범주 Code는 전처리 된 데이터셋에서 기존의 624개의 고유 Item에 대해 자연어 처리(N-gram과 TF-IDF)을 수행한 결과에 군집을 실행. kmeans와 계층적 군집화를 모두 이용해봤는데 후자가 신뢰도나 결과값이 더 좋아서 후자를 이용. 이 결과값과 아마존의 식품 범주들을 보고 범주명을 정했으며 이후에 품목 이름을 보며 약간씩의 수정을 거침. 이를 통해 가장 매출이 가장 높은 범주인 곡물류 신선 농산물의 1번 부터 순서대로 9개의 범주 code 선정을 완료
  • 브랜드 코드는 모든 품목의 앞 단어에 'Better, High, Ebony' 등 브랜드명이 있는 것을 발견. 색깔 등 브랜드명이 아닌가 싶은 것들도 분석 결과 브랜드로 결론. 이를 역시 가장 매출이 가장 높은 브랜드인 Better의 1번 부터 총 55개의 브랜드 code 선정 완료. 이 컬럼들을 상품 매출 분석을 위한 주요 속성으로 활용.

 

4) 왜도, 첨도

  • 왜도, 첨도는 0~1 사이가 정규분포인데 이 긴 꼬리의 히스토그램에서 보듯이 우리 자료들은 전처리 후에도 매출 기준으로 18.80, 498.42 등의 엄청난 수치를 기록. 이는 우리 데이터셋의 거래에서 Sales Amount가 평균 주위에 집중된 것이 아니라 낮은 매출에 조금 집중됐지만 이후로 중간~높은 매출까지 퍼져 있으며 돌발적으로 큰 매출도 자주 일어났다는 의미.  
  • 이러한 매출 형태에 맞춤 마케팅을 하기 위해 우리는 두 번째 장의 고객 관련 지표에서 RFM을 적극적으로 이용해 매출이 높은 고객들이 어떠한 소비형태를 띄고 있는지 분석.

 

 

2. BI

1) 비즈니스 시나리오

앞서 파악한 아마존 푸드 비즈니스는 도매상을 중심으로 다양한 식료품을 판매하는 온라인 상점입니다. 고객은 온라인으로 제품을 주문하고 대부분 하루 내에 배송받을 수 있습니다. 하지만 전광판에서 볼 수 있듯이 2018년 초 현재 매출이나 순익이 전반적으로 하향곡선을 그리고 있습니다.

 

2)비즈니스 목표

이번 프로젝트의 목표는 Amazon Food의 2018년상반기 전체 매출을 전년 동기 대비 -2~3로 내로 최대한 보합하는 것이고 올해 하반기에는 이번 상반기보다 5% 가량 매출을 증가시키는 것입니다. 이 같은 수치의 근거는 대시보드에는 나타나있지 않지만, 올해 1, 2월 2달 동안 작년 동기 대비 10%나 되는 매출 하락이 있었고, 작년 상반기는 하반기보다 약 2.4%의 매출 증가가 있었기 때문입니다. 이를 통해 2018년 올해 통틀어서는 작년 총 매출 대비 보합 이상의 매출 성적을 거둬 19년 고도 성장의 발판을 마련하는 것이 목표가 될 것입니다.

 

3) 대시보드 목적 및 뷰어

  • 이를 위한 우리 애프터조 대시보드의 목적은 매출의 트렌드와 매출에 영향을 미치는 주요 요인을 파악하고 전달하는 것이며
  • 뷰어: 마케터 및 경영진으로 설정

 

4) 대시보드 구성

  • 지표 설정('2017.9~2018.2 전월 대비 이번 월 변동폭' 중심)
  • 주요 지표 4가지: SA, SM, APRU, MAU로 각각 이번 프로젝트의 KPI가 되는 매출과 그 변동에 직접적으로 관련되는 마진, 고객 당 평균 매출, 고객수로 정했습니다.
  • 이를 기반으로 크게 마케터를 주요 뷰어로 하는 Product 장과 경영진이 주요 대상인 Customer 장으로 나누었으며 대부분의 지표들이 2017년 9월 부터 2018년 2월 까지 각 월에 맞춰 나타나도록 해서 변화를 파악할 수 있게 했다. 

 

4. 상품 지표

1) 주요지표

  • 전광판을 보면 SA, SM, MAU 등의 주요 지표가 모두 전반적으로 연말보다 2월에 우하향하고 있으며 ARPU 역시 1월에 비해서는 줄어들었습니다. 전월 대비로 봐도 3~8%의 하락폭을 보이고 있고 9월에 비해서는 SA나 SM은 20% 이상의 심각한 낙폭을 보이기도 했습니다. 이는 아마존 푸드 비즈니스의 KPI에 해당하는 총 매출이나 총 마진, 월별 사용자가 줄어들고 있으며 유저당 평균 매출에 있어서도 좋은 흐름을 보이고 있지 못하다는 것을 나타낸다. 
  • 우리는 특히 ARPU의 개선을 위해 고객에게 판매될 품목들에 대한 세부적인 분석을 진행하기로 했으며 MAU의 개선을 위해 뒷장에서 고객들의 LTV와 RFM을 자세히 들여다보기로 했습니다. 

 

2) 범주 및 브랜드 차트

  • 먼저 말씀드렸듯이 우리는 각 품목에 대한 세세한 분석을 위해 범주와 브랜드 컬럼과 그에 대한 차트를 만들었습니다. 범주 차트에는 곡물류 및 신선 농산물, 통조림 식품, 즉석 가공 육류, 간식 및 기타 가공식품, 유제품 및 치즈 등이 있으며 보시는 바와 같이 총 매출 기준으로 1~9번 까지 번호를 매겼습니다. 
  •  이 차트에서 알 수 있는 것은 아마존 푸드 매출의 상당 부분이 건강 식품류에서 발생한다는 것입니다. 매출 비중 1, 2위는 약 20%의 곡물류 및 신선 농산물와 15%의 통조림 식품, 특히 야채 및 생선 통조림이 차지하며 유제품 및 치즈류도 약 10%로 5위권에 달합니다. 이는 데이터셋의 기간 동안 미국인들의 건강 음식에 대한 관심이 높았다는 것을 의미하며 우리가 마케팅에서 집중할 만한 포인트입니다. 
  • 또한 브랜드 차트를 볼 때 우선 나타나는 것은 범주와의 강한 상관관계입니다. 먼저 데이터셋의 기간 동안 Ebony, High, Red, Nationeel, Gorilla 등의 상위 5개 매출 브랜드들은 55개의 브랜드들 중에서도 약 20~10%로 매우 높은 매출 비중을 차지했습니다.또한 이 브랜드들은 각각 통조림 식품, 곡물 및 신선 농산물, 즉석 가공 육류 등의 그 자체로도 총 매출이 높은 식품 범주들의 판매 비중이 80%가 넘었습니다.
  • 이는 각 브랜드들이 전문적으로 생산, 가공, 판매하는 식품 범주가 있다는 것과 높은 매출을 차지하는 건강식에 집중하는 브랜드들의 매출 기여도가 높다는 점을 나타냅니다. 따라서 우리는 통조림 식품, 곡물 및 신선 농산물, 유제품 및 치즈류를 전문적으로 판매하는 Ebony, High, Red, Moms 등의 브랜드 들과 긴밀한 제휴관계를 맺고 함께 전문적이고 적극적이고 마케팅을 구상하는 것이 매우 효과적이라는 것을 예상할 수 있습니다. 

 

3) 품목 별 U/M 간 평균 매출액 비교 및 범주 별 월 평균 총 판매액 차트

  • 다음으로 상위 매출 품목 5개에서 어떤 판매 단위로 판매했을 때 평균 매출이 높은지 알아봤습니다. 저희는 여기에서 품목 별로 개별, 한 쌍, 세트 등의 판매 단위에 따라 상당한 평균 매출 차이가 발생한다는 것을 알았습니다. 예를 들어 Golden Frozen Broccoli, Golden Frozen Corn은 SE일 때보다 EA일 때 각각 83.10%, 65.33%나 낮은 평균 매출액을 보였고 반대로 High Top Driedmushrooms는 SE일 때보다 EA일 때 98%나 되는 평균 매출 증가
  • 물론 이러한 차이는 매우 극단적인 경우들이고 각 품목에는 매출 이외에도 제품 크기, 종류 등 UM이 결정되는 다양한 이유가 있을 것입니다. 하지만 그렇다 해도 상품마다 가능한 한 평균 Sales Amount가 높은 유형의 U/M으로 맞춰서 판매한다면 총 매출의 증가를 기대할 수 있을 것입니다 
  • 범주 별 월 평균 총 판매액 차트에서 할인율은 범주 별로 어느 정도 일정한 값을 가집니다. 특히 1,2,3위의 매출 범주들은 다른 범주들에 비해서도 할인율 변동과 관련 없이 높은 판매량과 매출을 가졌습니다. 하지만 4~9위 범주들은 할인율에 따라 월별 매출이 상당한 폭의 변화를 보였습니다.
  • 따라서 1~3위의 곡물류 및 신선 농산물, 통조림 식품 등의 품목들은 할인 보다는 다른 프로모션에 집중하는 것이 효과가 좋고, 나머지 4위 이하에서 특히 우리가 집중하는 유제품 및 치즈류 등에서는 효율적인 할인율을 찾고 대대적인 관련 마케팅을 하는 것이 효과적이라는 것을 알 수 있습니다. 

4) 월별 요일, 이벤트에 따른 매출 변화 차트

  • 우리 데이터셋의 기간인 2017 년 09 월 ~ 2018 년 02 월까지의 요일, 이벤트에 따른 매출 변화를 보면 사실 특정 이벤트 및 요일과 매출이 어느 정도 연관이 있지만 그 효과는 자세하게 들여다봐야 함을 알 수 있습니다.
  • 예를 들어 2017년 9~12월은 일요일에 높은 매출액을 기록해서 직관적으로 보이지만, 2018 년에는 월요일이 다른 요일들보다 높은 매출액을 기록했습니다. 이러한 매출 변화는 우리가 월별로 범주, 브랜드, UM 등으로 다양한 분석을 해보았지만 특별한 원인을 알 수 없었고 연도가 바뀌며 일별 판매 시스템이나 프로모션에 큰 변화가 있었다는 추측만이 가능했습니다. 하지만 이는 다시 생각하면 적절한 프로모션이 상당한 매출 변화를 이뤄낼 수 있다는 것을 보여줍니다. 
  • 한편 이벤트를 중심으로 볼 때 9/4 일(월요일) 노동절은 주요한 공휴일인데도 불구하고 2017 년 9 월의 다른 날과 비교했을때 매출액이 낮은 편인데,  오히려 바로 전 날인 9/3 일(일요일)의 매출액은 상당히 높습니다. 이는 노동절 전 날도 일요일이기 때문에 미리 식료품을 구매하였을 가능성이 있으므로 '이벤트와 매출이 상관없다'고 단정지을 수는 없습니다. 보통 이벤트 당일 보다 이벤트 전에 매출액이 상승하는 경우가 있기 때문이다.
  • 또한 모든 기간 중 매출이 가장 높았던 9월에 전체 상위 판매액 품목에는 2위 high top dried mushroom, 4 위 ebony squash, 5 위 red spade pimento Loaf 등 농산물 및 육류가 많아 수확철을 가을 즈음에 농산물의 매출이 확실히 늘어나며 이것이 다시 총매출에도 긍정적인 영향을 준다는 것을 나타냅니다. 따라서 이 기간에 농산물 브랜드들과 긴밀한 관계를 맺고 마케팅을 집중하는 것도 좋을 것입니다.
  • 이외에 10/9 일 콜럼버스데이나 11/10 미 재항군인의 날(금), 11/24 일(금) : 블랙프라이데이 등 직관적으로 식품 매출과 큰 영향이 없는 이벤트들은 공유일인 경우라도 낮은 매출을 기록하며 큰 연관이 없다는 것을 나타냈습니다.
  • 한편 12/24 크리스마스이브(월요일) , 12/25 크리스마스(월요일) 등은 이 날은 다른 어떠한 날보다 매출액이 가장 높다. 이브날에는 fast mini donuts 가 가장 높은 매출액은 보이며 크리스마스는 피자,치즈,비프,치킨 넓적다리 등 크리스마스에 어울리는 식료품들의 판매액이 높았습니다. 크리스마스에도 매출을 올리고 싶으면 이러한 파티와 관련된 식료품들에 프로모션 진행하면 좋을 것 같

 

유저수는 2017년 12월에 가장 많지만, ARPU가 가장 적은 달 역시 2017년 12월. 따라서 유저수에 비해 그다지 높은 매출과 마진을 거두지 못함. 한편, 가장 매출과 마진이 높았던 달은 2017년 9월.