티스토리 뷰

Books

데이터 과학자 원칙

루돌푸다요 2024. 3. 27. 21:09

 

 

우리는 팀으로 일합니다. 

팀원들 각자 서로 잘하고 즐기는 분야가 다르기 때문입니다. 팀원의 구성과 성향이 다양할수록 더 좋은 팀이 될 확률이 높습니다. 팀원들이 각자 최고의 능력을 발휘할 수 있는 역할을 맡아 수행하며 서로의 역할을 존중하고 지식과 경험을 공유함으로써, 팀의 생산성은 올라가고 팀원 모두 성장 할 수 있습니다. 

하지만 팀으로 일한다는 것이 쉬운 일은 아닙니다. 사람마다 커뮤니케이션 방식도 다양해서, 서로 선호하는 방식이 다르기라도 하면 피로가 누적됩니다. 누구는 텍스트 기반의 메시지를 선호하고, 누구한테는 이메일을 보내면 전화가 걸려 오고, 누구는 얼굴 보고 이야기해야 진정한 커뮤니케이션 이라고 생각합니다. 또한 사람마다 상식과 기준이 다르기 때문에, 오해가 생기고 감정을 다치기도 합니다. 협업의 괴로움은 협업의 즐거움을 상쇄하고도 남을 만큼 치명적일 수 있습니다. 

더보기
  1. 모든 과정을 잘 기록하고 공유하자. 
  2. 무엇을 하느냐보다 어떻게 하느냐가 중요하다. 
  3. 우리가 먼저 실험하고 하나의 사례가 되자. 
  4. 차별화에 집착하기보다는 중요한 것을 반복해서 시도하자.

           -일일 회고-

 

 하루종일 계획을 세우고 앞만 보며 이야기하게 될 텐데, 아침에 10분 정도 뒤돌아볼 여유는 있어야 하지 않겠는가 생각했습니다. 다들 처음 하는 일이니까, 무엇을 잘했고 무엇을 못했으며 무엇이 좋았고 무엇이 마음에 걸렸는지 스스로 평가하고 마음을 나누는 것이 도움이 될 것 같았습니다. 

(마음을 전할 기회를 가진다는 것이 얼마나 중요한지와 마음을 담은 짧은 대화를 통해 팀워크가 싹트고 있다는 것을 깨달았습니다.) 

더보기
  1. 공부가 많이 되었다. 예를 들어 깃Git 과 같은 시스템은 혼자서도 쓸 수 있지만 여러 동료와 함께 사용해보는 경험이 꼭 필요한데, 오메가 모임에서 여러 가지 '협업을 위한 깃 활용'을 실험해 볼 수 있었다. 
  2. 일하는 속도가 빨라졌다. 의사결정을 위해 일정을 맞춰가며 따로 회의를 잡을 필요가 없고, 문제를 즉시 공유하고 그 자리에서 해결하기 때문에 진도가 빠르다. 특히 문제 해결 속도가 훨씬 빨라졌다고 느꼈다. 
  3. 문제 해결 능력이 향상되었다. 예를 들어 DB 구축 과정에서 개인 컴퓨터에서 잘 작동하던 코드가 워크룸에서 오류가 나는 문제가 있는데, 오메가 시간에 워크룸에서 다같이 그 문제를 살펴보고 생각보다 빨리 해결할 수 있었다. 혼자였으면 며칠 붙잡고 있을 문제였는데, 여러 사람이 달라붙어 해결하는 것이 시간적으로 더 효율적이었다.
  4. 커뮤니케이션에 도움이 된다. 특히 프로젝트 초기에 정보를 공유하는 것이 중요하다. 오메가 시간을 통해서 연구흐름과 맥락을 서로 충분히 공유하고 있기 때문에 메시징 앱으로 간단히 질문을 하거나 새로운 아이디어를 제안할 때에도 바로 알아듣고 피드백을 줄 수 있었다. 
  5. 시간을 더 효율적으로 사용하고 집중하게 된다. 오메가 시간에는 다같이 일을 하기 때문에 개인 업무를 할 시간이 없다. 오메가를 오전 10시에 시작해야 하므로, 오전 9시부터 10시까지 문서 작업 등 개인 업무를 더욱 집중해서 해치우게 되는 효과가 있었다. 

 

* 행동별 고객 분류 예시

  문자를 받지 않는 경우 구매 
문자를 받는 경우 구매  Yes 설득 가능한 고객 
(Persuadables)
어차피 구매할 고객 
(Sure things)
No 어차피 구매 안 할 고객
(Lost causes)
역효과 나는 고객 
(Sleeping dogs) 

 

'설득 가능한 고객' 은 문자를 받으면 구매를 하지만 문자를 받지 않으면 구매하지 않을 고객입니다. 즉, 프로모션 문자가 가장 필요한 타깃 입니다. '어차피 구매할 고객'은 문자를 받으나 받지 않으나 구매할 고객입니다. 굳이 문자를 발송하지 않아도 구매할 것이기 때문에 타깃에서 제외해도 괜찮습니다. 

 

'어차피 구매 안 할 고객'은 문자를 받으나 받지 않으나 어차피 구매하지 않습니다. 즉 어차피 안 살 고객이기 때문에 문자를 보낼 이유도 없습니다. '역효과 나는 고객' 은 조금 특이합니다. 문자를 받지 않았다면 구매를 했을 텐데, 오히려 문자를 받아서 구매하지 않을 고객입니다. 문자로 인해 불쾌하거나 귀찮아서, 혹은 기타 다른 이유로 다른 구매처를 찾을 수도 있을 겁니다. 이런 고객에게 문자를 보내면 오히려 손실이 발생하므로 주의해야 합니다. 

 

  • 첫번째 사례에서는 반응을 할 것 같은 고객과 하지 않을것 같은 고객중 반응을 할 것 같은 고객을 대상으로 문자를 발송했다면, 이번 사례에서는 위 테이블의 4가지 경우 중 '설득 가능한 고객'에 집중해 문자를 발송하는 전략을 세울 수 있습니다. 특히나 '역효과가 나는 고객'에는 문자를 발송 하지 않도록 주의해야 합니다. 이 방법을 사용하면 아무래도 더 정교한 예측이 가능할겁니다. 실제 모델링 작업에서는 위의 컨셉에 대한 또 다른 접근이 필요합니다. 위의 설명에서는 '특정 고객이 문자를 받으면 사고, 문자를 안 받았으면 안 산다' 는 등 각 상황에 대한 응답을 고려해 분류했지만, 실제로 한 고객에 대해서 문자를 받는 경우와 안 받는 경우를 동시에 적용시키는 것은 불가능 합니다. 쉽게 말해 문자를 받았으면 받은거고, 안 받으면 안받은거지, 한 고객이 문자를 받는 경우와 안 받는 경우를 동시에 취할수가 없습니다. 이러한 점 때문에 위의 개념을 기초로 해 다음과 같은 4개의 분류로 목푯값을 정의 합니다 .
  무응답자 응답자
트리트먼트 TN (트리트먼트 & 무응답자)  TR (트리트먼트 & 응답자) 
콘트롤  CN (콘트롤 & 무응답자) CR (콘트롤 & 응답자) 

 

 * 설득 가능한 고객에 대한 분류 예시 

 

트리트먼트 는 실험군, 즉 문자를 받는 그룹입니다. 콘트롤은 반대로 문자를 받지 않는 그룹 입니다. 응답자와 무응답자는 각각 반응을 한 고객과 반응을 하지 않는 고객을 의미합니다. 

이번에도 총 4가지 조합이 가능하며, 이를 간단하게 앞 글자만 따서 TN, TR, CN ,CR 로 표현했습니다. 각 경우를 풀어서 표현해보자면 TN 은 '문자 를 받았고 구매한 고객,'  TR 은 '문자를 받았고 구매한 고객', CN 은 '문자를 받지 않았고 구매하지 않은 고객', CR 은 문자를 받지 않았고 구매한 고객' 입니다. 여기서 또 한 가지 고려할 점이 있습니다. 경우의 수가 4가지 이기 때문에 더 이상 이진분류로 접근할 수 없다는 겁니다. 그래서 다중분류로접근해 예측 모델을 만들어야 합니다. 

이러한 분석에서 모델링에 활용되는 머신러닝 알고리즘이 별도로 있는 것은 아니며, 다중 분류가 가능한 알고리즘은 무엇이든 활용할 수 있습니다.  지금 까지 설명드린 내용을 업리프트 모델링 이라고 합니다. 

제가 전달하고 싶은 바는 사례에서 활용한 방법론이 아니라, 접근 방법의 깊이 입니다. 

더보기

Uplift modeling 

마케팅 캠페인과 같은 직접적인 접근이 사람의 행동에 미치는 점진적인 영향을 예측하는 예측 모델링 기법 

이는마케팅 및 전자상거래에서 특정 마케팅 캠페인에 반응할 가능성이 높은 고객을 예측하는 데 사용 됩니다. 그러나 업리프트 모델은 단순히 어떤 고객이 구매할 가능성이 높은지 예측하는 것이 아니라, 특정 마케팅이 주어지는 경우에 한하여 어떤 고객이 구매할지 예측합니다. 업리프트 모델링은 상향판매, 교차 판매, 그리고 잔존 등 고객 관계 관리에 서활용 됩니다. 


데이터를 활용할 수 있는 기반을 다지는 일 하나하나에는 많은 시간과 많은 단계와 그 사이의 인내심이 필요합니다.

어느 정도 수준이 높은 데이터 분석을 할 수 있게 되기까지 수많은 장벽을 넘어왔고, 각각의 장벽 앞에서 많은 것을 조사하고, 많은 사람을 설득하는 과정을 거쳐왔습니다. 이 과정에서 무수한 갈등과 고난이 있을 것은 명약관화합니다. 

또한 이 세사람은 항상 초반에는 잠시 좌절하고 방황하지만 결국에는 엄청난 인내심을 발휘합니다. 무슨 부귀영화를 누리겠다고 이렇게 까지 인내하고 이겨내는가 싶을 정도 입니다. 그리고 실제로 대부분의 데이터 과학자가 좌절하는 부분이기도 합니다. 

이가장 중요한 것은 보이지 않았지만 무겁게 이야기를 지탱하고 있던 시간과 호흡과 한숨의 존재 입니다. 그리고 우화에서 제시되었던 여러 시련보다, 밑바탕에 깔려 있던 시간과 호흡과 한숨을 이겨낸다는 것이 주인공의 존재를 더욱 비현실적으로 만듭니다. 

 

문제를 단계적으로 해결해가며 답을 찾아가는 일은 관점을 조금 바꿔보면 '데이터 과학자' 가 잘 할 수 있는 일 입니다. 

미래를 생각하면 아득하고 불안해지지만 현재에 집중하면 문제는 생각보다 크지 않습니다. 그리고 눈 앞에 당면한 문제에서 '뭐라도 해야지' 라는 마음가짐으로 일을 해결해나갑니다. 그것이 흔히 우리가 '데이터 과학자' 라고 말할 때 떠올리는 '데이터 과학자'가 할 법한 일이 아닌 것처럼 보이고, 주변에서 눈총을 받는다고 해도 개의치 않습니다. 

그리고 데이터 과학자가 얻는 큰 성 취는 '해결' 에서 옵니다. 데이터 과학자의 역할, 즉 '업'이란 궁극적으로는 '문제를 해결하는 것' 이기 때문입니다. 

 

데이터라는 과거의 정직한 기록에 숨어 있는 도래할 문제를 해결할 단서를 찾거나, 이를 활용해서 답을 찾는 사람이 데이터 과학자 입니다. 그래서 앞에 놓인 큰 난관을 헤쳐나가고자 '뭐라도 하는 것' 이야말로 데이터 과학자 본연의 역할을 다 하는 겁니다. 본인이 그간 갈고 닦은 기술을 충실히 사용해서 데이터를 직접 활용해가며 '데이터 과학스러운' 문제를 해결하는 것도 좋겠지만, 밑바닥에서부터 뭐라도 하면서 조금씩 나아가서 넓은 범위의 문제를 해결하는 것도, 그에 못지 않은 훌륭한 데이터 과학자의 면모라고 생각합니다. 그리고 이런 면모를 가진 사람들이라면, 앞서서 소개한 세 데이터 과학자처럼, 어떤 환경에서도 꿋꿋이 버텨낼 수 있을겁니다.  마치 영웅처럼 어려운 일을 이겨냐고 데이터 과학의 능력자로 우뚝서게 됩니다.

 

문제 해결의 시작은 문제를 명확하게 정의하는 것이고, 이를 위해서 문제 범위와 개념을 정의하는 겁니다.

그렇다면 우리의 직업인 '데이터 과학자' 부터 정의하면 어떨까요? 저는 데이터 과학자란 앞서 언급했던 것처럼 '데이터를 사용해서 문제를 해결하는 사람' 이라고 생각합니다. 이것은 저의 '최우선 원칙' 이기도 합니다. 

 

더보기

추천 서적 

<데이터 분석가의 숫자 유감 > 

<데이터를 엮는 사람들, 데이터 과학자 >


 

* 원칙 준수에 도움이 되는 정보 

< 스킨 인더 게임 > - 선택과 책임의 불균형이 가져올 파멸에 대한 해결 실마리를 제시하는 책 

< No brand 노브랜드 this is not a brand> 

< 퇴사 준비생의 도쿄2>

<이것은 작은 브랜드를 위한 책> 

< 커뮤니티는 어떻게 브랜드의 무기가 되는가 > 

<성공하는 스타트업을 위한 101가지 비즈니스 모델 이야기 >

<함께 자라기 애자일로 가는길> 

<상자 밖에 있는 사람> 

<한 장으로 끝내는 비즈니스 모델 100> 

<OLAP 테크놀로지>

<린 스타트업> 

<데이터 시각화 교과서> 

<데이터 시각화, 인지과학을 만나다> 

<UX/UI 의 10가지 심리학 법칙> 

 

성과 측정 지표를 단순하고 관찰 및 개선 가능한 것으로 정하세요. 또는 직접 설계하고 구현하세요. 

 


데이터 분석의 본질을 꿰뚫는 4가지 초식을 소개 합니다. 

첫 번째는 '목적을 명확히 하고 과정을 살피자' 입니다. 두 번째는 '익숙하지 않은 다양한 시도를 하자' 입니다. 세 번째는 '더 잘 공감할 수 있는 사람들과 함께 성장하자' 입니다. 마지막으로 '때로는 단순한 것만으로도 충분하다' 입니ㅏㄷ. 

 

목적을 명확히 하고 과정을 살피자. 

저는 데이터 분석이 과업(비전)을 달성 하는 데 필요한 문제를 정의하고, 해결하는 과정이라고 생각합니다. 

사용자가 서비스의 어떤 부분을 마음에 들어 하고, 어떤 과정을 거쳐서 구매하고 사용했는지, 그 과정에서는 어떤 이슈가 있는지, 앞으로 개선해야 할 부분은 어디인지 등의 문제를 정의하고, 목적에 맞게 데이터를 수집 한 뒤 분석하여 서비스를 개선해나가는 무한 반복 작업을 하게 됩니다. 

궁극의 목표, 즉 데이터 분석의 본질인 '매출'을 만들어내려면 '데이터 기반 의사결정'을 도와야 하며, 그러려면 매출이 만들어지는 과정과 맥락에서 나오는 데이터 안에서 인과관계를 캐내야 합니다. 

인과추론 : '데이터 분석' 이라는 요인으로 인해서 '매출 증가' 라는 결과를 만드는 것이 목표라고 하겠습니다. 

 

'나는 좋은 데이터 분석가랑은 거리가 먼 게 아닐까?' 와 같은 고민들을 합니다. 그런 고민을 하시는 분께 전합니다. 

"한두 가지 관점 말고 더 넓은 관점으로 데이터를 보세요. 목적을 명확히 알고 접근하면 충분히 좋은 결과를 도출할 수 있게 될 겁니다." 

 

현실에서는 데이터 품질이 별로이거나 부족합니다. 가설도 이미 다른 사람에 의해서 정해져 있습니다. '우리 제품에도 요즘 유행하는 민트초코를 넣으면 잘 팔릴꺼야' 처럼요. 또한 회사마다 프로젝트마다 상이한 도구를 사용해 시각화 하고 모델링하고 분석 리포트를 만들어 냅니다. 어렵사리 액션 계획을 세워도 회사 정책이나 팀 사정 등으로 아예 실행이 불가한 경우도 만나게 됩니다. 이런 상황에서 어떻게 하면 더 좋은 인사이트를 찾아 유의미한 액션을 만들어내느 데이터 분석가로 성장할 수 있을까요? 각 상황을 헤쳐나갈 4가지 능력이 있어야 합니다. 

데이터가 부족하면 채울 수집 능력, 다른 방향을 제시할 줄 아는 능력, 새로운 도구를 바르게 학습하는 능력, 비즈니스 본질을 파악해서 적절한 액션을 세우는 능력 말이죠. 

 

먼저 데이터를 수집 할 때 만들어지는 과정이나 품질, 관리 체계 그리고 데이터 거버넌스, 데이터 퀄리티 같은 키워드들을 만족시키는 조금 더 넓은 데이터를 확보하도록 습관을 바꿔보세요. 데이터가 없으면 힘을 많이 낼 수 없는 데이터 분석가이기에 없으면 만들어가는 경험을 해야 합니다. 

두 번째로는 동일한 데이터를 보고도 상황을 다르게 해석할 수 있는 경험을 얻어보세요. 숫자에서 드러나지 않는 맥락을 파악할 수 있는 도메인지식 이라고 표현 하고 싶은데요, 이론보다는 사용자들이 만들어내는 현상과 상황을 많이 경험해봐야 합니다. 마지막으로 목적을 달성하기 위한 비즈니스의 본질을 파악하는 능력을 기르려면 데이터 분석 프로젝트를 진행 하면서 성공과 실패의 경험을 맛봐야 합니다. 

 

데이터 분석을 통해 좋은 인사이트를 만들어내는 것은 크게 2가지 방향으로 구분할 수 있다고 생각 합니다. 

데이터에서 나타나는 맥락을 발견하는 것, 그리고 데이터에서 나타나지 않는 맥락을 발견하는 것 

 

데이터 분석은 설득 과정을 거쳐 액션에 영향을 줄 수 있어야 완성되는 겁니다. 데이터 분석의 과정이 명확하고, 결과도 잘 나온다면 설득도 쉬워질 겁니다. 그런데 현실의 데이터 분석은 제 경험상 이상적인 데이터 분석과는 어딘가 살짝 엇나갔습니다. 왜그랬을까 고민을 해보았습니다. 그 결과 그 어떤 데이터 분석 과정보다 다음과 같은 3가지가 선행 되어야 한다는 사실을 깨닫게 되었습니다. 

  1. 데이터 분석을 통해 달성하고자 하는 목적을 먼저 명확하게 정의한다. 
  2. 비즈니스 모델과 프로덕트/서비스에서 발생하거나 측정 가능한 데이터를 파악한다. 
  3. 도메인 인사이트로 데이터에서 나타나는 현상들을 맥락으로 이해한다. 

많은 데이터 분석가가 이 3가지를 인지하지 못하는 경우가 많습니다. 그러다 보니 성과를 내야 하는 데이터 분석가로서 데이터 분석을 잘 보여주는 결과를 만들깅 위해 새로운 지표를 정의하거나, 복잡한 분석 방법론을 적용한다거나, 화려한 차트를 쓰는 것 같은 '기술적인 접근'으로 채우려는 노력을 하기도 합니다. 이를 '데이터 흑마법' 이라고도 표현하기도 합니다. 

데이터 흑 마법에서 생각 나는 몇 가지 예시는 다음과 같습니다.

  • 여러 게산식과 지표 중 안좋은 것들은 배제하고 좋은 것만 체리 피킹 
  • 데이터의 품질을 핑계로 결론과 다른 결을 나타내는 데이터를 취사선택 혹은 보정 
  • 원활하게 작동하기 위해 여러 조건이 필요한(복잡한) 새로운 지표 활용 
  • 메시지가 더 명확하게 드러나게 차트와 그래프 가공 

이 흑마법은 앞에서 언급한 이상적인 데이터 분석 과정 중 일부가 빠져 유의미하거나 설득할 수 있는 분석의 결과가 잘 나오지 않는 상황에서 이를 메꾸기 위해 자주 등장합니다. 이 방법은 단기적으로는 결과가 날 수 있지만 장기적으로는 언젠가 또 다른 문제에 봉착하는 결과가 생기게 됩니다. 좋은 데이터 분석 사례를 만들어내는 데이터 시니어 중에는 분석 기술이 뛰어난 테크니션 유형 외에도 큰 그림을 그리는 구루 유형도 있다는 것을 생각하면, 새로운 것을 학습하는 것만큼이나 사고력을 키우는 연습도 필요한 것이 아닐까라고 생각합니다. 

 

더보기

<메타 인지> 

자신의 인지 과정(인지능력, 지식, 자신에 대한 이해)을 인식하고 이해하는 능력으로 자신에 대해 잘 이해하고 어떤것을 아는지 모르는지 분석해 개선 방안을 모색하는 과정 

 

10가지 원칙과 메타인지를 넓히는 데 도움이 된 방법 

1. 의도적으로 남다른 선택해보기 

2. 주기적으로 일하는 목적 찾기

3. 제너럴리스트, 스페셜리스트 이분법으로 생각하지 않기 

4. 업무도 메타인지하며 목적 중심으로 생각하기 

5. 나의 세상 정의하기

6. 회사에서 필요한 일과 내 흥미를 일치시키기 

7. 팀 현황을 파악해서 개선점 만들기

8. 더 나은 커뮤니케이션 능력 기르기 

9. 비즈니스 모델과 데이터의 접점 분석하기

10. 지금 힘들다면 여유가 있는지 생각해보기 

 

 

랜선 사수 만들고, 함께 자라기 

자신의 현 상황과 자신의 욕구를 파악하고 그 방향으로 가려면 어떤 경험을 해야 할까를 생각하고 실제로 실행하는 겁니다.

 

인사이트란? 특정 원인과 결과를 이해 하는 것 '특정 상황' 에서 '원인'과 '결과'를 파악 하는것이 핵심입니다. 특정 상황, 원인, 결과에 대한 관점을 다르게 표현 하면 "그 문제는 어떤 상황에서 발생하고 어떤 결과가 생기는가?" 로 표현 할 수있습니다. 

 

데이터를 파악할 때 무엇에 집중하느냐에 따라 사고방식이 달라집니다. 대표적으로 그래프 중심 사고, 데이터 중심 사고, 목적 중심 사고가 있습니다. 저는 여기에 호기심 중심 사고도 추가하곤 합니다. 우리는 왜 데이터를 활용할까요? 의사결정에 도움을 주기 위해서 입니다. 데이터 기반 의사결정을 하고 나서, 무언가 액션을 취해서 지표를 개선 하고 싶어 하지요. 

정리하면 인사이트를 내라는 업무를 전달받으면 지금 해결해야 하는 문제와 알고 싶은 것을 목적으로 만들고 관련 데이터를 수집해 결론을 내야 합니다. 그래서 우리는 'So What?', 즉 '무엇을 해야 합니다' 라는 액션을 도출 해야 합니다. 

 

데이터분석가라면 누구나 가설을 만들고 데이터를 들여다보며 어떤 패턴인지 확인합니다. 패턴을 발견하면 멈추지 않고 '우리는 그래서 무엇을 할 수 있지?' 액션 아이템을 생각해야 합니다. 그러다 보면 '이 가설을 해결하면 무엇을 할 수 있을지'로 이어지고 처리하는 속도가 더욱 빨라집니다. 

 

더보기

자신의 세상을 한정할 수 있는 언어보단 자신의 세상을 확장할 수 있는 언어를 사용하려고 합니다. 

그래서 "그럼에도 불구하고" 라는 말을 자주 합니다. 어떤 생각이나 행동에 항상 "그럼에도 불구하고" 라는 말을 자주합니다. 어떤 생각이나 행동에 항상 "그럼에도 불구하고" 를 붙이며 생각하는데, 그러면 새로운 해결 방법을 고민할 수 있게 됩니다. 

데이터 분석팀이 일을 잘하기 위해선 무엇을 해야 할까요? 팀에 대한 인지인 팀 메타인지를 가지고 액션 계획을 세우면 됩니다. 먼저 우리 팀이 진정 무엇을 하고 싶은지 논의해야 합니다. 팀원들이 이회사에 입사하게 된 계기, 이 회사에서 달성하고 싶은 목표, 어떤일을 많이 하는지, 어떤 일을 해보고 싶은지 등을 이야기해서 각자의 바라는 모습을 모아 팀 차원의 바라는 모습을 정의 합니다. 

 

더보기

회사의 이름 + businessmodel  

Uber Ride Business model  

우버 라이드는 이동이 필요한 라이더와 유연하게 수입을 얻고 싶은 드라이버가 공존하는 양방향 마켓 입니다. 

라이더(승객)가 이용한 만큼 우버에 비용을 지불하면, 우버는 드라이버(운전수)에게 수수료를 제외한 금액을 지급합니다. 운행 건을 늘려야 돈을 버는 비즈니스 모델 입니다. 이런 비즈니스 모델에서 수익을 늘리려면 어떻게 해야 할까요? 

우버는 라이더가 드라이버를 기다리는 시간인 ETA (Estimated Time Arrival ) 를 줄 여야 운행 건이 늘어난다고 가설을 세웠습니다. 데이터를 확인하니 실제로 ETA 가 길어지면 취소할 확률이 높아졌습니다. 그래서 ETA 를 줄일 액션을 생각해냈습니다. ETA 에 영향을 미치는 요소는 여러 가지지만 그중에 드라이버가 가장 중요한 요소 입니다. 

ETA 를 줄일려면 호출지 근처에 드라이버가 많이 활동해야 합니다. 드라이버가 많이 활동하게 하려면 어떻게 해야 할까요? 비가 오는날 처럼 운전이 어려운 상황에도 드라이버가 활동할 수 있게 할 방법은 무엇일까요 ? 

이런 고민 끝에 우버는 탄력 요금제 dynamic pricing를 도입해 운행료를 수요 공급 상황에 따라 조절합니다.

 

데이터 기반 의사결정을 하는 조직이라면 우버처럼 비즈니스 모델에서 매출이 발생하는 요인을 확인해 가설을 세우고 데이터를 파악해야 합니다. 비즈니스 모델의 매출과 데이터가 밀접하게 연결되어 있다면, 데이터 기반 액션을 취하기 수월합니다. 반면 비즈니스 모델과 데이터가 상관없다면 데이터 기반 액션에 대한 중요도가 적을 수도 있습니다. 따라서 데이터에 투자를 덜 할수도 있습니다. 회사의 비즈니스 모델을 도식화해보세요. 그리고 비즈니스 모델과 데이터가 밀접한 관계인지 확인해보세요. 밀접하다면 비즈니스의 성과를 내기 위해 여러 시도를 해보세요. 

회사의 비즈니스 모델을 분석해 데이터와의 밀접도를 확인하라고 조언합니다. 이런 과정을 통해 회사 비즈니스 모델을 이해할 수 있고, 데이터의 가치와 활용 방법에 대한 능력도 키울 수 있습니다. 더 나아가서 가고 싶은 회사의 비즈니스 모델과 여기서 생성되는 데이터에 대한 글을 작성하는 것을 추천합니다. 이런 글을 통해 비즈니스 모델 분석 역량을 키우면 지원한 회사에서도 인상 깊은 지원자로 생각하게 될 겁니다. 

 

더보기

제 원칙들의 핵심은 현재 나를 생각해보고, 과거의 나는 어떤 사람이였는지, 미래의 나는 어떤 사람이기를 꿈꾸는지 생각해 보는 겁니다. 그리고 미래의 내가 되기 위해 무엇을 해야 할지 고민하고 실행할 수 있는 액션 아이템을 만들고 그 액션을 진짜로 실행합니다. 여러분이 겪는 문제부터 시작하며 하나씩 해결하는 과정에 이런 생각을 가지며 행동하길 추천 드립니다. 

대시보드를 만들려면 보여줄 지표부터 정의해야 합니다. 그러고 나서 데이터를 수집하고 필요한 형태로 가공한 뒤 마지막으로 시각화 도구를 이용해서 데이터를 시각화해 대시보드를 만들면 됩니다. 

 

가장 먼저 보고자 하는 지표를 정의 해야 합니다. 

대시보드는 지표를 시각적으로 보여주는 도구일 뿐입니다. 보고자 하는 지표를 먼저 정의하지 않으면 어떤 데이터가 필요한지 시각화 도구를 이용해서 어떤 대시보드를 만들지 판단할 수 없습니다. 이커머스 회사에서 근무한다면 사용할 수 있는 지표로는 일일 가입자 수, 회원 가입 퍼널 전환율, 일일 매출 ,주간 매출, 월간 매출 ,상품별 매출, 카테고리별 매출, 구매 전환율 등이 있습니다. 이러한 지표를 바탕으로 대시보드에서는 매출 추이, 매출비중, 매출 순위, 매출 예측 등을 시각화 해 보여줄 수 있습니다. 

 

두 번째로 데이터가 필요합니다. 가입자 수, 구매 전환율, 매출들의 지표를 보여주려면 가입일, 회원 아이디, 상품 ID, 결제 일자, 상품 가격, 상품 조회 수, 구매 버튼 클릭 수 등의 정보가 필요합니다. 

 

AARRR 프레임 워크 

Acquisition (고객 유치)

Activation(활동)

Retention(유지)

Referral(추천)

Revenue(수익화) 

 

고객 유치 단계에서는 새로운 사용자를 서비스에 유입시키는 것이 중요합니다. 이를 위해 사용자가 어떤 채널에서 유입되고 있는지 분석하고, 각 채널별로 어떤 지표가 나오는지 살펴보아야 합니다. 또한 사용자들이 어떤 이유로 서비스를 이용하는지 파악하고, 이에 맞게 마케팅 전략을 수립해야 합니다 .

 

활동 단계에서는 사용자들이 서비스를 활성화시키는 것이 중요합니다. 이를 위해 사용자들이 서비스를 쉽게 이용하도록UI/UX 를 개선하거나, 사용자가 원하는 기능을 추가하는 등의 작업이 필요합니다. 또한 사용자들이 서비스를 이용할 때 발생할 수 있는 문제점을 파악해 개선하는 것이 중요합니다. 

 

유지단계에서는 사용자가 서비스를 지속적으로 이용하도록 하는 것이 중요 합니다. 이를 위해서는 사용자들이 서비스를 이용하면서 발생하는 문제점을 파악하고, 이를 개선해야 합니다. 사용자들이 가장 많이 이용하는 기능을 파악해, 해당 기능을 개선하거나 새로운 기능을 추가하는 등의 작업도 필요 합니다 .

 

추천 단계에서는 사용자들이 다른 사용자를 서비스에 유입시키는 것이 중요 합니다. 따라서 사용자들이 서비스를 이용하면서 만족도를 높일 수 있는 기능을 추가하거나, 소셜 미디어를 활용해 사용자들이 서비스를 공유하도록 하는 등의 작업이 필요합니다. 

 

수익화 단계에서는 서비스에서 발생하는 수익을 최대화 하는 것이 중요합니다. 이를 위해서는 수익을 발생시키는 요인을 파악하고, 이를 최적화 하는 작업이 필요합니다. 또한 사용자들에게 추가 혜택을 제공하는 등의 전략을 수립해 수익을 증대시키는 것이 중요 합니다. 

 

AARRR 의 모든 부분을 신경쓰는 일이 불가능했습니다. 단순하게 각 단계의 지표를 추출하고, 각 지표를 끌어올릴 목적으로 제품을 개선하는 기획을 지원할 때 현황 데이터를 제공하는 수준으로 시작했습니다. 

우선 반복되는 일들을 최대한 자동화하고, 대시보드를 만들어서 반복 요청을 줄이고, 정기/비정기 푸시 발송 업무를 관리자 시스템에서 실무자가 직접 발송할 수 있도록 개선해 시간을 벌었습니다. 

그러고 나서 Activation 과 Retention 에 집중했습니다. 그 덕분에 신규가입자의 Retention 이 두 배 가까이 증가했습니다. 

그로스 해킹은 한 번만 수행하고 마는 것은 아니므로 앞으로도 지속적으로 AARRR 을 수행하며 비즈니스에 이바지 하는 팀으로 발전해 나아갈 계획 입니다. 어느 정도 만족할 만한 Retention 을 만들다면 이후에는 AARRR 각 단계의 지표를 지속적으로 높일 수 있도록 담당자들을 배정해 담당한 지표를 높일 수 있도록 분석하고 서비스를 개선할 예정입니다. 

 

현실 : 정보 전달은 생각보다 어렵다. 

새로운 지식을 알아내는 과정은 매우 어렵습니다. 무엇이 새로운지를 알아야 하고, 그러자면 먼저 새롭지 않은 것들을 충분히 습득해야 합니다. 거인의 어깨에 올라타면 더 멀리 볼 수 있다지만 거인의 어깨에 올라서는 것부터가 만만치 않은 일 입니다. 

배워야 할 것이 많기 때문이기도 하지만 말과 글로 지식을 주입 해야 하기 때문입니다. 게다가 자연의 섭리와 패턴, 원인과 결과는 사람의 언어로 쉽게 표현되지 않습니다. 

새로운 지식을 알아내는 과정보다 알리는 과정이 더 어려울 때도 많습니다. 지식과 생각을 전달하고 설득을 통해 남의 마음을 바꾸는 일은 지식을 내 머리에 넣는 일보다 남의 머리에 넣어주는 일이 훨씬 어렵습니다. 상대의 머릿속에 상반되는 지식이나 의견이 먼저 들어 있으면 설득을 해서 이를 물리쳐야 하고, 심지어 내가 전달하려는 것에 관심조차 없다면 관심부터 불러 일으켜야 하기 때문 입니다.