티스토리 뷰

Books

한 달 공부 데이터 분석

루돌푸다요 2024. 3. 28. 19:41

 

 

시장 점유율을 분석한느 목적은 크게 네 가지 이다. 첫째, 제품의 매력도를 파악 할 수 있다. 둘째, 경쟁사 제품의 위치를 

파악 할 수 있다. 셋째, 시장의 규모와 질적 수준을 파악할 수 있다. 마지막으로 경쟁 우위 제품을 파악하고 선별하는 데

유용하다. 

 

시장 점유율 분석의 목적 

- 제품의 매력도 확인, 경쟁사 파악, 경쟁 우위 제품 선별, 시장의 규모 및 질적수준 

시장 점유율 분석 대상에 따라 비용 측면 / 양적 측면 

시장 점유율 분석 기준에 따라 상대적 측면 / 절대적 측면 

 

매출액 기준 절대적 시장 점유율 = 전체 시장 매출액 / 당사 매출액 (%) 

 

BCC 매트릭스는 성장률과 시장 점유율을 기준으로 사업 또는 상품의 가치를 네 가지 등급으로 분류하는 평가 도구이다. 네 가지 분류란 계속 투자해야 할 사업, 성장 지체 사업, 성장성 높은 신규 사업, 시장에서 철수해야 할 사업을 말한다. 

 

  • 스타(Star) 사업 
    -성장률과 시장점유율이 높아서 계속 투자를 하게 되는 유망한 사업이다. (육성사업) 
  • 현금젖소 (Cash cow) 사업 
    - 점유율이 높아서 이윤이나 현금흐름은 양호하지만 앞으로 성장하기 어려운 사업이다. (합리화 사업) 
  • 물음표(Question Mark) 사업 
    신규사업. 상대적으로 낮은 시장점유율과 높은 성장률을 가진 사업으로 기업의 행동에 따라서는 차후 스타(Star) 사업이 되거나, 도그(Dog) 사업으로 전락할 수 있는 위치에 있다. 일단 투자하기로 결정한다면, 상대적 시장 점유율을 높이기 위해 많은 투자 금액이 필요하다. 
  • 개(Dog) 사업 
    - 더이상 성장하기 어렵고 이윤과 현금흐름이 좋지 못한 안 좋은 사업이다. (철수사업) 

 

 

단순 매출 성장률 = 올해 매출액 / 올해 매출액 - 전년도 매출액 (%)

CAGR = Compound Annual Growth Ration 평균 성장률을 의미 한다. 

- 공식은 단순 매출 성장률 = 기간 내 첫 매출액 / 기간 내 마지막 매출액 (기간/1)  -1 

액셀 이용시 = rate(기간, 0, - 시작 값, 종료값) 

CaGR 공식

비용을 분석하는 이유는 제품의 내부 경쟁력을 확인하기 위해서다. 시장 점유율 분석을 적을 알고, 안으로는 투자와 재원 확보 생산 공정 노동력 설계 기술 유통 체계를 기준으로 내부 경쟁력을 명확히 파악해야 시장에서의 생존 전략을 구체적으로 전개 할 수 있다. 

 

비용분석은 꼭 진행해야 합니다. 시장 점유율과 성장률을 통해 적을 알았다면 내부 경쟁력을 분석하여 나를 알아야

'백전불패' 한다는 의미다. 기업의 내부의 경쟁력을 명확히 알아야 시장에서의 생존전략을 구체화 할수 있다. 

 

제품별 매출 추이 (매출은 거짓말을 하지 않는다) 
- 제품별 매출 추이를 분석하는 이유는 해당 제품의 수명과 성장 가능성을 확인하기 위해서이다. 제품의 장기간 매출 추이를 분석한 결과 성장가능성이 크면 신기술 적용과 마케팅에 집중하고, 반대로 제품 수명이 다해 성장 가능성이 작으면 마케팅과 신기술 적용을 중단하면 된다. 

 

매출을 그리는 곡선? , 매출 곡선에서 의미를 찾자는 이야기. 

제품수명 주기 모형

 

목표 매출액 분석 , 올해 매출 목표가 얼마인가요 ? 

- 매년 초 많은 기업이 데이터 분석보다 경영진과 영업, 전략 부서의 의지와 꿈이 더 많이 반영된 목표 매출액을 발표한다.

이를 정성적인 목표라 한다. 반대로 전년도의 성장률, 또는 점유율을 분석해 합리적이고 실현 가능한 목표를 세우기도 한다. 이를 정량적인 목표라고 한다. 

 

목표 매출액 

- 성장지표 + 수익성 지표 + 생산성 지표 

'

목표 매출액 G1 = 5Y 매출액 x (1 + 저년 대비 성장률)

목표 매출액 G2 = 5Y 매출액 x (1 + 평균 성장률)

 "위 공식에 대입해 목표 매출액을 산출하면 다음과 같다 " 

목표 매출액 G1 = 4,158 x (1+3.5%) = 4,303(억 원) 

목표 매출액 G2 = 4,158 x (1+4.9% ) = 4,363(억 원)

 

즉 성장률 대비 목표 매출액은 기준점이 되고 성장률을 조정하며 목표 매출액에 변화를 주는 것 

'우리가 작년에 3.5% 정도 , 혹은 4.9% 평균 성장 했는데, 올해는 5% 성장을 하겠다. ' 이런 방법으로 성장률의 목표를 정하면 목표 매출액이 함께 산출이 된다. 

 

목표 매출액 P1 = 5Y매출액 X (1+시장 확대율) X (1+시장 신장률)

시장 확대율이란, 전년 대비 당사의 시장 점유율이 얼마나 증가했는지를 나타내는 지표를 의미한다. 

시장 확대율은 - 2.8% , 매출에 따른 성장은 있었지만 판매 시장은 그만큼 줄었다. 

 

단순히 매출이 늘었다고 마냥 좋아할 일은 아니다. 성장률과 점유율 분석을 게을리 하면 안된다. 

목표 매출액 P1 = 4,158 x (1+-2.8%) x (1+6.1%) = 4,289 (억원)

 

성장률에 따른 결과보다 점유율에 따른 목표 매출액이 떨어진다. 정확한 표현인지 모르겠지만 규모를 확대하는 성장(성장률) 도 중요하지만, 더 많은 시장을 확보하는 것(점유율) 도 매우 중요해 보인다. 

 

시장확대율과 시장 신장률을 산출해서 목표 매출액을 산정하는 것은 전체 시장이 얼마나 확산되고 있는지 파악하여 당사가 얼마 만큼 성과를 올릴 수 있는지 산정하는 간편하면서도 막강한 핵심도구 이다. 

 

더보기

"성장률에 따른 목표가 점유율에 따른 목표보다 높게 나온다는 것은 당사의 매출 규모가 매년 커지고 있기는 하지만, 전체 시장의 규모가 커진 만큼 우리가 충분히 시장을 확보하지 못했다는 의미도 있다." 

 

 

시계열 분석  정량적인 방법으로 수요를 예측하라 

- 수요 예측은 말 그대로 어떤 제품의 미래 수요를 예측 하는 것이다. 목표나 전략 수립, 투자에 대한 의사결정을 위해 기업에서는 꼭 해야 한다. 수요 예측 방법엔 전문가와 소비자 등 다수의 의견을 조사한느 정성적 방법과 수치화한 가까운 과거의 데이터를 분석해 예측하는 정량적인 방법이 있다. 

수요 예측의 두가지 축

구간을 설정하는 이유는 구간별로 평균의 변화와 추이를 확인하기 위한 것  그리고 추가로 기간, 즉 구간마다 변화도 감지할 수 있다. 

이동 평균을 구해 예측할 때는 언제나 예측값에 따른 변화와 실제 매출 추이와 비교하고 점검한다.

시계열 추세 분석 예측은 미래에 대한 최소한의 준비다. 
- 시간의 흐름에 따라 발생한 데이터, 즉 시계열 데이터를 수요 예측시 활용 하면 몇가지 좋은 점이 있다. 

첫째, 장기적인 수요 증가와 감소 추세를 살필 수 있다. 
- 수요의 장기적 변화, 즉 수요의 증가와 감소 추세를 반영 -> 경향 변동 

둘째, 시장 정치 경제 사회적 이슈에 따른 수요 변화를 감지할 수 있다. 
- 시장의 상황, 혹은 정치 경제 그리고 사회적 이슈ㅜ에 따른 순환적인 변화를 감지할 수 있따 -> 순환 변동 

셋째, 계절적 수요 변화를 살필 수 있다. 
- 1년을 기준으로 계절에 따른 수요의 변화 반영 -> 계절 변동 

넷째, 설명될 수 없는 요인 또는 돌발 상황으로 발생하는 변화를 감지 할 수 있다. 

- 설명 될 수 없는 요인 또는 돌발적인 상황으로 발생하는 변화를 감지 -> 우연 변동 

 

기울기와 절편 월별 예측치를 산출 하라. 

- 미래의 매출 수량을 예측하는 건 쉬운일이 아니다. 더욱이 완벽하게 예측하는 건 불가능하다. 하지만 그래도 예측해야 한다. 그래야 하나의 제품이든, 아니면 기업이든 앞으로 다가올 문제를 미리 개선하고 혁신 할 수있다 .

 

수요 예측 조금 더 깊이 있는 접근 

- 월별 매출 수량을 분석하면 이를 기준으로 분기별, 연도별 매출 수량도 예측할 수 있다. 반대로 월보다 작은 단위

즉, 주차별, 일자별 매출 수량도 어렵지 않게 예측할 수 있다. 

 

월과 분기의 매출 비율을 산출하는 이유는 평균적인 매출에서 차지하는 비중이 각 울과 분기별로 어느 정도 인지를 확인하기 위한 과정이에요. 

 

재고 분석, 재고의 회전율을 높여라 
- 재고 관리의 핵심은 최소 입고와 최대 출고, 또는 입고 즉시 출고가 되도록 하는 것이다. 적정한 재고 수준을 유지하기 위한 노력, 그 시작은 재고 회전율과 재고 일수 분석이다. 특히 회전율이 높은 기업은 다음 세 가지 특징이 있다. 

첫째, 자금 흐름이 원활하고 유동성이 높다.

둘째, 제품의 품질이 높다. 

셋째, 시장 경쟁력이 높아 수익성이 좋다. 

 

재고는 유무형의 모든 것을 포괄해요. 제품을 생산하기 위한 원부자재는 물론이요, 임가공을 통한 제품의 소싱부터 

기업 운영에 필요한 모든 것들은 구매 활동을 통해 진행하기 마련입니다. 구매는 생산 기업이든 판매 기업이든 기업 활동(이윤추구) 의 원재료를 매입하는 행위인 거죠. 돈을 벌어들이는 것이 아닌 돈을 직접 소비하는 부서인 셈이다. 그래서 구매 활동의 핵심은 적절한 시기에 품질이 우수한 제품을 합리적인 가격으로 적정 수준의 물량을 구매하는 것이 목적이 되어야 합니다. 

 

구매 활동의 5가지 목적 

적절한 시기, 우수한 품질, 안정적인 공급처, 합리적인 가격, 적정수준의 물량 

 

리드타임 이란 ? 

- 리드타임은 원래 소요 시간을 의미한다. 일반적으로 물품의 발주로부터 그 물품이 납입되어 사용할 수 있을 떄까지의 기간을 말한다. 상품의 생산 시작부터 완성까지 걸리는 시간 또는 고객의 제품 주문으로부터 생산하고 납품하기까지 걸리는 총 소요 시간을 의미할 때도 있다. 

주문 리드 타임 - 주문 시점에서 도착 시점까지 걸린 시간 

생산 리드 타임 - 생산 시점부터 생산 완료까지 걸린 시간, 진열 시점부터 판매 완료까지 걸린 시간 

 

더보기

표준편차를 이야기 하려면 평균에 대해서 언급해야 합니다. 평균 모르는 사람은 없죠. 우리가 흔히 말하는 평균, 즉 산술 평균은 일상에서 흔히 사용하는 매우 유용하며 중요한 수치이죠. 하지만 잘 아시는 것처럼 평균은 극단적인 값에 민감하게 반응하죠. 극단적으로 높거나 낮은 값이 그 외 값들이 가지는 가치를 상쇄해 버리는 것이죠. 그래서 각각의 값들이 평균으로부터 얼마나 떨어져 있는가를 판단하기 위해 평균에서 관측치(평균을 구하기 위해 활용된 각각의 값들) 을 빼서 편차를 구하게 됩니다. 

구해진 편차는 평균보다 높을 수도, 낮을 수도 있으므로 음수와 양수가 함께 등장하고 이런 편차의 합은 당연히 0이 됩니다.  이를 보완하기 위해 편차의 제곱을 하여 평균을 구하는데 이것이 바로 분산이 되는 것이죠. 

이 분산의 제곱근 값이 바로 표준 편차가 되는 것 입니다. 그래서 표준 편차가 적을수록 평균의 신뢰성이 높은거죠.

평균을 이야기 할 때는 표준 편차를 함께 짝으로 생각하는 것이 좋다는 의미이다. 


 

언제나 새로운 것을 알아 간다는 건 즐거운 일이다. 멈추면 나태해지고 도태된다는 스티브 잡스의 말 처럼 늘 새로운 도전을 하고 모르는 것을 기꺼이 받아들일 수 있는 겸손한 자세가 필요하다.

 

안전 재고 수준을 분석했다고 해서 일이 끝나는 게 아니다. 이를 적용해 실제 효과를 보려면 영업, 구매, 생산 등 모든 부서가 목표를 공유하고 협력해야 한다. 하지만 현업 부서는 대개 자기 부서 중심으로 사고하고, 관례에 따라 관성적으로 업무를 처리 한다. 공동의 목표가 아니라 부서 이기주의에 빠지면 안전 재고 유지는 물거품이 된다. 

생산은 결국 수요를 채우는 일의 반복이다. 생산에는 두 가지 패턴이 있다. 하나는 정기적으로 하는 것이고, 다른 하나는 정량적으로 하는 것이다. 정기적 방식은 말 그대로 생산 기간을 일정하게 유지하며 수요에 따라 수량을 조절하는 것이다. 

정량 생산 방식은 생산 시점마다 수량을 일정하게 하고 대신 생산 시기에 변화를 주는 것이다. 

 

정기적으로 생산을 할 때는 다음과 같은 사항이 충족되면 유리하다.

  • 생산처나 납품하는 공급처가 유일한 경우 
  • 재고 실사를 주기적으로 진행해야 하는 경우 
  • 제품이나 자재의 수요가 빠르게 진행되는 경우 
  • 금액이 높고 기업 자산에서 높은 위치를 점유하는 경우 

기업은 비용을 최소화하고 이윤을 극대화해야 한다. 따라서 생산 비용뿐 아니라 재고 관리 비용 역시 최소화해야 한다. 최적의 생산량을 구하면 생산 비용과 재고 관리 비용을 동시에 최소화 할 수 있다. '경제적 생산량 모형' 을 활용 하면 

최적 생산량과 생산 시기를 분석 할 수 있다.

 

ABC 재고 관리 기법은 재고 자산을 효과적으로 관리하는 가장 보편적인 방법이다. 재고 자산의 가치가 모두 같지 않기에 중요도에 따라 제품을 A,B,C 로 나누어 군집별로 관리하는 방식이다. A 군집은 전체 가치의 80% 를 차지하는 품목을 말한다. A 군집은 엄격하게 중점관리한다. B 군집은 전체 가치의 15% 를 차지하는 품목으로, 적정 수준으로 통제하고 관리를 한다. C 군집은 전체 가치의 5% 를 차지하는 품목이다. C 군집은 관리를 간소화하여 비교적 통제하지 않는다. 

 

생산성 분석 방법 어차피 고객은 제품으로 판단한다.

- 생산성 분석이란 기업의 생산 능력을 수치화 하는 것이다. 제품의 '효율적인' 생산을 유도하기 위해 꼭 수행해야 하는 작업이다. '효율'이란 용어가 등장하면 투입과 산출에 의해 분석이 이루어진다는 것을 뜻한다. 일반적으로 생산성 분석은 3가지 줄기로 나뉜다. 노동 생산성, 비용 생산성 그리고 설비 생산성이다. 

 

노동생산성은 특정한 기간 제조 과정에 투입된 노동력(시간 또는 인력수) 를 기준으로 생산 대수의 비율을 산출하는 것이다. 그리고 비용 생산성은 생산을 위해 투입된 금액 대비 생산된 제품의 비용을 근거로 분석한다. 즉, 전자는 노동의 투입량을 기준으로 한다. 

 

생산 효율성 분석이란 주어진 능력치 내에서 얼마나 성과를 거두었는지 확인하는 작업이다. 효율성을 분석하기 위해서는 반드시 투입이 있어야 하고 그에 따른 결과(산출)이 존재해야 한다. 반대로 투입은 고려하지 않고 산출만 고려하여 성과를 판단하고자 한다면 그건 효과성 분석이 된다. 효율적이라는 말은 과정이 좋다는 것을 의미한다. 반대로 효과적이라는 말은 결과가 좋다는 뜻이다. 효과적이지만 비효율적인 경영을 개선하기 위해선 효율성 분석이 꼭 이루어져야 한다. 

 

제품 효율성 분석이란 어느 제품이 얼마나 많은 성과를 내는지 파악하는 것이다. 즉 투입대비 산출이 얼마나 효율적인지 

분석하는 것이다. 제품 효율성을 분석하면 퇴출해야 할 제품과 살려야 할 제품을 정확히 파악할 수 있다.

 

더보기

예를 들어 영업사원의 성과를 판단하고 싶다면 사원의 급여와 판공비 등을 투입하고, 산출은 매출액과 

영업 이익등을 대입하면 되낟. 효율성을 통해 성과를 관리한다. 

기업이 진정 효율적으로 운영되고 있는지를 판단할 수 있다는 점에서 매우 유용한 분석이 된다. 

제품 효율성을 분석하는 이유는 불필요한 제품을 탈락시켜 경영 효율성을 높이기 위해서다. 효율성이 낮은 제품을 줄이면 생산비, 자재 구매비, 재고 비용, 물류비 등을 동시에 줄일수 있다. 단순히 비용 절감 차원을 넘어 선택과 집중이 가능해져 생산과 구매, 영업과 마케팅의 업무 성과까지 높일 수 있다. 그리고 제품의 방향성을 정립하고, 마케팅 정책을 결정하는 일도 훨씬 수월해진다.

 

납기 준수율 분석 

물류의 최종 목표는 기업의 진심을 고객이 느끼게 하는 것이다.

- 아무리 좋은 물건이더라도 고객(판매자와 소비자)이 원할 때 없으면 아무 쓸모가 없다. 물류는 그래서 중요하다. 기업에 대한 고객의 신뢰도와 만족도는 물류 소요 시간과 비례한다. 납기 준수율을 분석하면 물류 생산성을 파악할 수 있다. 

출하, 선적, 인도, 납품 수량 데이터를 분석하여 납기 준수율을 분석 할 수 있다. 

 

On Time Delivery = OTD 

 

소비자 반응 조사 

빅데이터 분석 방법 중 연관규칙 분석이라는 게 있다. 반복적인 패턴을 찾아 특정 사건이 동시에 일어나는 규칙을 탐색하는, 예를 들면 사건 A가 일어날 때 사건 B가 동시에 발생하는 확률이 엉ㄹ마나 되는지를 찾아내는 분석이다. 

'이 제품을 본 고객이 자주 찾는 상품' 혹은 '이 도서를 구매한 고객이 함께 구매한 책' 등이 연관 규칙 분석의 결과이다. 

 

어떤 상품과 관련하여 SNS 에서 소비자의 반응과 관심도가 어떠한지 파악하고 싶다면 SNS 에 등장하는 단어를 대상으로 연관규칙 분석하면 된다. 일반적으로 연관규칙으로 세 개의 값을 도출한다 .

지지도(support), 신뢰도(confidence) 그리고 향상도(lift) 이다. 이 세가지 도출 값을 해석 하면 소비 흐름을 파악 할 수있다

 

신뢰도는 출현 단어의 출현 빈도로, 동시 출현 단어의 빈도를 나누어 주면 됩니다. 

향상도를 파악해서, 신뢰도를 검증해주고. 향상도를 산출하기 위해서는 전체 단어의 출현 빈도를 알아야 한다. 

전체 단어의 출현 빈도는 1850 이라고 잡았을때, 일차적으로 1850 으로 각 단어의 출현 빈도를 나누어 주고, 그 값으로 다시 동시 출현 단어의 신뢰도를 나누어 주면 향상도를 산출 할 수 있습니다.

도출된 향상도를 기준으로 1 이하 신뢰도는 버리고 새롭게 정리해 줍니다. 향상도 1 이상의 신뢰도만 필요하니까요.

 

더보기

사람들이 많이 사용하니 중요하긴 하겠지만, 일단 우리가 수집한 분석 채널이 모든 대상을 대표한다고 설명할 수 없겠죠. 또 하나는 데이터를 수집하는 담당자의 의지가 반영되지 않았다고 볼 수 없겠죠. 또 하나는 데이터를 수집하는 담당자의 의지가 반영되지 않았다고 볼 수 없어요. 분석가가 잘못했다, 아니다의 문제가 아니라 정리에 오류가 발생 할 수도 있다는게 제 생각이에요. 

조사 기간에 대한 부분도 생각해 볼 필요가 있따. 선택한 단어들이 조사 기간의 사회 분위기를 반영 할수도 있으니까요. 

조사 기간에 산출한 단어가 특별히 출현 빈도가 높앗을 수도 있겠죠. 그렇다 해도 빈도가 높다는 건 그 만큼 관심이 많다는 이야기니까. 중요하다는 말보다 인기가 높았다, 이렇게 설명하면 좋지 않을까요? 

 

데이터베이스는 데이터를 저장하는 공간이지만, 그 공간에 담긴 자료의 구조와 성격까지 알게 되면 여러가지 좋은점이 많다. 데이터의 구조와 성격을 이해하고 있으면 원하는 데이터를 어디서 추출해야 하는지 알게 되낟. 그러면 빠르고 정확한 분석을 수행 할 수 있어서 데이터가 정확해야 그 결과의 가치가 더 높아진다는 건 잘 이해하고 있겠지? 그 뿐이 아니야. 데이터 베이스를 꿰뚫고 있으면 데이터가 발현할 가치를 폭넓게 생각하고 가늠할 수 있어. 데이터를 보고 그로부터 얻을 수 있는 결과와 가치를 판단하는 일은 무엇보다 중요하지. 마지막으로 데이터의 속성을 파악하고 있으면 어떤 방법론을 선택하고, 어떤 툴을 활용할지에 빠르게 결정 할 수 있다. 

 


데이터 분석가가 갖추어야 할 첫번째 역량 

스킬보다 비즈니스 환경을 먼저 이해하라. 데이터 분석은 코딩, 프로그램 언어 등 스킬이 뛰어나다고 잘하는 것이 아니다. 

스킬 보다 어느 시점에, 어떤 내용을, 어떤 방법으로 접근하여, 왜 그런 분석을 수행했는지 논리적으로 설명되어야 진정한

데이터  분석이다. 따라서 스킬보다 먼저 요구되는 것이 조직과 비즈니스 환경에 대한 높은 이해도 이다. 

특히 유동, 생산, 재무에 관한 높은 이해도가 중요하다. 

 

더보기

"강사님 어떤 걸 준비하면 대기업에 취업하기 가장 빠를까요?" 

대기업이 왜 여러분을 선택해야 할까요? 대기업이 원하는 걸 준비하세요. 이게 제 대답이에요.

그러자 다른 학생이 이렇게 말했다. 

아 그러니까, 그 기업에서 나를 왜 필요로 하는지 증명할 수 있도록 준비해라 이거죠.?

좀 뜬구름 같나요 ? 저는 명확한데 말이죠. 혹시 여러분이 취업하고자 하는 대기업은 무엇을 하는 회사인지 

정확히 알고 있나요? 만약 여러분이 원하는 기업에 취직한다면 어떤 분야에서 일하고 싶으세요? '분야는 뭔 분야야. 일단 취업만 돼라' 이건가요? 

그거야 당연히 과 특성상 빅데이터 분석 분야로 취업하는 것이 가장 좋지요. 

아 , 그건 여러분이 가진 기술이고요. 그 기술을 멋지게 펼칠 분야가 어디냐는 거죠? 

회사에서 여러분에게 어떤 분석 업무를 줄까요? 

뭐, 해당 기업에서 필요로 하는 분석 업무를 수행하면 되죠. 

첫 번째 비즈니스 환경은 바로 유통이다. 기업은 최대의 이윤을 남기기 위한 조직이다. 이윤을 남기기 위해서는 뭐든 팔아야 한다. 그것이 지적 재산이든 기술이든 아니면 보편적인 형태의 상품이든 팔아야 이윤이 생긴다.

디지털 혁명은 유통구조의 다변화를 가져왔다. 오프라인과 텔레마케팅을 통한 홈쇼핑은 물론이고 모바일 환경에서도 우리가 원하는 물건을 얼마든지 구매 할 수 있다. '코로나19' 이후 언택트 시대에 이런 흐름이 더 가속화하고 있다. 

유통 비즈니스 호나경에서 중요한 것은 상품이 생산되고 진열되어 판매되고 배송을 거쳐 고객의 손에 전달되는 과정을 

명확하게 이해하는 것이다. 이는 곧 SCM (Supply Chain Management)의 이해와도 연결된다. 

 

오프라인 판매와 온라인 판매가 다르지 않다. 한 기업에서 상품을 생산하면 그 상품은 판매자에게 넘겨진다. 판매자는 홍보를 통해 상품을 알리고 판매한다. 판매한 상품을 안전하게 고객이 원하는 장소와 시간에 전달해야 한다. 이 과정이 

유통 구조의 흐름이다. 유통구조를 이해 하는 것. 그것은 SCM 을 충분히 이해하고 공부 하는 것이다. 

 

SCM 이란? 단순히 물류의 흐름만을 의미하지 않는다. 원자재 공급부터 생산, 물류, 유통, 고객에 이르기까지 일련의 과정을 하나의 연결된 관점으로 접근한다. 서로의 정보를 공유하고 연결된 전체 프로세스 최적화를 목표로 하는 경영 혁신 기법의 하나이다. 

 

두 번째는 생산이다. 유통 이야기나 생산 관련 이야기가 디지털 혁명 시대에 조금 진부하다고 생각 할 수 있다. 하지만 

일상, 즉 아침에 일어나는 순간부터 잠자리에 들때까지 우리가 사용하고 소비하는 모든 것이 어디선가는 생산이 되고 있다는 사실은 변함이 없다. 

 

세 번째는 비즈니스 환경은 돈이다. 즉 재무 및 자금과 관련된 업무의 이해가 필요하다. 다시 말하지만, 기업은 어떤 상황에서도 이윤을 목적으로 한다. 즉 많이 벌고 많이 남기는 것이다. 앞서 말한 유통, 생산, 아니 모든 비즈니스의 업무는 바로 이윤을 남기기 위한 행위다. 

그래서 재무와 자금의 업무는 매우 중요하다. 

 

데이터 분석가를 살아가는 내가 후배들에게 자주 사용하는 문구가 있다. 

"나를 알아야 결과도 가치가 있다." 

여기서 '나'는 분석 대상을 의미한다. 데이터 분석 스킬이 뛰어나다고 만족스러운 결과를 얻는 것이 아니다. 스킬보다 

어느 시점에, 어떤 내용을, 어떤 방법으로 접근하여, 왜 그런 분석을 수행했는지 논리적으로 설명되어야 진정한 데이터 

분석이다. 앞서 말한 몇몇 비즈니스 환경에 대한 기본적인 이해도가 높아야 데이터 분석을 완벽히 수행 할 수 있다고 말할 수 는 없다. 하지만 분명한 것은 기본이 탄탄하면 내가 속해 있는 조직의 환경을 이해하는 데 많은 도움이 된다는 점이다. 

시간적으로도 그렇고 받아들이는 양과 질적인 부분도 기본이 없는 사람과는 차이가 크다. 직무에 관한 기본적인 이해와 

내가 몸담은 또는 근무할 환경에 관한 높은 이해도는 능력 있는 데이터 분석 전문가가 되는 지름길이다. 

 

데이터 분석가가 갖추어야 할 두 번째 역량 

수학을 잘할 필요는 없다. 그러나 확률과 통계는 알아야 한다. 데이터 분석은 예측 하기 위한 행위이다. 예측의 정확도를 높이려면 확률을 높이면 된다. 데이터 분석가가 수학을 특별히 잘할 필요는 없다. 하지만 확률과 통계는 제대로 익혀야 한다.

 

모든 데이터 분석은 평균 없이 이루어지지 않는다. 모든 분석은 평균으로부터 시작된다. 우리가 일상에서 살아가기를 

원한다면 평균에 대한 이해는 필수다. 아니 핵심이다. 모든 데이터 분석은 평균 없이 이루어지지 않는다. 모든 분석은 

평균으로부터 시작된다. 우리가 일상에서 자주 사용하는 평균은 산술 평균을 의미한다. 쉽게 말해 대상의 총합을 구하고 대상의 개수로 나누어준 값이다. 이러한 산술 평균은 누구나 쉽고 간단하게 구할 수 있는데 이는 데이터 분석의 엄연한 한 분야이다.  학교에서도 기업에서도 그 어느 조직에서도 이 평균을 산출해 최소한의 가치를 찾는다. 

하지만 평균 속에서는 오묘한 구석이 있다. 그것은 바로 극단적으로 높거나 혹은 낮을 때 평균은 이를 상쇄해 버린다는 약점이 있다.  이것을 나는 '평균의 오류' 라고 부르는데 이를 무시하면 데이터 분석의 결과가 전혀 예상치 못한 방향으로 전개된다. 그리고 분석을 통해 도출된 값은 무의미한 결과가 되기도 한다. 따라서 평균에 대한 맹목적인 신뢰는 

자칫 현상을 왜곡하여 바로보는 결과를 초래할 수 있다. 

 

데이터 분석은 데이터를 통해 가치를 발견해 내는 과정이다. 

 

데이터 분석가가 갖추어야 할 세 번째 역량 

알고리즘은 코딩이 아니라 논리적으로 생각하는 힘이다. 간혹 알고리즘을 컴퓨터의 한 분야, 특히 프로그래밍 능력을 높이는데필요한 덕목으로 인식한다. 하지만, 알고리즘은 컴퓨터의 한 분야가 아니다. 알고리즘은 어떤 문제를 논리적으로 해결 하고 풀어가기 위한 절차와 방법을 정의하는 것이다. 문제를 해결하고자 할 때 논리적으로 생각하는 힘, 더 효율적으로 

접근하는 방법, 이것이 알고리즘이다. 

우리는 처한 환경과 상황은 모두 다르다. 그렇기에 무엇보다 알고리즘이 중요핟. 모든 사람이 받아든 문제가 동일하지 않기에 스스로 주어진 문제를 해결하는 방법을 익혀 나갈 필요가 있다. 

알고리즘은 단순히 컴퓨터의 한 분야가 아니다. 다양한 환경과 분야에서 꼭 필요한 핵심적인 기본 소양이다. 

알고리즘에 강하면문제 해결 능력이 향상되고 문제 해결 능력이 뛰어나면 조직에서 적응하는 데 유리하다. 

누구에게나 상황에 따라 해결해야 할 문제는 반드시 닥친다. 따라서 알고리즘을 코딩이라는 일반적인 시각에서 벗어나자. 문제를 해결하고자 할 때 더 효율적으로 접근하는 방법을 통칭해 알고리즘이라고 하자. 논리적으로 생각하는 힘, 

그것이 알고리즘 이다. 

 

데이터 분석가를 꿈꾸는 사람에게 알고리즘은 무척 중요하다. 왜냐하면, 나만의 독창적인 문제 해결 과정을 수립해야 하기 때문이다. 그것은 오래전 어느 가수가 말한 '창작의 고통' 을 겪는 것과 같은 것이다. 나만의 독창적인 문제 해결 과정이 수립되려면 수없이 많은 문제를 받아야 하고 이를 해결 하기 위한 합리적 체계를 반복적으로 수립해야 한다. 그것은 시간과의 싸움이며 반복적인 훈련의 결과이다. 

알고리즘 능력은 반복적 수행 결과에 비례 한다. 어렵게 해결한 묹일수록 그 해결 과정을 꼼꼼히 분석하고 기록하여 반복적으로 풀어보아야 한다. 지금 이 시각부터, 꼭 데이터 분석가가 되지 않더라도, 어떤 문제를 해결 했다면 어떤 과정으로 그 문제를 해결 했는지 기록하는 나만의 노트를 만들자. 분명 그 노트가 어느 순간 당신의 등대가 되어줄 것이다. 

'단순함이 가장 아름답다' 라는 말이 있다. 바로 그 단순함을 찾아가는 과정, 그것은 바로 알고리즘으로 부터 나온다. 

그렇다면 알고리즘을 통한 문제 해결 능력을 높이기 위해서 우리는 무엇을 훈련해야할까? 알고리즘은 문제를 파악하고 그 해결 방안을 찾아가는 과정을 의미한다. 해결하고 푸는 과정 그리고 해결하고 풀기 위해 절차를 저으이해 나가는 과정이 곧 알고리즘 훈련이다. 

 

데이터 분석에서 입력 없이 출력이 이루어지는 경우는 없다. 세상 모든 일에는 원인이 있기 마련이다. '인과관계' 라고해도 좋다. 모든 사건에는 그 사건을 일으킨 원인이 존재한다. 마찬가지로, 문제 해결 과정에서는 결과를 얻기 위한 입력이 반드시 존재한다. 

 

정의한 절차는 반드시 수행할 수 있는 내용이어야 한다. 문제를 해결하기 위한 결과는 당연히 모두가 '공감 할수 있는 것이냐, 아니냐' 의 문제와 같다. 따라서 데이터 분석가는 언제나 이타적이어야 한다. 언제나 분석을 수행한 자신보다 그 결과를 필요로 하는 사람을 먼저 생각해야 한다. 

 

데이터 분석가가 갖추어야 할 네 번쨰 역량 

스토리 텔링 기법을 활용하여 커뮤니케이션 능력을 키워라. 데이터 분석가는 분석 결과를 현명하게 전달하는 커뮤니케이션 능력이 필요하다. 상대를 이해하고 존중하는 자세, 과장하지 않은 솔직한 표현, 당신의 이야기에 귀를 기울이게 하는 스토리텔링 능력, 나를 낮추는 겸손한 태도, 커뮤니케이션 능력이 당신의 분석 결과를 받아들이게 한다. 

 

나를 표현하고 알리기 위한 가장 좋은 방법은 솔직함이다. 뭐든 솔직하면 된다. 나와 관계된 사람들이 나를 과장되거나 모자라게 생각하지 않도록 솔직해지면 된다. 첫 만남에서 거짓으로 접근하면 그 거짓을 덮기 위해 더 큰 거짓이 필요하기 마련이다. 그리고 그것이 밝혀졌을 때 후유증과 상처는 너무 늦어 치유할 수 없게 된다. 

모르면 모른다고 대답하자. 괜한 자존심 때문에 또는 남들에게 부족한 부분을 보이기 싫어 모르는 것도 아는 척하는 오류를 범하지 말자. 당신이 진정한 실력자라면, 당신이 모른다고 해도 사람들은 크게 신경쓰지 않는다. 하지만 반대로 허세 가득한 당신이 모르는 것도 아는 척을 하게 되면 언젠가 당신은 양치기 소년이 부럽지 않은 자리에 앉게 된다. 

솔직하게 다가가는 노력의 핵심은 나를 개방하는 것이다. 열린 마음으로 상대를 대하면 상대도 나에게 열린 마음으로 다가온다. 서로가 마음을 열고 다가가면 언젠가 상대의 마음도 통제할 수 있는 경지에 이른다. 

 

상대가 나의 이야기에 귀 기울여주길 바란다면 나도 상대의 이야기에 귀를 기울이어야 한다. 마찬가지로 상대가 나를 알아주길 바란다면 나도 상대를 알아가려는 모습을 보여야 한다. 보통 공감 능력 이라 하는데, 뭐 굳이 조직에서 감정까지 공유할 필요는 없다. 다만, 언제나 내가 상대를 존중하고 있다는 느낌을 받도록 하자. 상대를 존중하기 위해서는 나를 낮춰야 한다. 겸손해야 한다. 

 

우리가 데이터를 분석하는 목적은 더 나은 내일을 위해서다. 억지로 결과를 뽑다 보면 내 실력도 안 늘고 그 결과를 덮기 윟나 더 큰 억지를 만들게 된다. 조직에는 나보다 똑똑한 사람이 얼마든지 있다. 금방 탄로 날 억지는 하지 않는것만 못하다. 때로는 과감한 포기가 더 좋다. 나오지 않을 가치를 찾지 말고 새로운 시도를 하는 것이 더 현명하다. 

 

상대로부터 나의 이야기에 귀를 기울이게 하려면 무엇보다 내가 전달하는 이야기가 재미있어야 한다. 아무리 주제가 좋아도 재미없는 이야기를 들어줄 청중은 없다.분석결과가 아무리 가치가 있다 하여도 전달하는 과정이 흥미롭지 못하면 무용지물이 된다. 쉽고 재미있게 전달하는 능력은 많은 훈련과 풍부한 지식에서 나온다. 

분석 결과를 스토리화 할 수 있어야 한다. 여기서 말하는 스토리는 친목 도모를 위해 친구들끼리 나누는 이야기가 아니다. 

정글과 같은 조직 환경에서 살아남기 위한 경쟁력을 말한다.

 

데이터 분석가가 갖추어야 할 다섯 번째 역량 

다르게 생각하고, 색다른 시선을 가져라. 데이터 분석가에게 꼭 필요한 덕목이 색다른 시선이다. 데이터 분석가는 이 색다른 시선을 통해 앞으로 나아간다. 분석 기법과 분석 도구를 공부하는 것보다 색다른 시선을 갖추는 게 몇 배는 더 중요하다. 왜냐하면, 데이터 분석가는 데이터에서 새로운 가치를 발견하고, 무한한 가능성을 찾아내는 사람이기 때문이다. 

색다른 시선을 갖는 최고의 방법은 독서이다. 독서는 참으로 힘이 쎄다. 

 

'어제와 같은 오늘을 살며 달라진 내일을 기대하는 건 사치다' 

이 말을 언제나 잊지 않고 생활한다. 만약 당신이 무엇인가 이루고 싶은 목표가 있다면 어제, 지난주 오늘, 지난달 오늘, 멀게는 1년 전 오늘 당신이 무엇을 했는지 들여다보는 것이다. 생활 패턴을 조금만 바꿔도 내 주변에 일어나는 일들에 엄청난 변화가 생긴다. 거짓말이라고 치부하는 사람들도 있겠지만, 사실이다. 

 

데이터를 보고 그로부터 도출된 결론이 무엇일까 고민하는 훈련을 끊임 없이 하는 것이다. 이런 훈련을 거듭하면 많은 이점이 있겠지만 그중에서도 내가 선택할 수 있는 또는 내가 분석할 수 있는 데이터가 무한하다는 것이다. 

데이터를 보고 가치를 발견하는 훈련을 정말 오랜 시간 해왔다. 아마도 내가 가장 많은 시간을 투자하고 훈련하는 것중 최고는 바로 이것일 것이다. 


더보기

궁금한게 많다면 plusstar@cuk.edu  

좋은 서적이다. '데이터 분석가' 라는 직업에 대해 알아가고자 한다면 매우 좋은 서적이라고 당부한다. 

프로젝트를 앞두고 있는 상황에서 시간내서 읽어볼 가치가 매우 있는 서적이다.