티스토리 뷰
데이터 분석을 제대로 하려면
- 분석의 목적 정의
- 데이터로 문제를 해결해야만 하는 사람
데이터로만 문제 해결이 가능한 분야와 이를 해결하려는 사람을 말한다.
즉, 데이터 분석을 해야만 문제가 풀리는 경우이다. 국가의 인구나 주식, 경상수지 같은 각종 경제 지표를
수집하고 분석하는 통계청 이라든가, 실험을 통해 얻은 데이터를 분석하여 물질의 성질을 정의하는
실험 물리학자들 같은 경우가 대표적이다.
이 부류에 있는 분들의 1차 목적은 "분석 그 자체" 이다. 국가 통계라는 문제를 해결 하기 위해 인구를 조사하고,
남녀 구성비를 조사하고 GDP 나 GNP 를 계산하는 문제를 해결 하기 위해 관련 데이터를 모으는 것이라고 할 수 있다.
분석 실력만큼 중요한 것이 데이터의 가치를 판단하는 능력이다. - 데이터의 문제를 해결 하는 사람
데이터의 문제를 해결하는 사람은 이미 어떤 형태로든 데이터화 된 정보를 다루는 사람을 뜻한다. 이미 자료는
데이터 형태로 되어 있기 때문에 이들에게 데이터가 어디서 왔느냐는 중요한 문제가 아니다.
이들에게 중요한 것은 "어떤 식으로 데이터를 구조화(DB화) 하느냐?" 와 "어떻게 원하는 유효한 값들을 신속하게
계산할 것인가?" 이다
사실상, 이 영역은 데이터 과학의 영역이라기 보다는 소프트웨어 개발자의 영역에 가깝다.
특히 데이터 분석을 다루는 범용 패키지나 커스터마이징 된 모듈을 다루는 분들이 이런 일을 한다. - 데이터로 설득하려는 사람
사업을 하는 비즈니스 맨이거나 마케팅 담당자가 여기에 해당한다.
기본적으로 데이터를 다룰 줄은 알지만 이들에게 중요한 것은 보여주는 것, 시각화 (Visualization) 능력이다.
보통 데이터의 시각화를 이야기 하면, 연관 검색어를 보여주기 혹은 시각화 기능이 뛰어난 R 같은 프로그래밍
언어를 생각하기 쉽지만, 이보다 범용적으로 쓰이는 용어는 인포그래픽스(infographics)이다.
이분들에게는 데이터가 의미하는 바를 정확하게 이해하는 보편적인 지식도 필요하겠지만, 정작 필요한 것은
예술적 감각이다. 시각화는 과학적인 사고나 논리의 결과물을 효과적으로 보여주는 것에 불과한 것이지
시각화가 과학적인 사고나 논리의 결과물 자체는 아니기 때문이다. - 데이터로 문제를 해결하려는 사람
데이터를 다루는 전공자는 아니지만, 데이터 사이언스에 관심을 갖고서 이를 자신의 영역에 적극 사용하고자 하는
분들이다. 이분들은 데이터 사이언스 내지는 데이터 분석까지 자신의 영역에서 사용하고자 한다.
전산학이나 통게학이 아닌 분야에서 말하는 데이터 관련 이야기들은 모두 여기에 해당한다.
이분들에게 필요한 것은 데이터를 다루는 기술이나 통계학적 지식이 아니라 "문제의 본질을 파악하는 능력" 이다.
여기서 문제란 데이터를 통해 밝히고자(풀고자)하는 어떤 사안을 말하며, 이를 위해서는 통계적 가설을 설정하고
확인하는 것이 필요하다. 가설에 따라 수집해야 할 데이터가 결정되고, 이를 정리하고 분석하는 것이 문제 해결의
과정에 해당한다.
데이터 사이언스를 사용한다(혹은 학습한다) 는 것은 데이터를 이용해 내가 일하는 분야에서 발생한 특정 문제를
해결하고자 하는 목적일 가능성이 높다. 이때 가장 중요한 것은 문제의 본질을 얼마나 제대로 파악하고 있는가이다.
문제의 본질은 데이터 사이언스를 통해 알려고 하는 것, 데이터 사이언스를 통해서 하려는 정확한 의사결정이 무엇인가
파악하는 것이다. 이를 어떻게 알고 있느냐에 따라 해야 하는일(나아가 내가 해야 하는 공부)이 달라지낟.
그것은 데이터의 속성을 파악하는 일이 될 수도 있고, 통계 처리가 될 수도 있고, 데이터 처리와 관련된 컴퓨터
기술 습득이 될 수도 있다. 데이터 사이언스를 업으로 하는 이들 대부분은 "데이터로 문제 해결을 '해야만 하는 사람"으로
퉁쳐서 말하지만, 사실상 대부분은 "데이터로 문제를 해결하려는 사람"에 해당한다. 즉, 우리가 접하는 대부분의 데이터
관련 문제들은 분석 자체 가 목적이 아니라, 어떤 문제를 해결하기 위해 데이터를 이용한다 정로도 보아야 하낟.
이 책을 읽는 대다수의 분들도 자신이 갖고 있는 문제를 해결하고자 데이터를 어떻게 활용하면 좋을지 궁금해서
이 책을 찾았을 것이다. (그렇지 않은 분들은 이책을 보지않고 좀 더 전문 서적을 볼 것이다.)
02 가장 좋은 분석이란
소셜 마케팅에서의 데이터 분석 또한 마찬가지다. 연관 검색어를 분석하고 사용자가 몇 번 클릭했는지 집계하는 이유
는 데이터 분석으로 얻어진 정보를 바탕으로 마케팅에 활용하고자 함이다. 좀 더 직설적으로 말하자면 고객 확보가
원래의 목적이다. 즉, 데이터 분석 과정 자체가 목적이 아니라 성공적인 마케팅 전략 수립이 문제의 본질이다.
이러한 관점에서 생각해볼 문제는 어떻게 하면 소비자의 데이터를 잘 분석하느냐가 아니라
"소비자를 끌어들이기 위해서는 고객의 어떤 데이터를 어떤 식으로 수집해서 분석하는가?" 이다.
빅데크 기업들의 성공을 보면서, 그들이 말하는 공식(데이터 기반의 의사결정) 이 마치 전부이고 성공의 핵심 역량으로
생각하지만 그들은 고객이 아쉬워하고 어려워 하는 문제를 잘 해결해준 것 뿐이었다.
시작은 거기서 출발해야 한다. 이 사실을 절대 잊어서는 안 된다.
데이터를 이용해 문제를 해결하는 데 있어서 문제 본질을 파악할 줄 아는 능력 다음으로 중요한 것은 실제로
데이터 분석의 고급 기술 혹은 많은 양의 데이터가 필요한 때가 언제인지를 아는 것이다. 즉, 많은 양의
데이터 다룰줄 아는 능력보다 언제 써야 하는지 아는 것이 훨씬 더 훌륭한 능력이라 할 수 있다.
그리고 또 하나 기억해야 할 것은 데이터 사이언스가 세상의 다양한 문제를 해결하는 강력한 도구인 것은 맞지만,
상황에 따라 그리고 여건에 따라 쓸 수 있는 다른 도구는 상상 이상으로 차고 넘친다는 사실이다.
'Books' 카테고리의 다른 글
IT 트렌드 읽는 습관 _ 3부 (0) | 2024.04.08 |
---|---|
데이터는 예측하지 않는다 _ 2부 (Amang Kim) (1) | 2024.04.05 |
데이터는 예측하지 않는다 _ 요약 (Amang Kim) (1) | 2024.04.03 |
IT 트렌드 읽는 습관 _ 2부 (1) | 2024.04.03 |
IT 트렌드 읽는 습관 _ 1부 (2) | 2024.04.02 |
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 아무일 없는것처럼
- ADsP
- A/B테스트
- BI
- BA
- 빅데이터
- 퍼포먼스 마케팅
- 데이터 분석가
- 설레다
- 북극성 지표
- 데이터 시각화
- 그로스 해킹
- 머신러닝
- 퍼포먼스 마케터
- 데이터 분석가 주니어
- 데이터 분석
- PM
- 통계학
- 책 추천
- 프로젝트 매니저
- 알고리즘
- 프로덕트 매니저
- 방법론
- 데이터분석가
- 기획자
- 아하 모먼트
- 데이터 리터러시
- 빅테크
- 프로덕트 분석가
- 데이터 분석 주니어
- Total
- Today
- Yesterday