본문 바로가기 메뉴 바로가기

RudolpiA

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

RudolpiA

검색하기 폼
  • 분류 전체보기
    • IT
      • 마케팅 신병 훈련소
      • ADsP 자격증
      • ADsP 기출문제
      • Tableau
      • Challenge
      • Prompt
    • Books
      • 버텨내어 좋은 일 투성이
  • 방명록

전체 글 (163)
우버잇츠 주저리 주저리

허슬 문화는 '꿈을 이루기 위해 추가 근무를 감수하고, 자신의 삶에 일을 쏟는 것이 당연시 되는 문화'로 정의되고 그것이 생활화된 문화를 말합니다. 수요가 많은 날에는 할인을 해주면 안된다는 값진 교훈을 얻은 거죠. 배달업은 운송사업 이다. Uber Pass - How it Works 각겨 정책은 독일까, 약일까 차량의 수요가 공급을 초과할 때는 가격을 인상하는 정책을 도입한 것이다. 회사는 항공사나 호텔처럼 서비스의 수요가 몰릴 때 가격을 가변적으로 운영하는 정책을 도입하면서 두 가지 효과를 기대했다. 첫째, 서비스 가격이 오르면 운전사는 더 많은 돈을 벌 수 있기 때문에 더 많은 기사들이 도로에 나가서 일할 것이다. 경제학적 원리에 따르면 단기적 인센티브는 공급을 자극하는 효과를 발휘한다. 둘째, 가..

카테고리 없음 2024. 4. 5. 13:07
데이터는 예측하지 않는다 _ 1부 (Amang Kim)

데이터 분석을 제대로 하려면 - 분석의 목적 정의 데이터로 문제를 해결해야만 하는 사람 데이터로만 문제 해결이 가능한 분야와 이를 해결하려는 사람을 말한다. 즉, 데이터 분석을 해야만 문제가 풀리는 경우이다. 국가의 인구나 주식, 경상수지 같은 각종 경제 지표를 수집하고 분석하는 통계청 이라든가, 실험을 통해 얻은 데이터를 분석하여 물질의 성질을 정의하는 실험 물리학자들 같은 경우가 대표적이다. 이 부류에 있는 분들의 1차 목적은 "분석 그 자체" 이다. 국가 통계라는 문제를 해결 하기 위해 인구를 조사하고, 남녀 구성비를 조사하고 GDP 나 GNP 를 계산하는 문제를 해결 하기 위해 관련 데이터를 모으는 것이라고 할 수 있다. 분석 실력만큼 중요한 것이 데이터의 가치를 판단하는 능력이다. 데이터의 문제..

Books 2024. 4. 3. 20:03
데이터는 예측하지 않는다 _ 요약 (Amang Kim)

내가 하는 일에 있어서 데이터의 역할을 정의하자. 즉, 데이터와 관련해서 나의 롤이 무엇인지를 알아야 데이터에관한 공부의 목적성이 분명해 진다. 내가 데이터 수집 전문가인지, 수집된 데이터를 갖고서 분석을 하는 전문가인지, 마케터로서 분석된 데이터를 갖고서 업무에 활용하려는 사람인지 이를 분명히 할 때, 데이터 사이언스와 관련해서 무엇을 알아야 하고, 무엇을 주의해야 하는지가 결정 된다. 이 책은 데이터 전문가 중에서는 이제 막 입문하고자 하는 분들 그리고 데이터 전문가가 아닌 분 중에서는 데이터에대한 특징을 이해해서 업무적으로 도움을 얻고자 하는 분들이 보는 책이다. 데이터 사이언스 입문서 중에서도 "자칫 실수할 수 있는 부분들"에 좀 더 주목해서 쓴 책이다. 그래서 "데이터에 관해 꼭 알아야 할 오해..

Books 2024. 4. 3. 18:33
IT 트렌드 읽는 습관 _ 2부

8. 유명 스타트업의 행보와 목소리에 집중한다. 이제 막 성장하기 시작한 스타트업은 두려울 게 없다. 그래서 이들은 누구보다 지금의 트렌드를 잘 설명한다. 그리고 자신이 그 중심에 있다고 말한다. 즉, 이들의 목소리를 잘 청취하고 쫓는 것만으로도 주목할 트렌드 읽기가 가능하다. 9. 인기 상품 / 서비스의 히트 원인을 탐색한다. - 핫 한 상품과 서비스를 탐색하고 이들의 비즈니스 모델을 파악한다. 최근에는 상품과 서비스의 결합으로 인기를 얻는 사례도 많아지고 있다. 히트원인은 여러 가지로 분석될 수 있는 만큼 다양한 관점이라는 것을 놓치지 말아야 한다. IT 기술이 시장에서 최종적으로 선보이는 방식은 결국 상품을 통해서다. 많은 사용자에게 선택되고 사용되면 해당 상품에 쓰인 기술은 트렌드가 된다. 그러므..

Books 2024. 4. 3. 17:07
IT 트렌드 읽는 습관 _ 1부

1. 키워드 중심으로 정보를 습득한다. - IT 미디어/ 뉴스레터 / 콘퍼런스에서 키워드 중심의 정보를 습득한다. 그리고 책을 통해서 키워드가 의미하는 변화의 큰 흐름을 읽는다. 그런 다음 커뮤니티의 댓글, 구글 트렌드 검색으로 사용자의 반응을 살펴본다. 눈 떠서 가장 먼저 하는 일은 IT 뉴스를 챙기는 것부터다. 그래서 이 책을 읽는 분들에게도 가장 먼저 권하고 싶은 것은 뉴스 챙기기 다. 특히 내가 IT에 속하지 않는 곳(산업)에서 일하고 있다면, 다른 무엇보다 매일 아침 IT 뉴스 읽기부터 시작해야 한다. 더보기 기본적으로 내가 뉴스를 읽는 방법은 세 가지다. 첫번째는 IT 전문 사이트의 뉴스레터를 구독하는 방법이다. 인터넷 기업 협회, 더코어, 더 밀크 등의 뉴스레터를 구독한다 . 페이스북이나 트..

Books 2024. 4. 2. 23:18
ANOVA 의 통계적 가정 Assumption

앞의 t-test에서, 이상치와 왜도를 통해 그 결과가 건강한지 살펴보았습니다. ANOVA 는 이러한 제약이 조금 더 타이트하며, 다른 통계학 모형들 또한 그런 경우가 많습니다. ANOVA와 많은 모형들은 원본 Raw 데이터가 아닌 잔차Residual 에 대한 가정을 가집니다. 정규성 Normality 잔차의 분포가 정규분포를 따름을 가정합니다. 가장 흔한 문제는 앞에서 보았던 왜도Skewnes와 이상치Outlier이며, 가장 중대한 문제입니다. QQplot 을 통해 시각적으로 확인할 수 있습니다. 통계적 검사를 통해 이를 진단할 수도 있습니다. -Shapiro 는 소표본 (N1,000,000) 는 샘플링하여 검사한느 것도 좋습니다. 로그 변환 Log transformation 와 이상치 제거로 해결되는..

카테고리 없음 2024. 3. 31. 19:13
ANOVA 한 번에 여러 평균 검사하기

Why ANOVA 앞서 보았듯, t-test 는 3개 이상의 집단을 검정할 수 없습니다. 이를 커버하기 위해, 한 번에 여러 집단의 평균을 검사하는 ANOVA 를 사용 합니다. 앞서의 예시를 보자면, 주중/주말의 차이가 아닌 요일별 차이를 볼 수 있습니다. ANOVA 의 원리 : 평균을 검정하는 분산 분석 ANOVA 는 평균을 비교하는 방법론이지만, 분산을 이용 합니다. 각 집단의 평균은 어차피 조금씩 다를 수밖에 없는데, 그 차이가 유의미하게 큰지를 확인 하기 위해 분산을 이용 합니다 그래서, 분산에 관련된 2개의 분포를 더 배워보겠습니다. 카이제곱 분포는 이름은 어려워보이지만, 굉장히 자주 쓰이는 분포 입니다. 기본적으로 표쥰 정규 분포의 제곱합으로 정의 됩니다. 여기서는 K 는 데이터의 개수이며, ..

카테고리 없음 2024. 3. 31. 18:34
통계적 가설 검정

통계적 가설 검정 이란 ? 주어진 자료가 특정 가설을 충분히 뒷받침 하는지 여부를 결정하는 통계적 추론 방법. 통계적 가설의 구분 귀무(영) 가설 Nll Hypothesis - 기존의 통념이라 일반적으로 표현, 기본값 Default 에 가깝습니다. 대립 가설 Alternative Hypothesis - 새롭게 입증, 주장하고자 하는 것 - 우리의 목표는 보통 귀무가설이 틀렸을 데이터로 증명하는 것 입니다. Example - 앞의 인스타카트 예시를 다시 다듬으면 다음과 같이 됩니다. - Before : 인스타카트를 이용하는 유저들은 주말에 조금 더 많은 수량의 상품을 구매할 것이다. After - 귀무가설 : 인스타카트를 이용하는 유저들의 1회 상품 구매량은, 주중과 주말에 차이가 없다. - 대립가설 : ..

카테고리 없음 2024. 3. 31. 17:56
딥러닝 실습

Tensorflow : 구글이 오픈소스로 공개한 기계학습 라이브러리로 2.0 버전부터는 딥러닝 라이브러리를 구축 하는 Keras 패키지를 통합하게 되었다. Tensorflow 패키지 이해 tensorflow.keras.model.Sequentital model.add : 모델에 대한 새로운 층을 추가함 - unit model.compile : 모델 구조를 컴파일 하며 학습 과정을 설정 -optimizer : 최적화 방법, Gradient Descent 종류 선택 loss : 학습 중 손실 함수 설정 - 회귀 : mean_squared_error(회귀) - 분류 : categorical_crossentropy metrics : 평가 척도 -mse : Mean Squared Error -acc : 정확도 f..

카테고리 없음 2024. 3. 31. 16:46
딥러닝

공통점 : 데이터로부터 가중치를 학습하여 패턴을 인식하고 결정을 내리는 알고리즘 개발과 관련된 인공지능 (AI)의 하위 분야 차이점 - 머신러닝 : 데이터 안의 통계적 관계를 찾아내며 예측이나 부류를 하는 방법 - 딥러닝 : 머신러닝의 한 분야로 신경세포 구조를 모방한 인공 신경망을 사용함 딥러닝의 유래 인공 싱경망 ( Artificial Neural Networks) - 인간의 신경세포를 모방하여 만든 망(Networks) 신경 세포 : 이전 신경세포로 들어오는 자극을 이후 신경세포로 전기신호로 전달하는 기능을 하는 세포 퍼셉트론 (Perceptron) : 인공 신경망의 가장 작은 단위 선형회귀식 - Y = wX + B 몸무게와 키 데이터 Y : 키 x : 몸무게 b: 100로 임의로 설정 W : 1로..

카테고리 없음 2024. 3. 31. 01:53
공지사항
  • 첫번째 공지 입니다 ! 앞으로의 방향성
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
최근에 올라온 글
최근에 달린 댓글
글 보관함
링크
TAG
  • A/B테스트
  • 알고리즘
  • 아하 모먼트
  • 머신러닝
  • 북극성 지표
  • 프로덕트 매니저
  • 아무일 없는것처럼
  • 빅테크
  • 데이터 시각화
  • 퍼포먼스 마케터
  • BI
  • BA
  • PM
  • 기획자
  • 데이터 분석 주니어
  • 데이터 리터러시
  • ADsP
  • 설레다
  • 데이터 분석가 주니어
  • 데이터 분석
  • 통계학
  • 데이터분석가
  • 퍼포먼스 마케팅
  • 프로젝트 매니저
  • 데이터 분석가
  • 그로스 해킹
  • 빅데이터
  • 프로덕트 분석가
  • 방법론
  • 책 추천
more
Total
Today
Yesterday

Blog is powered by Tistory / Designed by Tistory

티스토리툴바