티스토리 뷰
데이터를 가공하여 유의미한 정보를 도출하고 분석하는 방법론에 대해 학습 합니다.
통계 이해가 필수인 머신러닝, 딥러닝을 이어가는 기초과정이며 데이터의 기본기를 가질 수 있습니다.
ADsp 를 배우면
- 현대 사회는 데이터 기반으로 모든 것이 이루어짐
- 모든 IT 직무에서 활용 가능
- 데이터 분석에 대한 기본적인 이해를 바탕으로 한 소통 가능
정성적 데이터 | 언어 문자 등 | 설문 조사 , SNS 데이터 등 |
---|---|---|
정량적 데이터 | 수치. 기호 도형 등 | 41kg , 31세 , 29츠 등 |
정형 데이터 ' 비정형 데이터 ' 반정형 데이터
- 정형 데이터
고정된 틀이 있으며 연산이 가능 (Ex.CSV, 엑셀, 스프레드 시트, 관계형 데이터베이스 등)
- 비정형 데이터
고정된 틀이 없으며 연산이 불가능 (EX.NoSQL, 영상, 음성 등)
- 반정형 데이터
고정된 틀을 가지고 있지만 연산이 불가능 (EX.HTML, JSON, XML 등 )
기업 내 조직의 관점에서 조직원 개인의 지식을 공유하고 발전시키는 데 관심을 둔 경영학 에서는 암묵지와 형식지의 상호 작용을 중요하게 생각 합니다. 개인에게 내면화된 지식을 조직의 지식으로 공통화하기 위해서는 기호, 숫자 등의 형태로 표출화 하고 이를 다시 개인의 지식으로 연결하여 그 바탕 위에서 새로운 경험을 부가하여 다시 내면화되는 과정을 거칩니다. 상호 순환작용을 통해 조직의 지식이 증대된다고 보기 때문에 데이터 지식 형성의 중요한 기초를 이룹니다.
DB : 필요로 하는 정보를 체계적으로 수집/축적 하여 제공하는 정보의 집합체
DBMS : 이용자가 쉽게 데이터 베이스를 구축하고 유지할 수 있도록 하는 소프트웨어
데이터 베이스의 종류
- 데이터 베이스 종류에는 계층형, 네트워크형, 관계형,NoSQL 등이 있음
관계형 데이터 베이스 (Relational Datebase)
- 데이터를 행과 열로 표현된 표형식으로 저장하며 데이터 간의 관계를 나타내는 테이블을 사용함
- 관계형 데이터베이스는 SQL 을 사용하여 데이터를 조작하고 검색
- Oracle, MYSQL, MariaDB, SQLite, Postgresql 등
비관계형 데이터 베이스
- Not Only SQL 또는 Non-SQL 의 약자로, 관계형 데이터 베이스 가 아닌 다른 형태의 데이터베이스 관리 시스템을 나타내는 용어
- 관계형 데이터 베이스와는 다른 데이터 모델과 기술을 사용하여 데이터를 저장, 검색 및 관리
- 비정형 데이터와 대용량의 데이터 분석 및 분산 처리에 용이
- MongoDB, ElasticSearch, Redis, Dynamo 등
통합된 데이터 | 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미 데이터 중복을 관리상의 복잡한 부작용을 초래 |
저장된 데이터 | 컴퓨터 기술을 바탕으로 컴퓨터가 접근 할 수 있는 저장 매체에 저장되는 것을 의미 |
공용 데이터 | 다수의 사용자가 다양한 목적으로 데이터를 이용한다는 것을 의미, 대용량화되고 구조가 복잡한 것이 일반적 |
변화되는 데이터 | 데이터의 삽입, 삭제, 갱신으로 변화하면서도 항상 정확한 데이터 상태를 유지 |
데이터 베이스의 다양한 측면에서의 특징
구분 | 특징 |
정보의 축적 및 전달 측면 (기계) | 기계가독성 : 대량의 정보를 일정한 형식에 따라 컴퓨터 등의 정보처리기기가 읽고 쓸 수 있음 - 검색 가능성 : 다양한 방법으로 필요한 정보를 검색 가능 - 원격 조작성 : 정보통신망을 통해 원거리에서도 온라인 이용 가능 |
정보 이용 측면 (사용) | 다양한 정보를 신속하게 획득 원하는 정보를 정확하고 경제적으로 찾아낼 수 있다 |
정보 관리 측면 (데이터 관리) | 정보를 일정한 질서와 구조에 따라 정리 저장 검색 관리 할 수 있도록 하여 대량의 정보를 체계적으로 축적하고 새로운 내용 추가나 갱신이 용이 |
정보기술 발전의 측면 | 정보처리, 검색, 관리 소프트웨어, 관련 하드웨어, 정보 전송을 위한 네트워크 기술 등의 발전을 견인할 수 있다 |
경제 산업적 측면 | 다양한 정보를 필요에 따라 신속하게 제공하고 이용 할 수 있는 인프라의 특성을 가지고 있어 경제, 산업, 사회 활동의 효율성을 제고하고 국민의 편의를 증진 하는 수단으로서 의미를 가진다 |
기업 내부 데이터 베이스
1. 1980 년대 기업 내부 데이터 베이스
OLTP (Online Transaction Processing) : 정보 시스템
- 데이터 베이스의 데이터를 수시로 갱신하는 프로세싱
- 데이터 갱신 위주
ex . 주문이 들어올 경우 이를 처리하고(주문입력시스템), 재고를 업데이트(재고관리시스템) 하는데 사용
OLAP (Online Analytical Processing) : 분석 중심의 시스템
- 데이터 조회 위주 -> 모아둔 데이터에 초점
ex. 복잡한 데이터를 분석하여 제품의 판매 추이, 구매 성향 파악 등을 프로세싱
2000년대 기업 DB 구축 화두
CRm (Consumer Relationship Management, 고객 관계 관리)
- 고객의 구매 이력 데이터를 분석하여 고객에 대한 이해도를 높이고 이를 바탕으로 효과적이고 효율적인 마케팅 전략을 펼치는 것
ERP 기업이 보유한 자원을 효율적인 활용과 분배를 위한 목적
사회 기반 구조로서의 데이터 베이스
기본 개념
- 1990년대 정보화가 본격화되면서 데이터베이스 구축이 활발하게 추진
- 이후 무역, 통관, 물류, 조세, 국세, 조달 등 사회간접자본(SOC) 차원에서 EDI(전자문서교환) 활용이 본격화 되며 부가 가치 통신망(VAN) 을 통한 정보망이 구축되기 시작
- 지리, 교통 부문의 데이터 베이스 고도화
- 의료, 교육, 행정 등 사회 각 부분으로 공공 DB 의 구축 및 이용이 확대됨
- 물류 부문
- '실시간 차량 추적' 을 위한 종합물류 정보망 구축
- CVO 서비스 (Commercial Vehicle Operation System, 화물운송정보)
- EDI 서비스 : 주문서, 납품서, 청구서 등 무역에 필요한 여러 서류를 표준화 된 양식을 통해 컴퓨터 통신망을 이용하여 거래처에 전송하는 시스템
- VAN : 부가가치 통신망, 공중 전기통신사업자(예컨대 한국 전기통신 공사로)로 부터 통신회선을 차용하여 독자적인 네트워크를 형성 하는 것
- CALS(Commerce At Light Speed) : 제품의 설계, 개발, 생산에서 유통, 폐기에 이르기까지 제품의 라이프 사이클 전반에 관련된 데이터를 통합하고 공유, 교환할 수 있도록 한 경영 통합 정보 시스템
- PORT -MIS : 해양수산부의 항만운영정보시스템
- KROIS : 철도청의 철도운영 정보 시스템
- 데이터 베이스 서비스(물류정보), 부가서비스로 구성
2. 지리 부문
- 지리 정보 유통망이 가시화 : 국토 교통부의 지리정보 유통센터를 중심으로 지리정보 통합 관리소 운영, 지리 정보 수요자에게 정보 제공
- GIS 응용에 활용하는 4S 통합 기술
- GIS : 지리 정보 시스템
- RS : 원격 탐사
- GPS : 범지구위치결정 시스템
- LBS : 위치 정보 서비스
- SIM : 공간정보 관리 시스템
3. 교통 부문
- ITS : 지능형 교통시스템
- 교통 정보, 기초자료 및 통계 제공 등 대국민 서비스 확대
4. 의료 부문
- 의료정보 시스템 : 처방전달시스템, 임상병리, 전자의무기록, 영상처리 시스템, 병원의 멀티미디어, 원격의료, 지식정보화
- HL7 국내 표준화 작업에 따라 전국적인 진료 정보 공유 체계 구축 계획 수립
- PACS (Picture Archiving and Communications System)
- U 헬스 (Ubiquitous - Health)
5. 교육 부문
- NEIS (Nationla Education information System) 교육 행정 정보 시스템
- 첨단 정보 통신 기술 (ICT) 을 활용한 각종 교육정보 개발 및 보급 정보 활용 교육
'IT > ADsP 자격증' 카테고리의 다른 글
ADsP 기술 통계 및 T 검정 (0) | 2024.02.21 |
---|---|
ADsP 통계 분석과 이해 ! (0) | 2024.02.21 |
ADsP 자격증 코스 분석 마스터 플랜 (0) | 2024.02.20 |
ADsP 3주차 데이터 분석 기획 (0) | 2024.02.20 |
ADsP 자격증 코스 2주차 (0) | 2024.02.20 |
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 그로스 해킹
- BA
- 데이터 분석 주니어
- 아무일 없는것처럼
- A/B테스트
- 퍼포먼스 마케팅
- 책 추천
- 빅테크
- 알고리즘
- 프로젝트 매니저
- 데이터 분석가 주니어
- PM
- 통계학
- 아하 모먼트
- 기획자
- 빅데이터
- 데이터 분석가
- 데이터 시각화
- 설레다
- 머신러닝
- 퍼포먼스 마케터
- BI
- 방법론
- 데이터 리터러시
- 북극성 지표
- 프로덕트 매니저
- ADsP
- 데이터분석가
- 데이터 분석
- 프로덕트 분석가
- Total
- Today
- Yesterday