728x90
공 부 시 작
[빅데이터 분석기획 3가지 역량(데이터 사이언티스트의 역량)]
- 수학과 통계
- 정보기술
- 도메인 지식
[데이터 사이언티스트의 하드 스킬, 소프트 스킬]
- 하드 스킬: 이론적 지식, 기술적 숙련과 관련된 능력 - 머신러닝, 통계, 분산 컴퓨팅 등의 능력
- 소프트 스킬: 데이터의 가치를 발견하고 기회를 만드는 능력 - 창의적 사고, 비주얼라이제이션, 커뮤니케이션 능력
[빅데이터 분석 주제 유형]
- 분석 대상, 분석방법에 따라서 분류
- 최적화(Optimization): 분석대상 및 분석방법을 알고 있는 경우
- 솔루션(Solution): 분석대상은 알고 있지만 분석방법을 알지 못하는 경우
- 통찰(Insight): 분석대상이 불명확하지만 분석방법을 알고 있는 경우
- 발견(Discovery): 분석대상과 분석방법을 모를 때
- 분석 주제 유형같은 경우 영어로도 출제 될 때가 있기 때문에 OSID등의 앞글자만 따서 외우는 방법이 필요
[목표 시점별 분석 기획]
- 과제 중심 접근방법
- 과제를 빠르고 단기적으로 해결하는 것
- Speed & Test, 단기적 관점(Quick-Win), 문제 해결(Problemm Solving)
- 마스터 플랜 접근방법
- 장기적으로 분석과정을 정의
- Accuracy & Deploy, 장기적 관점(Long term view), 분석과제 정의(Problem Definition)
[빅데이터 분석기획 시 고려사항]
- 가용 데이터(Available Data): 수집되는 데이터의 유형에 따라서 적용 가능한 분석 솔루션도 달라진다.
- 유즈케이스탐색: 이전 프로젝트에서 사용된 시나리오를 활용하면 빠르고 정확하게 분석할 수가 있다.
- 장애요소 사전제거(Low Barrier of Execution): 지속적인 분석활동을 하기 위해서 장애요소를 제거
[데이터의 특징]
- 존재론적 특징: 데이터가 가지고 있는 존재적 특징으로 정성적 데이터와 정량적 데이터로 구분
구분 | 정성적 데이터 | 정량적 데이터 |
데이터 형태 | 비정형 데이터 | 정형 및 반정형 데이터 |
데이터 특징 | 객체 하나가 함의된 정보를 가짐 | 여러 개의 속성들이 객체를 구성 |
데이터 구성 | 언어, 문자 등 | 수치, 도형, 기호 등 |
저장형태 | 웹, 파일 | 데이터베이스, 스프레드시트 |
소스위치 | 소셜 데이터와 같은 외부 시스템 | DBMS 등의 내부 시스템 |
- 목적론적 특징: 주체의 관점에 따라서 여러 종류의 데이터로 분류
- 주체의 관점에 따라 원본 데이터의 속성 분리, 다른 데이터와의 병합 등이 발생하여 새로운 데이터 객체 생성
- 수집활동에서의 데이터 특징: 수집된 데이터를 활용하기 위한 재생산 과정
중요 - OSID, 정량적 & 정성적 데이터
728x90
'자격증 > ADsP (데이터분석 준전문가)' 카테고리의 다른 글
[데이터분석 준전문가 Day 5/독학] ADsP 3-1 빅데이터 수집과 정제 플랜 정리본 (0) | 2022.08.05 |
---|---|
[데이터분석 준전문가 Day 4/독학] ADsP 2-2 분석 마스터 플랜 정리본 (0) | 2022.08.04 |
[데이터분석 준전문가 Day 3/독학] ADsP 2-1 데이터 분석의 이해 정리본 (0) | 2022.08.03 |
[데이터분석 준전문가 Day 2/독학] ADsP 1-2 데이터의 가치와 미래 정리본 (0) | 2022.08.02 |
[데이터분석 준전문가 Day 1/독학] ADsP 1-1 데이터 이해 정리본 (0) | 2022.08.01 |