자격증/ADsP (데이터분석 준전문가)

[데이터분석 준전문가 Day 2/독학] ADsP 1-3 데이터 사이언스와 전략 인사이트 정리본

thisisjade 2022. 8. 2. 12:00
728x90

 

공 부 시 작

 

[빅데이터 분석기획 3가지 역량(데이터 사이언티스트의 역량)]

  • 수학과 통계
  • 정보기술
  • 도메인 지식

 

[데이터 사이언티스트의 하드 스킬, 소프트 스킬]

  • 하드 스킬: 이론적 지식, 기술적 숙련과 관련된 능력 - 머신러닝, 통계, 분산 컴퓨팅 등의 능력
  • 소프트 스킬: 데이터의 가치를 발견하고 기회를 만드는 능력 - 창의적 사고, 비주얼라이제이션, 커뮤니케이션 능력

 

[빅데이터 분석 주제 유형]

- 분석 대상, 분석방법에 따라서 분류

  • 최적화(Optimization): 분석대상 및 분석방법을 알고 있는 경우
  • 솔루션(Solution): 분석대상은 알고 있지만 분석방법을 알지 못하는 경우
  • 통찰(Insight): 분석대상이 불명확하지만 분석방법을 알고 있는 경우
  • 발견(Discovery): 분석대상과 분석방법을 모를 때

 

- 분석 주제 유형같은 경우 영어로도 출제 될 때가 있기 때문에 OSID등의 앞글자만 따서 외우는 방법이 필요

 

[목표 시점별 분석 기획]

- 과제 중심 접근방법

  • 과제를 빠르고 단기적으로 해결하는 것
  • Speed & Test, 단기적 관점(Quick-Win), 문제 해결(Problemm Solving)

 

- 마스터 플랜 접근방법

  • 장기적으로 분석과정을 정의
  • Accuracy & Deploy, 장기적 관점(Long term view), 분석과제 정의(Problem Definition)

 

[빅데이터 분석기획 시 고려사항]

  • 가용 데이터(Available Data): 수집되는 데이터의 유형에 따라서 적용 가능한 분석 솔루션도 달라진다.
  • 유즈케이스탐색: 이전 프로젝트에서 사용된 시나리오를 활용하면 빠르고 정확하게 분석할 수가 있다.
  • 장애요소 사전제거(Low Barrier of Execution): 지속적인 분석활동을 하기 위해서 장애요소를 제거

 

[데이터의 특징]

- 존재론적 특징: 데이터가 가지고 있는 존재적 특징으로 정성적 데이터와 정량적 데이터로 구분

구분 정성적 데이터 정량적 데이터
데이터 형태 비정형 데이터 정형 및 반정형 데이터
데이터 특징 객체 하나가 함의된 정보를 가짐 여러 개의 속성들이 객체를 구성
데이터 구성 언어, 문자 등 수치, 도형, 기호 등
저장형태 웹, 파일 데이터베이스, 스프레드시트
소스위치 소셜 데이터와 같은 외부 시스템 DBMS 등의 내부 시스템

 

- 목적론적 특징: 주체의 관점에 따라서 여러 종류의 데이터로 분류

  • 주체의 관점에 따라 원본 데이터의 속성 분리, 다른 데이터와의 병합 등이 발생하여 새로운 데이터 객체 생성

 

- 수집활동에서의 데이터 특징: 수집된 데이터를 활용하기 위한 재생산 과정

 

 

중요 - OSID, 정량적 & 정성적 데이터

728x90