자격증/ADsP (데이터분석 준전문가)

[데이터분석 준전문가 Day 1/독학] ADsP 1-1 데이터 이해 정리본

thisisjade 2022. 8. 1. 18:23
728x90

취준(이직준비)을 하면서 토스와 같이 공부를 하려고 합니다.

저는 정보처리기사와 SQLD자격증이 있습니다.
ADsP는 시험을 보고 떨어져서 재시험입니다.(52점 탈 ㅠㅠ)
8월 28일 접수를 했습니다.
이번에는 제대로 준비해서 합격해보려고 합니다.

[공부 시작]
데이터: 추론과 추정의 근거를 이루는 사실

특성 내용
존재적 특성 객관적인 사실을 의미
당위적 특성 추론, 예측, 전망, 추정을 위한 근거


데이터의 유형: 정성적 데이터, 정량적 데이터로 분류

유형 내용
정성적 데이터 언어, 문자등의 형태로 데이터 저장과 분석 등에 많은 시간이 소모
정량적 데이터 수치, 도형, 기호 등의 형태로 정형화된 데이터, 비용 소모 적음


지식창조 메커니즘

특성 내용
공동화 암묵지를 고차원의 암묵지로 전환
표출화 암묵지를 형식지로 전환, 구체적인 개념으로 전환, 언어를 통해 공식화
연결화 형식지의 단편을 수집, 분류, 통합하여 새로운 형식지 창조, 지식 체계화
내면화 형식지 암묵지로 전환


암묵지, 형식지

구분 내용
암묵지 개인의 관심사 등 전달하기 곤란한 지식, 공유하기 어려운 지식
형식지 문서화되고 공식적, 체계적인 언어로 전달과 공유 가능


데이터와 정보의 관계
데이터: 객관적인 사실, 여러개의 데이터가 체계화 조직화되어 정보로 사용
정보: 정보는 미래를 예측할 수 있는 결가물인 지식으로 변환, 지식이 쌓여서 지혜로 변화

지식 피라미드(DIKW 피라미드)

지식 피라미드 내용
데이터(Data) 가공전 순수한 수치나 기호(ex. a세트 100원, b세트 200원)
정보(Information) 패턴을 인식하고 의미 부여(ex. a세트가 더 싸다)
지식(Knowledge) 패턴을 이해하고 예측한 결과물(ex. 더 저렴한 a세트를 사야겠다)
지혜(Wisdom) 원리를 이해하고 도출되는 창의적인 아이디어(ex. a세트의 재료비도 더싸겠다라고 판단했다.)


데이터베이스: 데이터를 저장하여 여러사람들이 같이 공유하며 사용할 수있는 데이터의 집합체

데이터베이스 특징

  • 통합된 데이터
  • 저장된 데이터
  • 운영 데이터
  • 공용 데이터
  • 실시간성
  • 지속적 변환
  • 동시 공유성
  • 내용에 의한 참조


데이터 베이스의 단점(장점은 많아서 패스)

  • 데이터베이스 구축에 따른 비용발생
  • 백업과 복구가 복잡


데이터 웨어하우스(DW, Data Warehouse)
- 합리적인 의사결정을 위해서 기업 내부 및 외부 데이터를 통합한 데이터의 집합체

데이터 웨어하우스의 특징

  • 주제지향적: 정보를 특정한 주제에 맞게 분류,가공 후 구조화(ex.고객, 상품)
  • 통합적: 내부 운영데이터와 외부 데이터는 통합하고 가공되어야 한다.
  • 시계열성: 과거, 현재 데이터를 일정기간 저장하여 미래를 예측하고 시점별로 분석 가능(시간순으로 가공 가능)
  • 비소멸성: 갱신이 발생하지 않는 조회 전용


데이터 웨어하우스 구성

  • 경영기반 솔루션: 분석을 위한 솔루션(ex. BSC, RMS, BI, DSS, EIS)
  • 데이터마이닝: 대규모의 데이터를 알려지지 않은 사실과 패턴을 분석하는 과정
  • OLAP(Online Analytical Processing): 직접 OLAP 툴을 통해 다차원 분석을 수행하는 솔루션
  • DW Meta Data: 데이터 모델에 대한 정보를 제공하는 운영 메타데이터, 비지니스적 측면에서 정보를 제공하는 활용 메타데이터
  • ODS(Operational Data Store): 다수의 OLTP 시스템에서 추출한 데이터를 통합적으로 관리하는 데이터베이스
  • ETL(Extract Transform Load): 기업내부 및 기업외부 데이터 추출, 정제 및 데이터 웨어하우스에 적재를 수행하는 작업
  • 데이터 모델: 주제 지향적으로 설계된 ER(Entity Relationship)모델, OLAP를 활용한 다차원 모델


데이터베이스 활용

  • KMS(Knowledge Management System): 개별적인 지식 체계화 및 공유
  • ERP(Enterprise Resource Planning): 기업 내 업무 프로세스 통합적으로 연계관리 하는 전사적 통합 패키지
  • SCM(Supply Chain Management): 공급 상의 정보, 물자, 현금흐름의 인터페이스 및 프로세스를 통합하고 관리
  • CRM(Customer Relationship Management): 고객과의 관계를 극대화하기 위한 경영전략
  • EAI(Enterprise Application Integration): 기업내부의 정보를 중앙 집중적으로 통합, 관리, 사용할 수 있는 미들웨어 솔루션
  • 클라우드 컴퓨팅(Cloud Computing): 인터넷을 사용해서 공유자원을 On-Demand 형태로 이용할 수 있는 서비스
  • ISP(Information Strategy Planning): 비지니스 전략을 효과적으로 지원하기 위해 정보시스템을 수립하는 활동


오늘 공부한 내용중에는 아는 것들이 많이나와서 빠르게 했네요.
1-1에서는 데이터베이스 활용 부분만 더 공부하면 될 것 같습니다.

728x90