자격증/ADsP (데이터분석 준전문가)

[데이터분석 준전문가 Day 7/독학] ADsP 4-1 자료분석 정리본

thisisjade 2022. 8. 9. 12:55
728x90

 

3과목 공부시작

 

[자료분석]

  • 관련지식과 통계지식을 사용해서 최선의 의사결정을 하기 위해 자료를 정리하고 분석하는 활동
  • 변수: 값이 달라질 수 있는 것
  • 상수: 값이 달라지지 않는 것
  • 관측치: 모집단으로 추출된 표본의 수
  • 모수: 전체 집단을 설명하는 진실된 값, 통계는 전수조사를 할 수 없기 떄문에 모수와 표본 간의 오차 범위를 예측
  • 잔차: 관측 값과 계산 값의 차이를 의미, 잔차를 연구하여 각종 오차를 계산

 

[함수]

  • dim()함수: 관측치와 변수를 확인
  • head()함수: 상위 6개의 데이터를 조회해서 화면에 출력
  • str()함수: 변수리스트와 변수의 데이터 타입(ex. 정수, 실수, 범주형)

 

[변수] - 측정결과가 조사대상과 다른 값으로 나타날 수 있는 속성 혹은 특성

- 독립변수와 종속변수

  • 독립변수: 설명변수로 원인이 되는 변수
  • 종속변수: 결과변수로 독립변수에 영향을 받아서 결과가 되는 변수

 

- 질적변수와 양적변수

  • 질적변수: 수치로 나타낼 수 없는 변수
  • 양적변수: 수치로 나타낼 수 있는 변수

 

- 이산변수와 연속변수

  • 이산변수: 셀 수 있는 정수 값을 가지고 있는 변수
  • 연속변수: 연속적인 모든 실수 값을 가질 수 있는 변수

 

- 명목변수와 서열변수

  • 명목변수: 자료를 서로 다른 범주로 구분하여, 각 범주에 수치를 부여
  • 서열변수: 자료에 서열을 부여하기 위해서 수치를 사용

 

- 등간변수와 비율변수

  • 등간변수: 자료를 서열뿐만아니라 상대적 차이까지 제시
  • 비율변수: 자료를 분류, 서열, 차이와 함께 절대영점까지 표현

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

728x90