Search
🐣

집계 데이터

데이터 변환

데이터 마이닝 프로세스를 보다 효율적으로 수행하기 위해, 데이터의 패턴을 더 쉽게 이해할 수 있도록 데이터를 통합하거나 변환하는 과정
집계(Aggregation), 일반화(Generalization), 정규화(Normalization)

집계(Aggregation)

데이터를 요약 하는 데 필요한 평균, 중앙값 및 분산과 같은 통계 수식을 적용하는 프로세스
예) 일일 판매 데이터를 집계하여 월별 및 연간 총 금액을 계산

그룹연산

데이터를 그룹 별로 나눈 후 계산을 할 수 있는 방법
복잡한 데이터를 특정 기준에 따라 여러 그룹으로 나누어 관찰
그룹 연산은 데이터를 집계, 변환, 필터링을 하는데 효율적
지역별 편의점 월급 데이터 그룹 연산

피봇테이블

데이터를 행과 열 기준으로 그룹화하여 연산을 적용, 통계화하는 방법
피봇테이블 예시 1) 행 기준 한 개 설정된 경우
피봇테이블 예시 2) 행 기준 두 개 설정된 경우

Exercise

영화 데이터의 장르별 집계 정보 확인
–2010년대 한국에서 개봉한 한국영화 600개에 대한 감독, 이름, 상영등급, 관객 수 등의 정보가 담긴 데이터
dir_prev_bfnum: 해당 감독이 이 영화를 만들기 전 제작에 참여한 영화에서의 평균 관객수(단, 관객수가 알려지지 않은 영화 제외)
dir_prev_num : 해당 감독이 이 영화를 만들기 전 제작에 참여한 영화의 개수(단, 관객수가 알려지지 않은 영화 제외)