엑셀에서 데이터를 관리 하기 위해 지켜야 할 3가지 중요 규칙

1. 머릿글은 반드시 ‘한줄’로 관리 하기

데이터는 가공을 위한 것입니다.

비정규화된 테이블.png

이와 같은 데이터는 각 주차 별 점수 평균 산출에는 쉬울지 몰라도 각 사람 별 1에서 3주차간의 평균을 구하기에는 적적하지 않습니다. 이런 경우 위에 주차에 해당하는 필드를 추가하여

정규화된 테이블.png

이런 방식으로 하면 피벗이나 다른 방식으로 데이터의 재가공성이 올라게 됩니다.

2. 원본데이터에는 셀 병합 절대 사용 금지

위의 경우와 동일 합니다. 데이터베이스 정규화를 이해한다면 말도 안되는 행동입니다. 개인적으로 원본이 아닌 피벗화된 분석, 집계 테이블에서 조차 테이블의 구조화를 이해 한다면 셀병합은 사용하지 않는 것이 좋다고 생각합니다.

3. 집계 데이터는 원본에서 제외하기

제일 아래에 합계라는 부분이 있습니다 이 부분은 아래와 같이 피벗화 되어 있는 데이터를 피벗을 해제하는 경우에 합계가 하나의 레코드가 되어 버립니다. 이런 경우 1/1의 사과 1, 배 7, 귤 8, 오렌지 4가 합산의 의미로 20이 있지만 합계라는 레코드로 1/1날짜에 20이 있으므로 만약 1/1의 총합계를 다시 피벗화 해서 구하면 40이라는 증폭이 일어납니다. 이는 데이터의 의미를 훼손 하는 경우가 되므로 집계 데이터는 따로 나중에 분석 피벗 테이블에서 구현하는 것이 좋습니다.

입고표.png

세로 방향 블록 쌓기 규칙과 이유

위의 피벗화된 데이터를 아래와 같이 Column으로 제품, 날짜, 수량으로 제대로 된 테이블로 만든경우 아래로 데이터를 추가한 것만으로도 데이터를 연속적 추가 관리가 가능합니다.

데이터원본.png

열 피벗 해제

간단한 피벗 해제

데이터가 정규화된 테이블로 존재하지 않는 경우 MS 2016 이후의 추가된 기능인 파워쿼리를 통해 수동이 아닌 자동으로 정규화 할수 있는 방법이 존재 합니다.

일단 이렇게 작성된 데이터가 존재하며 정규화 해야 한다면