Data/Excel

[Excel&Marketing] chapter 03.엑셀 함수를 활용하여 데이터 정리하기(히스토그램, 표준편차/분산,백분위수)

bce_xopowo 2022. 10. 20. 12:09

 

*마케팅 데이터가 너무 크고 많은 경우 요약해야 하는 경우가 있다.

 이 경우 다음을 참고한다.


데이터의 대표값 활용

  • 평균 : 엑스 바로 표기
    =AVERAGE( : )
  • 중간값 : 데이터를 나열 했을때 50%에 위치하는 수
    =MEDIAN( : )
  • 최빈값 : mode 혹은 mode.mult(최빈값이 여러개인 경우, 모든 최빈값 구하기) 활용하여 구할 수 있음
    =MODE( : )

*어떤 대표값이 가장 좋을까?

: 상황과 목적에 따라 적절한 대표값을 고르는 것이 중요.

  • 만약 왜도가 +1보다 크거나 -1보다 작다면 (히스토그램이 기울었다면), 분포에 잠재적인 왜곡이 있을 수 있으니 중간값을 쓰는 것이 좋다
    -아웃라이어의 영향을 많이 받을 수 있기 때문이다
  • 왜도가 -1과 +1의 중간이라면 평균을 쓰는 것이 좋다.

 

* 그 외 데이터를 파악하기 위해 알아야 하는 수치

  1. 분산, 표준 편차
    -VAR( : ) 분산
    -STDEV( : ) 표준편차

  2. 백분위수 구하기
    -PERCENTILE.EXC( : ,0.95) 95% 위치에 있는 수 구하기
    EX) 상품을 만들때 제품이 다 떨어질 가능성이 5% 미만의 수량으로 만들어야 한다.
           이 경우, 전체 판매량 리스트에서 95% 위치에 있는 수를 구하는 식을 활용.
          >만약 위 함수가 122가 나왔다면, 122보다 더 많이 팔릴 가능성은 5% 미만이다.

  3. **번째로 작은 함수, 큰 함수
    -LARGE( : ,N) N번째로 큰 수 구하기
    -SMALL( : ,N) N번째로 작은 수 구하기
    EX)가장 비용을 많이 지불하는 상위 세명의 고객 알아보기

  4. SUMIF, COUNTIF
    -COUNTIF(범위, 조건) 조건에 맞는 셀의 개수를 센다
    -SUMIF(범위, 조건, SUM_RANGE) 조건에 맞는 셀이 있으면 합한다.\

*COUNT - 숫자 데이터의 개수

*COUNTA - 빈칸이 아닌 숫자 혹은 텍스트 셀의 개수 

*COUNTBLANK - 빈칸인 셀 세기

   5. 순위 정하기
   -RANK(셀, 범위, 0/1)

 


데이터를 정리할때 기본적으로 알아야 할 함수에 대해 학습!