중간값 VS 평균값

HAI

미국의 주요 경제 통계들은 중간값median을 이용한다. 중간값이란 말 그대로 Data를 순서대로 늘어 놓았을 때 그 중간에 위치한 값을 의미한다. 즉, 100개의 값이 1부터 100까지 존재한다면, 이 data의 중간값은 50이 될 것이다.

중간값을 왜 사용하는가? 왜 평균값을 사용하지 않는가?

여기 100명의 사람이 있다고 치자. 98명의 소득은 10불이고 나머지 두 명의 소득은 10만불이라고 하자. 이 경우 이 100명의 평균 소득은 [20만불 + (980불)]/100이 될 것이고 즉, 209.8불이 평균값이 될 것이다. 하지만, 중간값은 어떻게 될까? 100명을 소득이 작은순서로 늘어놓으면 98명까지 10불이고 나머지 99와 100은 10만불이 될 것이다. 이들의 중간은 50번째 사람이 될 것이고, 그의 소득은 10불이니 이 백명의 중간값은 10불이 될 것이다(사실, 중간값은 50번째와 51번째의 소득을 더해서 2로 나눈 값이 된다. 즉, 이 경우 10 + 10 / 2 이므로 10불이 될 것이다.).

어느쪽이 더 진실에 가까울까? 209.8불과 10불 중에서 이 100명의 소득을 반영하고 있는 것은 어느쪽일까?

어느쪽이 더 진실인지는 모르겠지만, 미국의 경우 통계를 낼 때 중간값을 쓴다. 그래서, 10불이 median income이 될 것이다. 한국은 지금까지 살펴본 바로는 평균값을 쓴다. 따라서, 209.8불이 될 것이다. 물론, 이 경우는 좀 극단적인 사례가 되겠지만, 미국이나 한국이나 대부분의 "부"는 극소수가 차지하고 있기 때문에 이런 예가 아주 근거가 없는 건 아니라고 본다.

완전히 객관적일 것만 같은 통계도 이렇게 방법에 따라서 다른 이야기를 전한다. 따라서, 하나의 지수나 통계값에 집착하지 않는 것이 현상을 좀 더 깊이 이해하는 길이 될 것이다.

PS. 통계청에 가서 뒤져봐도 중간값을 보여주는 부분은 없다. 내가 못 찾는것 뿐인가..?

by corwin | 2010/01/24 13:56 | 트랙백
트랙백 주소 : http://corwin.egloos.com/tb/4324954
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
※ 로그인 사용자만 덧글을 남길 수 있습니다.