본문 바로가기
읽고 생각하고 쓰고

Dummy variable, table

by 타라와 2011. 5. 16.
Dummy.

1. Safety dummy
내가 통계학을 배우기 전까지의 '더미'라는 단어에 대한 이미지는 위의 'safety dummy'였다. 사람을 대신해서 자동차 충돌 실험에 쓰이는... 이 '더미'는 사람과 같은 구조로 만들어져서 주요 부분에 센서를 달아 충돌 때 발생하는 손상의 정도나 부위에 대해서 정보를 알 수 있도록 되어 있다.

2. Dummy variable
통계학에서의 더미 변수는 실제 데이터를 이용해서 우리가 원하는 특정 변수로 새롭게 재구성해낸 변수를 말한다. 백과사전에 의하면 계량경제에서 처음에 사용되었다고 한다(http://goo.gl/c37Wz). 여러 양적 변수를 단순히 합치거나 재구성한 변수가 아니라 질적 성격을 가진 변수를 수치화시킨 것을 말한다. 이 때문에 양적인 성격을 가지기는 힘들고 0, 1 등으로 구분되게 된다. 이러한 성격 때문에 로지스틱 분석 방법을 사용하게 되는 것이 일반적이다. 자동차 충돌실험에서의 더미가 사람 대신 충돌을 하여 의미를 만들어낸다면, 통계학에서의 더미는 그 변수를 구성해내는 과정부터 실지 새로운 의미를 만들어내는 것과 같다. 

3. Dummy table
어제는 네팔에서 사용할 설문조사지 초안을 작성해서 교수님께 검토를 받았다. 교수님의 답장은 '더미 테이블까지 고려하도록 하라' 였다. 더미 테이블. 여기서의 더미는 무엇을 의미할까? 검색을 해보니, 데이터를 수집하기 전에 어떻게 변수를 배치해서 테이블을 구성하여 연구 결과를 제시할 수 있을지, 예상되는 표를 그려보는 것이다.