있는 그대로 |
2008-04-15 21:30
스크랩 0 | 추천 0
응 그려. 난 저 그래프의 정체를 도통 모르겠네 그려. 일단 이걸 대략 읽어보라구.
http://en.wikipedia.org/wiki/Logistic_regression
나도 첨 듣는 내용인데 멋대로 이해하자면 이렇네.
회귀분석이란 하나의 변수와 다른 변수들의 관계를 찾는 분석이네.
logit은 그 방법론 중 하나이고.
위키디피아의 예를 들자면, logit을 사용하여 프로그램 돌리면 이런 결과가 나온다네.
데이터로는 사람들의 뒈진 기록, 성별, 나이, 혈압이 사용되었지.
뒤질 위험 = -5 +2 x 나이 - 성별 + 1.2 x 혈압
아이추판다(이하 저 친구)는 연도와 투표율의 logit 회귀분석을 한 것인데, 도대체 뭘 한 건지 모르겠군.
데이터 계열로는 총선, 대선, 지방선거를 사용한 모양이야.
본문에서 저 친구가 말한 바의 결과는 이러하지.
투표율 = 132.89 - 서기 * 0.067 (식1)
그니까 아이추판다(이하 저 친구)는 통계 프로그램을 하나 돌려서 최적 계수를 하나 찾은 거 같네.
이해할 수 없는 저 그래프로 봐서는 서기를 데이터로 사용했지. 본문에서 말한바대로 0.067로 감소하고
Intercept는 리플의 132.89를 사용했어.
그런데 말야
2000년 부근을 넣으면 이 값은 항상 거의 0이야.
투표울이 -1% ~ 2% 정도라고 말이되냔 말이지.
저 친구의 리플을 다시 보네.
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 132.897700 14.810228 8.973 2.16e-06 ***
year -0.066247 0.007412 -8.937 2.24e-06 ***
elecP 0.691374 0.110079 6.281 6.00e-05 ***
elecR -0.164276 0.118261 -1.389 0.192
이친구 회귀 분석 말야 혹시 이거 아닌가?
총선투표율 = 132.89 - 0.067 *(서기) + 0.69 * (대선투표율) - 0.16 * (지자체투표율) (식2)
이 친구 엉뚱한 회귀분석한 거 같은데?
elecP와 elecR이 year와 함께 관계변수로 설정되어 있거든.
식2 를 변형해보지
총선투표율 = [132.89 - 0.067 *(서기)] + 0.69 * (대선투표율) - [0.16 * (지자체투표율)] (식2-2)
1990년대와 2010년대에서 대괄호 안은 작은 값으로 무시할 수 있네.
총선투표율 = 0.69 * (대선투표율) (식2-3)
그럼 이 회귀의 결론은 시기와 무관하세 총선투표율은 대선투표율의 70%라는 것이지.
내 생각엔 저 친구 자기가 의도한 바를 회귀분석할 능력이 없고, 자신의 분석을 이해할 능력이 없는 것 같은데?