Louie NRT Story

[인공지능] 만화로 쉽게 배우는 회귀분석 본문

책읽기

[인공지능] 만화로 쉽게 배우는 회귀분석

hyeok0724.kim@gmail.com 2017. 11. 26. 22:01
반응형

(ShinTakahashi, Iroha Inoue)

Ch01 회귀분석

1. 종속변수와 독립변수

 - y = ax + b 일 경우 y는 종속변수, x는 독립 변수라고 함

 - a는 회귀계수라고 함


Step01: 독립변수와 종속변수의 상관계수 확인(±1 에 가까울 수록 좋음)

 - Scatter Graph를 통하여 보여짐


Step02: 회귀식 구함

 - 최소제곱법을 통하여 회귀식을 구함

 - y = ax + b

   𝑎=𝑆_𝑥𝑦/𝑆_𝑥𝑥 = x와 y의 편차의 곱의 합 / x의 편차의 제곱의 합

   b = 𝑦 ̅  −𝑥 ̅a


Step03: 회귀식 정도 확인

 - 중상관계수

   𝑅=𝑆_(𝑦(𝑦 ) ̂ )/ √(𝑆_𝑦𝑦× 𝑆_(𝑦 ̂𝑦 ̂ )) = y와 𝑦 ̂의 편차의 곱의 합 / √(y의 편차의 제곱의 합 × 𝑦 ̂의 편차의 제곱의 합)

 - 결정계수 = (중상과계수)^2
 - 결정계수가 0.5 이상이면 회귀식 정도가 높다고 함

Step04: 회귀계수의 검정

 - 모집단을 정의함

 - 귀무가설과 대립가설을 세움(귀무가설 A = 0 이다, 대립가설 A != 0 이다.

 - 회귀계수의 검정을 실행함

 - 유의수준을 결정

 - 검정통계량을 구함

 - 검정통계량의 값에 대응하는 P의 값이 유의수준보다 작은지 조사함

 - P의 값이 작으면 대립가설은 옳다 또는 귀무가설은 틀렸다고 할 수 없다는 결론을 냄


Step05: 모회귀 추정

 - 신뢰율 95% 또는 99%로 하는 것이 일반적은 추정을함


Step06: 예측함

 - 같은 신뢰율이면 예측 구간의 폭은 신뢰구간보다 폭이 넓어지게 설계됨


※ 계열상관: 시간의 경과가 종속변수의 영향을 미치고 있을지 모를 데이터를 분석 할 때 쓰임(다윈,와트슨의 통계량)

                2에 가까울 수록 계열상관은 없다고 해도 됨


Ch02 중회귀분석

 Step01: 독립변수와 종속변수의 상관계수 구함

  - 회귀분석과 동일

 

 Step02: 중회귀식을 구함

  - 회귀분석과 동일


 Step03: 중회귀식의 정도를 확인

  - 회귀분석과 동일

  - 중회귀식에서는 조정결정계수의 값이 더 신뢰성이 있음


 Step04: 편회귀계수의 검정을 실행

  - 회귀분석과 동일함 하지만 편회귀계수가 전체 0 일 때와 각각이 0 일 때를 가정하여 검정함


 Step05: 모회귀를 추정

  - 회귀분석과 동일


 Step06: 예측함

  - 회귀분석과 동일


※ 독립변수의 개수가 적고 정도가 높은 중회귀식을 구해야 함

   독립변수 선정에 있어서 총경우법이 존재함

   독립변수가 a1, a2, a3가 있을 때 독립변수가 하나 일때와 두개 일때 세개 일때 모두의 조정결정계수를 구하여 높은 것을 고름


반응형
Comments