[인공지능] 만화로 쉽게 배우는 회귀분석
(ShinTakahashi, Iroha Inoue)
Ch01 회귀분석
1. 종속변수와 독립변수
- y = ax + b 일 경우 y는 종속변수, x는 독립 변수라고 함
- a는 회귀계수라고 함
Step01: 독립변수와 종속변수의 상관계수 확인(±1 에 가까울 수록 좋음)
- Scatter Graph를 통하여 보여짐
Step02: 회귀식 구함
- 최소제곱법을 통하여 회귀식을 구함
- y = ax + b
𝑎=𝑆_𝑥𝑦/𝑆_𝑥𝑥 = x와 y의 편차의 곱의 합 / x의 편차의 제곱의 합
b = 𝑦 ̅ −𝑥 ̅a
Step03: 회귀식 정도 확인
- 중상관계수
𝑅=𝑆_(𝑦(𝑦 ) ̂ )/ √(𝑆_𝑦𝑦× 𝑆_(𝑦 ̂𝑦 ̂ )) = y와 𝑦 ̂의 편차의 곱의 합 / √(y의 편차의 제곱의 합 × 𝑦 ̂의 편차의 제곱의 합)
Step04: 회귀계수의 검정
- 모집단을 정의함
- 귀무가설과 대립가설을 세움(귀무가설 A = 0 이다, 대립가설 A != 0 이다.
- 회귀계수의 검정을 실행함
- 유의수준을 결정
- 검정통계량을 구함
- 검정통계량의 값에 대응하는 P의 값이 유의수준보다 작은지 조사함
- P의 값이 작으면 대립가설은 옳다 또는 귀무가설은 틀렸다고 할 수 없다는 결론을 냄
Step05: 모회귀 추정
- 신뢰율 95% 또는 99%로 하는 것이 일반적은 추정을함
Step06: 예측함
- 같은 신뢰율이면 예측 구간의 폭은 신뢰구간보다 폭이 넓어지게 설계됨
※ 계열상관: 시간의 경과가 종속변수의 영향을 미치고 있을지 모를 데이터를 분석 할 때 쓰임(다윈,와트슨의 통계량)
2에 가까울 수록 계열상관은 없다고 해도 됨
Ch02 중회귀분석
Step01: 독립변수와 종속변수의 상관계수 구함
- 회귀분석과 동일
Step02: 중회귀식을 구함
- 회귀분석과 동일
Step03: 중회귀식의 정도를 확인
- 회귀분석과 동일
- 중회귀식에서는 조정결정계수의 값이 더 신뢰성이 있음
Step04: 편회귀계수의 검정을 실행
- 회귀분석과 동일함 하지만 편회귀계수가 전체 0 일 때와 각각이 0 일 때를 가정하여 검정함
Step05: 모회귀를 추정
- 회귀분석과 동일
Step06: 예측함
- 회귀분석과 동일
※ 독립변수의 개수가 적고 정도가 높은 중회귀식을 구해야 함
독립변수 선정에 있어서 총경우법이 존재함
독립변수가 a1, a2, a3가 있을 때 독립변수가 하나 일때와 두개 일때 세개 일때 모두의 조정결정계수를 구하여 높은 것을 고름