CS 공부/AI

베이즈 통계학

imsmile2000 2023. 1. 10. 22:43

https://hmkim312.github.io/posts/%EA%B2%B0%ED%95%A9_%EC%A1%B0%EA%B1%B4%EB%B6%80_%ED%99%95%EB%A5%A0%EA%B3%BC_%EB%B2%A0%EC%9D%B4%EC%A6%88_%EC%A0%95%EB%A6%AC/

 

결합, 조건부 확률과 베이즈 정리

1. 결합확률과 조건부 확률 1.1 결합확률(Joint Probabilit) 사건 A와 B가 동시에 발생할 확률 P(A,B)

hmkim312.github.io

  • P(A,B) = P(A)P(B)=P(A | B)P(B)
  • P(X1,X2,X3) = P(X3 | X1,X2)P(X1,X2) = P(X1)P(X2 | X1)P(X3 | X1,X2)

 

  • 조건부 확률: 사건 B가 일어난 상황에서 사건 A가 발생할 확률 (인과관계 추론할 때 함부로 사용하면 안됨)

  • <베이즈정리> 
    • ex) D: 테스트결과, P(D)=evidence, P(D |θ)=가능도

P(D)=0.1*0.99 + 0.9*0.01=0.108

                 P(θ | D)=0.1*(0.99/0.108)=0.916

  • True Positive (P(D | θ)P(θ)): 양성인데 실제 양성인 경우
  • False Positive (P(D | ¬θ)P(¬θ)): 1종 오류, 양성 나왔는데 실제로 음성인경우
  • True Negative: 음성인데 실제 음성인 경우
  • False Negative: 2종 오류, 음성 나왔는데 실제 양성인 경우
=> FN을 줄이는 것이 중요!
  • COVID-99 판정을 받은 사람이 두 번째 검진에서도 양성이 나왔을 때 진짜 COVID-99에 걸렸을 확률은?
    •  P(θ | D)=0.524,  P(D | θ)=0.99  P(D|¬θ)=0.1 일떄
      • P(D*)=0.99*0.524 + 0.1*0.476=0.566
      • P(θ | D*)=0.524*(0.99/0.566)=0.917
  • 인과관계
    • 데이터 분포의 변화에 강건한 예측모형을 만들 때 필요
    • 중첩요인의 효과를 제거하고 원인에 해당하는 변수만의 인과관계를 계산해야함

          예제)

조건부 확률에서는 a=78%, b=83%

                    중첩효과(Z)를 제거하여 계산했을 때 a=0.8325, b=0.7789 => a가 더 좋음