서로 다른 가우시안의 혼합
- 만일 가우시안 분포를 따르는 2개의 센서가 존재하고, 이 2개의 센서를 조합하여 관측 결과를 얻으려고 한다면, 두 관측 결과를 가중치를 이용하여 선형 결합해서 최종 결과를 얻을 수 있다. 아래 흐름을 확장하면 2개가 아니라 $N$개의 결과에 대한 조합도 가능함을 알 수 있다.
- 우선 두 센서의 정밀도에 차이가 있을 수 있으므로, 그 정밀도를 기준으로 가중 평균을 내는 것이 합리적이다. 정밀도는 분산의 역수이므로, 두 센서의 정밀도는 다음과 같이 정의할 수 있다. (센서의 분산은 제조사에서 알려준다고 가정하자)
$$
\lambda_1 = {1 \over \sigma_1^2}, \lambda_2 = {1 \over \sigma_2^2}
$$
- 보통 1번의 측정 결과만 이용하지 않고, $n$번의 측정 결과를 이용하게 되는데, 두 센서가 각각 다른 측정 횟수를 가질 수 있다고 한다면, 정밀도는 다음과 같이 정의될 수 있다.
$$
\lambda_1 = {n_1 \over \sigma_1^2}, \lambda_2 = {n_2 \over \sigma_2^2}
$$
- 두 센서의 측정 결과는 각 센서의 측정 결과에 대한 평균으로 정의할 수 있다.
$$
\mu_1 = {1 \over n_1} \sum_{i=1}^{n_1} y_i^{(1)}, \mu_2 = {1 \over n_2} \sum_{i=1}^{n_2} y_i^{(2)}
$$
- 각 센서의 결과에 각 센서의 정밀도를 가중치로 곱하고, 그것을 각 센서의 정밀도의 합으로 나눠서 전체 측정 결과의 평균을 얻는다. (각 센서 정밀도의 합으로 나누는 것은 가중 평균을 계산할 때, 가중치의 합으로 결과를 나눔으로써 가중치의 합이 1이 되도록 조정하는 것을 의미한다.)
$$
\mu_{\text{total}} = {\lambda_1 \cdot \mu_1 + \lambda_2 \cdot \mu_2 \over \lambda_1 + \lambda_2}
$$
- 분산은 정밀도의 역수이고, 전체 정밀도는 각 센서의 정밀도의 합으로 정의할 수 있다.
$$
\lambda_{\text{total}} = \lambda_1 + \lambda_2 \\ \sigma_{\text{total}}^2 = {1 \over \lambda_{\text{total}}} = {1 \over \lambda_1 + \lambda_2}
$$
- 전체 평균과 분산을 구했으므로, 전체에 대한 가우시안 분포를 정의할 수 있다.
$$
\mathcal{N}{\text{total}}(y|\mu{\text{total}}, \sigma_{\text{total}}^2)
$$
노이즈에 대한 가우시안
- 만일 어떤 가우시안 분포를 따르는 측정 결과에 노이즈가 끼어 있다면, 그 측정 결과에 대한 분포를 $y$로 놓고, 노이즈가 없었을 경우의 분포를 가우시안 잠재 분포 $z$로 두면, 두 분포가 노이즈에 의해 선형 관계를 갖는다고 할 수 있고, 이를 바탕으로 측정 결과에 대해 노이즈가 제거된 결과를 얻을 수 있다.
- 일반적으로 노이즈가 낀 분포 $y$와 잠재 분포 $z$에 대해 다음과 같은 관계를 정의한다.
- 여기서 $z$는 평균 $\mu_0$, 분산 $\Sigma_0$인 노이즈가 없는 분포를 의미하고,
- 측정된 결과 $y$는 $z$에 노이즈텀 $\epsilon$이 낀 것으로 정의한다.
- 노이즈텀 $\epsilon$은 가우시안 분포를 따르며, 평균이 0이고 분산이 $\Sigma_y$인 것으로 정의한다.
$$
z \sim \mathcal{N}(\mu_0, \Sigma_0) \\ y = z + \epsilon \\ \epsilon \sim \mathcal{N}(0, \Sigma_y)
$$
- 위와 같이 정의하면, $y$는 $z$에 대해 노이즈가 추가된 것이므로 다음과 같이 조건부 분포를 정의할 수 있다.
- 여기서 $\lambda$는 정밀도로 $\lambda = 1 / \sigma^2$