차등정보보호 이해: 최대 가능도

환자 질병 유무 데이터가 주어질 때 환자별로 스피너를 시행하고 그 결과에 따라 질병 유무를 그대로 기록하거나 반대로 기록하여 공개합니다.

이 문서에서는 공개 데이터로부터 그것을 얻게 될 가능성이 가장 높은 원본 데이터가 무엇인지 추정하고 가능성의 정도를 정량화하여 제시합니다.

1. 공개 데이터

어떤 원본 데이터에 대하여 환자별로 스피너를 시행하고 데이터를 처리한 결과를 공개합니다.

위의 데이터세트는 다섯 명의 환자 중에서 patient-1을 제외한 나머지 네 명이 질병을 보유하고 있음을 말합니다.

2. 가능한 원본 데이터 목록

공개되지 않은 원본 데이터는 아래 테이블의 서른두 가지 중에서 어느 하나일 것입니다.

3. 스피너 경우의 수

환자별로 스피너를 시행할 때 발생할 수 있는 든 경우의 수를 찾아서 테이블로 표시합니다. 그리고 스피너의 밝은 부분이 차지하는 면적의 비율이 90%일 때 각각의 경우가 발생할 확률을 구하고 테이블의 마지막 열에 추가합니다.

하나의 사례를 들어 구체적으로 설명하기 위하여 가능한 원본 데이터 목록 중에서 두 번째(인덱스 1) 데이터를 사용합니다. 스피너 시행 결과에 따라 환자 데이터를 처리하고 각각의 경우에 대하여 질병 보유 환자의 수를 구한 결과는 아래와 같습니다. 그리고 위에서 구한 확률값을 테이블의 마지막 열에 함께 표시하였습니다.

스피너를 시행하고 처리한 데이터들 중에서 주어진 공개 데이터를 얻게 될 가능성은 아래와 같이 구합니다.

이것은 가능한 원본 데이터 목록에서 두 번째(인덱스 1) 데이터에 대하여 환자별로 스피너를 시행할 때 가능한 경우의 수 중에서 열 번째(인덱스 9) 경우가 발생하면 주어진 공개 데이터를 얻게 되고 그 경우가 발생할 확률은 0.007290임을 나타냅니다.

4. 원본 데이터의 가능도

관찰 결과로부터 원래의 값이 무엇인지 추정하고 그것의 가능성을 정량화하여 말할 때 가능도(likelihood)라는 용어를 사용합니다. 여기에서는 공개 데이터가 관찰 결과에 해당하고 원본 데이터가 원래의 값에 해당합니다.

  • 확률: 어떤 행위의 결과로 특정 사건이 발생할 가능성을 정량적으로 표현
  • 가능도: 특정 사건이 발생했을 때 가능한 원래의 값들을 추정하고 각각의 가능성을 정량적으로 표현

아래의 출력은 가능한 모든 원본 데이터 목록에서 각각의 원본 데이터로부터 주어진 공개 데이터를 얻게 될 확률을 구한 것이고 이 값들이 가능도입니다.

공개 데이터를 얻게 될 원본 데이터의 가능도 분포를 그래프로 나타내면 아래와 같습니다.

위의 그래프를 근거로 가능한 원본 데이터 목록 중에서 다섯 번째(인덱스 4)에 해당하는 [True False True True True]가 원본 데이터일 가능성이 가장 크다고 말할 수 있습니다. 그 다음으로 높은 가능성을 가지는 원본 데이터는 인덱스 0, 9, 10, 11, 15에 해당하는 것들입니다.

이번에는 스피너의 밝은 부분이 차지하는 면적의 비율을 바꾸어 가면서 주어진 공개 데이터로부터 원본 데이터의 가능도 분포를 살펴 봅니다.

스피너의 밝은 부분이 차지하는 면적의 비율이 클수록 원본 데이터의 값을 뒤집을 확률이 줄어듭니다. 이로 인해 좀 더 높은 확신을 가지고 공개 데이터로부터 원본 데이터를 추정하는 것이 가능해집니다. 그와 반대로 스피너의 밝은 부분이 차지하는 면적이 절반에 가까워질수록 어떤 원본 데이터를 대상으로 스피너를 시행하더라도 공개 데이터를 얻을 가능성이 서로 비슷해지므로 하나의 원본 데이터를 높은 확신을 가지고 지목하는 것이 어려워집니다.

5. 정리

공개 데이터로부터 가능한 원본 데이터들을 추정하고 각각의 가능성을 정량적으로 구하여 제시하였습니다. 이를 통해 다음 두 가지를 알 수 있었습니다.

  • 가장 가능성이 높은 원본 데이터를 선택할 수 있다.
  • 데이터 처리 과정에서 불확실성을 높이면 특정 원본 데이터가 다른 원본 데이터보다 더 진짜 원본 데이터라고 확신하기가 어려워진다.

온-디바이스 마이데이터 앱

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store