기본 콘텐츠로 건너뛰기

Probability density function(PDF)와 Cumulative distribution function(CDF)



1. PDF

'확률밀도함수(PDF)란 정규화(Normalize)된 연속변수에 대한 히스토그램이다.'



확률 밀도란 연속 확률 변수가 일정 구간에 포함될 확률을 확률밀도라고 한다. 이를 함수로 나타내는 PDF는 위의 성질을 만족해야한다.





Histogram란, 도수 분포의 상태를 기둥 모양의 그래프로 나타낸 것. 즉 각 데이터들의 갯수를 세어 본 것이다. 여러 예시가 있겠지만, 나는 사진을 좋아해서 위 사진을 참고하면, 포토샵에서 볼 수 있는 히스토그램이다. 이미지의 각 색상, 또는 밝기의 데이터의 범위는 0부터 255까지라고 하면 값이 0인 것, 1인 것, ... , 254인 것, 255인 것의 갯수를 세어서 막대 바 모양으로 그래프를 그린다.(정수만 생각해보자)

Normalize란, 다 더했을때 1이 되게 맞춰주는 것 이다. 사진의 해상도가 256x256이라면 각 바의 값을 픽셀 수만큼 나누어 주면 되겠다. 값이 200인 Red의 개수가 100개였다면, 100/65536가 될 것이고 각각의 바를 다 더하면 1이 된다.

이 PDF를 f(value)라고 명명하고, 픽셀의 값이 이산적인 경우(1,2,3, ... ,254,255)에는 이 사진의 어떤 픽셀의 Red값이 200일 확률은? 이라는 질문에  f(200)가 답이라고 할 수 있을 것이다(bar의 가로 길이가 1임). 이렇게 셀수 있고 유한한 변수의 경우에는 확률 질량 함수(probability mass function)이라고 부르며 아래를 만족해야한다..
① f(x)≥0, ② ∑f(x)=1, ③ 

하지만, 데이터가 연속적이거나 레졸루션(δ)을 고려해야한다면 질문자체가 Red값이 200 + δ일 확률은? 이라고 물어야하고 그 의미를 포함하는 바의 면적을 확률로 답해야 할 것이다. 




2. CDF

'PDF를 누적하면 CDF(누적 분포함수)'

CDF는 PDF를 누적한 것이다. 즉 PDF를 적분하면 CDF가 된다는 참인 명제로 대우 격인 CDF를 미분하면 PDF가 된다. 이렇게 말해도 되나..
정규분포의 경우엔 확률 공간 중간의 CDF는 0.5를 나타낼 것이다. 


정규분포(normal distribution)

많은 통계적 분석에서는 오차가 정규분포를 따름을 가정하고 있다. 그리고 다양한 자연법칙 및 측정할 수 있는 대상들 (몸무게, 혈압, 키 등...)도 정규분포를 따른다고 한다.
정규분포의 모양은 평균을 중심(line of symmetry)으로 좌우가 대칭이다. 데칼코마니를 생각나게 하는 모양으로 접힌 선을 중심으로 좌우에 50%씩 분포하고 있는 모양이다. 
중간으로 부터 양쪽 1시그마(표준편차)의 경우 68%, 2시그마는 95%... 
이걸 68-95-99.7 Rule이라고 부르기도 한다고 한다네


댓글

이 블로그의 인기 게시물

공부: Multiple View Geometry (3)Cont.

Multiple View Geometry Study Note 2. Projective Geometry and Transformations of 2D (Cont.3) 지난번 MVG(3)에서는 2D geometry에서 affine properties의 복원에 대해서 공부했습니다. 이번에는 metric properties의 복원에 대해 공부할 것 입니다. 지난 공부에서 배웠듯이 metric properties에는 angle, length ratio가 있습니다. 이 성분들을 복원하기 위해 우리는 conic dual to circular points라는 개념을 사용합니다. 그럼 circular points부터 시작하겠습니다. WIKI : circular points at infinity? absolute points라고도 불리는 circular points는 similarity transform에 불변하는 점입니다. I,J로 표시하는데 복소수를 사용하는 저런 좌표를 canonical coordinates라고 하고 I와J는 서로 켤레 복소수 임을 알 수 있습니다. 이 두 점이 similarity transform에 불변하는 것은 왼쪽 슬라이드 두번째 식을 보면 알 수 있습니다. 변환 결과 homogeneous 좌표 모든부분에 같은 실수가 곱해지므로, 결과적으로 similarity transform에 불변함을 증명할 수 있습니다. 'circular points at infinity lie on the complexification of every real circle.' 코닉이 원이 되려면 코닉 기본식에서 a=c, b=0을 만족해합니다. complexification(infinity와 관련?)이기 때문에 x3=0인 것 같습니다. 그럼 결국 오른쪽의 코닉 식에서 만족하는 점은 circular points at infinity인 I와 J 입니다. 또한 I와 J를 외적하면 (0,0...

공부: Multiple View Geometry (1)

Multiple View Geometry Study Note 1. Introduction 연구실에서 MVG 세미나를 진행하여, 참석하게 되었다. 블로그를 시작하면서 내 공부를 정리하는 공간으로 활용해 보고 싶었는데 이번 기회에 제대로 시작하려고 한다. 그림 1. 다시점에서 3D 객체의 사영(projection) 위 그림 1.을 인식하는 것 부터 관련 공부가 펼쳐진다. 실세계의 3D 물체가 카메라 등의 2D 영상으로 매핑되는 것, 관련된 카메라 파라미터, 여러 수학적 설명 방법들을 이해한다. 그리고 더 나아가서 공학적으로 사용한다. 3D가 2D로 매핑되는 것과 반대로, 2D 영상과 시점의 정보를 사용하여 3D 객체를 재현할 수도 있을 것이다. 3D reconstruction 연구에는 다양한 접근 방법이 있다. 하지만 모든 방법에서 가장 기본이 되는 것은 MVG인 것 같다. 관련된 영상들을 몇개 찾아보니 재미있을 것 같지만 굉장히 어렵다고 한다. 앞으로 공부가 기대된다.   3D models from 2D video - automatically Researchers of Computer Vision and Geometry lab Transforming a 2D image into 3D Researchers of Carnegie Mellon University Mathematical  : 3D 컴퓨터 비전 위한 기하학 Seminar study :   D. Kim, MVG Seminar, 2012 winter @IPIS\ Reference book : "Multiple View Geometry in Computer Vision" by Richard Hartley Multiple View Geometry in Computer Vision Richard Hartley |   Cambridge University Press |  200...

공부: Multiple View Geometry (3)

Multiple View Geometry Study Note 2. Projective Geometry and Transformations of 2D (Cont.2) 첫번째로 맡게된 발표에서 다룬 내용은 Projective transformation 된 영상에서, 원영상의 Affine properties와 Meric properties를 회복시켜서 원영상의 모양을 복원하는 주제입니다.  이전의 개념들을 사용하여 실질적인 목적을 수행하는 내용으로 중요한 내용입니다. 발표준비를 하면서 몇일 밤을 새면서 공부했는데, 공부하면 할 수록 너무 재밌는 내용입니다.  이전에 머릿 속에 대강 있던 이차원 공간상의 여러 기하학적 개념을 구체화 하고,  수학이란 툴을 사용해서 실제 영상에 적용하는 이론을 배웠습니다.  여태 살아오면서 가장 열심히 공부했던 것 같습니다.  그럼, 내가 준비한 발표자료와 간단한 설명을 정리해보겠습니다.  따끈따근한 오늘 발표의 포스팅입니다. 이 발표에서는 Projective Transform된 이차원 영상의 특성과 그것을 복원하는 복원할 때 어떤 접근 방법들이 있는지 알아보겠습니다. Projective Transform은 카메라, 극단적으로 우리 시각에서도 항상 일어나는 개념으로 모두가 잘 알고 있을 것으로 생각됩니다.  이제 시작할 이야기를 이해 하시려면 지난번 MVG(2)의 개념들을 알고 있어야합니다.  영상의 기하학적인 성질은 크게 두가지로 나눌 수 있습니다. 첫번째로 Affine properties는 선의 평행성, 평행선 끼리의 길이 비율 입니다. Affine properties는 line at infinity와 밀접하게 연관하여 결정되는 것으로, line at infinity를 실선으로 매핑시키는 Projective transform 성분중 Hp으로 특성이 왜곡됩니다. 두번째로 Metirc p...