기본 콘텐츠로 건너뛰기

중심 경향(Central Tendency)그리고 중간 값의 종류

통계학에서의 중심경향이란 확률분포에서의 중심을 의미하는데 평균, 중심, 중간, 최대빈도 값 등등 어떤 것으로 규정할지 헷갈린다.




가장 익숙한 것이 Mean(평균), Median(가운데), Mode(최빈값)이다.

유추할 수 있겠지만, 아래 예시로 다시 한번 확인해보자.


data:      1-1-2-3-4-5-6-6-6-10-10
counter: 1-2-3-4-5-6-7-8-9-10-11

Counter는 어디가 가운데인지 측정하기 위한 '자'라고 생각하면 된다.

각각을 계산해보면,

                                  Mean: (1+1+2+3+4+5+6+6+6+10+10) / 11 = 4.9

                                  Median: date_6 = 5
                                  Mode: 6


참고로 정규분포(normal distribution)의 경우에는 아래와 같은 모양일 것이다.





Arithmetic mean or simply, mean
the sum of all measurements divided by the number of observations in the data set.
Median
the middle value that separates the higher half from the lower half of the data set. The median and the mode are the only measures of central tendency that can be used for ordinal data, in which values are ranked relative to each other but are not measured absolutely.
Mode
the most frequent value in the data set. This is the only central tendency measure that can be used with nominal data, which have purely qualitative category assignments.
Geometric mean
the nth root of the product of the data values, where there are n of these. This measure is valid only for data that are measured absolutely on a strictly positive scale.
Harmonic mean
the reciprocal of the arithmetic mean of the reciprocals of the data values. This measure too is valid only for data that are measured absolutely on a strictly positive scale.
Weighted arithmetic mean
an arithmetic mean that incorporates weighting to certain data elements.
Truncated mean or trimmed mean
the arithmetic mean of data values after a certain number or proportion of the highest and lowest data values have been discarded.
Interquartile mean
a truncated mean based on data within the interquartile range.
Midrange
the arithmetic mean of the maximum and minimum values of a data set.
Midhinge
the arithmetic mean of the two quartiles.
Trimean
the weighted arithmetic mean of the median and two quartiles.
Winsorized mean
an arithmetic mean in which extreme values are replaced by values closer to the median.
Any of the above may be applied to each dimension of multi-dimensional data, but the results may not be invariant to rotations of the multi-dimensional space. In addition, there are the
Geometric median
which minimizes the sum of distances to the data points. This is the same as the median when applied to one-dimensional data, but it is not the same as taking the median of each dimension independently. It is not invariant to different rescaling of the different dimensions.
Quadratic mean (often known as the root mean square)
useful in engineering, but not often used in statistics. This is because it is not a good indicator of the center of the distribution when the distribution includes negative values.
Simplicial depth
the probability that a randomly chosen simplex with vertices from the given distribution will contain the given center
Tukey median
a point with the property that every halfspace containing it also contains many sample points

https://en.wikipedia.org/wiki/Central_tendency

댓글

이 블로그의 인기 게시물

공부: Multiple View Geometry (3)Cont.

Multiple View Geometry Study Note 2. Projective Geometry and Transformations of 2D (Cont.3) 지난번 MVG(3)에서는 2D geometry에서 affine properties의 복원에 대해서 공부했습니다. 이번에는 metric properties의 복원에 대해 공부할 것 입니다. 지난 공부에서 배웠듯이 metric properties에는 angle, length ratio가 있습니다. 이 성분들을 복원하기 위해 우리는 conic dual to circular points라는 개념을 사용합니다. 그럼 circular points부터 시작하겠습니다. WIKI : circular points at infinity? absolute points라고도 불리는 circular points는 similarity transform에 불변하는 점입니다. I,J로 표시하는데 복소수를 사용하는 저런 좌표를 canonical coordinates라고 하고 I와J는 서로 켤레 복소수 임을 알 수 있습니다. 이 두 점이 similarity transform에 불변하는 것은 왼쪽 슬라이드 두번째 식을 보면 알 수 있습니다. 변환 결과 homogeneous 좌표 모든부분에 같은 실수가 곱해지므로, 결과적으로 similarity transform에 불변함을 증명할 수 있습니다. 'circular points at infinity lie on the complexification of every real circle.' 코닉이 원이 되려면 코닉 기본식에서 a=c, b=0을 만족해합니다. complexification(infinity와 관련?)이기 때문에 x3=0인 것 같습니다. 그럼 결국 오른쪽의 코닉 식에서 만족하는 점은 circular points at infinity인 I와 J 입니다. 또한 I와 J를 외적하면 (0,0,i)인 복소수 곱의 line

공부: Multiple View Geometry (1)

Multiple View Geometry Study Note 1. Introduction 연구실에서 MVG 세미나를 진행하여, 참석하게 되었다. 블로그를 시작하면서 내 공부를 정리하는 공간으로 활용해 보고 싶었는데 이번 기회에 제대로 시작하려고 한다. 그림 1. 다시점에서 3D 객체의 사영(projection) 위 그림 1.을 인식하는 것 부터 관련 공부가 펼쳐진다. 실세계의 3D 물체가 카메라 등의 2D 영상으로 매핑되는 것, 관련된 카메라 파라미터, 여러 수학적 설명 방법들을 이해한다. 그리고 더 나아가서 공학적으로 사용한다. 3D가 2D로 매핑되는 것과 반대로, 2D 영상과 시점의 정보를 사용하여 3D 객체를 재현할 수도 있을 것이다. 3D reconstruction 연구에는 다양한 접근 방법이 있다. 하지만 모든 방법에서 가장 기본이 되는 것은 MVG인 것 같다. 관련된 영상들을 몇개 찾아보니 재미있을 것 같지만 굉장히 어렵다고 한다. 앞으로 공부가 기대된다.   3D models from 2D video - automatically Researchers of Computer Vision and Geometry lab Transforming a 2D image into 3D Researchers of Carnegie Mellon University Mathematical  : 3D 컴퓨터 비전 위한 기하학 Seminar study :   D. Kim, MVG Seminar, 2012 winter @IPIS\ Reference book : "Multiple View Geometry in Computer Vision" by Richard Hartley Multiple View Geometry in Computer Vision Richard Hartley |   Cambridge University Press |  2004.02.01  |  672p  |

공부: Multiple View Geometry (3)

Multiple View Geometry Study Note 2. Projective Geometry and Transformations of 2D (Cont.2) 첫번째로 맡게된 발표에서 다룬 내용은 Projective transformation 된 영상에서, 원영상의 Affine properties와 Meric properties를 회복시켜서 원영상의 모양을 복원하는 주제입니다.  이전의 개념들을 사용하여 실질적인 목적을 수행하는 내용으로 중요한 내용입니다. 발표준비를 하면서 몇일 밤을 새면서 공부했는데, 공부하면 할 수록 너무 재밌는 내용입니다.  이전에 머릿 속에 대강 있던 이차원 공간상의 여러 기하학적 개념을 구체화 하고,  수학이란 툴을 사용해서 실제 영상에 적용하는 이론을 배웠습니다.  여태 살아오면서 가장 열심히 공부했던 것 같습니다.  그럼, 내가 준비한 발표자료와 간단한 설명을 정리해보겠습니다.  따끈따근한 오늘 발표의 포스팅입니다. 이 발표에서는 Projective Transform된 이차원 영상의 특성과 그것을 복원하는 복원할 때 어떤 접근 방법들이 있는지 알아보겠습니다. Projective Transform은 카메라, 극단적으로 우리 시각에서도 항상 일어나는 개념으로 모두가 잘 알고 있을 것으로 생각됩니다.  이제 시작할 이야기를 이해 하시려면 지난번 MVG(2)의 개념들을 알고 있어야합니다.  영상의 기하학적인 성질은 크게 두가지로 나눌 수 있습니다. 첫번째로 Affine properties는 선의 평행성, 평행선 끼리의 길이 비율 입니다. Affine properties는 line at infinity와 밀접하게 연관하여 결정되는 것으로, line at infinity를 실선으로 매핑시키는 Projective transform 성분중 Hp으로 특성이 왜곡됩니다. 두번째로 Metirc properties는 선과 선 사이의 각도와 선 끼리의 길이비율 입니다.