평균은 통계학뿐만 아니라 기하학이나 해석학에서도 쓰인다. 이러한 맥락에서 통계학에서는 그 목적에 맞는 다양한 평균들이 고안되었다.
표본 평균은 모평균 같은 중심경향치(center tendency)에 대한 추정량으로 자주 쓰인다. 그러나 중심경향치(center tendency)의 다른 추정량이 쓰이기도 한다.
실수값을 갖는 확률 변수X에 대해서, 평균은 X의 기댓값이 된다. 기댓값이 존재하지 않는다면 그 확률 변수에는 평균이 없다.
자료 집합에 대한 평균은 단순히 모든 관측값을 더해서 관측값 개수로 나눈 것이다. 일단 자료 집합의 공통성을 이렇게 설명하기로 하면, 관측값이 어떻게 다른지 설명하는 데는 보통 표준편차를 쓴다. 표준편차는 편차들(deviations)의 제곱합(SS)을 평균한 값의 제곱근이다.
평균은 편차 제곱의 합이 최소가 되는 유일한 값이다. 중심경향치(center tendency)을 평균이 아닌 다른 방식으로 측정하는 경우, 편차 제곱의 합을 구해 보면, 평균을 썼을 때 구한 값보다 크다. 이는 왜 통계 보고서에서 보통 평균과 표준편차를 인용하는지를 설명해 준다.
퍼진 정도에 대한 다른 측도로는 평균 편차가 있다. 이것은 (평균에 대한) 절대 편차를 평균한 것과 같다. 평균 편차는 바깥값에 덜 민감하지만, 자료 집합을 합칠 때 다루기 어렵다.
모든 확률 분포가 평균이나 분산으로만 정의되지는 않는다는 점을 주의할 수 있다. 예를 들면 코시 분포 같은 것이 있다.
데이타에대한 n개의 집합에서 평균을 구하는 다양한 방법을 살펴볼 수 있다. 여기서 사용한 기호는 수학기호표를 참고할 수 있다.
산술평균은 중앙값이나 최빈값과 종종 혼동되곤 한다. 이 평균은 값들이나 분포의 산술적인 평균을 의미하며 기울어진 분포에 대해서는 중앙값이나 최빈값과 보통 다르다. 예를 들어 평균 수입의 경우 적은 수의 사람이 매우 큰 수입을 갖고 따라서 평균 이하의 사람 수가 더 많다. 하지만 중앙값의 경우 정확히 반은 더 큰 수입을 갖고 나머지 반은 더 작은 수입을 갖는다. 최빈값의 경우에는 가장 많이 나타나는 값을 말하므로 수입이 적은 쪽에 가깝다(수입이 적은 사람이 많으므로). 중앙값과 최빈값은 종종 데이터에 대한 직관적인 척도가 된다.
가중 산술 평균은 같은 모집단에서 표본을 서로 다른 개수로 뽑을 때 평균값을 구하려고 쓴다.
가중치 는 부분 표본에 대한 한계(bound)를 나타낸다. 다른 응용에서는 각 표본이 평균에 미치는 영향을 잰다.
절단평균
가끔 너무 큰 값이나 너무 작은 값이 들어있는 등 부정확한 값에 의해 자료가 오염될 수 있다. 이럴 때 절단평균을 사용한다. 이 평균은 데이터에서 가장 큰 값이나 작은 값 쪽을 "잘라내고" 산술평균을 낸 것을 의미한다. 일반적으로 잘라내는 양쪽 범위는 같게 한다. 잘라낸 값의 숫자는 전체 자료 수에 대한 백분율로 표시한다.
사분평균
사분평균은 절단평균의 한 예로, 아래 1/4, 위 1/4을 잘라내고 산술평균을 구한 것을 의미한다.자료들이 정렬되어 있다고 할 때, 사분평균은
이 된다.
함수의 평균
미적분학, 특히 다변수 미적분학에서 함수의 평균은 덜 엄밀하게, 정의역에서 함수값을 평균한 것으로 정의한다.일변수에서 구간 (a,b)에서 정의된 함수 f(x)의 평균은
로 정의한다(평균값 정리 참조). 다변수의 경우 유클리드 공간에 대해 컴팩트한 정의역 U에서 평균은
직관적으로 말하자면, 비가중 평균은 가중치가 모두 같은 가중 평균이라 할 수 있다. 하지만 위에서 가중 평균을 드러나는 가중치를 통해 정의한 것이 아니기 때문에, 가중치가 같다는 것을 다른 방법으로 정의해야 한다. 여기서는 가중치가 같으면 데이터의 순서를 서로 바꾸어도 결과가 변하지 않는다는 것을 이용하여 정의할 것이다.
M이 가중 평균이고 주어진 자료의 임의의 순열에 대해서도 결과가 바뀌지 않으면 M을 비가중 평균이라 한다.
자료에 같은 원소가 여럿 있다고 생각하면, 비가중 평균을 가중 평균으로 바꿀 수 있다. 또한 이 관계는 평균이라는 것이 비가중 평균의 가중치 버전이라는 것을 의미한다. 비가중 평균 과 자연수 가중치 를 생각해 보자. (만일 숫자들이 유리수이면, 최소공통분모를 곱하여 자연수로 만든다.)
그러면 이 가중치에 해당하는 가중 평균 는
.
이 된다.
다른 크기를 가지는 자료들의 평균
만일 평균 이 다른 크기를 가지는 여러 순서쌍에 대해 정의되어 있다면,전체 평균은 각 순서쌍 평균들의 범위 밖으로 벗어날 수 없을 것이다. 정확히 말하자면,
임의의 순서쌍 이 로 분할되었다고 하자. 그러면 이 성립한다. (볼록 껍질(convex hull) 참조)
가평균
가평균(假平均, temporary average)은 평균을 낼 때 많은 데이터를 기준으로 계산을 간편하게 하기 위해 랜덤으로 정의한 평균치이다.