남은 문제 : 36
문제 1258
다음 중 아래의 표가 나타내는 확률질량함수를 가진 확률변수 x의 기댓값 E(x)로 가장 적절한 것은?
보기
1.1
2.1.7
3.2.5
4.10
정답
2
해시
태그
lADsP 완전 정복l 기술통계_3
ODAKPrP5iCQ
00:05
: 통계량에 의한 자료 종류의 두 번째 특성을 나타내는 척도가 산포라고 말씀드렸죠. 산포는 중심은 구했습니다.
00:16
: 전체 자료의 중심은 구했습니다. 근데 전체 자료에서 이 중심을 기준해서 자료가 어떻게 퍼져 있는지
00:26
: 얼마나 자료들이 많이 흩어져 있는지를 나타내주는 그런 통계량이 산포에 대한 통계량인데
00:34
: 산포에 대한 통계량들은 아무래도 자료들의 흩어져있는 정도가 자료의 중심뿐만이 아니라 흩어져 있는 정도를
00:43
: 함께 알려줘야지만 전체 자료에 대한 분포를 정확하게 파악을 할 수 있게 됩니다.
00:50
: 그래서 통계 자료에 있어서 산포 정도를 나타내주는 대표적인, 구체적인 통계량들은
00:59
: 분산이 있고요. 그리고 표준편차도 있고, 범위도 있고, 사분위수도 있고, 그리고 변동계수도 있습니다. 이게 대표적인데요.
01:07
: 특히 분산 같은 경우에 한번 보시면 분산이 가장 자료에 분포의 특성을, 특히나 흩어진 정도를 나타내는
01:18
: 요약 특성치로는 분산을 가장 많이 사용하고 있고요.
01:24
: 그리고 앞으로 통계분석 기법 이후에 나오는 다양한 어떤 통계분석에 있어서도
01:30
: 자료의 분포를 많이 얘기할 텐데 자료의 분포를 얘기할 때 앞에서 평균을 기본적으로 중심 구할 때 쓴다. 그랬었죠.
01:39
: 산포에 대한 특성치를 얘기하는 통계량들도 여러 가지가 있지만 기본적으로 통계학에서는
01:47
: 평균과 함께 분산을 가장 대표적으로 쓰고 있습니다.
01:53
: 이 분산은 variance라고 얘기를 하고요. 분산 같은 경우에는
01:59
: 식 자체를 보시면 알겠지만, 각 자료에 대한 편차. 각각 자료에 대한 편차가 여기거든요.
02:06
: 이게 편차예요. 여기에 평균 구했고, 각 자료에서 평균을 빼면 그걸 편차라고 얘기하는데
02:14
: 편차를 제곱을 하고요. 그걸 전부 다 더한 다음에, 자료의 개수로 이렇게 나눠주게 되면
02:24
: 각 자료 편차 제곱들의 평균을 한 것이기 때문에, 이것을 편차 제곱의 평균. 즉 분산이라고 얘기를 하는 겁니다.
02:32
: 앞에 자료를 가지고 분산을, 공식을 대입해 가지고 이렇게 구한 거 보실 수 있어요.
02:39
: 편차들을 모두 다 제곱한 다음에, 다 더한 다음에, 전체 자료의 수에다가 -1. 14로 나눠주게 되면
02:49
: 490.7이라고 나와지는데. 이거는 거리를 한번 보세요. 평균이 53이었는데요.
02:58
: 15에서 53을 빼도 편차가 이렇게 백 단위로 나올 수 없죠.
03:04
: 이것도 역시 마찬가지 백 단위로 편차는 나오지 않습니다.
03:07
: 그런데 분산을 포함해서 이렇게 백 단위가 돼버립니다. 그러니까 단위 자체가 역시 제곱이 돼버렸다는 겁니다.
03:13
: 단위 자체도 제곱이 돼버렸죠. 그래서 비교를 하시려고 하면 원래 단위대로
03:22
: 단위를 원래의 단위대로 맞춰줄 필요가 있습니다. 그래서 표준편차를 쓰는 겁니다.
03:28
: 표준편차는 standard deviation이라고 얘기하고요. 분산에다가 루트를 씌우게 되면 표준편차를 구하실 수 있죠.
03:38
: 그래서 아까 그 값에다가 루트 씌워서 구하시게 되면 22.152라고 하는. 보세요. 평균적으로 중심에서 얼마나 커져 있느냐 하는
03:47
: 단위가 10단위로 이렇게 같이 맞춰진 그런 흩어져 있는 정도를 표준편차를 통해서 구하실 수 있습니다.
03:57
: 그리고 세 번째로 많이 이용하는 것이 사분위수, 백분위수 하는 분위수인데요. 분위수라고 하는 부분들은
04:08
: 전체 자료에 있어서, 어느 정도 자료들이 퍼져 있느냐 하는 것을 보여주는 하나의 척도가 될 수 있겠는데
04:17
: 이거 같은 경우에는 상대적인 위치를 특정 자료가 전체 중에서 어느 정도 상대적 위치를 하고 있는지를 알려주는
04:28
: 그런 통계량이라고 보실 수 있습니다. 특히 백분위수 같은 경우에는 자료를 전체 크기 순서로 정렬을 해서 백 등분을 했을 때
04:38
: 각각 자료가 백 등분 중에서 어느 위치에 있는지를 보여주는 것이 바로 백분위수라고 한다면
04:46
: 사분위수 같은 경우에는 백분위수 중에서 25번째, 그리고 50번째, 75번째 하는 것을 그걸 가지고
04:59
: 1사분위수. 25번째 위치에 있으면 1사분위수, 50번째 위치에 있으면 2사분위수, 그리고 75번째 위치에 있으면 3사분위수라고 해서
05:12
: 기호로는 q1, q2, q3 이렇게 나타내는 겁니다.
05:18
: 그리고 이 사분위수의 범위라고 하는 것들이 많이 쓰이는데 이 범위는
05:27
: q3에서 q1을 뺀 거죠. 그래서 전체에 어떤 크기 순서로 했을 때, 75번째 순서에 있는 자료에서 25번째 있는 자료 순서를 빼 주게 되면
05:41
: 그게 q3에서 q1을 뺀 사분위수의 범위가 되는 겁니다. 앞에 자료를 가지고 구해 보시면 이렇게 사분위수의 범위
05:49
: 그리고 각각의 1사분위수, 2사분위수, 3사분위수에 대한 것들도 찾아낼 수 있습니다.
05:57
: 그리고 여기에 또 보시면 변동계수라고 하는 것을 구할 수 있는데요. 변동계수 같은 경우에는 2개의 자료 집단이 있고요.
06:06
: 2개의 자료가 있는데 그 자료들의 표준편차를 직접 비교한다는 것은 불가능한 경우들이 있습니다.
06:14
: 왜냐하면 서로 간의 측정 단위가 다른 2개의 자료라고 한다면 측정 단위가 기본적으로 다르기 때문에
06:22
: 그걸 가지고 표준 편차를 가지고 비교한다. 라는 것이 어렵거든요.
06:28
: 그런 경우에는 표준편차나 분산 같은 거. 절대적인 수치를 쓰는 것이 아니라 평균을 고려해서
06:37
: 변동의 어떤 상대적 수치를 사용합니다. 그걸 변동계수라고 얘기하는 거죠.
06:43
: 서로 자료들 간의 퍼져 있는 정도를 비교를 하려고 할 때, 직접적으로 서로 다른 단위의 자료들을 이용할 수 없기 때문에
06:51
: 그래서 평균이라고 하는 것을 평균을 고려한 그런 변동계수라고 하는 걸 쓰는 거고요.
07:00
: 그래서 이걸 가지고 다른 이름으로 뭐라 그러냐면, 상대적 표준편차라고 얘기합니다. 그래서 여기 보세요.
07:06
: 아까 표준편차 구했었죠. 그걸 가지고 평균으로 나눠서 구하는 변동계수를 구하시고요.
07:14
: 그러면 이런 변동계수들은 서로 다른 어떤 단위의 자료들이 여러 개 있다. 하더라도
07:20
: 이거에 대한 v1과 v2를 구한 다음에 두 자료 간에 비교를 하실 수 있게 되는 겁니다.
07:28
: 평균의 표준오차 같은 것도 나중에 통계학에서 특히나 가설검정, 검정통계량 이런 거 얘기할 때 많이 쓰는데
07:36
: 추론통계 할 때 많이 쓰게 되는데, 그때 한 번 더 확인해 보시면 되겠습니다.
20:00
:
03:57
~
00:00
1
2
3
검수 상태 :
통과
통과
불통
최종불통
lADsP 완전 정복l 기술통계_3
ODAKPrP5iCQ
00:05
: 통계량에 의한 자료 종류의 두 번째 특성을 나타내는 척도가 산포라고 말씀드렸죠. 산포는 중심은 구했습니다.
00:16
: 전체 자료의 중심은 구했습니다. 근데 전체 자료에서 이 중심을 기준해서 자료가 어떻게 퍼져 있는지
00:26
: 얼마나 자료들이 많이 흩어져 있는지를 나타내주는 그런 통계량이 산포에 대한 통계량인데
00:34
: 산포에 대한 통계량들은 아무래도 자료들의 흩어져있는 정도가 자료의 중심뿐만이 아니라 흩어져 있는 정도를
00:43
: 함께 알려줘야지만 전체 자료에 대한 분포를 정확하게 파악을 할 수 있게 됩니다.
00:50
: 그래서 통계 자료에 있어서 산포 정도를 나타내주는 대표적인, 구체적인 통계량들은
00:59
: 분산이 있고요. 그리고 표준편차도 있고, 범위도 있고, 사분위수도 있고, 그리고 변동계수도 있습니다. 이게 대표적인데요.
01:07
: 특히 분산 같은 경우에 한번 보시면 분산이 가장 자료에 분포의 특성을, 특히나 흩어진 정도를 나타내는
01:18
: 요약 특성치로는 분산을 가장 많이 사용하고 있고요.
01:24
: 그리고 앞으로 통계분석 기법 이후에 나오는 다양한 어떤 통계분석에 있어서도
01:30
: 자료의 분포를 많이 얘기할 텐데 자료의 분포를 얘기할 때 앞에서 평균을 기본적으로 중심 구할 때 쓴다. 그랬었죠.
01:39
: 산포에 대한 특성치를 얘기하는 통계량들도 여러 가지가 있지만 기본적으로 통계학에서는
01:47
: 평균과 함께 분산을 가장 대표적으로 쓰고 있습니다.
01:53
: 이 분산은 variance라고 얘기를 하고요. 분산 같은 경우에는
01:59
: 식 자체를 보시면 알겠지만, 각 자료에 대한 편차. 각각 자료에 대한 편차가 여기거든요.
02:06
: 이게 편차예요. 여기에 평균 구했고, 각 자료에서 평균을 빼면 그걸 편차라고 얘기하는데
02:14
: 편차를 제곱을 하고요. 그걸 전부 다 더한 다음에, 자료의 개수로 이렇게 나눠주게 되면
02:24
: 각 자료 편차 제곱들의 평균을 한 것이기 때문에, 이것을 편차 제곱의 평균. 즉 분산이라고 얘기를 하는 겁니다.
02:32
: 앞에 자료를 가지고 분산을, 공식을 대입해 가지고 이렇게 구한 거 보실 수 있어요.
02:39
: 편차들을 모두 다 제곱한 다음에, 다 더한 다음에, 전체 자료의 수에다가 -1. 14로 나눠주게 되면
02:49
: 490.7이라고 나와지는데. 이거는 거리를 한번 보세요. 평균이 53이었는데요.
02:58
: 15에서 53을 빼도 편차가 이렇게 백 단위로 나올 수 없죠.
03:04
: 이것도 역시 마찬가지 백 단위로 편차는 나오지 않습니다.
03:07
: 그런데 분산을 포함해서 이렇게 백 단위가 돼버립니다. 그러니까 단위 자체가 역시 제곱이 돼버렸다는 겁니다.
03:13
: 단위 자체도 제곱이 돼버렸죠. 그래서 비교를 하시려고 하면 원래 단위대로
03:22
: 단위를 원래의 단위대로 맞춰줄 필요가 있습니다. 그래서 표준편차를 쓰는 겁니다.
03:28
: 표준편차는 standard deviation이라고 얘기하고요. 분산에다가 루트를 씌우게 되면 표준편차를 구하실 수 있죠.
03:38
: 그래서 아까 그 값에다가 루트 씌워서 구하시게 되면 22.152라고 하는. 보세요. 평균적으로 중심에서 얼마나 커져 있느냐 하는
03:47
: 단위가 10단위로 이렇게 같이 맞춰진 그런 흩어져 있는 정도를 표준편차를 통해서 구하실 수 있습니다.
03:57
: 그리고 세 번째로 많이 이용하는 것이 사분위수, 백분위수 하는 분위수인데요. 분위수라고 하는 부분들은
04:08
: 전체 자료에 있어서, 어느 정도 자료들이 퍼져 있느냐 하는 것을 보여주는 하나의 척도가 될 수 있겠는데
04:17
: 이거 같은 경우에는 상대적인 위치를 특정 자료가 전체 중에서 어느 정도 상대적 위치를 하고 있는지를 알려주는
04:28
: 그런 통계량이라고 보실 수 있습니다. 특히 백분위수 같은 경우에는 자료를 전체 크기 순서로 정렬을 해서 백 등분을 했을 때
04:38
: 각각 자료가 백 등분 중에서 어느 위치에 있는지를 보여주는 것이 바로 백분위수라고 한다면
04:46
: 사분위수 같은 경우에는 백분위수 중에서 25번째, 그리고 50번째, 75번째 하는 것을 그걸 가지고
04:59
: 1사분위수. 25번째 위치에 있으면 1사분위수, 50번째 위치에 있으면 2사분위수, 그리고 75번째 위치에 있으면 3사분위수라고 해서
05:12
: 기호로는 q1, q2, q3 이렇게 나타내는 겁니다.
05:18
: 그리고 이 사분위수의 범위라고 하는 것들이 많이 쓰이는데 이 범위는
05:27
: q3에서 q1을 뺀 거죠. 그래서 전체에 어떤 크기 순서로 했을 때, 75번째 순서에 있는 자료에서 25번째 있는 자료 순서를 빼 주게 되면
05:41
: 그게 q3에서 q1을 뺀 사분위수의 범위가 되는 겁니다. 앞에 자료를 가지고 구해 보시면 이렇게 사분위수의 범위
05:49
: 그리고 각각의 1사분위수, 2사분위수, 3사분위수에 대한 것들도 찾아낼 수 있습니다.
05:57
: 그리고 여기에 또 보시면 변동계수라고 하는 것을 구할 수 있는데요. 변동계수 같은 경우에는 2개의 자료 집단이 있고요.
06:06
: 2개의 자료가 있는데 그 자료들의 표준편차를 직접 비교한다는 것은 불가능한 경우들이 있습니다.
06:14
: 왜냐하면 서로 간의 측정 단위가 다른 2개의 자료라고 한다면 측정 단위가 기본적으로 다르기 때문에
06:22
: 그걸 가지고 표준 편차를 가지고 비교한다. 라는 것이 어렵거든요.
06:28
: 그런 경우에는 표준편차나 분산 같은 거. 절대적인 수치를 쓰는 것이 아니라 평균을 고려해서
06:37
: 변동의 어떤 상대적 수치를 사용합니다. 그걸 변동계수라고 얘기하는 거죠.
06:43
: 서로 자료들 간의 퍼져 있는 정도를 비교를 하려고 할 때, 직접적으로 서로 다른 단위의 자료들을 이용할 수 없기 때문에
06:51
: 그래서 평균이라고 하는 것을 평균을 고려한 그런 변동계수라고 하는 걸 쓰는 거고요.
07:00
: 그래서 이걸 가지고 다른 이름으로 뭐라 그러냐면, 상대적 표준편차라고 얘기합니다. 그래서 여기 보세요.
07:06
: 아까 표준편차 구했었죠. 그걸 가지고 평균으로 나눠서 구하는 변동계수를 구하시고요.
07:14
: 그러면 이런 변동계수들은 서로 다른 어떤 단위의 자료들이 여러 개 있다. 하더라도
07:20
: 이거에 대한 v1과 v2를 구한 다음에 두 자료 간에 비교를 하실 수 있게 되는 겁니다.
07:28
: 평균의 표준오차 같은 것도 나중에 통계학에서 특히나 가설검정, 검정통계량 이런 거 얘기할 때 많이 쓰는데
07:36
: 추론통계 할 때 많이 쓰게 되는데, 그때 한 번 더 확인해 보시면 되겠습니다.
20:00
:
00:05
: 통계량에 의한 자료 종류의 두 번째 특성을 나타내는 척도가 산포라고 말씀드렸죠. 산포는 중심은 구했습니다.
00:16
: 전체 자료의 중심은 구했습니다. 근데 전체 자료에서 이 중심을 기준해서 자료가 어떻게 퍼져 있는지
00:26
: 얼마나 자료들이 많이 흩어져 있는지를 나타내주는 그런 통계량이 산포에 대한 통계량인데
00:34
: 산포에 대한 통계량들은 아무래도 자료들의 흩어져있는 정도가 자료의 중심뿐만이 아니라 흩어져 있는 정도를
00:43
: 함께 알려줘야지만 전체 자료에 대한 분포를 정확하게 파악을 할 수 있게 됩니다.
00:50
: 그래서 통계 자료에 있어서 산포 정도를 나타내주는 대표적인, 구체적인 통계량들은
00:59
: 분산이 있고요. 그리고 표준편차도 있고, 범위도 있고, 사분위수도 있고, 그리고 변동계수도 있습니다. 이게 대표적인데요.
01:07
: 특히 분산 같은 경우에 한번 보시면 분산이 가장 자료에 분포의 특성을, 특히나 흩어진 정도를 나타내는
01:18
: 요약 특성치로는 분산을 가장 많이 사용하고 있고요.
01:24
: 그리고 앞으로 통계분석 기법 이후에 나오는 다양한 어떤 통계분석에 있어서도
01:30
: 자료의 분포를 많이 얘기할 텐데 자료의 분포를 얘기할 때 앞에서 평균을 기본적으로 중심 구할 때 쓴다. 그랬었죠.
01:39
: 산포에 대한 특성치를 얘기하는 통계량들도 여러 가지가 있지만 기본적으로 통계학에서는
01:47
: 평균과 함께 분산을 가장 대표적으로 쓰고 있습니다.
01:53
: 이 분산은 variance라고 얘기를 하고요. 분산 같은 경우에는
01:59
: 식 자체를 보시면 알겠지만, 각 자료에 대한 편차. 각각 자료에 대한 편차가 여기거든요.
02:06
: 이게 편차예요. 여기에 평균 구했고, 각 자료에서 평균을 빼면 그걸 편차라고 얘기하는데
02:14
: 편차를 제곱을 하고요. 그걸 전부 다 더한 다음에, 자료의 개수로 이렇게 나눠주게 되면
02:24
: 각 자료 편차 제곱들의 평균을 한 것이기 때문에, 이것을 편차 제곱의 평균. 즉 분산이라고 얘기를 하는 겁니다.
02:32
: 앞에 자료를 가지고 분산을, 공식을 대입해 가지고 이렇게 구한 거 보실 수 있어요.
02:39
: 편차들을 모두 다 제곱한 다음에, 다 더한 다음에, 전체 자료의 수에다가 -1. 14로 나눠주게 되면
02:49
: 490.7이라고 나와지는데. 이거는 거리를 한번 보세요. 평균이 53이었는데요.
02:58
: 15에서 53을 빼도 편차가 이렇게 백 단위로 나올 수 없죠.
03:04
: 이것도 역시 마찬가지 백 단위로 편차는 나오지 않습니다.
03:07
: 그런데 분산을 포함해서 이렇게 백 단위가 돼버립니다. 그러니까 단위 자체가 역시 제곱이 돼버렸다는 겁니다.
03:13
: 단위 자체도 제곱이 돼버렸죠. 그래서 비교를 하시려고 하면 원래 단위대로
03:22
: 단위를 원래의 단위대로 맞춰줄 필요가 있습니다. 그래서 표준편차를 쓰는 겁니다.
03:28
: 표준편차는 standard deviation이라고 얘기하고요. 분산에다가 루트를 씌우게 되면 표준편차를 구하실 수 있죠.
03:38
: 그래서 아까 그 값에다가 루트 씌워서 구하시게 되면 22.152라고 하는. 보세요. 평균적으로 중심에서 얼마나 커져 있느냐 하는
03:47
: 단위가 10단위로 이렇게 같이 맞춰진 그런 흩어져 있는 정도를 표준편차를 통해서 구하실 수 있습니다.
03:57
: 그리고 세 번째로 많이 이용하는 것이 사분위수, 백분위수 하는 분위수인데요. 분위수라고 하는 부분들은
04:08
: 전체 자료에 있어서, 어느 정도 자료들이 퍼져 있느냐 하는 것을 보여주는 하나의 척도가 될 수 있겠는데
04:17
: 이거 같은 경우에는 상대적인 위치를 특정 자료가 전체 중에서 어느 정도 상대적 위치를 하고 있는지를 알려주는
04:28
: 그런 통계량이라고 보실 수 있습니다. 특히 백분위수 같은 경우에는 자료를 전체 크기 순서로 정렬을 해서 백 등분을 했을 때
04:38
: 각각 자료가 백 등분 중에서 어느 위치에 있는지를 보여주는 것이 바로 백분위수라고 한다면
04:46
: 사분위수 같은 경우에는 백분위수 중에서 25번째, 그리고 50번째, 75번째 하는 것을 그걸 가지고
04:59
: 1사분위수. 25번째 위치에 있으면 1사분위수, 50번째 위치에 있으면 2사분위수, 그리고 75번째 위치에 있으면 3사분위수라고 해서
05:12
: 기호로는 q1, q2, q3 이렇게 나타내는 겁니다.
05:18
: 그리고 이 사분위수의 범위라고 하는 것들이 많이 쓰이는데 이 범위는
05:27
: q3에서 q1을 뺀 거죠. 그래서 전체에 어떤 크기 순서로 했을 때, 75번째 순서에 있는 자료에서 25번째 있는 자료 순서를 빼 주게 되면
05:41
: 그게 q3에서 q1을 뺀 사분위수의 범위가 되는 겁니다. 앞에 자료를 가지고 구해 보시면 이렇게 사분위수의 범위
05:49
: 그리고 각각의 1사분위수, 2사분위수, 3사분위수에 대한 것들도 찾아낼 수 있습니다.
05:57
: 그리고 여기에 또 보시면 변동계수라고 하는 것을 구할 수 있는데요. 변동계수 같은 경우에는 2개의 자료 집단이 있고요.
06:06
: 2개의 자료가 있는데 그 자료들의 표준편차를 직접 비교한다는 것은 불가능한 경우들이 있습니다.
06:14
: 왜냐하면 서로 간의 측정 단위가 다른 2개의 자료라고 한다면 측정 단위가 기본적으로 다르기 때문에
06:22
: 그걸 가지고 표준 편차를 가지고 비교한다. 라는 것이 어렵거든요.
06:28
: 그런 경우에는 표준편차나 분산 같은 거. 절대적인 수치를 쓰는 것이 아니라 평균을 고려해서
06:37
: 변동의 어떤 상대적 수치를 사용합니다. 그걸 변동계수라고 얘기하는 거죠.
06:43
: 서로 자료들 간의 퍼져 있는 정도를 비교를 하려고 할 때, 직접적으로 서로 다른 단위의 자료들을 이용할 수 없기 때문에
06:51
: 그래서 평균이라고 하는 것을 평균을 고려한 그런 변동계수라고 하는 걸 쓰는 거고요.
07:00
: 그래서 이걸 가지고 다른 이름으로 뭐라 그러냐면, 상대적 표준편차라고 얘기합니다. 그래서 여기 보세요.
07:06
: 아까 표준편차 구했었죠. 그걸 가지고 평균으로 나눠서 구하는 변동계수를 구하시고요.
07:14
: 그러면 이런 변동계수들은 서로 다른 어떤 단위의 자료들이 여러 개 있다. 하더라도
07:20
: 이거에 대한 v1과 v2를 구한 다음에 두 자료 간에 비교를 하실 수 있게 되는 겁니다.
07:28
: 평균의 표준오차 같은 것도 나중에 통계학에서 특히나 가설검정, 검정통계량 이런 거 얘기할 때 많이 쓰는데
07:36
: 추론통계 할 때 많이 쓰게 되는데, 그때 한 번 더 확인해 보시면 되겠습니다.
20:00
:
01:53
~
02:49
1
2
3
검수 상태 :
불통
통과
불통
최종불통
lADsP 완전 정복l 기술통계_3
ODAKPrP5iCQ
00:05
: 통계량에 의한 자료 종류의 두 번째 특성을 나타내는 척도가 산포라고 말씀드렸죠. 산포는 중심은 구했습니다.
00:16
: 전체 자료의 중심은 구했습니다. 근데 전체 자료에서 이 중심을 기준해서 자료가 어떻게 퍼져 있는지
00:26
: 얼마나 자료들이 많이 흩어져 있는지를 나타내주는 그런 통계량이 산포에 대한 통계량인데
00:34
: 산포에 대한 통계량들은 아무래도 자료들의 흩어져있는 정도가 자료의 중심뿐만이 아니라 흩어져 있는 정도를
00:43
: 함께 알려줘야지만 전체 자료에 대한 분포를 정확하게 파악을 할 수 있게 됩니다.
00:50
: 그래서 통계 자료에 있어서 산포 정도를 나타내주는 대표적인, 구체적인 통계량들은
00:59
: 분산이 있고요. 그리고 표준편차도 있고, 범위도 있고, 사분위수도 있고, 그리고 변동계수도 있습니다. 이게 대표적인데요.
01:07
: 특히 분산 같은 경우에 한번 보시면 분산이 가장 자료에 분포의 특성을, 특히나 흩어진 정도를 나타내는
01:18
: 요약 특성치로는 분산을 가장 많이 사용하고 있고요.
01:24
: 그리고 앞으로 통계분석 기법 이후에 나오는 다양한 어떤 통계분석에 있어서도
01:30
: 자료의 분포를 많이 얘기할 텐데 자료의 분포를 얘기할 때 앞에서 평균을 기본적으로 중심 구할 때 쓴다. 그랬었죠.
01:39
: 산포에 대한 특성치를 얘기하는 통계량들도 여러 가지가 있지만 기본적으로 통계학에서는
01:47
: 평균과 함께 분산을 가장 대표적으로 쓰고 있습니다.
01:53
: 이 분산은 variance라고 얘기를 하고요. 분산 같은 경우에는
01:59
: 식 자체를 보시면 알겠지만, 각 자료에 대한 편차. 각각 자료에 대한 편차가 여기거든요.
02:06
: 이게 편차예요. 여기에 평균 구했고, 각 자료에서 평균을 빼면 그걸 편차라고 얘기하는데
02:14
: 편차를 제곱을 하고요. 그걸 전부 다 더한 다음에, 자료의 개수로 이렇게 나눠주게 되면
02:24
: 각 자료 편차 제곱들의 평균을 한 것이기 때문에, 이것을 편차 제곱의 평균. 즉 분산이라고 얘기를 하는 겁니다.
02:32
: 앞에 자료를 가지고 분산을, 공식을 대입해 가지고 이렇게 구한 거 보실 수 있어요.
02:39
: 편차들을 모두 다 제곱한 다음에, 다 더한 다음에, 전체 자료의 수에다가 -1. 14로 나눠주게 되면
02:49
: 490.7이라고 나와지는데. 이거는 거리를 한번 보세요. 평균이 53이었는데요.
02:58
: 15에서 53을 빼도 편차가 이렇게 백 단위로 나올 수 없죠.
03:04
: 이것도 역시 마찬가지 백 단위로 편차는 나오지 않습니다.
03:07
: 그런데 분산을 포함해서 이렇게 백 단위가 돼버립니다. 그러니까 단위 자체가 역시 제곱이 돼버렸다는 겁니다.
03:13
: 단위 자체도 제곱이 돼버렸죠. 그래서 비교를 하시려고 하면 원래 단위대로
03:22
: 단위를 원래의 단위대로 맞춰줄 필요가 있습니다. 그래서 표준편차를 쓰는 겁니다.
03:28
: 표준편차는 standard deviation이라고 얘기하고요. 분산에다가 루트를 씌우게 되면 표준편차를 구하실 수 있죠.
03:38
: 그래서 아까 그 값에다가 루트 씌워서 구하시게 되면 22.152라고 하는. 보세요. 평균적으로 중심에서 얼마나 커져 있느냐 하는
03:47
: 단위가 10단위로 이렇게 같이 맞춰진 그런 흩어져 있는 정도를 표준편차를 통해서 구하실 수 있습니다.
03:57
: 그리고 세 번째로 많이 이용하는 것이 사분위수, 백분위수 하는 분위수인데요. 분위수라고 하는 부분들은
04:08
: 전체 자료에 있어서, 어느 정도 자료들이 퍼져 있느냐 하는 것을 보여주는 하나의 척도가 될 수 있겠는데
04:17
: 이거 같은 경우에는 상대적인 위치를 특정 자료가 전체 중에서 어느 정도 상대적 위치를 하고 있는지를 알려주는
04:28
: 그런 통계량이라고 보실 수 있습니다. 특히 백분위수 같은 경우에는 자료를 전체 크기 순서로 정렬을 해서 백 등분을 했을 때
04:38
: 각각 자료가 백 등분 중에서 어느 위치에 있는지를 보여주는 것이 바로 백분위수라고 한다면
04:46
: 사분위수 같은 경우에는 백분위수 중에서 25번째, 그리고 50번째, 75번째 하는 것을 그걸 가지고
04:59
: 1사분위수. 25번째 위치에 있으면 1사분위수, 50번째 위치에 있으면 2사분위수, 그리고 75번째 위치에 있으면 3사분위수라고 해서
05:12
: 기호로는 q1, q2, q3 이렇게 나타내는 겁니다.
05:18
: 그리고 이 사분위수의 범위라고 하는 것들이 많이 쓰이는데 이 범위는
05:27
: q3에서 q1을 뺀 거죠. 그래서 전체에 어떤 크기 순서로 했을 때, 75번째 순서에 있는 자료에서 25번째 있는 자료 순서를 빼 주게 되면
05:41
: 그게 q3에서 q1을 뺀 사분위수의 범위가 되는 겁니다. 앞에 자료를 가지고 구해 보시면 이렇게 사분위수의 범위
05:49
: 그리고 각각의 1사분위수, 2사분위수, 3사분위수에 대한 것들도 찾아낼 수 있습니다.
05:57
: 그리고 여기에 또 보시면 변동계수라고 하는 것을 구할 수 있는데요. 변동계수 같은 경우에는 2개의 자료 집단이 있고요.
06:06
: 2개의 자료가 있는데 그 자료들의 표준편차를 직접 비교한다는 것은 불가능한 경우들이 있습니다.
06:14
: 왜냐하면 서로 간의 측정 단위가 다른 2개의 자료라고 한다면 측정 단위가 기본적으로 다르기 때문에
06:22
: 그걸 가지고 표준 편차를 가지고 비교한다. 라는 것이 어렵거든요.
06:28
: 그런 경우에는 표준편차나 분산 같은 거. 절대적인 수치를 쓰는 것이 아니라 평균을 고려해서
06:37
: 변동의 어떤 상대적 수치를 사용합니다. 그걸 변동계수라고 얘기하는 거죠.
06:43
: 서로 자료들 간의 퍼져 있는 정도를 비교를 하려고 할 때, 직접적으로 서로 다른 단위의 자료들을 이용할 수 없기 때문에
06:51
: 그래서 평균이라고 하는 것을 평균을 고려한 그런 변동계수라고 하는 걸 쓰는 거고요.
07:00
: 그래서 이걸 가지고 다른 이름으로 뭐라 그러냐면, 상대적 표준편차라고 얘기합니다. 그래서 여기 보세요.
07:06
: 아까 표준편차 구했었죠. 그걸 가지고 평균으로 나눠서 구하는 변동계수를 구하시고요.
07:14
: 그러면 이런 변동계수들은 서로 다른 어떤 단위의 자료들이 여러 개 있다. 하더라도
07:20
: 이거에 대한 v1과 v2를 구한 다음에 두 자료 간에 비교를 하실 수 있게 되는 겁니다.
07:28
: 평균의 표준오차 같은 것도 나중에 통계학에서 특히나 가설검정, 검정통계량 이런 거 얘기할 때 많이 쓰는데
07:36
: 추론통계 할 때 많이 쓰게 되는데, 그때 한 번 더 확인해 보시면 되겠습니다.
20:00
:
00:05
: 통계량에 의한 자료 종류의 두 번째 특성을 나타내는 척도가 산포라고 말씀드렸죠. 산포는 중심은 구했습니다.
00:16
: 전체 자료의 중심은 구했습니다. 근데 전체 자료에서 이 중심을 기준해서 자료가 어떻게 퍼져 있는지
00:26
: 얼마나 자료들이 많이 흩어져 있는지를 나타내주는 그런 통계량이 산포에 대한 통계량인데
00:34
: 산포에 대한 통계량들은 아무래도 자료들의 흩어져있는 정도가 자료의 중심뿐만이 아니라 흩어져 있는 정도를
00:43
: 함께 알려줘야지만 전체 자료에 대한 분포를 정확하게 파악을 할 수 있게 됩니다.
00:50
: 그래서 통계 자료에 있어서 산포 정도를 나타내주는 대표적인, 구체적인 통계량들은
00:59
: 분산이 있고요. 그리고 표준편차도 있고, 범위도 있고, 사분위수도 있고, 그리고 변동계수도 있습니다. 이게 대표적인데요.
01:07
: 특히 분산 같은 경우에 한번 보시면 분산이 가장 자료에 분포의 특성을, 특히나 흩어진 정도를 나타내는
01:18
: 요약 특성치로는 분산을 가장 많이 사용하고 있고요.
01:24
: 그리고 앞으로 통계분석 기법 이후에 나오는 다양한 어떤 통계분석에 있어서도
01:30
: 자료의 분포를 많이 얘기할 텐데 자료의 분포를 얘기할 때 앞에서 평균을 기본적으로 중심 구할 때 쓴다. 그랬었죠.
01:39
: 산포에 대한 특성치를 얘기하는 통계량들도 여러 가지가 있지만 기본적으로 통계학에서는
01:47
: 평균과 함께 분산을 가장 대표적으로 쓰고 있습니다.
01:53
: 이 분산은 variance라고 얘기를 하고요. 분산 같은 경우에는
01:59
: 식 자체를 보시면 알겠지만, 각 자료에 대한 편차. 각각 자료에 대한 편차가 여기거든요.
02:06
: 이게 편차예요. 여기에 평균 구했고, 각 자료에서 평균을 빼면 그걸 편차라고 얘기하는데
02:14
: 편차를 제곱을 하고요. 그걸 전부 다 더한 다음에, 자료의 개수로 이렇게 나눠주게 되면
02:24
: 각 자료 편차 제곱들의 평균을 한 것이기 때문에, 이것을 편차 제곱의 평균. 즉 분산이라고 얘기를 하는 겁니다.
02:32
: 앞에 자료를 가지고 분산을, 공식을 대입해 가지고 이렇게 구한 거 보실 수 있어요.
02:39
: 편차들을 모두 다 제곱한 다음에, 다 더한 다음에, 전체 자료의 수에다가 -1. 14로 나눠주게 되면
02:49
: 490.7이라고 나와지는데. 이거는 거리를 한번 보세요. 평균이 53이었는데요.
02:58
: 15에서 53을 빼도 편차가 이렇게 백 단위로 나올 수 없죠.
03:04
: 이것도 역시 마찬가지 백 단위로 편차는 나오지 않습니다.
03:07
: 그런데 분산을 포함해서 이렇게 백 단위가 돼버립니다. 그러니까 단위 자체가 역시 제곱이 돼버렸다는 겁니다.
03:13
: 단위 자체도 제곱이 돼버렸죠. 그래서 비교를 하시려고 하면 원래 단위대로
03:22
: 단위를 원래의 단위대로 맞춰줄 필요가 있습니다. 그래서 표준편차를 쓰는 겁니다.
03:28
: 표준편차는 standard deviation이라고 얘기하고요. 분산에다가 루트를 씌우게 되면 표준편차를 구하실 수 있죠.
03:38
: 그래서 아까 그 값에다가 루트 씌워서 구하시게 되면 22.152라고 하는. 보세요. 평균적으로 중심에서 얼마나 커져 있느냐 하는
03:47
: 단위가 10단위로 이렇게 같이 맞춰진 그런 흩어져 있는 정도를 표준편차를 통해서 구하실 수 있습니다.
03:57
: 그리고 세 번째로 많이 이용하는 것이 사분위수, 백분위수 하는 분위수인데요. 분위수라고 하는 부분들은
04:08
: 전체 자료에 있어서, 어느 정도 자료들이 퍼져 있느냐 하는 것을 보여주는 하나의 척도가 될 수 있겠는데
04:17
: 이거 같은 경우에는 상대적인 위치를 특정 자료가 전체 중에서 어느 정도 상대적 위치를 하고 있는지를 알려주는
04:28
: 그런 통계량이라고 보실 수 있습니다. 특히 백분위수 같은 경우에는 자료를 전체 크기 순서로 정렬을 해서 백 등분을 했을 때
04:38
: 각각 자료가 백 등분 중에서 어느 위치에 있는지를 보여주는 것이 바로 백분위수라고 한다면
04:46
: 사분위수 같은 경우에는 백분위수 중에서 25번째, 그리고 50번째, 75번째 하는 것을 그걸 가지고
04:59
: 1사분위수. 25번째 위치에 있으면 1사분위수, 50번째 위치에 있으면 2사분위수, 그리고 75번째 위치에 있으면 3사분위수라고 해서
05:12
: 기호로는 q1, q2, q3 이렇게 나타내는 겁니다.
05:18
: 그리고 이 사분위수의 범위라고 하는 것들이 많이 쓰이는데 이 범위는
05:27
: q3에서 q1을 뺀 거죠. 그래서 전체에 어떤 크기 순서로 했을 때, 75번째 순서에 있는 자료에서 25번째 있는 자료 순서를 빼 주게 되면
05:41
: 그게 q3에서 q1을 뺀 사분위수의 범위가 되는 겁니다. 앞에 자료를 가지고 구해 보시면 이렇게 사분위수의 범위
05:49
: 그리고 각각의 1사분위수, 2사분위수, 3사분위수에 대한 것들도 찾아낼 수 있습니다.
05:57
: 그리고 여기에 또 보시면 변동계수라고 하는 것을 구할 수 있는데요. 변동계수 같은 경우에는 2개의 자료 집단이 있고요.
06:06
: 2개의 자료가 있는데 그 자료들의 표준편차를 직접 비교한다는 것은 불가능한 경우들이 있습니다.
06:14
: 왜냐하면 서로 간의 측정 단위가 다른 2개의 자료라고 한다면 측정 단위가 기본적으로 다르기 때문에
06:22
: 그걸 가지고 표준 편차를 가지고 비교한다. 라는 것이 어렵거든요.
06:28
: 그런 경우에는 표준편차나 분산 같은 거. 절대적인 수치를 쓰는 것이 아니라 평균을 고려해서
06:37
: 변동의 어떤 상대적 수치를 사용합니다. 그걸 변동계수라고 얘기하는 거죠.
06:43
: 서로 자료들 간의 퍼져 있는 정도를 비교를 하려고 할 때, 직접적으로 서로 다른 단위의 자료들을 이용할 수 없기 때문에
06:51
: 그래서 평균이라고 하는 것을 평균을 고려한 그런 변동계수라고 하는 걸 쓰는 거고요.
07:00
: 그래서 이걸 가지고 다른 이름으로 뭐라 그러냐면, 상대적 표준편차라고 얘기합니다. 그래서 여기 보세요.
07:06
: 아까 표준편차 구했었죠. 그걸 가지고 평균으로 나눠서 구하는 변동계수를 구하시고요.
07:14
: 그러면 이런 변동계수들은 서로 다른 어떤 단위의 자료들이 여러 개 있다. 하더라도
07:20
: 이거에 대한 v1과 v2를 구한 다음에 두 자료 간에 비교를 하실 수 있게 되는 겁니다.
07:28
: 평균의 표준오차 같은 것도 나중에 통계학에서 특히나 가설검정, 검정통계량 이런 거 얘기할 때 많이 쓰는데
07:36
: 추론통계 할 때 많이 쓰게 되는데, 그때 한 번 더 확인해 보시면 되겠습니다.
20:00
:
01:53
~
02:49
1
2
3
검수 상태 :
불통
통과
불통
최종불통
키워드 :
영상UID :
시작 시간 :
종료 시간 :
우선순위 :
추가
이전
다음