[정시 용어의 이해 (심화)] 5편 : 표준점수 함수의 형성 원리 (탐구)
안녕하세요
표준점수, 등급, 백분위에 관한 기본 설명을 모두 마치고 드디어 심화편에 들어왔습니다.
타이틀에 (심화) 표시를 붙였지만 사실 이번 편은 크게 어려운 내용이 아니고, 다음 편이 진짜 어렵습니다.
특히 이번 편에서 파트 Ⅰ~Ⅱ 부분은 다음 편 내용의 기본이 되기 때문에 이 파트만이라도 잘 숙지해주시기 바랍니다. 파트 Ⅲ~Ⅳ는 솔직히 말씀드리면 TMI에 가깝습니다.
지난 편 링크입니다.
[1편] 표준점수 기본 : https://orbi.kr/00059924973
[2편] 표준점수와 등급컷 : https://orbi.kr/00059952153
[3편] 표준점수 증발/점프 현상 : https://orbi.kr/00059992389
[4편] 백분위 계산법 : https://orbi.kr/00060019522
다 읽으실 필요는 없고, 1편 정도만 읽고 오시면 될 것 같습니다.
Ⅰ. (사회/과학/직업)탐구 표준점수 함수의 원형
탐구 영역에서 표준점수 함수의 원래 형태는 다음과 같습니다.
S는 표준점수, x는 원점수입니다.
"어! 1편에서는 S = ax + b라고 했잖아요! 그럼 1편에서 거짓말을 한 건가요?"
거짓말이 아닙니다. 함수를 다음과 같이 변형시키면 결국 S = ax + b꼴이 된다는걸 알 수 있습니다.
여기서 x의 계수를 a로, 상수항을 b로 처리하면 결국 S = ax + b가 되는거죠.
1편에서는 여러분들의 이해를 돕기 위해 표준점수 함수를 S = ax + b로 간략화하여 소개하였습니다.
하지만 이번 편은 심화편인만큼, 원형도 함께 곁들여서 설명할 테니 잘 따라오시기 바랍니다.
Ⅱ. 탐구 표준점수 함수의 요소
* 읽을때 표준'편차'와 표준'점수' 헷갈리지 않으시기 바랍니다. 저도 쓰면서 계속 헷갈리더라고요.
표준점수 함수의 요소는 원점수(x), 평균(m), 표준편차(σ), 이 세 가지입니다.
그런데 원점수(x)는 개인에 따라 다르기 때문에 논외로 하고,
평균(m)과 표준편차(σ)가 표준점수에 어떻게 영향을 주는지 살펴보도록 하겠습니다.
(1) 평균
표준점수 함수에서 평균의 역할은 다음과 같습니다.
"평균이 낮을수록 표준점수가 전체적으로 높아진다."
사실 당연한 이야기입니다. 표준점수는 난이도가 반영된 점수 체계이지 않습니까?
평균이 낮을수록 난이도가 어렵다는 의미니까, 평균이 낮을수록 표준점수가 높은 것은 당연합니다.
수식에서도 이를 충분히 증명할 수 있는데요
m이 작을수록 x-m이 커지는거니까, 결국엔 S가 커지는 결과로 이어지게 되는 것입니다.
상식적으로 충분히 받아들일 수 있는 이야기이기 때문에 여기까지만 설명하고 넘어가도록 하겠습니다.
(2) 표준편차
표준점수 함수에서 표준편차의 역할은 다음과 같습니다.
"표준편차가 낮을수록 (저득점자와 고득점자 간의) 표준점수 격차가 커진다."
이 사실 자체는 수식을 통해 충분히 증명 가능합니다.
표준점수 함수를 S = ax+b라고 할 때, x의 계수 a는 다음과 같다고 하였습니다.
즉, a는 표준편차와 정확히 반비례 관계입니다.
표준점수 함수 S = ax + b의 특징 중에 하나는 다음과 같습니다.
"원점수가 1점 오를 때마다 표준점수는 a점씩 오른다."
결국 a가 클수록 표준점수 격차가 커진다는 사실을 알 수 있습니다.
그런데 a는 표준편차와 반비례 관계라고 했으니
a가 커지기 위해서는 표준편차가 작아져야 합니다.
따라서 표준편차가 작을수록 표준점수 격차가 커진다는 결론을 얻을 수 있습니다.
음... 그래도 잘 모르겠다면...?
직접 계산해보면 되죠!
평균이 25점이고 표준편차가 13점이라고 가정했을 때
0점과 만점(50점)의 표준점수를 각각 구해보면 31점과 69점이 나온다는 사실을 알 수 있습니다.
이때의 0점과 만점의 표준점수 격차는 38점이 되겠네요.
그렇다면 평균은 유지한 채 표준편차만 9점으로 낮춰보겠습니다.
0점과 만점(50점)의 표준점수를 각각 구해보면 22점과 78점이 나오게 됩니다.
이때의 0점과 만점의 표준점수 격차는 무려 56점입니다.
아까의 38점과 비교해보면 확연한 차이가 있죠?
이처럼 표준편차가 작을수록 표준점수의 격차가 커진다는 사실을 구체적인 예를 통해서 알아보았습니다.
그런데 왜 그런걸까요? 왜 표준편차가 낮을수록 표준점수 격차가 커지도록 설계했을까요?
표준편차가 작으면 위 그래프처럼 인원이 평균 주변에 몰리는 경향이 나타납니다.
인원 대부분이 평균 주변에 몰려있는 상황에서 혼자서 고득점을 한다면, 잘하는게 훨씬 두드러져 보이겠죠? 그래서 이때 고득점자에게 상당히 높은 표준점수를 주는 것입니다.
그런데 반대로, 이 상황에서 매우 낮은 점수를 받는다면
"남들은 그래도 평균 근처에는 다 갔던데, 넌 그 근처도 못 가고 뭐했니?"
가 되어버리는거죠. 따라서 저득점자에게는 표준점수가 상당히 낮게 부여되는 것입니다.
고득점자에게는 표준점수를 상당히 높게 주고, 저득점자에게는 상당히 낮게 주니
결국 표준점수 격차가 커지는 결과로 이어지는 것이죠.
그런데 평균이 유지된 채로 표준편차만 커지면?
평균 주변에 있던 인원들이 다 흩어져서 양 끝에 각각 몰리게 될겁니다.
따라서 고득점자 입장에서는 "너 말고도 고득점자 많은데? 표준점수를 좀 덜 줘야겠군."이 되는 것이고
저득점자 입장에서는 "너 말고도 저득점자가 많네? 표준점수를 조금 더 줄게."가 되는 것입니다.
결국 둘의 표준점수 격차는 줄어들게 되는 것이죠.
이해를 돕기 위해 혼잣말을 동원해봤는데 이해가 잘 되셨을지는 모르겠습니다 ㅎㅎ...
마지막으로 표준편차가 작아지면 누구에게 이득이고 누구에게 손해인지 수식 관점에서 살펴보고 다음 파트로 넘어가겠습니다.
(1) 원점수(x)가 평균(m)과 매우 가까울 경우
'x - m'이 거의 0이 되므로, 수식에서 파란색 네모친 부분의 값이 0에 수렴합니다.
따라서 저 부분을 0으로 처리하면 표준점수(S)는 50점에 수렴한다는 사실을 알 수 있습니다.
x - m이 0에 가깝기 때문에 표준편차(σ)의 영향은 잘 받지 않습니다.
(2) 원점수(x)가 평균(m)보다 높을 경우
'x - m'이 양수이므로, 표준편차(σ)가 작을수록 파란색 네모친 부분의 값이 커집니다.
따라서 표준편차(σ)가 작을수록 높은 표준점수를 받을 수 있으며, 표준편차(σ)가 크면 표준점수를 덜 받게 됩니다.
(3) 원점수(x)가 평균(m)보다 낮을 경우
'x - m'이 음수이므로, 표준편차(σ)가 작을수록 파란색 네모친 부분이 절댓값 큰 음수가 되어 손해가 커집니다.
따라서 표준편차(σ)가 작을수록 표준점수가 낮아지며, 표준편차(σ)가 크면 상대적으로 높은 표준점수를 받게 됩니다.
Ⅲ. 표준점수 함수 구해보기
실제로 여러분이 교육청 학력평가에서 탐구 표준점수 함수를 직접 구해보실 수 있습니다.
교육청 학력평가 채점자료에는 평균과 표준편차가 명시적으로 주어져있기 때문입니다.
다만 평가원 모의평가와 수능은 평균과 표준편차를 안 주기 때문에 여러분이 구할 수 없는...건 아니지만 구하기가 어렵습니다.
따라서 이 파트에서는 교육청 학력평가 자료를 통해 표준점수 함수를 직접 구해보는 것으로 하겠습니다.
올해 10월 전국연합학력평가 채점 결과 파일을 첨부했는데, 다운받기 싫으시면 안 받으셔도 괜찮습니다.
다운받아서 '영역별 원점수평균 및 표준편차' 탭에 들어가시면
다음과 같이 인원, 평균, 표준편차가 과목별로 모두 기록되어 있습니다.
탐구 표준점수 함수는 평균과 표준편차만 있으면 구할 수 있으니까, 구하는게 그리 어렵지는 않을겁니다.
그러면 함수를 직접 구해보는데 뭘 구해볼까요...
화학Ⅰ, 생명과학Ⅰ, 물리학Ⅱ 이렇게 세 과목의 표준점수 함수를 구해보겠습니다.
화학Ⅰ : 평균(m) = 24.44점, 표준편차(σ) =12.87점
생명과학Ⅰ : 평균(m) = 24.96점, 표준편차(σ) =10.94점
물리학Ⅱ : 평균(m) =16.26점, 표준편차(σ) =10.96점
이 값만 그대로 아래 식에 집어넣으시면 되겠죠.
정말 그대로 집어넣으시면 됩니다.
전혀 어렵지 않죠?
이제 이 함수에 x = 30을 대입하시면 30점의 표준점수가 나오는 것이고
x = 45를 대입하시면 45점의 표준점수가 나오는 것입니다.
"S = ax + b 꼴로 바꿔야 하는 것 아닌가요?"
굳이 안 바꾸셔도 됩니다. 이 자체로도 표준점수 함수입니다.
하지만 ax+b가 훨씬 직관적이긴 하니까, 그 꼴로 한 번 바꿔보겠습니다.
무한소수를 끝까지 쓸 수는 없으니, 소수점 아래 넷째 자리까지만 표현했습니다.
이렇게 교육청 학력평가의 채점 자료를 통해 여러분이 직접 표준점수 함수를 구해보실 수 있습니다.
교육청 학력평가 채점 자료는
학력평가자료 > 교육정보 > Home (sen.go.kr)
서울특별시교육청 사이트에서 웬만하면 다 찾아보실 수 있습니다.
Ⅳ. 표준점수 함수의 그래프
함수 얘기가 나오면 역시 그래프가 빠질 수 없겠죠.
그래서 이 파트에서는 위에서 구한 표준점수 함수를 토대로 그래프를 그려볼겁니다.
(1) 생명과학Ⅰ vs 물리학Ⅱ
생명과학Ⅰ과 물리학Ⅱ의 표준점수 함수는 각각 다음과 같았습니다.
이 식을 토대로 원점수(x)를 가로축으로, 표준점수(S)를 세로축으로 두고 그래프를 그려보겠습니다.
그려보니까 어떤가요? 마치 둘이 평행하는 것처럼 그려졌습니다.
그리고 물리학Ⅱ의 그래프가 생명과학Ⅰ보다 전반적으로 위에 있습니다. 왜 그런걸까요?
둘의 평균과 표준편차를 유심히 보셨다면 알 수 있습니다.
생명과학Ⅰ : 평균(m) = 24.96점, 표준편차(σ) =10.94점
물리학Ⅱ : 평균(m) =16.26점, 표준편차(σ) =10.96점
둘을 비교해볼때, 표준편차(σ)는 거의 비슷합니다. 표준편차가 비슷하기 때문에 그래프의 기울기도 비슷해서 거의 평행하는 것처럼 그려진 것이죠.
그러나 평균(m)에서 큰 차이가 나고 있습니다. 물리학Ⅱ의 평균이 생명과학Ⅰ보다 8.7점이나 낮죠?
두 그래프를 비교함으로써 다음과 같이 의미 있는 관찰을 할 수 있습니다.
① 표준편차(σ)가 비슷한 경우에, 평균(m)이 낮을수록 표준점수가 전반적으로 높아진다는 사실을 다시 한 번 살펴볼 수 있었습니다.
② 표준편차(σ)가 비슷하기 때문에, 두 과목에서 저득점자와 고득점자 간의 표준점수 격차는 비슷하다는 사실도 알 수 있습니다. 실제로 생명과학Ⅰ의 0점과 만점의 표준점수는 각각 27점, 73점이므로 격차는 46점이고, 물리학Ⅱ의 0점과 만점의 표준점수는 각각 35점, 81점이므로 역시 격차가 46점이 됩니다.
(2) 화학Ⅰ vs 생명과학Ⅰ
이번에도 앞에서 구한 함수를 토대로 그래프를 그려보겠습니다.
처음에는 화학Ⅰ의 표준점수가 더 높았는데, 20점대 후반 쯤에서 생명과학Ⅰ이 화학Ⅰ을 따라잡습니다.
이번에도 평균과 표준편차를 통해 이유를 살펴보도록 하겠습니다.
화학Ⅰ : 평균(m) = 24.44점, 표준편차(σ) =12.87점
생명과학Ⅰ : 평균(m) = 24.96점, 표준편차(σ) =10.94점
둘을 비교해볼 때, 평균(m)은 생명과학Ⅰ이 살짝 더 높고, 표준편차(σ)는 화학Ⅰ이 많이 높네요.
이 조건은 생명과학Ⅰ 저득점자에게는 최악의 조건이라고 할 수 있습니다.
일단 평균(m)이 높으면 표준점수가 낮아진다고 했고, 표준편차(σ)가 낮으면 고득점자에게 이득인거지 저득점자에게는 오히려 손해이기 때문에 저득점자 입장에서는 나쁜 조건만 모두 갖춘 것이나 다름없습니다.
따라서 생명과학Ⅰ의 그래프가 더 낮은 위치에서 시작한 이유를 여기에서 찾을 수 있습니다.
그러나 고득점 영역에서는 표준편차(σ)가 낮은 것이 오히려 이득이기 때문에, 표준편차(σ) 차이가 크게 나는 지금과 같은 상황에서는 고득점 영역에서 생명과학Ⅰ이 화학Ⅰ을 따라잡기에 매우 유리합니다.
그래프를 보시면 결국 28점 쯤에서 생명과학Ⅰ이 화학Ⅰ을 따라잡았고, 만점에서는 생명과학Ⅰ이 화학Ⅰ보다 표준점수가 3점 높은 것으로 그래프가 끝나게 됩니다.
두 그래프를 비교함으로써 다음과 같이 의미 있는 관찰을 할 수 있습니다.
① 평균(m)이 비슷한 경우에, 표준편차(σ)가 낮으면 고득점자에게는 이득, 저득점자에게는 손해라는 사실을 다시 한 번 살펴볼 수 있었습니다.
② 화학Ⅰ의 0점과 만점의 표준점수는 각각 31점과 70점으로, 격차가 39점입니다. 생명과학Ⅰ에서는 각각 27점과 73점으로 격차가 46점이었다는 것을 생각하면, 표준편차(σ)가 낮을수록 고득점자와 저득점자 간의 표준점수 격차가 커진다는 사실도 다시 한 번 확인할 수 있습니다.
이제 가장 어려운 6편만을 남겨두고 있습니다.
6편에서 찾아뵙겠습니다. 감사합니다.
[6편] (심화) 표준점수 함수의 형성 원리 (국어·수학)
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
고3 담임 한줄 써줬네 개너무하네
-
친구가없어서
-
파스텔색깔 지린다 밤하늘예쁘니깐 운동가야지
-
이제 폰주니까 강제금딸에서 해방
-
실수다
-
진지하게 거기 현지인 비율의 절반정도가 한국인이었던 것 같았음 베트남인 × 1/2...
-
. 14
.
-
너무 이쁘다 진짜 꼭 가보고싶네요
-
우선 저는 작수 언매 확통 세계사 정법 98 75 1 42점 98의 성적을...
-
21번에 ‘늘어선‘에서 정서가 안보여서 답인건데 늘어선 자체에서는 아무것도 안...
-
그지가 되버림 6
이번에 아이패드사면 ㄹㅇ허리띠 졸라매야겠음 한달 용돈 40으로 버티기 스타트
-
족발vs휫자 5
알볼로 쉬림프핫치킨임
-
올해 수능 성적입니다. 1. SKY (로스쿨 때문. 학과 상관 X) 2. 약대 진학...
-
6시 기상 ~8시:지옥철 8시~18시:재수학원 18~20시:지옥철...
-
열등감 미쳤네 진짜 ㅠㅠ
-
중국인보다 많은 것 같은데
-
알 적출마렵네 그냥 11
쓰지도 못할거 쓸데없이
-
안녕하세요 '지구과학 최단기간 고정 1등급만들기' 저자 발로탱이입니다. 지난 1년간...
-
노을이 이뻐 2
우웅..
-
뱃지 나왔네 1
-
신기하게 수험생 때는 그렇게 성욕이 셌는데 딱 입시 끝나자마자 귀신같이 성욕이 사라짐 나만그런가
-
통통인데 상경계 갈거라 경영경제수학 대비해서 미리 미적 조금만 하고 가려하는데...
-
글을 못쓴다 0
매번 고민이다 ..
-
부모님이랑 누나가 그냥 대학 다니라는거 제가 한번만 더 해보고 싶다고 우겨서 독재...
-
노: 노노 무: 무조건 현: 현대소설
-
금딸 3
시발 3주지나면 성욕 없어진다며 이 개새끼들아
-
자지 말라면 자지마
-
어그로 ㅈㅅ 지인이 물어봐달라는데 26수능 원서접수일 아직 안나왔나요?
-
군대 오지 마라 4
내가 싫어하는 3가지
-
대학오지마라 8
그 앞은.. 지옥이다
-
손승연 샘 숙제가 많은데 혹시 일주일동안 다하는게 낫겠죠? 다못해가서 미적은다푸는데...
-
여기저기서 알람소리 짜증나네
-
일본인이 카와이 하고 가는데 머냐
-
"죽기 전에 성관계 한번만"…女화장실서 20대 덮친 군인 19
[파이낸셜뉴스] 휴가를 나온 군인이 여자화장실에서 일면식도 없는 여성에게 흉기를...
-
ㅈㄱㄴ
-
아 물리하다가 경제하니까 암기량은 비슷한데 계산량은 반의반이네
-
그럼 수능보기전이나 원서넣기 전에 쓰던가 합격기다리는데 저지랄하네
-
잘하는 편은 아닌 재수생인데 공부 열기가 1월보다 좀 식은거 같아서요;; 본인...
-
동국대 중도 열람 코드는 친구한테 삥뜯엇어
-
춥고 배고파 4
성냥 사세요
-
두각 본관에 쌓여있다는 소문은 들은것 같은데
-
비인기과 의사는 될 수 있었을지도.. 아님말고
-
재고가 없어서 대가리 봉합됨
-
부산대 긱사 0
제가 만약 과1,2중 1만 최초합되어서 긱사 신청했는데 과2가 긱사 신청 기간...
-
추천해주세요!
-
5번 받았다 이거 도냐ㅠㅠ
-
가보자 관악에!
이거보고 걍 4일뒤에 성적표 받아서 확인하기로 했다...
개추는 눌렀습니다!!!
ㅋㅋㅋ
올려주신 글 잘 읽고 있습니다. 저도 예전에 호기심으로 엑셀로 원점수에 대응하는 표점과 백분위 산출하는 걸 해봤었는데, 말하신 바와 같이 평가원 시험은 원점수 평균과 표준편차를 제공하지 않아 직접 추정해야만 하더라고요.. 그래서 제가 내린 결론이, 평균, 표준편차를 미지수로 놓고 (50-m)/σ×10+50 = 만점 표준점수±0.5 범위, (0-m)/σ×10+50 = 0점 표준점수±0.5 범위로 세워서 두 부등식의 영역의 교집합을 구한 다음 각 교집합에 해당되는 (m, σ) (*0.01 간격으로 이산화)의 순서쌍별로 나타나는 표점 증발 중 가장 그럴듯해 보이는 표점 증발 리스트가 포함된 순서쌍으로 결정하는 것이었는데요, 이런 로직으로 코드를 짜서 돌려도 애초에 표점 증발 구간을 깔끔하게 예측하기가 어려운 문제가 있었습니다. 환동님은 평가원 채점결과 자료 제작하실 때 어떤 방식으로 평균/표준편차를 추정하시는지 궁금합니다! (특히, 원점수 만점이 존재하지 않기도 하는 직업탐구 영역은 위에 적은 과정대로 안 될 것 같아서요..)
제가 만든 프로그램은
① 0점과 50점의 표준점수
② 증발된 표준점수
를 입력하면 평균과 표준편차를 자동으로 산출하도록 짜여있습니다.
군대에서 무지성으로 짠 코드라 지금 보면 뭔 소린지 하나도 모르겠는데... 일단 아는대로 말씀드리겠습니다.
[① 0점과 50점의 표준점수]를 입력하면
두 표준점수의 차이를 이용하여 표준편차와 평균의 대략적인 범위를 구할 수 있습니다.
0점과 50점의 표준점수 차이가 n점이라면,
500/(n+1) < σ < 500/(n-1)임이 자명합니다.
이렇게 표준편차의 대략적인 범위를 구해놓습니다.
그리고 이 '대략적인 표준점수 범위'와 '0점 표준점수', '50점 표준점수'를 이용해서 또 평균의 대략적인 범위도 알아냅니다. 범위 식이 복잡하니 이하 생략하겠습니다.
[② 증발된 표준점수]는 제가 직접 입력해야 하는데요,
도수분포표를 보시면 중간중간에 유난히 인원 수가 튀는 점수가 있습니다. 그 부분이 주로 표점 증발이 일어난 부분입니다.
예를 들어, 표준점수 56점, 57점, 58점의 인원이 각각 342명, 615명, 327명이라면 표준점수 57점에서 표점 증발이 일어났을 확률이 높습니다.
그런데 원점수 기준으로 40점대와 10점 미만에서는 이 법칙이 잘 안 맞을 때가 많습니다.
그럴 때는 10점대 ~ 30점대 라인에서 증발된 표준점수를 모두 구해놓고 그 간격을 보는겁니다.
예를 들어서, 표준점수 증발이 37점, 42점, 46점, 51점, 55점에서 일어났다면, 표점 증발이 전반적으로 4~5점 간격으로 일어나고 있기 때문에 그 다음 표점 증발은 59점이나 60점에서 일어났음을 알 수 있습니다. 59점인지 60점인지는 인원 수를 보고 최종 판단합니다.
증발된 표준점수를 모두 입력하면
프로그램이 평균 범위를 최종적으로 좁혀서 알려줍니다.
그 다음에 제가 그 범위 안에 있는 평균값을 아무거나 하나 입력하면
그 평균에 맞는 표준편차의 범위를 최종적으로 좁혀서 알려줍니다.
예를 들어서, 평균 범위가 27.614 < m < 27.713으로 나와서 제가 27.66을 입력했다면,
27.66점에 맞는 표준편차 범위(ex : 12.124 < σ < 12.147)를 출력해줍니다.
따라서 엑셀 표에 평균 27.66을 입력하고, 표준편차는 12.13이나 12.14로 입력하면 통계표가 자동으로 완성이 됩니다.
처음부터 끝까지 완벽하게 설명하려면 수식이 정말정말 많이 필요하고 수학적인 인과관계도 하나하나 다 따져봐야 됩니다... 댓글로 모든걸 설명하기에는 상당히 제한되는 점 양해 부탁드립니다
그렇군요.. 감사합니다!