[정보글] 머리식힐사람 들어오세요. 열심히 썼습니다..ㅎ
요즘 다들 선택과목을 미적분으로 한다 들었는데, 인공지능(특히 강화학습 분야)에서는 확률론 분야의 중요성이 이전에도 그렇고 점점 중요시되고 있습니다.
놀랍지는 않겠지만 확률은 미적분은 생각보다 밀접하게 연관되어 있습니다. (사실 엄밀하게 말하자면 미적분은 실해석 분야의 응용버전인데, 실해석에서 정의하는 측도공간에서 전체 공간의 측도 크기가 1짜리인 경우만 떼어놓은 것이 확률론 분야이기 때문에 사실상 확률론 연구는 해석학 범주로 분류됩니다)
여담으로, 실해석에서 정의하는 공간들 중 sigma-finite measurable space라는 것이 있는데, 이 공간에서는
1. fubini theorem, tonelli theorem과 같은 예쁜 정리들이 잘 성립함
2. Radon Nykodym theorem에 의해 absolutely continuous한 함수들에 한정하여 probability density function이 잘 정의됨
와 같은 좋은 성질들이 있습니다. 1번의 겅우 말이 어렵게 쓰여있지만, '다중적분에서 적분의 순서를 바꿀 수 있다.' 정도로 이해하시면 되고, 2번의 경우 Radon Nykodym theorem은 일반화된 미적분학 기본정리라고 보시면 됩니다.
아무쪼록, 확률론이 중요하다는 말을 남기면서 같이 문제 하나를 풀어보고자 합니다. 출처는 2016 가톨릭대 모의논술입니다. 제가 고2때였나 저 문제를 처음 접했는데 신선한 충격이었습니다. 당시에는 저런 문제를 누가 만들었을까 싶었는데, 방 정리를 하던 도중 우연히 저 문제를 발견해서 한 번 풀어보니 재밌어서 같이 공유해보고자 합니다.
일단 문제는 다음과 같습니다. 요즘도 정규분표를 배우는지는 잘 모르겠는데, 대 인공지능 시대에 normal distribution을 모르는건 시대에 뒤쳐지는 사람이라고 전 생각합니다:) (농담이고 공학분야에 종사하게 된다면 대부분 data analysis를 다룰 때 white noise 등을 마주하게 될 거라서 결국 공부하게 될 분야이기는 합니다)
제시문 (ㄴ)과 (ㄷ)을 한번 음미해보겠습니다. 아실 분들을 다들 아시겠지만 (ㄴ)과 (ㄷ)은 그 유명한 central limit theorem을 소개하는 부분입니다. Central limit theorem은 다음과 같이 서술됩니다.
영어로 되어 있어 간단하게 해설을 하자면, i.i.d는 독립, 항등 분포라는 소리로 확률변수 이 각각
1. 항등적으로 분포: 임의의 실수 에 대해서 의 값이 에 무관하게 동등하다)
2. 독립: 임의의 실수 에 대해 이하 관계식이 성립한다.
입니다. 이 때, 이 무한대로 갈 때 확률변수 의 분포가 대략적으로 정규분포 랑 비슷해짐을 말해주는 것이 바로 CLT 입니다. 이를 조금 더 구체적으로 설명해보겠습니다. 위 CLT 서술은 아래와 같은 식을 서술하고 있습니다.
다만, 저 이 별로 안예쁘기도 하고 설명하기도 힘들기도 해서 보통 고등학교나 일반통계학에서는 다음과 같은 꼴로 CLT를 소개합니다.
아실 분들은 아시겠지만 확률분포에 상수를 곱하면 그 상수의 제곱만큼의 상수가 분산에 곱해지는 점, 그리고 상수를 더하면 똑같은 상수가 평균에 더해진다는 성질로부터 만들어진 등식입니다. 이것이 바로 고등학교에서 소개하는 CLT, 일명 표본평균의 분포에가 표본의 크기가 커짐에 따라 정규분포를 따른다의 의미입니다.
다만, 비슷해진다는 의미가 위에서는 converges in distributon (또는 weakly converge)한다고 적혀있는데, 이건 측도론 지식이 있어야 이해할 수 있으므로 지금 시점에서는 위와 같이 이해하면 좋을 거 같습니다.
여기서 다시 제시문 (다)로 돌아가보겠습니다. 제시문 (다)에서는 신뢰구간의 이야기를 하고 있는데, 잠시 을 음미해보도록 하죠, 이 커짐에 따라 는 와 거의 유사해진다는 점을 우리는 알고 있습니다. 즉, 위에서 말하는 신뢰구간의 정의는 다음과 같이 서술할 수 있습니다:
어떤 양수 에 대해서 구간 의 신뢰도는 다음과 같이 정의된다.
처음 보면 이 정의가 정말 (다)에서 정의한 신뢰도의 정의와 동일한지 아리까리할 수 있는데, 조금만 생각해보면 동일하다는 점을 쉽게 파악할 수 있습니다. 그리고 우리는 연속확률변수 z의 probability density function을 잘 알고 있기 때문에 (제시문 (가)에 주어져 있죠) 이로부터 신뢰도를 직접적으로 계산할 수 있는 식을 유도해볼 수 있습니다.
이제 드디어 배경지식 설명이 끝난 거 같으니 본격적으로 문제를 풀어보도록 합시다. 문제 1번을 살펴보도록 하죠.
신뢰범위 지름 구하기는 그냥 제시문 (ㅁ) 읽고 풀면 되니깐 잠시 제껴두고 저희는 제시문 (ㅂ)을 보도록 하겠습니다.
이제 저희는 무엇을 해야 할 지가 명확해졌습니다. 먼저 표본 전체를 통해 구한 신뢰도 짜리 구간 을 구해보겠습니다. 표본의 크기가 이므로 우리가 구해야 할 는 다음과 같은 관계식을 만족합니다.
여기서 우리가 구할 를 제시문 (ㅇ) 나온 notation들을 통해 서술해야 합니다. 그러면 더 쉬워지는데, 정규화 과정을 통해 일단 위 등식을 약간 고쳐볼 것입니다.
이제 그냥 (ㅇ) notation을 그대로 사용해주면 됩니다.
이제 조금 더(?) 어려워보이는 두 번째 구간을 를 구해보겠습니다. 사실 이 신뢰구간을 구하는 방식을 간파하는 것이 이 문제의 핵심인 거 같은데요.. 사실 그렇게 어렵지는 않습니다. (ㄹ)에서 두 표본으로부터 나온 신뢰구간의 의 길이는 동일하다고 주어져 있으며(사실 동일하지 않아도 풀 수 있는 문제인데 아마 계산 상 이슈로 동일하다고 놓고 풀라는 거 같습니다) 이 를 포함만 하지 않으면 됩니다. 이는 다음과 같은 바를 의미합니다: [표본1]로부터 얻어진 표본확률변수를 , [표본2]로부터 얻어진 표본확률변수를 라고 할 때 이하와 같은 관계가 성립한다.
여기서 표본은 독립추출되므로 (위에서 가 i.i.d라고 했죠?) 위 등식은 다음과 같이 정리됩니다.
이제 남은 건 계산입니다. ,는 를 따르므로 제시문 (ㅇ) notation을 이용하면 다음과 같이 정리됩니다. 먼저 정규화를 시켜야겠죠?
그 다음에, 마찬가지로 (ㅇ)를 사용해서 나타내보면,
이는 곧 이하를 의미합니다.
이로부터 를 구하면 이하와 같습니다.
이제 신뢰범위의 지름을 구해봅시다.
이 정의를 이용하면 지름의 길이를 구할 수 있다. 자세한 설명은 생략하고 바로 지름의 값을 적어보겠다.
이렇게 해서 논제 1번이 풀렸다. 이 상황에서 제시문 (ㅅ)을 읽어보자.
이제야 우리는 제시문 (ㅅ)에서 의 지름은 크기 에 따라 불변한데 의 지름은 표본 추출에 따라 크기가 달라짐을 알 수 있다. () 부분 때문에... 그래서 과 중 뭐가 더 좋은지는 지름의 크기로는 판별하기 힘들다는게 (ㅅ) 제시문의 요지이다. 이제 우리는 두 신뢰범위 중 평균 지름이 더 작은 것을 더 나은 신뢰범위라고 판단한다고 제시문에 적혀있다. 즉, 우리는
이 녀석의 평균을 구해야 한다는 의미이다.
이 문제가 정말 요물인데, 잔말말고 한 번 풀어보도록 합시다. 의 지름은 항상 일정하므로 평균을 구해도 일정할 것이다. 의 지름은 위에서 설명했듯이 시그마 항 때문에 변동이 생기는데 우리는 곧
이 녀석의 평균을 구해야 한다. 얼핏보면 굉장히 어려워 보이는 문제인데, 우리에게는 CLT를 엄밀하게 사용하지 않고 바로 표본의 합이 얼추 정규분포를 따른다고 퉁 칠수 있는 무기가 있다. 로 정의할 때 제시문 (가)에서의 조건을 활용하면 임은 자명하게 알 수 있다. 또한, 위 식은 다음과 같이 정리된다.
는 y축 대칭이므로 빼는 것은 곧 더하는 것과 동일하게 취급할 수 있다. 이는 곧 위 평균을 구하는 것이 다름이 아니라 이하 값을 구하는 것과 동일함을 시사한다.
이거 구하는건 식은죽 먹기이다. 다들 미적분 할 줄 알거니깐 제시문 (ㅈ)에 나온 대로 계산을 하면 된다.
이제 문제를 다시 보면,
1. 신뢰도 99%, 즉 일 때 두 신뢰구간의 평균지름의 크기를 비교하고,
2. 신뢰도 64% 이하, 즉 일 때 두 신뢰구간의 평균지름의 크기를 비교해보시오.
로 정리할 수 있다.
과 의 평균지름 크기는 이하와 같다.
1. 면 이므로 이다. 그리고, 이므로 이다. 이제, 두 값을 비교해보자.
즉, 이다. 즉, 이 더 낫다.
2. 소신발언하면, 위 정보로는 알 수 없고, 컴퓨터로 계산해야 할 거 같습니다. 다만, 신뢰도가 50% 이하가 되면 무조건 이 더 나은건 증명할 수 있습니다.면 이므로 이다. 그리고, 이므로 이하 수식이 만족한다.
즉, 이다. 즉, 이 더 낫다.
길고 긴 문제 풀이가 끝났습니다. 저도 제 논문 발표자료 너무 만들기 싫어서 타이핑 치다가 시간을 날렸네요ㅎ
아무쪼록, 이런 문제는 절대 나올 일이 없어서 그냥 재미로만 보세요. 아마 욕심이 과하신 확률 전공 교수님이 낸 문제가 아닐까 싶습니다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
설날에 사촌동생이 이태리 볼로냐대인가 나와서 로스쿨가서 판검사쪽 가보고 싶다하던데...
-
지금 상위권 해외대 다니는데 학점 리트 안정적으로 가져가면 학벌에서 이득을 볼 수 있나요?
-
오르비 OFF 5
다시 빡공 ON
-
로스쿨 들어가도 치열한 경쟁…서울대 신입생 5명중 1명 휴학변시 합격률 크게...
-
이미 뒤진 사시도 있고 허허..
-
로스쿨 진학뒤 군법무관 지원하고 싶은데 어떻게 해야하나요 1
신검 신청하라고 왔는데 신검 자체를 연기해야 하나요 아니면 신검을 받고나서 입영을...
-
변호사도 4차 산업혁명에 의해 AI로 대체된다고 하고... 이래저래 변수가 많은...
-
전 닥전
-
성적분석에서 보여주는 거요 이것도 시간 지나면 변하나요?
-
거의 처음인데 필수고전 다루는 책이나 인강 추천좀해주십쇼
-
ㅇㅇ작년에 이미 7급을 봤다 떨어졌던...
-
변호사, 9급 공무원 지원... "충격 그 자체"... 7
ㅇㅇ원래 로스쿨 도입 취지가 이런 것이긴 했지만...막상 실제로 벌어지니 놀랍긴...
-
ㅇㅇS등급 : 서연고포카의치한경A등급 : 이B등급 : 경외시부C든급 : 나머지...
-
2012년 제54회 사법시험 최연소 합격자 박지원당해년 최연소뿐만 아니라 사법시험...
-
은 선진띠~ 6
커욥ㅋㅋㅋ
-
http://media.daum.net/issue/1618/newsview?issue...
-
ㅇㅇ변호사들이 공인중개사 업무하겠다는 게,소비자 입장에선 잘 된 일이지만...
-
http://news.naver.com/main/read.nhn?mode=LSD&mi...
-
로스쿨 '불공정 입학' 의심 사례 상당수 적발... 5
http://news.naver.com/main/read.nhn?mode=LSD&mi...
-
"선배님, 저 휘문고 95기입니다"를 보고 생각난 짤... 6
동양그룹 현재현 회장이 경기고, 서울대 법대, 검사 출신인데,(동양그룹은 원래 처가...
-
ㅇㅇDJ-Arin님을 끝으로 오르비 고시 합격의 맥이 끊어진... ㅎ이제 사시...
-
얼마전 로스쿨 1~5기 아웃풋에 대한 추가글(고려대 로스쿨) 13
일단 저는 고로를 준비하는 학생이구요 그 자료에 대한 해명을 좀...
-
누나가 영단x에서 책을 무료로 받았는데 그 조건이 신규가입이라서제 명의로 책을...
-
성낙인 서울대 총장, 사법시험 폐지 유예는 '날벼락'이라고 표현...명망 있는...
-
ㅇㅇ경희대 로스쿨 다니는 아들이 졸업시험 탈락해서 변호사시험 응시가...
-
한의대 졸업하고 로스쿨 들어간 선례가 있나요??한의대 출신이 검사로서 메리트가 있는지도 궁금해욧
-
ㅇㅇ새정치에 이어 새누리도... ㅎ그렇죠. 평소엔 싸워도 이런 일엔 여야가 따로...
-
의대 출신이 로스쿨을 가는게 현실적으로 힘든가요? 공부량에 있어서 많은 분들이...
-
ㅇㅇ드디어 헌재에서 변시 성적 비공개는 위헌이라는 결정을 내렸네요. ㅎ이로써 변시...
-
ㅇㅇ베플이 정곡을 찔렀네요. ㅎ아빠가 판사면 자식도 판사, 아빠가 검사면 자식도...
-
좋은 로스쿨생이다... 10
ㅇㅇ학기 중에 서울까지 원정을 오다니... ㅎ전북 지역 W대 로스쿨이라네요.
-
굳은 다짐. 7
100일 정도 남았다. 정신 바짝차리고 지금부터 다시 불사려봐야겠다. 오늘부터...
-
역대 대학별 사법고시 합격자 수 총계 [1회~56회(2014)] 13
1970년까지는 서울대 75%선 1980년까지는 서울대 고려대 70%선...
-
기분 엄청 안좋다. 점점 국어에서 한문 한자어 추방해야하지 않을까? 솔직히 한문교육...
-
변호사 '7급' 채용은 처음중앙선거관리위원회가 변호사 자격 소지자를 대상으로 일반직...
-
체면 구긴 김앤장, '입도선매' 로스쿨生 변시 낙방 9
국내 최대 로펌인 김앤장 법률사무소가, 유능한 자원이라고 입도선매까지 한 로스쿨...
-
출처 : 서로연ㅇㅇ서 > 연+고성대, 이대는 인서울 대형의 체면을 차렸고,부산대는...
-
로스쿨이 설치된 학교의 법학과 수업이 실제로 폐강이 많이 이루어지고 있는지요? 4
제목 그대로 입니다. 사실상 08학번이 마지막이라서로스쿨 설치 대학들의 법학과...
-
올해 검사장급(차관급) 이상...
-
일반고인데 어제 졸업식때 장학증서 받았는데 금액 안써있고 입금도 안되어 ㅋㅋㅋ...
-
로스쿨 7
이번에 경북대에 입학하게 되는 새내기입니다. 로스쿨 입학에 있어 큰 영향력을...
-
서울대 --- 10 연세대, 성균관대 --- 5 고려대 --- 3 경희대, 부산대,...
-
7급 공무원? 1
어느정도 수준의 대학 라인(?)에서 7급 공무원 시험을 많이 준비하고, 많이...
-
마감당일 6시 30분쯤에 올린 The Future는 최종마감지원률을 반영하여 대학별...
-
제목대로 연고대 fait 는 지낙지등과 비교해서 어떤 차별성이 잇나요? 연고대만 분석해 주는지요
-
어느정도까지 가능한가요??물론 문과여
-
대략 어느정도가 적정선일까요? 또 상한선은 어느정도일까요?
-
국어 136 97 수학 131 100 영어 129 97 생윤 63 44 93 윤사...
-
언수외 391 사탐백분위평98인데 지원대학에서 변형점수로 매길때 사탐보정이 어느정도...
이걸 읽고 머리가 없어졋습니다
완벽히 이해했어...!
???: 확실히 통계를 아는 사람이다
통계킬러 ㄷㄷ
이거보고 체온계 꽂았는데 수은이 증발했습니다