예전에 썼던 연경제 예측 2024년에 다시 보다.
우리는 과거 입시 결과를 통해 올해, 더 나아가 미래까지 예측할 수 있습니다. 여기서 예측은 단순한 예측이 아닌 과거 입시 결과 즉 빅데이터에 기반한 예측입니다. 그렇기에 필자는 통계적인 방법을 사용하여 올해 연경제를 분석하기로 했습니다.
제가 예전에 작성했었던 게시글 중 '모집 인원의 중요성' 이라는 글이 있는데 그 글에서 대형 모집 단위의 특징은 안정성이라고 말씀드린적이 있습니다. 이런 안정적인 데이터들이 쌓이고 쌓이면 비로소 통계적인 방법을 사용할 수 있고 신뢰도도 매우 높을 것입니다.
그러나 통계적인 방법을 사용하여 올해 연경제를 분석하기에 앞서 변수들간의 상관 관계를 체크하는 과정에서 소위 말하는 '튀는 값'들을 발견했습니다. 통계에서 튀는 값들을 발견하면 골때리게 되는데 여기서 튀는 값들이란 쉽게 말해서 이질적인 값이라 할 수 있습니다.
위 표에서 모집인원, 지원자 수 등은 변수이며 x, y 등은 우리가 알고자 하는 값들이니 미지수가 됩니다. a, b는 편의를 위해 변수를 문자화한 것이고요. 그럼 표를 이용해 튀는 값을 한번 찾아 보도록 하죠.
우선, 총 합격자 수/지원자 수=a+c/b라고 정의할 수 있는데 편의를 위해 이를 문자 k로 나타내겠습니다. 즉 변수들의 상관 관계 k가 정의되는겁니다. 이 k값을 4개년의 데이터들을 이용해 표로 나타내니 다음과 같은 결과가 도출되었습니다.
해당년도 | 2016 | 2017 | 2018 | 2019 |
k=a+c/b | 0.47 | 0.47 | 0.39 | 0.47 |
놀랍게도 2018년도를 제외한 나머지 k값들은 동일하게 0.47로 나타났습니다. 이것이 바로 대형 모집 단위의 특징인 안정성을 나타내는 지표입니다. 안정적이기 때문에 변수들간의 상관 관계가 동일하게 나오는 것입니다. 그렇지만 유독 2018년도에만 0.39라는 이질적인 값이 나왔는데 이것이 바로 튀는 값입니다.
만약 2018년도의 k값이 0.47이 나왔다면 올해 2020년도의 k값도 0.47일 것이므로 올해 2020년도 연경제의 추가 합격 인원인 x값은 18이 됩니다.
엥? 올해 연경제 추합 인원이 18명이 될거라고요?
여기서 튀는 값의 중요성을 알게 됩니다. 만약 2018년도의 k값이 0.39가 아닌 0.47로 나타났다면 우리는 곧이곧대로 올해 2020년도 연경제의 추합 인원을 18명이라고 단정지어 버릴 것입니다.
그러나 현재 연경제의 점공 상황을 봤을 때 서울대로 빠질 인원은 적어도 35명으로 보입니다. 이 말은 k값의 신뢰도가 높지 않다는 것을 의미합니다. 즉 튀는 값이 있기에 k값의 신뢰도가 높지 않음을 추정할 수 있는 것입니다.
우리는 이제 k값의 신뢰도가 낮으니 k값이 쓸모가 없다는 것을 알게 됩니다. 그런데 왜 k값에서 튀는 값이 발생할까요? 그 이유는 바로 k값에는 경쟁률이라는 외적 변수가 영향을 주는데 우리가 그것을 간과했기 때문입니다.
k의 정의를 다시 살펴보면 k=모집 인원+추합 인원/지원자 수이므로 나누는 수인 지원자 수에 따라 k값이 천차만별로 바뀐다는거죠. 즉 우리는 지원자 수 즉 경쟁률이 k값에 주는 영향력을 간과한겁니다. 실제로 2018년도에만 경쟁률이 약 4:1이었고 나머지 년도의 경쟁률은 약 3:1이었습니다.
지금부터 본격적으로 x, y, z, 값들을 구해보도록 하겠습니다.
우선 k값처럼 경쟁률 등 외적 변수에 최대한 영향을 안 받도록 변수들간의 상관 관계를 다시 정의해야합니다. 즉 외적 변수라 할 수 있는 경쟁률에 영향을 크게 받는 변수인 b값을 제외한 변수 a, 변수 c를 이용해 이 둘의 상관 관계를 정의하면 됩니다. 여기서 또 주의해야 할점은 변수 a와 변수 c가 외적 변수에 영향을 받는지를 살펴봐야 합니다.
우선 변수 a는 모집 인원이므로 외적 변수에 영향을 받지 않는다는 것을 쉽게 알 수 있습니다. 문제는 변수 c입니다. 변수 c는 연경제의 추합 인원인데 연경제의 추합 인원은 서울대 입결에 영향을 받지만 그 영향력은 미미하기에 변수 a와 변수 c의 상관 관계를 정의하면 됩니다.
이것을 e로 정의하면 e=c/a가 됩니다.
해당년도 | 2016 | 2017 | 2018 | 2019 |
e=c/a | 0.67 | 0.57 | 0.54 | 0.56 |
이번에도 튀는 값이 발견됬습니다. 하지만 괜찮습니다. 2016 연경제는 빵구가 발생했기에 우리는 정상 입결을 기록한 2017, 2018, 2019년도의 e값을 사용하면 됩니다. 지금까지의 내용들을 종합하자면 다음과 같습니다.
1. 외적 변수인 경쟁률을 고려하지 않고 k값을 정의하여 2020 연경제의 추합 인원을 예상하려니 2018년도의 k값이 튀므로 2016년도, 2017년도, 2019년도의 k값만을 이용하려 했으나 올해 경쟁률이 2:1대이므로 과감히 k값을 버림, 만약 2016년도, 2017년도, 2019년도의 경쟁률이 올해 경쟁률과 비슷했거나 또는 올해 경쟁률이 2016년도, 2017년도, 2019년도의 경쟁률과 비슷했다면 k값을 사용했을 것
2. k값과 다르게 외적 변수의 영향을 받지 않게 e값을 정의하여 2020 연경제의 추합 인원을 예상하려니 여전히 튀는 값이 존재하지만 그 튀는 값에 해당하는 2016년도에만 빵구가 발생했으므로 2016년도의 e값만 과감히 버림
2017년도, 2018년도, 2019년도의 e값들의 평균을 구하면 0.56이므로 이 수치를 이용해 올해 연경제 추합 인원에 해당하는 x값을 구하면 x/76=0.56
x=43
이렇게 최대한 외적 변수에 영향을 받지 않도록 각 변수간의 상관 관계를 정의한 후 y,z의 값들을 구해보면 y=67, z=103이 됩니다.
따라서 올해 연경제 최종 컷은 연대식 기준으로 740.89점이 될 것입니다.
언제까지나 개인적인 예측입니다. 참고용으로만 써주시면 감사하겠습니다.
2024 10월 16일자에서 다시 보다.
저 당시에 2020 연경제 추합 수 43명으로 예측했는데
실제로 47명 돎
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
좋아요 0 답글 달기 신고
-
좋아요 0 답글 달기 신고
-
그냥 하기 9모는 어법 1틀 20번 실수틀이에요.. (답 나왔다는거에 흥분해서 체크를 잘못함)
-
이걸로 기출 마지막으로 보려는데 괜찮나..
-
9모 100 더프 백분위 94~97 왔다갔다 거리는 수준이고 지금까지 마닳 1/2랑...
-
이로운이랑 강x 풀어야지
-
스카입실 1
ㄱㄱ
-
수학 하도 ㅈ된 것 같아서 그냥 논술 최저러로 살 수도.... 포기도 안 할거고,...
-
. 2
-
추천좀 부탁드립니다 고2라 내년 수능 응시예정이에요 원래 물지러였는데 어쩌다...
-
그 엉덩이 안쪽 뼈가 미친듯이 아픈데 아파서 죽을 거 같아요 이거 자세 이상하게...
-
사촌형누나들 보면 취업한 후에도 자격증이네 시험준비네 대학원이네 하며 계속 공부함
-
수능이 한 달 정도 남았는데 영어랑 지구 중에서 4등급에서 2등급으로 올리는데...
-
; : 이런거 나오면 새로운 문장 시작된다고 봐야하는거??
-
이 세상 누구도 삶을 두 번 살진 않습니다 남 눈치 보지 말고 세상을 만끽해주세요...
-
사실 진짜 100점은 아니고요 평가원은 비문학 용어에 대한 이해 문항에서 주관적...
-
나 기분이 너무 좋다 슬럼프 때문에 60점대 도배에 50점대까지 갔다가 1일2실모...
-
국어: 브레턴우즈 시즌2, 빡센 생명지문+비연계 고난도 현소 수학: 2506 스타일...
-
이미 의치한약수로 가 잇음; 예전처럼 머리 좋은 애들이 공대 가는 경우는 좀처럼...
-
현역때 국어는 좀 잘했어서 재수하면 남들처럼 수학도 많이 오를줄 알고 시작했는데...
-
개뻘소리를 여기다 풀어버려서 블로그에 일기를 안 쓰게되네.. 써야지..ㅎ.ㅎ
-
유에짱 ㄷㄷ
-
5수까지 정말 감사했습니다 부모님
-
약대만 가면 개국 하기 전에 페약으로 경험쌓고 돈 모은 다음 그 돈으로 동남아...
-
배운 기억이 나는데 이것이 개념이다를 뒤져보는데 안보이네요..
-
성비가 어케 됨
-
백분위 6모 97 9모 98 10모 100인데 이감만 보면 70점대 ㅋㅋ..
-
10으로 깨져버리면 개줫댔구나 체감될듯
-
게이한테 번따당한 썰.. 살면서 그정도 충격을 준 번따가 없었슴 어지간한 여성분보다...
-
왜 이딴식으로 내는거지.... 문제형식은 교육청스러워서 괜찮은데 선지가 너무 얕아서 당황잼
-
672시간 << 가능 40320분 << 개씹가능
-
시즌 1? 시즌2? 알려주세용
-
국어수학이 불안함
-
어렵지 않나......?? 나만 그런거면 글삭함
-
15 귀납 수열 22 3차함수 고전소설 연계 현대시 하나 연계 ㅇㅇ
-
옆으로 누워서 살 몰린 가슴만지면 여자 가슴만지는 느낌+ 만져지는느낌을 동시에 받을...
-
아니 근데 고라니페인트를 화학 전공자 출신 중고스펙이면 2
ㄹㅇ 진지하게 주변 취준 친구들한테 추천해 보겟는데 나는 기계 계열 전공자라...
-
미적 수능 패턴이 69 는쉬운문제 28 29 30 몇개넣어주다가 2
수능날 28 29 30 헬 시작 패턴 지금 n년째지않나 ㅋㅋㅋ
-
6모때 8점 9모때 13점 맞았는데 원체 한국사 자체를 싫어해서 계속 미루다가...
-
내가 게이는 아닌데 14
남자가 좋은데 이건 뭐임?
-
질문이 있는데 하나만 알려주실 수 있나요 ?
-
22 30 풀다가 포기함 30번 수열같은 문제 그만좀 내야한다고 생각해요...
-
수학실모 뭐풀지 2
이제 슬슬 매일 풀어야되는데 이거 좋았다 하신 거 추천해주시면 감사 서바랑 킬캠은 풀었습니다
-
그게정석인가
-
김승리 현강 0
예비고3 김승리 올오카부터 현강 듣고 싶은데 신청은 어디서 하고 언제 하나요..?...
-
모의수능 2차 1
국어가 좀 많이 힘드네요 언매에 20분 넘게써서 2지문을 아예 날림 솔직히 수학은...
-
난 뭐 졸업했으니 알빠노지만 이 나라의 미래는 더이상 없다 조선 학생들의...
-
10월 17일 0
시간 하나는 진짜 존나게 빠르네
-
요근래 어느순간부턴가 실모풀때 체감이 좀 달라짐 거의 6개월의 정체기가 깨지는...
-
멘탈 박살나서 28 29 30 우수수 틀릴듯..