lacri [2] · MS 2002 · 쪽지

2017-11-16 18:58:13
조회수 352,240

오르비는 무엇을 하는 회사인가

게시글 주소: https://mclass.orbi.kr/00013839609



모르는 사람들이 직업이 뭐냐고 물어보면 저는 그냥 “회사원이에요”라고 답하는데, 의대 동기들을 이따금 오랜만에 만나 “요즘은 뭐 하고 지내냐”는 질문을 받으면 답을 하기가 참 어렵습니다. 정확히 얘기하자니 말이 너무 길어질 것 같고, 짧게 이야기하면 오해를 사겠고, 그래서 결국 “그냥 저냥 먹고 산다” 정도 답을 합니다.


오프라인에서 이런 일이 또 벌어지면야 어쩔 수 없다해도 앞으로 온라인에서 이런 질문을 받게 되면 글을 하나 써놓고 링크를 보내주면 좋겠다는 생각이 들어서, 나는 요즘 무슨 일에 관심을 갖고, 무슨 일을 하고 사나, 다시 말해 오르비는 지금 무엇을 하는 회사인가에 대해 써보려 합니다. 더 정확히는 오르비가 아니라 무브(Move) 주식회사는 무엇을 하는 회사인가입니다. 보통 저희 회사 이름은 모르실 거라 생각해 제목을 저렇게 적었습니다. 


본래 창업 당시 저희 회사 이름은 위젯(Wizet)이었는데 (세간에 잘못 알려진 것과는 달리 Wizet은 Nexon의 자회사도 아니고, Maple Story를 만든 Wizet Studio와도 우연히 이름이 같았던 것이고 관계가 없는 회사입니다.) 2013년에 무브(Move)로 이름을 바꾸었습니다. Move는 유치원생도 아는 쉬운 단어이기도 하면서 좋은 뜻을 가지고 있어서요. Orbis Optimus 이후에, 무언가 이름을 짓는다면 이번에는 동사를 써보고 싶기도 했고요. Move는 세상을 “움직여서”(타동사의 주된 뜻) 앞으로 나가게 하겠다는 의미를 담고 있고, 그런 변화를 통해 세상을 “감동시키겠다”(타동사의 부차적인 뜻)는 의미도 있습니다.


2009년 12월 창업 당시 무브는 오르비라는 커뮤니티 사이트를 가지고 있는, 기본적으로는 온라인 교육업을 하는 회사였습니다. 그런데 하필 건국 이래로 줄곧 성장만을 해온 사교육 시장이 회사를 창업한 해에 고점을 찍더니 그 이후엔 꾸준히 쪼그라들기 시작했습니다. 



제가 20대 때만 해도, 의사도 돈 잘 벌고 사교육업자들도 잘 먹고 잘 살아서, 우리나라에서 의료와 교육 두 개 분야를 잡았으니 죽을 때까지 먹고 살 걱정은 없겠다는 이야기를 종종 들었는데, 요즘은 의료도 휘청거리고, 사교육은 만신창이이니 격세지감이죠.

 

시장이 줄어드는 분야에서 사업을 한다는 것은 대단히 고통스러운 일입니다. 20% 성장을 해도 시장 자체가 20% 쪼그라들면 그 노력이 도루묵이거든요. (20% 늘고 20% 줄면 본전도 아니고 정확히는 4% 축소죠) 게다가 교육업은 의외로 산업화하기가 어려워서 규모의 경제 구현도 어렵고, 경쟁도 치열해서 본전치기를 간신히 넘어도 보통은 순이익률이 한 자리 수로, 제조업 분야만큼 낮습니다. 강사나 개인 사업자 규모가 아니라 법인 규모일 때 말이죠. 이렇게 순이익률이 낮은 상황에서 시장이 쪼그라들면 흑자를 유지하기도 보통 벅찹니다. 


아무튼 그럼에도 불구하고 무브는 나름 선방을 해서 시장이 쪼그라드는 와중에 오르비라는 온라인 커뮤니티에 입시출판을 붙이고, 인강 붙이고, 학원 붙이고 해서 지금까지는 성장을 했습니다. 연매출 100억 근방까지는 교육만으로 꾸역꾸역 밀어붙여서 도달을 했죠. 


그런데 저희가 앞으로도 이렇게 살면 망하기 딱 좋겠구나라는 생각이 든 것은 수험생 인구 절벽 그래프를 접하고 나서부터였습니다. 



당장 후년(2019년)이 되면 한 해에 13%의 인구가 줄고 이것은 사업이 유기적으로 15% 성장을 해도 본전이라는 의미 (1.15 x (1-0.13) = 1)가 됩니다. 그 다음 해에는 또 인구가 12% 줄어서 고작 2년 사이에 인구가 23% 주는데 이것은 30%의 성장을 무용지물로 만드는 외부 충격입니다. (1.30 x (1-0.23) = 1) 그렇다고 1인당 사교육비 지출이 인구 감소에 반비례해 늘 분위기도 아니어서 회사로서는 다른 산업 분야에서 성장 동력을 찾고 사업다각화를 해야만 했습니다.











그 와중에 손을 댄 분야 중 하나가 옷이었습니다. 처음 옷에 손을 댄 것은 2014년이었는데 처음 1년은 내내 돈만 까먹고 갈피를 못 잡았고, 교육 회사가 쓸데없는 짓을 한다는 비아냥을 많이 들었습니다. 2015년만 해도 오르비에서 “크줌마”에게 제목에 “[광고] 안 달고 글 썼다”고 악플 달고 욕하는 것이 말하자면 오르비의 스트레스 풀이 문화였을 정도였죠. 너무 심하게 몰아붙여서 불쌍하니 적당히좀 하자는 회원들의 글이 올라왔을 정도니까요. 의류업을 시작한지 1년 정도 지난 후 저희는, 급식체(?)에 능한 관리자 명의로 본격적으로 피벗팅(pivoting)을 하겠다는 선언을 했습니다. 물론 당시는 그게 그런 의미인지 대부분 모르셨겠지만, 저희로서는 의미있는 비유를 들었죠. 이를테면 노키아는 펄프 회사에서 시작해 핸드폰을 만들며 시대를 풍미했지만 변화를 읽지 못하고 사라졌다, 소니는 전자회사로 시작해 망할 뻔하다 보험업으로 태세전환을 해 풍파를 헤쳐나갔다, 그래서 우리도 태세전환 하겠다 등등. 


이후 긴 이야기가 있었지만 간단히 요약을 하면, 크루비 매출은 재작년에서 작년으로 넘어오면서 10배가 늘었고, 작년에서 올해로 넘어오면서 또 10배가 늘었습니다. 올해를 기점으로 이제 크루비 매출이 크루비를 제외한 오르비 전체 매출을 넘어섰습니다. 오르비가 만약 내년에 2배 성장을 하면 그건 기적 같은 일인데, 크루비가 내년에 5배 성장을 하면 요즘 인터넷 용어로 평타를 친 정도죠. 이미 100억이 넘는 규모에서 한 해 만에 5배 성장을 하는 것은 쉬운 일은 아닙니다. 그것이 가능하리라 여겨지는 것은 비아냥과 핍박에도 불구하고, 아니 더 중요하게는 돈을 계속 잃어가면서도 꾸역꾸역 몸에 맞지 않는 옷을 입고 벗어가며 저희 나름의 성공 공식을 찾아 나가려는 노력을 해왔기 때문일 것입니다.


그럼 무브는 이제 스트릿 패션 쇼핑몰인 것이냐? 그렇지는 않습니다. 교육으로 백억 단위를 넘어서 천억 단위를 가기는 벅차겠다는 생각에 의류에 진입을 했고, 크루비가 순항을 하면 천억 단위에 도달할 수 있을 것 같지만, 크루비 역시 그 다음 자릿수에 도달하기는 벅차다는 생각이 들었죠. 그래서 저희는 더 큰 그림을 그려보았습니다. 한국이라는 시장에 국한되지 않고, 성공을 한다면 조 단위에 도달할 수 있는 것은 무엇일까? 









저희가 고른 선택지는 AI(artificial intelligence, 인공지능)였습니다.  



때마침 알파고와 이세돌 간의 바둑 대결이 있었습니다. 곧 수그러들기는 했지만 AI에 대한 관심이 잠깐이나마 폭발했죠. “알파고”라는 단어에 대해 가지고 있는 생각과 편견들이 사람마다 다르겠지만, AI라는 것을 설명해야 하는 입장에서는 그나마 알파고 덕분에 상대적으로 쉽게 비유를 할 수 있게 된 셈입니다.


알파고와 이세돌 간의 바둑 시합 당시 사람들은 이세돌이 알파고를 한 번 이겼다는 사실에 기뻐했지만, 저희는 알파고가 이세돌을 네 번 이겼다는 사실에 더 주목을 했습니다. 그리고 이 분야, 더 구체적으로는 AI의 넓은 분야 중에서도 ML(machine learning, 기계학습), ML이라는 넓은 분야 중에서도 RL(reinforcement learning, 강화학습)에 무브의 미래가 있다고 판단했습니다. (알파고는 RL의 가장 대표적인 성과입니다.)


크루비의 오오티디 섹션은 저희가 ML의 가장 대표적인 분야인 image recognition(사진 인식) 분야를 공부하면서 생긴 것입니다. 오오티디에 올라오는 모든 사진은 인간의 개입 없이 기계가 관리하는 것입니다. 쏟아져 들어오는 수백만 장의 사진들 중에서 “인간”이 주된 피사체가 아닌 대부분의 사진을 걸러내고, 음란물로 추정되는 것을 또 걸러내고, 남은 것을 통과시킵니다. 정확도가 100%는 아니기에 이따금 음란물을 걸러내지 못하는 경우도 있습니다만, 만약 기계가 사진을 걸러내지 않는다면 거의 모든 사진이 음란물이었을 것입니다. 


오르비 게시물에 붙는 #auto:정치 태그는 ML의 또다른 분야인 NLP(자연어 처리, natural language processing)를 공부하면서 적용된 것입니다. 올해 봄까지만 해도 오르비에 분쟁을 유발하는 정치 게시물이 자주 올라왔고 그것들을 현명하게 걸러낼 필요가 컸습니다. 이따금 엉뚱한 글에 정치 태그가 붙어서 유저들의 눈길을 끌기는 하지만, 그래도 하나하나 훑어보면 각각의 글에 정치 태그가 붙은 이유를 유추할 수 있을 정도의 글에 이 태그가 붙습니다. 뿐만 아니라 봄부터 오르비에 올라오는 모든 글들은 공부와 관련된 글인지 관련이 없는 글인지가 기계에 의해 분류됩니다. 그래서 공부글만 읽기를 원하는 사람에게는 공부와 관련 없는 글들은 제거하고 보여줍니다. (현 시점에서는 모르비 모아보기 화면에서만 지원되는 기능) 그리고 안드로이드 앱의 DeepFeed의 경우 기계가 각각의 유저들이 그동안 읽은 글을 분석해 해당 유저의 학년이나 나이대를 추측하고 그에 따른 관심사에 맞추어 서로 다른 글을 서로 다른 순서로 보여줍니다.


여기까지는 워밍업이었습니다. 저희가 RL에 손을 대면서 처음 세운 목표는 오르비 게시물에 정치 태그를 붙이거나 공부글과 잡담글을 분류하거나 오오티디에서 음란물을 걸러내는 것은 아니었습니다... 게다가 정확히 말하면 지금까지의 예시는 AI 혹은 ML의 한 분야이기는 하지만, RL과는 무관한 것이죠. 









흔히 큰 돈을 버는 데는 세 가지 방법이 있다고들 합니다. 1) 남들보다 훨씬 똑똑하거나(supersmart), 2) 남들보다 훨씬 빠르거나 = 산업의 유행을 선도하거나(superfast), 3) 실질적으로 사기를 치거나. 저희는 남들을 괴롭혀서 돈을 벌 생각은 애초에 없었고, 딱히 학창시절에 날라리(?)도 아니었으니까, 역시나 적성에 맞는 것은 그냥 좀 더 공부하고 머리 쓰는 supersmart 옵션이었습니다. 그 국면에서, 저희가 하고 싶던 것은 바로 스스로 자산을 거래하는 기계(trading bot)를 만드는 것이었습니다. 알파고가 바둑을 두는 기계라면, 말하자면 주식 거래를 하는 기계를 만들자는 것이죠. 말로만 들어도 정말 원대한 꿈이죠. 이 정도면 “미래”라고 할 수 있을만한 주제 아닐까요? 


앞서 언급한 사진 인식, 자연어 처리 같은 분야는 ML(기계학습)의 한 분야이기는 하지만 여전히 사람이 기계를 “가르치는” 것(supervised learning)입니다. 사진을 보여주고 이건 곰이야, 이건 개야, 이건 사람이야, 하면서 10만 장의 사진을 보여주면 기계도 스스로 처음 접하는 사진에서 사람을 찾아낼 수 있다는 논리죠. 마찬가지로 한 편의 글을 형태소 단위로 쪼개면서 이거는 욕이고, 이거는 정상적인 문장이야, 이건 화가 난 감정이 들어있는 표현이야, 하고 기계를 가르치면 기계도 말과 감정을 알아듣는다는 논리입니다. 


반면 RL(강화학습)은 인간처럼 생각할 수 있는 기계를 설계하는 것에 가깝습니다. 바둑으로 치면, “이게 바둑에서 말하는 ‘집’이라는 것이고, 더 많은 집을 가진 사람이 게임에서 이기는 거다. 자 그럼 이제 게임에서 이겨봐.” 라는 것에 가깝습니다. 처음에는 프로 기사들의 기보를 입력해 주기는 했지만, 그 기보들을 가지고 알파고가 스스로 학습을 한 것이지, 일일이 사람이 가르쳐준 것은 아니죠. 게다가 지난 달에 발표된 알파고 제로는 기보 입력조차도 없이 바둑에서의 룰만을 가르쳐 놨는데 혼자 바둑의 원리를 깨우치는 수준에 이르렀습니다. 알파고 제로는 혼자 학습을 한지 3일만에 이세돌의 수준에 다다랐고, 40일 만에 기존 모든 버전의 알파고를 능가했습니다.


흔히 금융 분야에서 AI, ML을 한다거나 핀테크(fintech)를 한다거나, 로보어드바이저(robo-advisor) 같은 것들을 한다고 할 때의 접근법은 저희와는 많이 다릅니다. 기본적으로 대부분의 “첨단 금융 산업”을 한다는 회사들은 엄청난 양의 뉴스나 정보를 정리해주는 기계를 만들어서, 그 기계가 만들어낸 정보를 금융기관에 구독시키며 돈을 받거나, 방대한 정보를 상시 감시하다 일정 조건을 만족하는 상황이 발생하면 그것을 빠르게 알려주거나 단순히 전통적으로 존재해 온 금융 분야를 일부 자동화하고 수수료를 받는 정도의 일을 수행합니다. 그게 아니라 더 진지하게 트레이딩 봇이나 시스템 트레이딩(둘 다 넓은 의미에서 스스로 거래하는 기계를 의미)을 한다는 회사들도 보통은 사람이 입력해 둔 수식이나 조건을 만족시켰을 때 사람이 정해놓은 규칙에 따라 자산을 사고 파는 정도의 기계를 만듭니다. 이 분야에서 최첨단을 달리는 헤지펀드나 IB(투자은행)에서 일하는 퀀트(quants, quantitative analyst)들이 하는 일도, 주가의 움직임에서 기존에 발견되지 않은 특정 구성요소(factor, smart beta)를 찾아내고 포트폴리오(거래 가능한 자산의 구성과 조합)를 최적화(portfolio optimization)해서 위험 대비 기대수익률을 높이거나 수학적인 분석을 통해 거래비용을 낮추는 일(transaction cost analysis)입니다.


반면 무브가 시도해 온 것은 “스스로 생각을 하고 분석을 할 줄 아는 금융 뇌”를 설계하는 것에 가깝습니다. 사람의 뇌, 비유하자면 뉴런과 시냅스를 모사한 구조를 설계하고, “더 싸게 사서 더 비싸게 팔면 돈을 버는 것이고, 목표는 더 많은 돈을 버는 것이다”라는 “게임의 룰”을 가르치고, 그 다음에는 “자 여기 그동안의 시장 움직임에 대한 (사람이라면 평생 읽을 수 없는 분량의) 기록이 있으니 니 머리로 알아서 공부해 봐”라고 하는 것에 가깝죠. 이 시도는, 시장의 움직임은 브라운 운동이나 랜덤 워크가 아니라, 트레이더나 기존 봇들이 어떤 시장 상황에 대해 의식적으로 혹은 무의식적으로 보이는 패턴이나 경향이 존재한다는 가설을 전제로 합니다. 이 방법의 특징은 기계가 돈을 벌어와도 왜 돈을 벌었는지 알기가 힘들고, 돈을 잃어도 왜 잃었는지 알기가 힘들다는 것입니다. 인과관계를 논리적으로 설명할 수 없습니다. 마치 아기가 어떻게 말을 배우는지 논리적으로 설명할 수 없듯이요. 금융 분야 전문가들이나 금융업자들은 이런 접근 방식에는 본능적인 거부감을 갖습니다. 그들의 상식에도 맞지가 않고, 법에도 저촉되죠. 이들은 보통 자기 돈으로 거래(prop trading)하기보다는 다른 사람의 돈을 대신 운용해주고 그 대가로 일정 비율의 수수료(management fee)를 받는데, 수익이 많이 났을 때야 모두가 만족을 하니 문제가 되지 않지만, 손실이 발생을 했을 때에는 손실을 해명할 의무(fiduciary duty)가 발생하기 때문이죠. 그런데 현행법 상으론 “엉엉.. 제가 금융 알파고를 만들었는데 알파고가 졌어요”라는 설명은 법정에서 채택이 될 수 없습니다. 그러면 사기죄가 성립하죠. 그렇기 때문에 일반적으로는 이 분야로는 접근조차 하지 않죠. 남는 것이 없으니.


그래서 선행 연구도 없고, 참고할만한 책도 없는 상태에서, 저희는 정말로 (알파고를 만든) DeepMind의 논문을 읽고, (크루비를 시작할 때처럼) 좌충우돌 해가며 한 걸음 한 걸음 느리게 걸어갔습니다. DeepMind야 구글의 엄청난 슈퍼컴퓨터들의 도움이라도 받았죠. 저희는 컴퓨터에 꼽혀있는 그래픽카드로 느릿느릿 연산을 해가면서요. 처음에는 프로그램을 실행시키는 것부터가 문제였습니다. 코드 첫 줄을 작동시킬 수 없는 지경이었죠. RL 분야에도 많은 논문들이 있고, github에도 수많은 코드들이 있었지만, 그런 논문, 연구, 코드들의 대부분은 재현조차 되지 않고 실효성이 없었습니다. 저명한 논문에서도 저자도 모르는 버그들이 허다했고요. 저명한 논문의 저자에게 이메일로 물어보면 “잉? 너 그거 어떻게 알았냐? 나도 그 부분 틀린 거 같아서 지금 고민+연구중.” 정도 답을 받는다거나. 이마저도 의미있는 답을 해줄 수 있는 건 Google Brain 소속 연구원들인 경우도 있었죠.


좌충우돌 끝에 지난주에 이르러서야 무브 트레이딩 봇의 첫 베타 버전으로 하여금 모 증권사 HTS를 통해 KOSPI 선물 시장에서 거래를 하게 해 보았습니다. 이것은 오늘을 포함해 지난 3일 간의 결과인데, 우리 트레이딩 봇이 “매수”를 한 지점에 빨간색 점을 찍었고, “매도”를 한 지점에 파란색 점을 찍었습니다. 


실제 상황입니다.





11월 14일 





11월 15일 





11월 16일 




(* 2017-12-19 업데이트: 이제 저희는 6주 이상의 track record를 보유하고 있으며, 트레이딩 봇의 수익률은 오르비 AI펀드 수익률 업데이트 게시물에 지속적으로 업데이트하고 있습니다.)






이 점들은 시간이 지나고 나서 높은 곳, 낮은 곳을 보고 찍은 것이 아니라 실제로 시장이 그 지점을 지날 때 그 가격에서 거래를 하고 찍은 것입니다. 주식 거래를 해본 적이 없는 분들도, 그래프의 낮은 지점에 빨간색 점이 찍히고, 높은 지점에 파란색 점이 찍히면 돈을 버는 것이겠구나, 정도는 추론할 수 있으시겠죠? 그리고 실제로 거래를 해본 분은 이것이 우연만으로는 얼마나 발생하기 힘든 상황인지 더 절절히 체감이 되실 것입니다. 


앞으로 몇 주 내지 몇 달 더 국내 시장에서 유효성을 검증하고 난 후에는 미국 선물 시장과 외환, 가상화폐 시장에도 우리 트레이딩 봇을 출석시켜 보고 싶습니다. 한국의 교육, 한국의 패션은 미국의 교육, 유럽의 패션과 차이가 있지만, 한국의 수학과 미국의 수학, 한국의 금융과 유럽의 금융에 적용되는 공식은 동일하니까요. 


지난 달 저희는 한 장에 천만원이 넘는 Tesla V100이라는 그래픽카드를 구입했습니다. 한국에서는 거의 첫번째 구매자 명단에 들어가 있습니다. 지금까지는 게임 애호가들의 컴퓨터에도 꼽혀있는 Titan X라는 그래픽 카드를 묶어서 여기까지 왔지만, 앞으로는 좀 더 빠른 속도로 "미래"를 향해 나아가보려고 합니다.





— 





그럼 다시 처음으로 돌아가서, 오르비는 무엇을 하는 회사인가?


교육으로 시작했고, 지금은 의류유통업에서 주된 매출을 얻는 회사이지만, 


이 시각 현재 오르비는, AI 회사입니다.






저희와 함께 “Move Mankind Forward” 할 연구원을 채용중입니다. 

Reinforcement learning, financial engineering 분야에 expertise/experience가 있는 분들의 지원을 기다립니다. 


함께 인류를 진보시킵시다. 


이력서를 보내주실 이메일 주소는 cfo@move.is 입니다. 



0 XDK (+6,850)

  1. 2,000

  2. 10

  3. 10

  4. 10

  5. 500

  6. 1,000

  7. 10

  8. 1,000

  9. 10