lee.JPG

 

 

1. 교수님의 주요 관심/연구분야에 대한 소개를 부탁드립니다.

저의 주요 관심분야는 크게는statistical learning (또는 machine learning)과 다변량분석(multivariate analysis)이고, 세부적으로는 classification, ranking, dimension reduction, kernel기법등에 관심이 있습니다. 포괄적으로 보자면, 그동안 제 연구의 많은 부분이 통계학과 machine learning의 접목에 대한 것이라고도 할 수 있겠네요.

 

 

2. 먼저 올해 ASA Fellow로 선정되신 것을 진심으로 축하드립니다. 학자로서 큰 영예의 하나일텐데 감회가 새로우실 듯 합니다. 이를 계기로 느끼신 개인적인 소회나 앞으로의 각오가 있다면 말씀해 주시겠습니까?

감사합니다. 매해 ASA Fellow리스트를 보면, 학문적인 성과가 이미 너무 잘 알려진 통계학자들 가운데서 뒤늦게 Fellow로 선정되는 이들이 종종 있습니다. 개인적으로는 그런 뒤늦은 선정이 훨씬 더 의미가 있을거라 생각하곤 했는데, 올해 제가 ASA Fellow가 된건 아무래도 이른감이 없지 않네요. 직접적으로는 저를 위해 추천서를 써주신 분들께 감사드리고, 그동안 학문적으로 많은 도움을 주신 저의 지도교수님, 동료들, 그리고 제자들에게 고마움을 전하고 싶습니다. 한사람의 학문적 성장이란 혼자만의 것이 아니고, 많은 이들의 도움이 없이는 가능하지 않기에 Fellow 선정은 여러모로 저를 겸손하게 만드는 경험이기도 했습니다.

 


3. Support Vector Machine (SVM)은 classification, regression, pattern recognition 등에 폭넓게 사용되고 있고 일반 대중의 관심은 높은 편입니다. 교수님의 주 연구분야 중 하나인 Multicategory Support Vector Machines에 대한 소개와 연구 성과에 대해서 말씀해주시겠습니까?

2000년대 초반에 제가support vector machine (SVM)에 대한 공부를 처음 시작할 당시에는 개인적으로 이 분류기법이 지금처럼 대중화될 거라고 예상하지 못했는데요. Machine learning에 대한 전반적인 관심과 관련 분야 연구자들의 활약으로 이제는 reproducing kernel을 이용하는 kernel기법들이 여러 분야에서 광범위하게 자료분석의 도구로 사용되고 있습니다. 
Multicategory SVM은 저의 박사 학위 논문 주제였는데, 이진(binary) 분류를 위해 고안된 기존의 SVM에 대한 통계학적인 해석을 바탕으로 구분하고자 하는 범주가 셋이상인 경우 통계적인 일관성(statistical consistency)을 유지하면서 어떠한 방식으로 SVM의 확장이 가능한지를 보여주는 것이었습니다. 제 논문에서 제시한 특정한 형식의 확장은 한편으로는 SVM이 어떻게 다른 분류방법들 (이를테면 logistic regression 또는nearest neighbor 방법)과는 달리 독특한 방식으로 이진 분류 문제를 다루는지를 다시 한번 상기시키고, 다른 한편으로는 algorithm적인 방법인 SVM을 분류의 consistency라는 좀더 기초적인 통계적 관점에서 보게 했다고 할 수 있습니다.

 


4. 교수님의 최신 연구 분야의 하나인 Ranking에 (http://www.stat.osu.edu/~yklee/talks/Madison-ranking.pdf) 관한 질문입니다. 대상의 ranking을 위해 사용되는 주된 통계학적 방법은 무엇이며 그 과정에서 가장 어려운 단계가 있다면 무엇입니까? 관련 연구의 진행은 어떻게 되고 있는지요?

제가 ranking문제에 관심을 가지게 된 계기는 우연히 듣게 된 컴퓨터 공학과 세미나를 통해서였는데요. Ranking과 classification이 통계적으로 굉장히 밀접한 문제라는 것을 알게 되고, 실제적으로 classification에 쓰이는 여러가지 계산적인 방법들이 적절히 변형되어서 ranking에 두루 쓰인다는 것을 알게 되면서, ranking에 대한 통계학자로서의 근본적인 질문들을 던지게 되었습니다. 이를테면, classification 문제에서 최소 분류오류율 (Bayes error rate)을 주는 이론적으로 생각할 수 있는 최적의 분류방법을 정의하듯이, 주어진ranking 문제에서 최소의 ranking 오류율 또는 반대로 최대의 정확도을 주는 이론적으로 최적인ranking함수가 무엇인지를 생각하게 되었고, 나아가 그러한 최적의 ranking함수를 자료를 가지고 구현하고자 할때 계산적인 편의상 어떠한 손실함수 (loss function)를 대체해서 쓸 수 있는지, 그리고 그에 따라 얻게 되는 ranking 함수는 원래의 이론적으로 최적의 함수와 어떠한 관계가 있는지 등등을 연구하게 되었습니다. 처음 시작은 bipartite ranking이라는 가장 쉬운 형태의 문제에 대한 것이었고, 그 이후 결과들을 multipartite 경우로 확장하였습니다. 최근에는 좀더 복합적인 형태의 ranking 문제들 (이를테면 preference learning)을 생각하고 있고, 분류 문제와의 관련들을 더 깊이 생각하고 있는 중입니다. 이 분야의 연구를 하는데 있어서 가장 어려운 단계라기 보다는 ranking 관련 문제들을 다루다 보면 순위를 보존하는 변형(transformation)을 생각하게 되고, 그런 변형하에서 불변인 함수의 class를 뭔가 수학적으로 우아하게 다룰수 있는 이론이 있을 것 같긴 한데, 저의 수학적인 지식이 거기까지는 닿지 못한 점이 좀 아쉽다고나 할까요. 

 


5. 과거에 비해 computing 능력은 통계학 전공자가 지녀야 할 기본조건이 되어가고 있습니다. 통계학을 전공하는 후학들이 앞으로 특히 갖추어야 자질이 있다면 말씀해 주십시오.

물론 통계학자로서 어떠한 기여를 하고자 하는지에 따라 갖추어야 할 자질들이 어느 정도는 다르겠지만, Computing의 중요성에 대해서는 이미 많은 통계학자들이 이야기를 해왔습니다. 교과서적인 자료분석 사례들을 넘어서 대용량의 복잡한 자료들을 쉽게 다루고 필요한 계산과 분석을 효율적으로 할 수 있는 실용적인 기술 뿐만 아니라, 관련된 optimization 이론들 (이를테면 convex analysis)과 통계적 방법 또는 문제에 대한 근본적으로 계산적인 접근들 (이를테면 cross-validation, bootstrap, Monte Carlo 기법 등등)의 장단점을 잘 이해하는 것도 중요하다고 생각합니다. 더불어 통계학자들이 다른 분야의 사람들과 팀을 이루어 분석 및 연구활동을 하는 경우들이 더욱 빈번해졌는데, 주어진 실제 문제들을 통계학적인 틀안에서의 적절한 문제로 변환하고, 그러한 문제를 푸는데 필요한 통계학적인 아이디어들과 그 결과들을 다른 구성원들에게 명확히 전달할 수 있는 의사소통 능력도 매우 중요한 자질 가운데 하나라고 생각합니다.

 

 

6. The Ohio State University (OSU) 통계학과는 프로그램 규모가 큰 학교 중의 하나입니다. OSU 통계학과가 가진 강점은 무엇입니까? 다른 top-tier 학교들과 차별화된 전략이 있다면 무엇인가요?

학과 규모가 큰 만큼 학생들이 다양한 분야의 연구들을 접할 수 있고, 과내의 교수들끼리 공동 연구도 매우 활발해서 주제면에서 상호 보완적인 두명의 지도교수와 함께 논문을 쓰는 학생들도 상당수 있습니다. 더불어 학교자체의 규모도 커서 통계적인 응용과 관련하여 다른 분야의 전문가들과도 쉽게 만날수 있다는게 또 하나의 장점이라고 볼 수 있겠네요. 최근에 Data analytics가OSU의 주력분야로 부상해서 컴퓨터공학과와 함께 운영하는 새로운 학부 전공이 생기고, 빅데이터 분석과 관련하여 통계학에 대한 관심이 날로 증가하고 있는 추세입니다. 이에 따른 학교의 지원과 저희 학과의 관련분야 교수진도 더 늘어날 전망입니다.

 

 

7. JSM 2016 의 Korean International Statistical Society (KISS)의 Program Chair로 선정되셨습니다. 그동안 KISS의 주요 활동에 참여하셨을텐데 Chair로서 생각하시는 바가 있다면 무엇입니까?

Program Chair로서의 주요활동은JSM (Joint Statistical Meetings)에서KISS관련된 세션 기획과 멤버들의 참여를 돕고, 간접적으로는KISS의 인지도를 높이는 것인데, 지금까지의 활동은 JSM 2016의 기획세션 (invited session)들을 구성하는 것이었습니다. 올해는 특별히 KISS이름아래 제출된 기획세션 계획안들이 기록적으로 많아서 Program Chair로서 상당히 만족스러웠고, 개인적으로는 다양한 분야의 신진 학자들이 본인의 연구를 바탕으로 세션을 기획하는 과정을 옆에서 지켜보고 또 한편으로는 제가 도울 수 있는 범위안에서 기획자들을 보조해 줄 수 있었던 점에 보람을 느꼈습니다. 학회 세션을 기획하는 것은 연구 논문을 쓰는 것과는 좀 다른 활동으로, 현재 학계의 전망과 주요한 연구자들의 최신 업적에 대한 정보, 주제와 연사의 선정등 여러가지 면들을 고려해야 하는데, 특히나 신진학자들이라면 굳이 JSM이 아니더라도 다른 학회의 세션을 한번쯤은 꼭 기획해 보라고 권하고 싶네요.









제목 날짜
태그 목록