
Jeremy
글을 쓰기 전, 구성에 대한 깊은 고민을 했다. 작은 네모 칸 안에 양적 연구라는 주제로 어떤 글을 써야 구독자 분들의 흥미를 돋울 수 있을까? 고민 끝에 구독자분들에게 내가 했던 고민들을 털어놓기로 결심했다. 나의 이야기가 어떤 이들에게는 공감이 되어 작은 위로가 되기를, 또 연구를 막 시작하는 단계에 있는 분들에게는 조금이나마 도움이 되기를 바라며 지난 3년 간의 양적 연구 여정을 일기(?)로 작성했다.
어쩌다(?) 양적 연구를?
학부 4학년이 되어서야 국제정치의 근간을 이루는 현실주의, 자유주의, 구성주의 간 이론적 논쟁에서 벗어났다. 이후 국제정치의 최신 쟁점을 다루는 수업을 수강하면서 나는 현상에서 갖는 궁금증들을 조금 더 구체적으로 설명할 수 있는 중범위 이론에 이끌렸다. 원조 규모가 증가해도 수원국이 발전하지 못하는 이유는 무엇일까? 다국적 기업들이 많은 나라들 중 굳이 “권위주의 국가”에 해외직접투자를 하는 이유는 무엇일까? 경제 논리로 설명할 수 없는 질문들에 구원 투수로 등장하는 정치 이론들은 굉장히 매력적이었다. 하지만 흥미로운 연구 질문 제기와 이론 소개 파트가 끝나면 찾아오는 수식들과 통계표들은 나에게 공포 그 자체였다. 논문을 읽다 방법론 파트를 마주할때면 난 항상 “오 무슨 근거로 저자는 이러한 수식들과 통계표가 자신의 이론을 뒷받침할 수 있다고 주장하는거지?”와 같은 생산적인 질문을 떠올리는 것이 아니라 “오 도대체 해당 저자들은 어떠한 인생을 사셨길래 문과의 중심인 (국제)정치학 논문에서 이런 괴상한 수식들을 아무렇지 않게 쓰시고 우리에게 고통을 주시는거지?” 라는 비틀린 생각으로 해당 파트를 외면해왔다. 마치 기말고사가 코앞이지만 책을 한번도 펴 보지 않아 막막함과 두려움을 느껴 내일의 나에게 모든걸 던져두고 친구들과 피시방으로 직행했던 내 중학생 시절처럼 나는 논문을 읽을 때마다 곧 대학원에 진학할 나에게 모든 짐을 던져버렸다.
양적연구방법을 공부함에 있어 어떤 부분에서 어려움을 많이 느끼시나요?
“대학원 가면 양적연구방법 뿐만 아니라 방법론의 전반적인 과정에 대해 체계적으로 학습하는 줄 알았어요.”
석사과정을 마친 내가 느끼는 어려움과 현재 대학원에 재학중인 혹은 대학원에 곧 진학할 여러분들이 느끼는 어려움에 차이가 있을 수 있다는 점을 고려하여 대학원 재학생 다섯 분에게 똑같은 질문으로 인터뷰를 시도해보았다 (물론 인터뷰 대상 중 타대학원생은 오직 한 명 뿐이라 답변의 객관성은 보장할 수 없다). 돌아오는 답변은 모두 똑같았다. 처음에는 대학원 방법론 수업 커리큘럼이 굉장히 체계적으로 잡혀 있어 수업 내용도 어느 정도 따라갈 만하다고 느꼈는데 어느 순간부터 간극을 메우기 어려울 정도로 난이도가 올라가서 따라가기 너무 힘들었다고 한다. 예를 들어, 계량정치연구 수업을 들으면 교수님께서 통계 결과를 해석하는 방법과 사용된 모형의 메커니즘을 알려주시지만 해당 모형을 온전히 이해하는데 필요한 선수 지식들은 본인들이 알아서 공부해야 한다는 것. 더 구체적으로 이해하고자 교수님께 조언을 구하면 아마 십중팔구는 “경제학과에서 선형대수학와 미적분 학부 과목을 수강한 후 경제통계학을 수강하라”는 답변을 듣게 될 것이다. 하지만 바쁜 대학원생이 학기 중 해당 수업들을 모두 수강하는 것은 쉬운 일이 아니다. 한 주에 적게는 10개 많게는 20개 정도의 논문을 읽으며 발제 준비를 하고, 기타 여러 조교 업무에 석사논문 준비까지.. 또, 유학을 가고자 하는 분들은 영어 시험까지 준비해야 하는 입장에서 몸이 남아 나질 않는다. 여기서 끝이 아니다. 힘들게 구한 데이터를 가공하고 분석하여 결과를 구현해 줄 프로그램을 다룰 줄 알아야 하기 때문에 프로그램 언어를 공부하는 것도 소홀히 하면 안된다. 극한의 스케줄 속에서 양적연구방법 공부를 포기하지 않고 끝까지 챙길 수 있는 방법은 없을까?
양적연구방법 공부의 재미를 깎는 위험 요인들
숫자와 담을 쌓은 문돌이들에게 양적연구의 진입 장벽은 굉장히 높다. 숨막히는 대학원생의 스케줄 속에 우리는 아무런 대책 없이 양적연구방법의 위험 요인들을 접하기 쉽다. 이러한 위험 요인들은 우리로 하여금 높은 진입 장벽에 도전할 용기를 꺾는다. 어떻게 하면 이 위기를 효과적으로 극복할 수 있을까?
양적연구를 학습하는 과정은 크게 두 가지로 나뉜다. 자료를 수집하고 분석 목적에 맞게 데이터를 가공(전처리)하는 과정과 통계 지식을 활용하여 가공된 데이터를 분석하는 과정이다. 첫 번째, 데이터 전처리 과정은 (1) 어떠한 데이터를 수집해야 하는지에 대한 문제에서 시작하여 (2) 데이터를 확보할 수 있는 방법, (3) 데이터의 형태에 대한 고민과 (4) 데이터 가공(전처리), 총 4가지 학습 절차로 구성된다. 우리는 무수히 많은 경로를 통해 (4)번 과정을 효과적으로 배울 수 있고 그렇기 때문에 해당 과정을 가장 먼저 접하게 된다. 학교 강의는 물론, KOSSDA와 같은 외부 강의와 더불어 심지어 유튜브까지, ‘입문자를 위한 코딩 강의’라는 이름 하에 데이터 분석 강의를 너무나도 쉽게 접할 수 있기 때문에 대개 (4)번이 데이터 분석에서 마주하는 어려움의 전부라고 착각하게 된다.
그러나 진짜 문제는 (1)번부터 (3)번까지의 과정에 대한 학습을 대수롭게 여기지 않고 (4)번만 반복학습 하는 과정에서 발생한다. 야심차게 코딩 강의를 틀어 놓고 Hello World를 열심히 따라 치며 프로그래밍 언어를 공부하지만 정작 논문을 쓰기 위해 본격적으로 연구를 시작하게 되면 고난과 역경은 (1)번에서 (3)번 사이에서 발생하여 연마해둔 코딩실력을 발휘하지도 못한 채 연구를 중단하는 경우가 부지기수이다. 필자 본인을 포함하여 해당 케이스에 속한 사람들을 마주하면서 느낀 점은 실증 데이터를 만드는 과정에 대한 이해도가 낮아 본인이 검증하고자 하는 데이터셋 확보가 실질적으로 가능한지, 가능하다면 구축하기 위한 예산과 시간은 어느 정도로 소요되는지 감을 잘 못 잡는다는 점이고, 이러한 감이 없기 때문에 힘들게 가설을 세워도 결국 검증을 하지 못해 앞에서 한 노력들이 무용지물이 된다. 이 부근에서 많은 사람들이 양적 연구에 대한 흥미를 잃고 방황하는 것을 목격할 수 있었다. 죽을 만큼 고생해서 힘들게 이론을 세웠는데 데이터를 구축할 수 없어 분석은 커녕 결국 논문주제마저 포기해야 하니 얼마나 허무맹랑한 일인가.
이러한 불상사를 피하기 위한 가장 최선의 방법은 논문 연구주제를 확보한 즉시 이론을 세우기 전에 (1)번부터 (3)번의 과정을 먼저 시뮬레이션 돌려봄으로써 사이징(sizing)훈련을 계속 해보는 것이다. 이 과정에서 본인 관심분야에 있는 교수님들의 연구조교(RA: Research Assistant) 기회를 적극적으로 활용하는 것은 좋은 훈련 방법 중 하나이다. 본인이 관심 있는 분야의 교수님에게 RAship에 대한 본인의 의지와 능력을 적극적으로 어필해보자. 교수님들은 위에서 언급한 과정을 이미 수도 없이 겪어 보셨기 때문에 데이터 분석을 위한 사이징을 놀랍도록 잘하신다. 고로, RA를 하는 동안 교수님의 연구 사이클을 쭉 따라가보면서 사이징 연습을 계속 해보는 것이 큰 도움이 된다. 설령 교수님이 단순 데이터 수집 업무를 지시하더라도 ‘해당 사이트에서 정보를 습득하는 이유가 무엇인지’, ‘해당 방식으로 데이터를 수집하는 이유는 무엇인지’, ‘해당 업무 이후에는 어떤 단계를 거치시는지’와 같은 질문들을 던지다 보면 긴 시간동안 많은 시행착오를 통해 얻은 교수님만의 노하우를 짧은 시간 안에 획득할 수 있을 것이다.
두 번째 조언은 프로그램 공부를 방학 때 몰아서 하지 말 것. 코딩 연습은 특정 기간에 몰아서 연습하는 것보다 매일 조금씩 시간을 투자하는 것이 더 효과적이다. 아무리 바쁜 스케줄을 소화하더라도 코딩연습을 일주일 이상 손 놓으면 안된다. 코딩은 언어를 배우는 과정과 비슷하다. 최고의 선생님을 만나 외국어를 배우더라도 배운 것을 적용하는 연습을 꾸준히 하지 않으면 결국 제자리로 돌아간다. 매일 조금씩 시간을 낸다는 것이 얼마나 어렵고 고통스러운 작업인지 필자도 잘 알고있다. 이를 극복할 수 있는 가장 효과적인 방법은 전처리 연습을 자신의 연구물로 해보는 것이다. 자신만의 연구물을 발전시켜 나아가는 행복만큼 큰 동력은 없는 것 같다. 꼭 학위 논문일 필요는 없다. 수업에 제출해야 할 텀 페이퍼에도 적용할 수 있는지 고민해보고 시도해보자 (당장 매듭짓지 못하더라도 언젠가는 쓰일 날이 꼭 올 것이다). 완벽하지 않아도 되니 조금씩 그때그때 배우면서 배운 내용들을 실전(페이퍼 작성 혹은 발표)에 꾸준히 적용시켜보자.
두 번째, 데이터 분석에 대한 학습 과정은 (1) 기초 통계지식 학습부터 시작하여 (2) 개별 분석모형 학습, (3) 프로그램을 통해 실제로 구현해보는 작업으로 이어진다. 이 과정은 데이터 구축 과정보다 몇배는 더 고통스러울 수도 있다. 하지만 해당 과정에 대한 공부 또한 재미를 붙일 수 있는 방법은 충분히 존재한다. 무작정 기초 통계 수업을 들으러 가는 것보다 전체과정을 역순으로 먼저 접해보는 것이다. 연구 가설에서부터 출발해보자. 만약 내가 ‘민주주의 국가가 권위주의 국가에 비해 해외직접투자 유치 규모가 더 크다.’라는 가설을 세우고 국가의 정치체제와 해외직접투자 간의 관계를 보고싶다면 적절한 분석 모형을 설계해야 한다. 분석 모형을 설계하기 위해 스스로 정보를 탐색하다 보면 특정 분석기법을 사용하는 이유가 무엇인지, 해당 분석기법을 사용하기 위해서 어떠한 가정이 충족되어야 하는지, 그 가정이 왜 존재하는지, 계속해서 스스로에게 질문을 하게 되는데 꼬리에 꼬리를 무는 질문들을 따라가다 보면 결국 종착지는 기초통계학습의 필요성이라는 것을 절실히 깨닫게 된다. 통계공부를 시작하기 전, 이러한 과정을 먼저 거쳐본 사람들은 기초통계학습의 필요성을 정확히 인지하고 있기 때문에 영문도 모른 채 선배가 혹은 교수님의 조언을 기반으로 학습하는 학생들보다 학습효과가 더 높을 수 밖에 없으며 배우는 과정속에서 이전에 본인이 가졌던 호기심들을 단계적으로 충족하여 학습효능감도 더 높을 수 밖에 없다.
끝 인사
마지막으로, 양적연구방법을 공부하는 과정이 두렵거나 현재 많이 괴로운 분들께 작은 응원의 메세지를 전달하고 싶다. 우리는 사회과학 연구자로서의 정체성을 가지고 있기 때문에 사회현상을 탐구하면서 생긴 호기심을 충족시키려는 욕구가 클 수 밖에 없다. 이러한 욕구를 잘 이용하여 연구방법학습에서 오는 괴로움을 잘 극복할 수 있었으면 좋겠다. 결국 양적연구방법이든 질적연구방법이든 본인이 세운 흥미로운 주장이 얼마나 타당한지 입증하는 수단일 뿐이다. 타인을 설득하기 위한 중요한 도구인 만큼 그 도구를 잘 다루기 위해 고통스러운 배움의 과정을 조금 더 감내해보자.
댓글 남기기