강연준비록 #4. 과학과 학문 그리고 탐구에 대해서

강연준비록 #4. 과학과 학문 그리고 탐구에 대해서

2021-07-11 0 By 커피사유

강연준비록(講演準備錄)은 카페지기 커피사유가 개인적인 강연 활동을 준비하기 위하여 스스로의 생각과 경험들을 정리해두는 공간입니다.

서문(序文)

지난 번에 쓴 강연준비록 #3의 결론부에서 나는 이 다음에 올리는 강연준비록에서는 아무래도 용남고등학교의 2부 강연에 해당할 해당 글의 서문에서 제시한 5번째 질문 – 즉, 다음 질문에 대한 강연을 준비하는 것이 맞겠다고 한 바가 있었다.

  • 고등학교에서 대학교 진학을 위해 탐구 활동을 진행할 때, 탐구 활동은 어떻게 진행해야 하는가? (주제 선정부터 보고서 작성까지, 사례를 들어주면 더 좋음)

그런데 2부 강연의 경우는 고등학생들의 경우는 질문과 답변에 약 20분 이상의 세션 시간을 주어야 할 것 같기 때문에, 사실상 강연 시간은 30분으로 제한된다. 애초에 다루는 문제가 단 하나이지만 그럼에도 불구하고 나는 이 준비 과정에서조차 강연 시간의 제약에 따른 분량에 신경을 쓰지 않으면 안 된다.

그런데 분량 이외에도 신경을 써야 할 부분이 사실 하나 더 있다. 당초에 나는 다음의 네 개의 질문을 나의 강연을 수강하겠다고 희망한 학생들에게 안내해달라고 부탁했는데, 차례를 조금 더 매끄럽게 다듬고 재구성하다가 1부 강연에서 원래 4개의 질문을 모두 할 계획을 깨고 두 개 정도의 질문을 하는 선에서 마무리해버리고야 말았기 때문에, 아무래도 두 개 정도의 질문은 2부로 옮겨야 한다는 것이다. 그러나 어떤 질문을 내가 1부 강연에 도입했고 어떤 질문을 2부에 도입해야 하는지를 알려면 일단은 그 문제의 네 개의 질문을 먼저 제시하는 것이 마땅한 서순일 것이므로, 따라서 제시하면 다음과 같다.

  1. 「과학」이란 무엇인가?
  2. 「과학자」는 어떤 사람인가?
  3. 「학문」이란 무엇인가?
  4. 「대학」이란 어떤 곳인가?

사실, 1부 강연에서의 주된 목적은 처음에 학문과 대학에 대한 학생들의 생각을 떠보기 위하여 3번 질문과 4번 질문을 연달아 맨 처음에 던지고, 그 중간 단계에 해당하는 사전 공개하지 않은 두 번째 질문에 해당하는 「’학문’을 어떤 방법으로 해야 하는가?」에 초점을 맞추어 자연히 3번 질문에 대한 학생들의 생각으로부터, 중간 질문에 대한 답을 제시하는 나의 강연을 통해 4번 질문에 대한 답을 굳이 인도하지 않아도 자연히 도출하게 되는 구도를 도출하는 것이었다. 그래서인지 1번 질문과 2번 질문이 들어오는 것은 Off-Topic이었다. 그래서 나는 1번 질문과 2번 질문을 살리기는 해야 하고, 그리고 기왕이면 1부 강연의 내용을 다룬 지난 강연준비록에서 말미에 고찰한 바와 같이, 강연의 전체 구성을 1부는 자소서 1번 문항, 2부는 자소서 2번 문항에 대하여 다루면 좋겠다는 생각이 들었으므로 이러한 내용과 연계하여 볼 때 2부 강연의 주제는 아무래도 위 질문에 대한 것이 맞으며 내가 고등학교 때에 어떤 탐구를 어떻게 진행했고 어떤 어려움이 있었는지를 회상하여 낱낱이 공개할 필요가 있다는 생각이 든다.

두 남은 질문은 첫 번째에 던질 계획이다. 왜냐하면, 강연준비록 #1에 등장하는 과학적 탐구 방법을 자명하게 이 2부 강연의 주제상 다루어야 할 것이기 때문이다. 과학이라는 것이 사실은 모든 학문에 대하여 정의가 확장될 수 있는 것이며, 그러므로 과학자는 자연과학자만을 지시하는 것이 아닌 전체 진리를 위해 탐구하는 모든 이들을 지시하는 말임을 확인시켜주고, 과학적 탐구 방법이 모든 학문의 탐구 방법에 적용되고 있다는 것을 지시한다면, 그리고 그 구체적인 방법을 나의 경험을 통해 도출해준다면 용남고등학교에서 내 강연을 수강하는 12명의 고등학생 중 이공계열과 인문계열 모두를 배려한 최선의 선택이 바로 이것이라고 말할 수 밖에 없을 것이다.

1. 자소서와 생기부, 그리고 내가 무엇을 이야기해야 하는지에 관하여

나는 이 짧은 2부의 강의에서 내 탐구 활동에 대하여 이야기하기로 고민했으며, 그 과정에서 대교협 자소서 2번의 내용이 결과적으로 요약으로서 기능할 수 있으면 좋겠다고 생각했다. 그래서 일단은 전체 내가 이야기할 개요에 해당할 이 대교협 자소서 2번의 내용을 우선적으로 옮겨놓는 편이 나을 것 같다고 생각되므로, 이제 여기 아래에 옮긴다.

나의 2020학년도 서울대학교 자기소개서

Q2. 고등학교 재학기간 중 본인이 의미를 두고 노력했던 교내 활동을 배우고 느낀 점을 중심으로 3개 이내로 기술해주시기 바랍니다. 단, 교외 활동 중 학교장의 허락을 받고 참여한 활동은 포함됩니다. (1500자)

지구과학을 연구했지만 평소 코딩도 좋아했던 저는, 정보과학 영재학급 학생이 자문을 구하러 오면서 ‘지구과학 영재학급 속 숨은 정보과학 영재’라고 불릴 정도로 정보과학과 지구과학 사이에서 진로에 대한 고민이 유독 많았습니다. 이런 저의 내적 갈등을 해결해준 것은 물론, 정보과학적 소양과 지구과학적 열정을 함께 발휘할 수 있는 꿈을 심어준 것이 바로 ‘연흔 곡률 지수’의 개발입니다.

현장연구에서 논문을 찾다가 지수를 이용하면 연흔에서 수괴의 존재만이 아닌 당시의 유속과 물이 흐른 방향까지 알 수 있다는 사실을 알게 되었습니다. 이에 매력을 느껴 학계에서는 연흔을 어떻게 기술하는지 찾아보았는데, 그 결과 연흔을 위쪽에서 본 모습은 상응하는 지수가 없어 정성적 분류만이 존재한다는 사실을 알게 되었습니다. 저는 유속과 관련 높은 연흔 상부를 기술하는 지수가 없다는 것은 이상하다고 생각하여, 직접 지수를 만들어보자는 결심을 했습니다.

처음에는 크기와 모양이 제각각인 연흔 상부를 어떻게 수학적으로 기술할 수 있을지 막막했습니다. 유속이 빠를수록 상부가 너비에 비해 그 폭이 커진다는 것에 착안하여, 폭에 대한 너비의 비로 ‘연흔 곡률 지수’를 정의했지만, 대부분 좌우로 이어진 연흔은 하나의 샘플에서 지수 값이 여러 개 산출되는 문제가 있었습니다. 돌출부들에 대한 평균으로 지수를 정의했으나, 검증 과정이 엄밀치 않아 지수의 체계성과 타당성이 떨어진다는 피드백을 받기도 했습니다. 꽤 실망했지만, 새로운 지수의 설계와 엄밀한 검증법 설계를 통한 타당성 입증이 얼마나 어렵고 중요한지 깨닫게 되었습니다.

검증법 설계에 제 정보과학에 대한 역량이 이용될 수 있다는 것을 발견한 것은 빅데이터 분석에 관한 영상을 본 때였습니다. 평소 정보과학에 흥미를 느끼고 있던 저는 데이터를 시각화하고 특징을 발견하는 데이터과학에 매력을 느껴 도서를 찾아보았습니다. 그 결과, 의사 결정 트리의 분류 기준인 정보 엔트로피를 이용하면 기존 분류에 대응하는 지수 범위를 산출할 수 있다는 결론에 이르게 되었고, 두 데이터 집합에서 최적의 경계선을 찾는 ‘경계선 알고리즘’을 개발하여 지수에 대한 신뢰높은 검증을 마칠 수 있었습니다.

… (후략)

또한 자기소개서 이외에도, 내가 연구활동을 한 것은 모두 고등학교 생활기록부에 기록되어 있는데, 내가 궁극적으로 고등학교 2년의 생활에서 탐구를 진행하였던 「연흔곡률지수」에 관한 연구에 관한 부분만을 발췌하여 옮기면 아래와 같다.

고등학교 1학년 생활기록부 자율활동 일부

… 창의연구발표회(2019. 11. 12.)에서 ‘교차연흔과 해파의 특성에 따른 연흔 발달에 관한 연구’ 결과를 발표, 연흔 모양의 정량적 기술에 어려움을 겪어 연흔곡률지수를 설계하고 실험 해석에 사용하는 등 창의성을 보였으며 …

고등학교 2학년 생활기록부 자율활동 일부

자율탐구활동(2020. 05. 27. – 2020. 08. 14.)에서 ‘모의 환경에서 연흔의 재현 가능성’을 주제로 탐구 활동을 진행함. 전년도 연구 활동에서 부족한 점이었던 ‘연흔 곡률 지수의 도출 과정에 대한 신빙성을 높이기 위하여 연흔 상부 사진, 연흔 샘플을 이용한 연흔 곡률 지수를 산출하고, 정보 엔트로피와 경사 하강법을 이용하여 각 연흔 파형 종류에 대한 최적값을 도출함. 이를 모의 폐수로 실험을 통해 얻은 연흔 데이터에 적용하고, 커널 밀도 추정과 히스토그램을 활용하여 데이터를 시각화함. 연구 과정 중 만 구조 모형 실험에서 발달하는 특이한 퇴적 구조를 전공 서적을 참고하여 대륙 주변부의 대륙붕과 대륙 사면 관련 지형임을 찾아내는 등, 열정적인 탐구역량을 보임.

창의연구발표대회(2020. 07. 03.)에서 분석 프로그램의 동작을 시연하고 ‘연흔 곡률 지수’의 전망성에 대한 타당성을 높이기 위해서 개선되어야 할 점을 피드백 받으며 연구 발전 방법과 추후 방향을 모색함.

… (후략)

고등학교 2학년 생활기록부 진로활동 일부

진로전공탐색활동(2020. 05. 21. – 2020. 08. 06.)을 통하여 자신의 지난 1년을 성찰하여, 지구과학 지식을 바탕으로 대기 현상이나 지질 구조 등을 설명할 때, 코딩을 활용하여 데이터를 분석하고 이를 연구에 활용할 때 자신이 보람을 느낀다는 사실을 깨달음. 데이터를 심층분석하며 이를 다양한 분야에 적용함. 예를 들어, 1학년 때부터 지속해오고 있는 ‘연흔 곡률 지수’에 대한 연구에서 지수의 타당성을 검증하기 위한 방법으로 정보 획득과 경사 하강법과 같은 머신러닝 기술을 활용하여 자신만의 ‘경계선 구분 알고리즘’을 개발함. 이러한 활동을 기반으로 지구의 다양한 데이터를 이해하고 분석하는 지구빅데이터분석가를 희망함.

고등학교 1학년 융합과학 탐구 세부능력특기사항 일부

… 퇴적구조 관련 수업에서 연흔의 형성에 대하여 관심을 가지고 추가 문헌 조사를 진행하면서 교차 연흔이라는 특이한 연흔에 관한 연구가 많지 않다는 점에서 연구 주제를 착안함. 해파의 특성에 따라 연흔의 발달 양상이 어떻게 다른지 조사하는 과정에서 기존의 연흔지수(R.I)1(커피사유 주) Ripple Index의 약자이다.와 연흔대칭지수(R.S.I)2(커피사유 주) Ripple Symmetry Index의 약자이다.의 개념을 도입하여 정량적으로 해석함. 이 과정에서 정량적인 수치를 나타내기 위한 연흔의 모양을 나타내는 데 어려움을 겪으면서 새롭게 연흔 곡률 지수를 설계하여 이를 실험 해석에 도입함. 기존의 연구 과정에 머무르지 않고, 자신만의 연구 해석방법을 고안하여 수식적인 해석을 도입하는 방법을 이용하는 등 적극적이고 비상적인 생각으로 문제를 해결해 나가는 모습이 매우 인상적임. 공동 연구에 있어 팀원과의 역할 분담과 실험 설계, 보고서 작성 등 많은 부분에 있어 의견을 맞추는 과정이 중요하다는 점을 인지하여 계속된 대화를 통해 실험을 진행함. 자유로운 주제 선정에서부터 연구의 진행까지의 과정에서 연구라는 것에 굉장히 매력적이고 재밌다고 느끼며 지속적인 연구 개선 및 피드백을 요구하는 적극적인 자세를 보임.

고등학교 2학년 심화수학 II 세부능력특기사항 일부

… 모평균과 모비율의 추정을 배우고, 데이터 집합에서 평균과 비율만이 아닌 두 데이터 집합 상을 구분짓는 최적의 경계선에 대해 호기심을 가짐. 산포도를 나타내는 분산이 편차 제곱의 평균으로 정의됨을 이용하여, 최적의 경계선에 해당하는 값은 이들 오차가 최소라는 가설 하에 두 데이터 집합의 최적의 경계선을 찾는 알고리즘을 설계함. 이 과정에서 머신 러닝에서 사용되는 비용함수의 개념과 정보 엔트로피의 개념을 조사하고 이를 자신의 블로그에 정리함. 정보 엔트로피를 이용하도록 경계선 알고리즘을 수정하고 이러한 배경 지식을 발표함.

… (후략)

이상의 모든 내용은 내가 고등학교 2년 동안 나의 영재학급에서 진행하였던 교내 R&E의 발전 과정에 대한 자기소개서와 생활기록부의 기술이다. 아무래도 긴 기간 동안 진행되는 연구가 어떤 방식으로 돌아갔는지를 이 경험을 토대로 추억하여 청강하는 학생들에게 나는 연구란 무엇이고 어떤 방식으로 진행하여야 하는지, 그리고 보고서를 어떻게 썼는지에 관하여 간략하게 설명하는 편이 나을 것이라고 생각된다. 그러나 설명해야 할 것은 비단 그것으로 그치지는 않을 것이라 생각되는데, 그러한 이유를 나는 알고 있다.

2. 일반적인 탐구 방법과 보고서 작성에 관한 나의 견해 및 기본 지식에 관하여

나는 강연준비록 #1에서 과학적인 탐구 방법에 대하여 이미 기술한 바가 있었다. 그러나 여기서 다시 한 번 언급하여 정리하는 편이 아마도 나을 것이리라 생각되는데, 왜냐하면 보고서 작성과 그 과학적인 탐구 방법에 대한 제반 지식을 연관짓지 않을 수 없기 때문이다.

일반적으로 「과학」이라고 하는 것은 적어도 표준국어대사전에 따르면 다음과 같이 정의된다.

과학(科學)

「명사」 보편적인 진리나 법칙의 발견을 목적으로 한 체계적인 지식. 넓은 뜻으로는 학(學)을 이르고, 좁은 뜻으로는 자연 과학을 이른다.

위 정의는 일반적으로 통용되는 의미의 「과학」에 대하여 무정의 용어와 다름없을 정의 방식에 의한 암묵적 정의에 비해 조금 다른 뜻을 가지는 것 같다. 일상적으로 통용되는 「과학」이란 보통은 좁은 뜻, 즉 자연 과학을 가리키는 용어로 줄곧 사용되는 편이기 때문이며, 교육 과정에서도 자연과학을 과학이라는 이름 하에 교수하고 있기 때문이다.

그러나 위 정의에서 나는 과학의 보다 넓은 뜻에 주목하고 싶다. 넓은 뜻에 따르면, ‘보편적인 진리나 법칙의 발견을 목적으로 한 체계적인 지식’이 바로 과학이므로, 모든 학문이 사실은 과학이라고 불릴 수 있다는 것을 깨닫게 된다. 이것은 약간 억지와 같다는 생각이 우리의 이 용어에 대한 표준 용례에 의하여 제기되지만, 조금 생각해보면 그렇게 무리도 아니겠다는 생각이 든다. 왜냐하면, 실제 모든 학문에 대한 연구에서는 과학적 탐구 방법들이 사용되고 있기 때문이다.

과학적 탐구 방법은 무엇이겠는가? 과학의 정의에 ‘체계적인 지식’이라는 단어들의 집합이 포함되어 있다는 점을 상기하자. 과학은 보편적인 진리나 법칙에 도달하기 위한 체계적인 지식들이므로, 자명히 체계적이어야 한다. 체계적이라고 하는 것은, 확립된 어떤 규범적 질서 혹은 방식을 이용하여, 기존의 것들로부터 새로운 것들을 생성해가는 어떠한 과정이 존재하는 계(System)을 칭할 때 사용하는 용어이므로, 체계적인 지식에 해당하는 과학에는 이 과학을 구성하는 생성 규칙이 존재하지 않을 수 없다. 그렇다, 바로 이것이 과학적 탐구 방법인 것이다.

흔히 우리가 과학적 탐구 방법에 대해 이야기하면 귀납법 혹은 연역법에 대하여 이야기하곤 한다. 그러나 나는 귀납법은 체계의 공리 혹은 믿음을 구성하기 위해 도입된 최소한의 현실 층위에서의 ‘가져옴’을 위한 방법이라고 간주하는 개인적 믿음이 있으므로, 보다 생성 규칙에 가까운 연역법에 대하여 조금 더 이야기해보고 싶다. 그리고 조금 더 나아가, 과학적인 연역법을 이야기할 때 줄곧 이야기되는 가설-검증법에 대하여 조금 더 논의해보고 싶다.

일반적으로 이야기되고 있는 가설-검증법을 나의 방식대로 기술하면 다음과 같다.

가설-검증법 (커피사유 ver.)

1. 자연 현상을 관찰한다. 그러한 관찰이 자신이 알고 있던 바나 경험에 모순되는 것에서 불편함을 느끼고, 의문을 제기한다. 보통 의문은 왜? 혹은 어떻게? 라는 의문사가 선행되어 완성되는 문장으로 기술된다.

2. 의문에 대한 답을 예상한다.3(커피사유 주) 우리는 흔히 이 예상한 답을 「가설」이라고 부른다.

3. 예상한 답이 맞는지 확인하기 위한 관찰 과정4(커피사유 주) 우리는 흔히 이것을 「실험」이라고 부른다.을 설계하고, 그것을 수행한다.

4. 관찰한 결과5(커피사유 주) 흔히 이것을 우리는 「실험 결과」라고 부른다.와 예상한 답6(커피사유 주) 다른 말로는 「가설」이라고 부른다.을 비교하여 예상한 답의 진위 여부를 가린다.

5. 예상한 답이 맞으면 그 결과를 확립하고,7(커피사유 주) 보통 이 과정을 「일반화」라고도 말하기도 하는데, 다만 약간 위험한 것이 일반적으로 일반화라는 것은 어떤 관찰 및 실험의 결과로부터 어떠한 학설이 이론으로 승격되는 과정을 말하므로, 충분한 데이터가 축적되어야 한다는 것이 전제되기 때문이다. 그러니 단적인 한 개의 실험만으로 일반화가 가능하다고 보기에는 어렵고, 비슷한 실험들이 다양한 조건들에서 이루어져서 가설 혹은 이론을 시험하였을 때 그 가설 또는 이론이 그 시험을 성공적으로 통과하는 경우에 비로소 이루어지는 과정이라고 보는 편이 나을 것이다. 그렇지 않으면 예상을 변경하여 다시 확인한다.8(커피사유 주) 보통 이 과정을 「가설 수정 및 재검증」이라고 부른다.

나는 의도적으로 일반적으로 이 가설-검증법을 기술할 때 사용되는 「가설」, 「실험」, 「문제 제기」 등과 같은 용어들을 사용하지 않고, 「의문」, 「관찰」, 「예상」, 「답」이라는 용어들을 사용했음을 이제 밝혀야겠다. 왜냐하면 내가 지금 여기서 하고 있는 것이란, 고등학생들에게 과학적 탐구를 어떤 방식으로 진행해야 하는지에 대하여 알려주는 것이기 때문이다. 그런데 「가설」, 「실험」, 「문제 제기」는 사실 궁극적으로는 내가 의도적으로 사용한 용어들을 그냥 멋들어져 보이게 압축한 것에 불과할 뿐이라, 사실 기본적으로 모든 탐구 과정은 의문에 대하여 관찰과 예상을 통하여 답을 얻는 과정으로 진행된다고 말할 수 있다.

사실 나는 탐구의 정의를 끌어내기 위하여 여기까지 논의를 진행해왔다. 그러니 이제는 다음에 올 마땅한 서순인 내가 생각하는 탐구의 정의를 정식적으로 제시하는 것이 맞겠다.

탐구(探究)의 정의 (커피사유 ver.)

의문에 대하여 관찰과 예상을 통하여 답을 얻는 것, 혹은 그러한 과정

그러므로 궁극적으로 탐구는 어렵게 생각할 것이 없는 것이다. 일반적으로 의문에 대하여 답을 찾는 모든 과정이 탐구의 과정인 것이며, 탐구 보고서란 그저 그 과정을 기록해둔 것일 뿐이다. 보통 형식에 얽매여서 이러한 탐구를 어떤 식으로 진행해야 할지 막막해 하는 경우를 나는 생각보다 많이 발견했는데, 그것은 탐구의 본질을 제대로 파악하지 못한 경우이거나 혹은 의문을 제기하지 못하는 경우라고 나는 단언할 수밖에 없다.

그러나 과학계에서는 탐구를 기록한 보고서인 탐구 보고서, 즉 이를테면 논문 및 보고서 등에 관하여 형식을 요구하고 있다. 이것은 왜 그러한가? 이것은 오히려 자유로운 탐구 정신을 오히려 형식의 울타리에 가두는 것이 아닌가? 그러나 과학의 정의에 우리는 ‘체계적’이라는 낱말이 포함되어 있다는 사실을 여기서 다시 한번 상기하지 않으면 안 된다. 과학은 발견과 경험으로부터, 그리고 기존의 지식으로부터 새로운 지식 그리고 기술, 이론들을 그 체계성에 따라 생성해낸다. 그러나 과학은 그 체계성에 의하여, 생성되는 지식, 기술, 이론이 기존의 경험과 지식, 즉 자연에 합치되는지 합치되지 않는지를 명백히 그 논리 전개 과정에서 검증할 의무를 동시에 지고 있다. 즉, 과학의 모든 요소는 매우 엄중한 절차를 통해 검증되어야 한다. 그렇지 않으면 그것은 체계적이지 못하기 때문에, 그리하여 자연을 성공적이지 못하게 기술할 수 있기 때문에 절차가 필요한 것이다.

그러하므로 탐구 보고서에 일련의 양식 혹은 절차가 요구되는 것은 이러한 측면에서 당연한 일이라고 생각된다. 그러나 탐구 보고서의 작성에 난항을 겪는 고등학생들을 위하여 나는 내가 고등학교 때에 작성하였던 탐구 보고서의 형식을 다시 한 번 더듬어 되짚어보지 않으면 안 된다. 따라서 나는 내가 작성하였던 보고서들을 읽고 그 대략적인 형식을 여기에 옮겨 두는 것이 나을 것이다.

탐구 보고서의 일반적 형식 (논문 기준)

– 요약 또는 초록(Abstract)
– I. 탐구 동기 및 목적
– II. 이론적 배경
– III. 선행탐구 조사 및 분석
– IV. 탐구 방법
– V. 탐구 결과
– VI. 결론 및 제언

이러한 형식을 모르는 이공계열 학생들은 사실 별로 없을 것으로 추정된다. 그러나 나는 인문계열 학생들을 위해서 간단하게 각 형식에 대하여 조금 설명해두는 편이 나을 것으로 생각되므로 각각에 대하여 간략한 설명을 곁들여야 할 것 같다.

먼저 요약 또는 초록이란 보고서 전체에 대한 요약문을 작성하는 것이다. 둘째로 탐구 동기 및 목적은 이 탐구가 어떤 의문으로부터 출발하였는지 그 구체적인 계기와 의문을 작성하고, 이 탐구에서 무엇을 탐구하고자 하는지를 명확히 규정하는 부분이다. 셋째로 이론적 배경은 탐구와 관련하여 기존에 알고 있는 개념들을 열거하는 것이며, 넷째로 선행탐구 조사 및 분석은 이 탐구와 유사한 선행된 탐구를 찾고 그것이 이 탐구와 어떤 점이 유사하며 다른지를 확인하는 것이다. 그러나 이 과정은 보통 생략되는 경우도 종종 있다. 다섯째인 탐구 방법은 탐구를 어떤 방식으로 진행할 것인지를 아주 구체적으로 기술하는 단락이다. 예를 들어 실험을 진행할 것이라면 그 실험을 어떤 식으로 진행하는지 준비물과 그 진행 방식을 단계별로 나누어 세세하게 적어야 한다. 이를테면 첫째. 공을 굴릴 트랙을 설치한다. 둘째. 공을 지면으로부터 약 60cm 높이에 위치한 트랙 위에 올리고 손으로 잡아 굴러 내려가지 않게 한다. 셋째. 손을 떼서 공이 트랙을 따라 굴러 내려가게 한다 – 이런 식으로 말이다. 여섯째로 탐구 결과는 탐구의 결과를 표, 그래프, 사진 자료 등을 이용하여 효과적으로 정리하고 그것을 해석하는 단락이다. 보통 탐구의 결과는 표로 제시하는 것보다는 경향성이나 변동을 확인하기 쉬운 그래프의 형태로, 그리고 사진이나 그래픽 자료 등을 활용하여 한눈에 데이터의 경향 및 분포를 확인하기 쉽게 제시하는 경우가 보통이다. 해석에서는 이러한 경향성을 발견하고 이것을 논의하거나, 데이터에서의 특잇값 혹은 오차 등의 요인에 대하여 다루는 것이 보통이다. 마지막으로 결론 및 제언의 경우는 이러한 데이터 결과와 경향성에 대한 해석을 종합하여 탐구 질문 즉 의문에 대한 답을 최종적으로 제시하는 단락이다.

그런데 이러한 탐구 보고서의 일반적 형식을 살펴보면 우리는 이러한 탐구 보고서가 사실은 겉만 번지르르하게 구성되어 있지, 사실은 앞에서 정의한 탐구의 정의에 따른 전형적인 기술이라는 것을 확인할 수 있다. 계속 설명에서도 등장했지만, 전적으로 의문에 대하여 예상하고 관찰한 과정과 결과, 그리고 그로써 얻어진 답을 모두 기록한 것이 사실은 탐구 보고서의 실체이기 때문이다. 그러하므로 오늘날 많은 수의 고등학생들이 탐구 보고서의 작성을 어려워한다면 그것은 매우 왜곡된 기우일 가능성이 실로 크다 할 것이다.

3. 고등학교에서 나의 탐구 「연흔 곡률 지수」

고등학교 2년의 과정에서 내가 탐구한 것은 사실 「연흔」이라고 불리는 어떤 지질 구조에 관해서라고 단언해도 좋을 것이다. 2019년 4월의 현장연구를 위한 사전조사 중에 우연히 나는 잔잔한 수괴 연안(호숫가, 해안 등)에서 물결 혹은 파랑에 의하여 생성되는 퇴적 구조인 연흔의 파형이 유속에 따라 달라진다는 것을 발견한 이후로, 이 「연흔」에 대한 「정량화」에 대한 욕구는 총 2년의 시간 동안 다양한 주변 지식들을 학습하도록 만들었기 때문이며 그 모든 과정들이 1에서 기술한 나의 고등학교 시절 생활기록부와 2020학년도 서울대학교에 제출한 자기소개서에도 잘 기록되어 있기 때문이다.

나의 탐구 주제라고 하는 것, 즉 초기의 의문을 설명하려면 연흔의 파형 분류에 대한 간단한 기본 지식을 설명하지 않을 수 없다.

연흔의 파형 분류. 일반적으로 형성된 지역의 유속이 빨라짐에 따라 Straight -> Sinuous -> Linguoid형으로 발달한다.

위 사진은 다양한 연흔의 파형 모습을 나타낸 것이다. 일반적으로 연흔의 상부 파형 형태는 그 연흔이 생성된 지역의 유속이 빨라짐에 따라 Straight -> Sinuous -> Linguoid 형과 같이 조금 더 파형이 굽이치고 중간이 끊기는 형태로 발달한다. 그런데 나는 문득 이 사실을 접할 당시, 이러한 연흔의 파형 모습은 유속을 추정할 수 있다는 점에서 그 중요성이 상당할 테인데, 왜 이러한 연흔의 파형의 모습을 수치적으로 기술할 수 있는 지수 모델을 개발하지 않았을까 하는 궁금증이 들었다. 그 의문에 따라 DBPia 등을 이용하여 선행연구(논문, 각종 학회 요약, 전국과학전람회 및 지역과학전람회 보고서 등)들을 조사해보았는데, 모든 선행연구에서 연흔의 파형 분류란 모두 정성적인 분류로서만 제시되어 있을 뿐이지, 어떤 수치를 통해 이들이 얼마나 파형이 굽이쳤는가에 관한 기술은 존재하지 않았다.

그래서 나는 이 문제를 내가 직접 다루어보기로 결심했고, 그 순간부터 나의 의문은 「생성 지역의 유속과 밀접한 관련이 있는 연흔의 상부 파형의 굽이친 정도를 기술하는 효과적인 수치를 어떻게 만들어낼 수 있을까?」로 정해지게 되었다.

그 주제를 가지고 나는 과학고등학교의 1학년 과정에서 진행되는 내부 과제연구(R&E)에서 이 질문에 대한 예상을 생각했다. 즉, 다른 방식으로 이야기하자면 연흔의 상부 파형을 굽이친 정도를 기술하는 수치에 대한 안(案)을 만들었다. 첫 번째 안, 그러니까 1학년 때, 2019년의 안은 다음과 같았다.

2019년의 연흔 곡률 지수(Ripple Curvature Index)를 측정하는 방법에 대한 나의 예상(안)

나는 이러한 지수를 일단 연흔의 굽이친 정도를 기술하는 지수라는 의미에서 연흔 곡률 지수(Ripple Curvature Index, 이하 R.C.I)라고 이름 붙였는데, 초기 연구였던 2019년의 연구에서는 위 그림과 같이 연흔의 가로 파형을 따라 적색 직선에 해당하는 조사선을 긋고, 조사선에서 조사 방향으로 평행하게 튀어나간 모든 부분의 폭(Ripple Horizontal Width)으로 조사 방향에 수직한 부분의 길이(Ripple Vertical Width)를 나눈 값, 그리고 조사선을 따라 조사한 연흔의 불연속점의 개수 $k$와 조사 시점과 조사 종점을 이은 직선과 조사선 사이의 각 $\theta$를 이용하여 다음과 같이 정의했다.

$R.C.I = {{Ripple Vertical Width} \over {Ripple Horizontal Width}} + 0.05k – 0.01\theta$

물론 보다 정확하게 분석을 하기 위해서는 여러 개의 인접한 조사선을 그어 산출하면 되겠다는 생각을 했다.

이 첫 번째 안이 과연 효과적으로 연흔의 파형을 기술할 수 있는지를 확인하기 위하여 나는 실제 연흔들에 대하여 이러한 나의 안을 적용시켜서, 내가 개발한 연흔 곡률 지수에 대한 예상이 효과적으로 연흔의 파형에 대하여 정성적인 분류에 따라 잘 변동하는지를 확인해야 했다. 그러나 당시 고등학교의 특성상, 자료 수집을 위하여 해안가 등으로 나가 연흔을 수집할 시간이 별로 없었으므로 나는 실험실에서 연흔 생성 조건을 구성하여 만들어낸 연흔과 학교에서 보관하고 있던 연흔 샘플들을 이용하여 검증하는 수밖에 없었다. 나는 모든 연흔들의 상부 사진을 촬영해서 내가 정해놓은 방법으로 분석해서 연흔 곡률 지수를 산출했고, 그것들의 분포 그래프를 그렸다.

그러나 처음 이러한 나의 탐구를 그해 11월의 발표 대회에서 발표했을 때에는, 검증 방법이 조금 더 체계적이고 엄밀하면 좋겠다는 진단을 받았는데, 왜냐하면 그 분포 그래프를 해석하는 과정에서 나는 이 지수가 연흔 상부 파형의 변동에 따라 잘 변동한다는 것을 뒷받침할 수 있는 수학적인 방법을 마련하지 못해서, 수치를 보고 그렇다라고 해석했기 때문이었다.

그래서 나는 이러한 연구를 2년차에 해당하는 2020학년도의 연구에서 R.C.I의 정의와 그 검증법을 바꿈으로써 해결하려고 했다. 우선 R.C.I의 변경된 정의부터 설명하자면, 조금 더 체계적인 방식으로 연흔 곡률 지수를 다음과 같이 정의하는 것으로 변경했다.

2020년의 연흔 곡률 지수(Ripple Curvature Index)를 측정하는 방법에 대한 나의 예상(안)

2020년의 탐구에서 도입한 정의에서는, R.C.I를 정의하기 위해서 우선 한 개의 연흔 돌출부에 대한 R.C.I를 우선 정의하였다. 그것은 연흔의 진행 방향에 수직인 임의의 직선이 튀어나간 부분의 양 끝과 만나는 두 점을 양 끝으로 하는 선분의 길이(Ripple Horizontal Width)와 이 선분에서부터 연흔의 진행 방향으로의 최대 거리에 해당하는 선분의 길이(Ripple Vertical Width)를 이용하여 다음의 수식과 같이 정의했다.

$R.C.I = {{Ripple Vertical Width} \over {Ripple Horizontal Width}}$

그리고 어떤 연흔 지역에서, 여러 연흔 돌출부에 대한 연흔 곡률 지수는 여러 돌출부 각각에 대하여 얻은 연흔 곡률 지수의 산술 평균으로 정의했다.

2020년 정의의 R.C.I에 따른, 임의의 연흔 지역에서 여러 돌출부에 대해 연흔 곡률 지수를 정의하는 방법

$R.C.I = {{\sum{{Ripple Vertical Width} \over {Ripple Horizontal Width}}} \over {n}}$

그리고 오차를 최소화하기 위하여 연흔 지역에서 여러 돌출부에 대한 연흔 곡률 지수를 분석할 경우 가급적 기준 직선을 돌출부 최대 진행점에서 가장 먼 곳에 설정하고, 인접한 돌출부 여러 개에 대해 연흔 곡률 지수를 조사하여 평균을 내어야 하는 산정 조건을 부언하였다.

이상으로 변경된 정의를 가지고 실험실에 있는 여러 연흔 샘플들과 인터넷에서 수집한 연흔 상부 사진을 이용하여 2020년에는 R.C.I에 대한 나의 안이 효과적으로 곡률을 기술하는지를 검증하였는데, 그 검증의 구체적인 방법에서 경계가 잘 나누어지는 것을 보이고 지수와 연흔의 기존 정성적 분류 체계 사이의 대응 관계를 확립하기 위하여 2020년에는 ‘경계선 알고리즘’이라는 것을 도입하였다.

경계선 알고리즘의 아주 깊은 내용까지 설명하면 머리가 아플 것이며 강연 시간도 대부분을 잡아 먹을 것이 아주 분명하므로, 나는 여기서는 단지 정보 엔트로피라는 개념과 머신 러닝의 기법 중 하나인 경사 하강법이라는 정보과학적 기법을 응용하여, 어떤 두 종류의 데이터가 있는 경우 이 데이터를 가장 잘 구분짓는 경계선의 값을 수학적으로 찾아주는 알고리즘이 ‘경계선 알고리즘’이라고 부언하는 선에서 만족하기로 하겠다.

그 정보 엔트로피를 이용하여 나는 내가 확보한 연흔 상부 파형 샘플들을 Straight형, Sinuous형, Linguoid형으로 정성적 분류 기준에 따라 분류하고 그 각각에 대하여 구한 R.C.I를 ‘경계선 알고리즘’을 이용하여 그들 데이터 각 군집의 최적 경계선을 찾았고, 그것을 Python을 이용하여 다음과 같이 도식했다.

결론(結論)

이상으로 해서 나는 나의 고등학교에서 진행했던 「연흔 곡률 지수」에 관한 탐구를 다루었으며, 그 과정을 예시로 들어 내가 일반적으로 생각하는 「탐구」의 정의를 확립하였다. 그리고 이 「탐구의 정의」를 확립하는 과정에서 ‘학문’에 해당하는 ‘과학’의 넓은 정의를 사용하였다.

이렇게 하여 나는 나의 모든 4개의 강의 – 즉, 용남중학교에서의 2개의 강연과 용남고등학교에서의 2개의 강연에 대한 준비를 모두 마쳤다. 따라서 당분간은 강연준비록을 후속으로 쓸 것이 없다. 다음으로 예상되어 있는 것이란 19일 정도에 벌어질 것 같은 모교인 중학교에서의 강연 정도가 될 것인데, 그 때는 그 때 생각하기로 하는 편이 정신 건강에 좋을 것 같다.

덧붙임 (2021. 7. 14.)

지난 12일에 사천용남고등학교에서 진행했던 강연에서 사용한 자료를 다음과 같이 공개한다.

주석 및 참고문헌

  • 1
    (커피사유 주) Ripple Index의 약자이다.
  • 2
    (커피사유 주) Ripple Symmetry Index의 약자이다.
  • 3
    (커피사유 주) 우리는 흔히 이 예상한 답을 「가설」이라고 부른다.
  • 4
    (커피사유 주) 우리는 흔히 이것을 「실험」이라고 부른다.
  • 5
    (커피사유 주) 흔히 이것을 우리는 「실험 결과」라고 부른다.
  • 6
    (커피사유 주) 다른 말로는 「가설」이라고 부른다.
  • 7
    (커피사유 주) 보통 이 과정을 「일반화」라고도 말하기도 하는데, 다만 약간 위험한 것이 일반적으로 일반화라는 것은 어떤 관찰 및 실험의 결과로부터 어떠한 학설이 이론으로 승격되는 과정을 말하므로, 충분한 데이터가 축적되어야 한다는 것이 전제되기 때문이다. 그러니 단적인 한 개의 실험만으로 일반화가 가능하다고 보기에는 어렵고, 비슷한 실험들이 다양한 조건들에서 이루어져서 가설 혹은 이론을 시험하였을 때 그 가설 또는 이론이 그 시험을 성공적으로 통과하는 경우에 비로소 이루어지는 과정이라고 보는 편이 나을 것이다.
  • 8
    (커피사유 주) 보통 이 과정을 「가설 수정 및 재검증」이라고 부른다.