gimmesilver's blog

Agbird.egloos.com

포토로그



교육을 위한 대용량 데이터 분석 데이터분석


 그리 멀지 않은 미래에 수천만명의 학생들이 온라인으로 수학을 공부하게 될 것이다. (그렇게되면) 학생들이 푼 수십억개의 연습 문제들에 대한 신규 데이터들이 쌓일 것이다. 

 이 데이터를 통해 우리는 학생들이 어떤 문제와 씨름하고 그것을 풀어내는지 알 수 있을 것이다. 반면 동일한 문제를 어떤 학생들은 풀려고 애쓰다가 포기하고 말 것이다. 이런 데이터 속에는 누군가는 빠르게 학습을 마치고 다른 누군가는 뒤떨어지는 등의 여러 가지 학습 과정이 나타날 것이다.

 10년 전 아마존에서 우리는 사람들이 우리 웹사이트를 누비는 행태를 추적했었다. 우리는 사람들이 어떤 페이지에서 다른 페이지로 넘어가기 위해 링크를 클릭하는 확률에 주목했고 사람들이 우리 사이트를 지나 어디에서 헤매는지 살펴봤다. 이렇게 사람들이 구매하는 과정을 통해 우리는 다른 미래의 소비자가 어떻게 하면 좀 더 쉽게 구매를 할 수 있을지에 대한 방법을 배웠다.

 구글과 마이크로소프트에서도 웹 검색을 이용해서 사람들로부터 비슷한 교훈을 얻는다. 구글에서는 언제 사람들이 자신이 원하는 것을 발견하는지 주목한다. 차후에 다른 사람들도 같은 검색을 시도하면 구글은 이전 검색 이용자로부터 배운 것을 교훈삼아 새로운 검색 이용자가 좀 더 쉽게 그들이 원하는 것을 찾을 수 있도록 이끈다.

<중략>

 우리는 어떤 문제를 푸는데 어려움을 겪은 학생이 다른 문제에서도 힘들어하는 것을 알 수 있다. 가령, (3x - 7 = 3) 이라는 문제를 잘 못 푸는 학생은 (2x - 13 = 5) 라는 문제도 어려워 한다.

 여기서 우리는 만약 특정 개념을 잘 이해하지 못할 경우 푸는데 어려워할 수 있을 만한 문제 집합들을 얻을 수 있다. 가령, (3x - 7 = 3) 과 같은 문제를 잘 못푸는 학생들은 -7 을 반대편 등식으로 넘기는 개념에 대해 혼란스러워한다. 

 그리고 우리는 이런 문제들 중 특별히 해당 개념을 잘 소개하고 있어서 학생들이 그런 몰이해를 극복하고 이전에 못 풀었던 문제를  풀 수 있도록 도와줄 수 있는 문제를 찾을 수 있을 것이다. 이를테면 (3x - 7 = 3) 같은 문제를 못 풀던 학생도 좀 더 쉬운 (x - 5 = 0) 이나 (2x - 3 = 1) 같은 문제를 먼저 풀게하면 대개 다른 (좀 더 어려운) 문제들을 풀 수 있다. 

 그렇다면 우리는 이런 비슷한 유형의 문제들 중에서 특별히 학생들에게 효과적이고 빠른 학습을 유도할 수 있는 방법을 찾을 수 있다. 선생들은 항상 이걸 배우려면 저걸 먼저 배워야 한다고 생각하지만 실제 데이터를 분석했을 때 다른 결과가 나온다면 어떨까? 만약 우리가 문제 푸는 순서를 바꿨을 때 학생들이 더 빨리 어떤 것을 배울 수 있다면 어떨까?

 심지어 우리는 효과적이고 빠른 학습을 위한 개별적이고 차별화된 학습 과정을 찾을 수 있다. 어떤 학생들은 정규 교과 과정을 밟음으로써 더 빨리 성장할 수 있지만 어떤 학생들은 특정 문제 유형에서 힘들어 할 수 있다. 우리는 이렇게 학생들이 학습에 어려움을 겪을 때마다 해당 개념을 이해하고 다른 과정으로 넘어갈 수 있도록 (여러 가지 다른) 학습 과정을 시도해 볼 것이다. 우리는 이전에 (비슷하게) 어려움을 겪었던 학생들의 경험을 바탕으로 그들을 성공적으로 인도할 수 있는 학습 방법들을 알게 될 것이다.

<하략>

* * * * *

 며칠 전 TV에서 광저우 아시안 게임에 출전하는 체스 국가 대표 선수에 대한 이야기를 보았다. 초등학교에 다니는 학생인데 체스만 잘 두는게 아니라 학교 공부도 최상위 수준이라면서 마치 체스를 배우면 머리가 좋아지고 그래서 공부도 잘 할수 있다는 듯이 소개되었다. 
 인과(因果)와 상관(相關)에 대해 기본적인 구분조차 못하는 사람들이 무슨 아이들의 공부에 대해 논의할 수 있을까만은 이런 것도 다 자녀들의 특성에 맞는 좋은 교육 방법을 찾기가 무척 어렵기 때문에 중구난방하는 것이라 생각한다.

'IT 업계가 사회 과학 분야와 산학연계를 하면 어떨까?' 라는 글에서도 썼지만 기존에는 감히 분석할 엄두도 내지 못하던 양의 데이터를 분석할 수 있는 능력을 갖게 되면서 많은 분야에서 새로운 정보를 얻을 수 있게 되었다. 교육계에서도 이렇게 전에 얻지 못했던 대용량의 학습 데이터를 확보하고 이를 처리할 수 있는 기술력을 갖게 된다면 교육에 대한 보다 과학적이고 합리적인 시도들을 할 수 있을 것이다.


핑백

  • gimmesilver's blog : 데이터 가치 정량화, 구글 헬스 2011-06-27 21:38:11 #

    ... 의료'와 '교육'이라고 생각한다(만약 내가 빅 데이터 관련 사업을 벌인다면 교육 서비스를 만들것이다). 빅 데이터를 교육에 활용하는 것에 대해서는 '교육을 위한 대용량 데이터 분석' 이라는 글을 참고하면 되겠고 의료 역시 이와 비슷하게 전 세계 수많은 사람들의 다양한 증상과 치료 과정을 수집해 분석할 수 있다면 아마 의료계의 ... more

덧글

댓글 입력 영역