gimmesilver's blog

Agbird.egloos.com

포토로그



'[펌]' 에 대한 단상 단상

구글이 우리 나라에서 유독 힘을 못 쓰는 이유 중 하나가 소위 우리 나라의 '[펌]' 문화 때문이라는 글을 예전이 읽은 적이 있다.
구글 검색 엔진은 특정 문서가 링크(참조)된 수를 파악해서 우선 순위를 정하는 알고리즘을 가지고 있는데 우리 나라 사람들은 주로 링크가 아닌 스크랩(펌)의 형태로 문서를 참조하기 때문에 이 알고리즘이 제대로 동작할 수 없다는 것이다.

이 글이 사실이든 어떻든 '[펌]' 이라는 단어로 대변되는 우리 나라 네티즌들의 자료 스크랩이 다른 나라보다 유별나다는 것을 나타내는 글이라 생각한다.

최근 블로그가 유행을 타면서 이러한 '[펌]'문화는 더욱 확산되고 있다. RSS로 다른 블로그 글들을 구독하다 보면 대략 올라오는 글의 1/4 ~ 1/3 정도는 이런 '[펌]' 글이다.

나 역시 일개 블로거인 주제에 이것에 대해 뭔가 심도 있는 고찰을 할 입장은 못된다. 그리고 그럴만한 글 재주도 없다. 게다가 저작권이 어쩌고 하는 법리적인 주장을 하려는 것도 아니다. 다만 '[펌]'이 자료의 중복을 야기시킨다는 점에서 개인적으로 반대한다.

'[펌]'글은 해당 원문이 있는 위치까지 굳이 링크를 클릭해 들어가지 않더라도 쉽게 글을 접할 수 있기 때문에 읽는 사람에게는 편리할 수 있다. 그 글을 퍼온 당사자 역시 자료 수집 및 보관 측면에서 좋을 수도 있다. 그러나 문제는 퍼온 글을 또 퍼오고 그 글을 다시 퍼가고 하는 과정 속에서 발생되는 문제가 심각하다는 것이다.

프로그래밍에서 Don't Repeat Yourself(축약하여 DRY)라고 하는 원칙이 있다. 코드나 문서/자료 등을 중복하여 생성하지 말라는 원칙이다. 중복된 자료는 유지 보수 시 정보의 불일치를 야기할 수 있기 때문에 적극적으로 피해야 한다.
이것은 비단 프로그래밍 세계에서만 통용되는 것이 아니다. 인터넷에서도 마찬가지로 적용되어야 하는 원칙이라 생각한다.

어떤 자료를 그대로 복사하여 다른 곳으로 옮기고 다시 그 옮긴 자료를 또 다른 누군가 복사해서 옮겼을 때 만약 원문 자료에 오류가 있어서 원문의 저자가 그 내용을 수정했다고 치자 원문은 수정되었어도 그 외에 다른 '[펌]'자료들이 모두 수정될 확률은 희박하다. 특히나 자료 출처가 불분명한 '[펌]'글이 만연하는 현실에서 가능성은 더더욱 줄어든다.
결국 자료는 넘쳐나지만 그 중 신뢰성있는 정보의 비중은 갈수록 줄어들게 된다.

예전에 TV에서 친일파 관련 다큐멘터리를 본 적이 있다. 한 친일파 자손이 지방 유지라는 신분을 이용해서 자신의 조상을 독립 투사였던 것처럼 꾸미는 과정이 나왔다. 자신이 영향력을 행세하고 있는 지역 신문에 특집 기사로 자신의 조상이 독립 투사로 활동한 - 날조된 - 역사를 실고 거짓 행적이 기록된 찬양비를 세우는 등의 행위가 나온 뒤 어떤 사람의 인터뷰가 나왔는데 '지금은 일제 시대에 살았던 사람들이 아직 살아 있으니 진실을 이렇게 나마 밝힐 수 있지만 나중에 몇 십년이 지난 후에 후세 사람들은 기록소에 보관된 신문 기사나 찬양비 내용만을 보고 - 친일파였던 - 그 사람을 독립투사로 착각하지 않겠느냐?'라는 그의 말이 무척 인상적이었다. 결국 '역사는 기록된 역사'일 뿐이다.

비약하자면 '[펌]'역시 위와 비슷한 문제를 가지고 있다. '[펌]'글은 시간이 지날 수록 출처가 불분명해지며 복사가 일어날 때마다 - 그것이 인위적인 실수든 그렇지 않든 - 원문이 훼손되거나 조작되는 문제가 발생한다. 코드의 중복이 버그를 야기하듯 자료의 중복은 거짓된 정보를 야기한다. 인터넷 세계에서 '정보는 기록된 정보'일 뿐이다.

물론 '[펌]'은 원문의 유실을 막는다는 점에서 장점을 가지고 있다. 그러나 개인적으로는 '모르는 것이 잘못 아는 것보다 낫다'고 생각한다. 프로그램으로 치자면 잘못된 결과를 리턴할 바에 예외를 발생시키는 것이 더 낫다.

자주 가는 블로그에 올라온 '[펌]'글에 출처가 표시된 경우 특별히 바쁘지만 않다면 출처를 따라가는 편이다. 그러나 그 중 몇몇은 결국 원문을 찾을 수 없다. 그나마 내가 자주 가는 블로그들은 출처 표기등을 잘 하는 소위 '깨어있는 사람'들이 운영하는 곳인데도 그렇다. 따라서 아마 전체적으로 보면 원문을 찾을 수 없는 '[펌]'글의 비중이 상당할 것이며 앞으로 더 늘어날 것이다. 심지어 요즘은 인터넷 신문 기사까지 '[펌]'이 만연해 있다.

이러다간 7~8년 전에 '정보 검색사'가 유행했듯이 인터넷 정보의 사실 여부를 감별해주는 '정보 감정사'라는 신종 직업이 나올지도 모르겠다.

핑백

  • gimmesilver's blog : static 을 이해하자 2008-04-16 19:44:56 #

    ... 한 3~4년 전쯤에 데브피아에 썼던 글인데 가끔 문의 및 스크랩 허락을 구하는 메일이 올 때가 있다. 오늘도 자기 홈페이지에 좀 퍼가도 괜찮겠냐는 메일이 왔는데 일단 펌질의 문제점때문에 그다지 좋아하지는 않지만 그렇다고 강력하게 막고 싶지는 않다. 어쨌든 그래도 생각난 김에 원문 보존 차원에서 내 블로그에도 있어야 하지 않나 싶어& ... more

  • gimmesilver's blog : 백번째 원숭이, 그 이면에 감춰진 진실... 2008-07-21 22:55:48 #

    ... 감동을 심어주려고 합니다. 비록 의도가 좋았다고는 하지만 조금만 인터넷을 검색해도 알 수 있는 뻔한 거짓말을 이렇게 사실인양 포장하는 것은 문제라 생각합니다. 예전에 '펌에 대한 단상' 이라는 글에서 언급했듯이 갈수록 자료의 양이 증가하면서 정보의 진위 여부를 판단하기 힘들어지고 있습니다. 과거에는 역사학자들이 자료의 부족으로 진실을 규명하는데 어려움을 ... more

덧글

  • 달룟 2006/01/11 03:58 # 삭제 답글

    DRY는 원칙이자 이상이죠. 현실은 그렇지 못하다는 것을 반증하는 것같구요. 마치 징리정돈이 원칙이지만, 현실은 엔트로피가 증가하는 우주의 섭리가 있구요.
    인터넷 세상에는 미러싸이트라는 방대한 중복을 자행하는 서버가 있습니다. DRY 원칙에는 배치되죠. 그런가 하면, 우리가 살고있는 지구라는 곳은 생명들이 유사 유전자를 끊임없이 중복 배포하는 곳이기도 합니다. 그리고 이 배포과정에서는 님의 글에서 걱정하신 불완전한 유전자 복사가 이루어지죠. 생명이 씨를 뿌리려고 하는 것이나 인간이 미러싸이트를 만들려고 하는 것, 펌을 하려는 것과 같은 성질의 것이라고 봅니다. 중복되기에 대재앙에도 멸종하기 힘들어지며, 불완전하기에 돌연변이를 통한 변화의 길이 열려있는 것 아닐까요. 우수한 종이 씨를 더 많이 뿌리듯이 사랑받는 좋은 글들이 더 많이 복사되겠구요.

    음... 초면인데, 따지는 글이 되었네요. 죄송합니다.
    이름만 듣던 Haskell을 배울 수 있는 곳을 찾게 되어 반갑습니다.
    저의 블로그에도 놀러와주세요. DRY를 집요하게 고수하려는 리팩토링 정신에 대한 블로그입니다. ^^
  • silverbird 2006/01/11 23:46 # 답글

    // to 달룟
    예...일리있는 말씀입니다. 모든 것은 장점과 단점이 있는 법이죠...하지만 '[펌]'을 '백업'과 같은 차원에서 바라보고 싶지는 않습니다. 따라서 미러사이트와 '[펌]'은 다른 이야기라 생각합니다.
    달룟님의 블로그에도 좋은 글들이 많더군요. 자주 찾아가겠습니다.
댓글 입력 영역