gimmesilver's blog

Agbird.egloos.com

포토로그



태그 : 네트워크프로그래밍 요약보기전체보기목록닫기

1

하스켈로 웹크롤러 구현하기...5

이번엔 파섹을 이용해 html 문서에서 링크 url을 추출하는 소스를 설명하겠습니다. 저는 링크 추출을 위해 다음과 같은 단계를 거치도록 구현했습니다.1) 태그 추출: '<'문자와 '>'문자 사이에 있는 태그 정보를 추출합니다. 이 때 주석, 자바 스크립트 소스의 경우 태그가 아닌데도 '<' 문자가 나올 수 있으므로 주석과 자바...

하스켈로 웹크롤러 구현하기...3

하스켈로 웹 크롤러 구현하기...1 에 올린 소스 내용을 하나씩 설명하도록 하겠습니다.이 웹크롤러는 다음과 같은 방식으로 동작합니다.1. 먼저 실행 인자로 최대 큐에 저장가능한 URL 갯수와 시작 지점이 될 seed URL 리스트를 받습니다.2. 1에서 받은 실행 인자들을 이용해 URL리스트를 저장할 큐를 만듭니다.3. 큐에서 URL을 하나 꺼내 HTT...

하스켈로 웹크롤러 구현하기...1

간만에 하스켈 관련 글을 올립니다...이번에는 간단한 웹 크롤러를 하스켈로 구현해 보겠습니다. 제가 지금 다니고 있는 회사에 입사할 때 받았던 지원 과제가 바로 '간단한 웹 크롤러 구현하기'였습니다. (정확하게는 웹 크롤러와 인덱스 생성기 두 개인데 이제는 과제가 바뀌었습니다.)그 때는 C++로 구현했었고 C++에서는 플랫폼 독립적으로 사용할 수 있는 ...
1