금요일, 9월 19, 2014

[일상다반사] 전문 검색과 분석을 위한 Elasticsearch 서버: 아파치 루씬 기반의 고성능 엔터프라이즈 플랫폼

지난 4월 말에 아파치 Solr 4 구축과 관리 : 오픈소스 루씬 기반 엔터프라이즈 검색 플랫폼이라는 제목으로 독자 여러분께 번역서를 하나 소개해드린 바 있다. 오늘은 Solr와 치열한 경쟁을 벌이고 있는 루씬 기반의 또 다른 검색엔진인 일래스틱서치 출간 소식을 전해야겠다. 현재 Yes 24에서 절찬 예약판매 중인 이 책은 일래스틱서치와 관련해 바로 사용 가능한 필수적인 정보를 꽉꽉 담은 책이라 보면 틀림없겠다. 원 저자가 라팔 쿠크로 지난번 '아파치 Solr 4 구축과 관리'를 읽고 마음에 들었다면 이 책 역시 여러분 취향에 딱 맞을 가능성이 높다.

일래스틱서치는 지난 번에 소개한 Solr 4의 기능과 거의 유사한 다음 기능을 제공한다. 따라서 일래스틱서치를 사용하느냐 Solr를 사용하느냐가 가장 큰 고민거리일지도 모르겠다.

  • JSON API
  • 검색 결과 강조(highlight)
  • 패싯 검색과 필터링
  • 공간 지리 검색
  • 빠른 점진적인 갱신과 색인 복제
  • 캐시
  • 클러스터 구성(고가용성)
  • 복제
  • 분산 색인/샤딩
  • 모니터링 인터페이스

다행히도 역자 서문에 제시한 바와 같이 Apache Solr vs ElasticSearch라는 사이트에서 아파치 솔라와 일래스틱서치의 기능을 API, 색인, 검색, 플러그인, 분산 측면으로 나눠 분석하고 있다. 검색 자체 기능만 놓고 보면 대동소이한데, 일래스틱서치는 외부 시스템과 연동 측면에서 월등하다.

예를 들어, 외부에서 들어오는 로그를 쌓는다고 가정하자. Solr 4를 사용할 경우에는 애플리케이션을 작성해 연결해야 하는 반면 일래스틱서치는 Rivers 플러그인을 사용해 외부에서 들어오는 들어오는 입력을 그대로 받아 색인이 가능하다. 자체적으로 지원하는 트위터, RabbitMQ, CouchDB, Wikipedia는 물론이고, 공동체에서 지원하는 수많은 플러그인(ActiveMQ, Amazon SQS, CSV, Dropbox, Filesystem, Git, GitHub, JDBC, JMS, kafka, LDAP, MongoDB, Redis, Neo4j, Solr, RSS, Subversion, DynamoDB, IMAP/POP3 등)을 사용해 외부 소스와 연계가 가능하다. 또한 최근 일래스틱서치의 일원이 된 오픈소스 로그 관리 도구인 로그스태시를 사용할 경우, 외부에서 들어오는 자료 형식을 변환한 다음에 일래스틱서치에 저장할 수 있으므로 유연성을 극대화할 수 있다. 이게 바로 일래스틱서치의 최대 강점이다.

일단 오늘 소개한 책을 읽으며 공부하고 계시면, 후속작으로 Open Source Log Analysis with Elasticsearch를 준비해서 선보일테니 독자 여러분들의 많은 성원 부탁 드리겠다.

EOB

댓글 없음:

댓글 쓰기