태그>lucene(총 13개의 글)
'lucene' 관련 최근글
-
- [Linux/ELK] full text search Query DSL 과 KQL
-
박모 사진첩 by 박모|2022/12/20 18:39
1. 원천 데이터message 에 "[(1, 2), (2, 2), (3, 3), (4, 4), (5, 3)]" 2. 이걸 검색할때, "2," 로 검색 하고자 할때 text라서 검색이 안됨. Query DSL로 할 경우 다음 처럼 { "query": { "regexp"..
- [Linux/ELK] full text search Query DSL 과 KQL
-
- [LUCENE] PositionIncrementAttribute
-
Linguist's Library by dockman|2019/09/20 11:09
PositionIncrementAttribute 인터페이스는토큰 스트림과 현재 토큰과의 관계를 정의 한다. (인도양) 이라는 이전 토큰이 있다고 하자, 다음으로 분석한 (남태평양) 토큰의 PositionIncrementAttribute 값을 1로 설정한다면, 이 토큰은 (인도양)의 다음에 위치하게 된다..
- [LUCENE] PositionIncrementAttribute
-
- [Python] 검색엔진 Whoosh
-
지훈현서 by 지훈현서아빠|2013/08/05 15:56
2000년 이전만 하더라도 별도의 전문(Full-Text) 검색엔진이 별로 없었습니다.Google, Yahoo, Altavista 등의 포털에서 개별 검색엔진을 만들어 이용하고는 하였고그것을 라이브러리 형태로 제공해 주는 것은 그렇게 많지 않았습니다.그것이 범용 시스템에서 여러가지 전..
- [Python] 검색엔진 Whoosh
-
- Lucene, Solr Korean Analyzer 3
-
幻想鄕.flamboyance by Lurid|2012/11/16 21:07
솔라의 애널라이저와 통신할 프로그램을 만들었다. 한나눔 형태소 분석기가 돌고 있는 쓰레드와, 소켓통신을 위한 쓰레드, 두 쓰레드간의 통신을 위한 파이프 스트림이 중심이다. 이렇게 하면 한나눔이 매번 사전을 새로 읽어와 트라이 구조로 만들 필요는 없어졌다. 다만 한나..
- Lucene, Solr Korean Analyzer 3
-
- Lucene, Solr Korean Analyzer 2
-
幻想鄕.flamboyance by Lurid|2012/11/05 22:27
한나눔 포팅 완료하였다. 토크나이즈의 기준을 잘못잡았었다 ㅠㅜㅠㅜㅠ. 그러나 한나눔이 무겁다보니 매번 애널라이저가 켜질 때 마다 객체를 생성하고 사전을 읽어오는 바람에 메모리 사용률이 높다. 가비지 컬렉터가 이 메모리 정리를 못따라가서 두 번 돌면 바로 뻗어버린다. ..
- Lucene, Solr Korean Analyzer 2
-
- Lucene/Solr Korean Analysis
-
幻想鄕.flamboyance by Lurid|2012/11/03 01:14
루씬 검색엔진에 웹인터페이스를 한번 래핑한 솔라를 공부하고있다. 루씬은 검색한 데이터를 Analyzer를 통해 인덱싱하여 검색할 수 있는 키워드를 생성하는데 동아시아의 3개국 언어에 대해 인덱싱을 기본적으로 제공한다. 그런데 이 기본으로 끼워주는 Analyzer-CJKToken..
- Lucene/Solr Korean Analysis
-
- lucene에서 indexing, searching을 위해 ..
-
인생은 속도가 아니라 방향이다 by 예술인|2011/06/13 15:46
1. indexing관련 - IndexWriter: 새로운 index를 생성하거나, 이미 존재하는 index파일을 열어서 index파일에 있는 document를 add/remove/update 수행. Index 파일에 뭔가 쓰기(write) 접근을..
- lucene에서 indexing, searching을 위해 ..
-
- [pylucene] Python용 lucene검색엔진에 ..
-
지훈현서 by 지훈현서아빠|2010/12/16 18:23
검색 엔진을 처음 생각한 것은 90년대 초 였습니다.국내 모 전화번호부 검색 시스템에서 "짜장면"을 검색 단어로 입력하면,"중국집"을 검색하라는 비디오텍스 프로젝트의 서브 프로..
- [pylucene] Python용 lucene검색엔진에 ..
-
- 검색엔진 : Density based model
-
NOW or NEVER by skyforce|2009/04/04 16:17
공개 검색엔진 Lucene은 다양한 현대적인 검색모델을 지원하고 있으며, 학습용도 혹은 상업적인 용도 모두에 사용할 수 있다. 여기에서는 루신이 사용하는 모델중 Density based model에 대해서 알아보도록 하겠다. 루신은 vector space model기반으로하는 검색엔진..
- 검색엔진 : Density based model
-
- [SOLR] SOLR 새버전(1.3) 배포
-
Enterprise Search Consulting by 슈퍼맨|2008/09/18 13:32
2008년 9월 15일에 solr 1.3버전이 배포되었으며, 다운로드는 Apache Mirror페이지에서 받을 수 있다. Release Notes를 대충봐도 정말 많은 새로운 기능과 bug fix가 이루어진것을 알 수 있다. 그럼 대강 어떤 내용들이 바뀌었는지 대강 살펴보자. 빠진 내용이 있으니 절대로 ..
solr, SearchEngine, lucene, 쏠라, 루씬
- [SOLR] SOLR 새버전(1.3) 배포
-
- [SOLR]검색 Score는 어떻게 산정되나?
-
Enterprise Search Consulting by 슈퍼맨|2008/07/30 17:53
출처 : TF(term frequency) : 한 문서에서 같은 검색어(term)가 많이 나타날수록 높은 점수를 부여IDF(inverse document frequency) : 많은 문서에서 공통으로 출현하는 term일수록 낮은 점수를 부여coord(coordination factor) : 검색질의가 여러개의 term으..
- [SOLR]검색 Score는 어떻게 산정되나?