태그>solr(총 25개의 글)
'solr' 관련 최근글
-
- Hue 설치(하둡 관리 기능)
-
블루오션 [BLUE OCEAN] by 장땡|2017/07/26 18:31
설치환경 :CentOS Linux release 7.3.1611 (Core) Python2.7 0. 기본 설치 패키지설치하다 에러나면 의존성 파일이 무엇인지 확인 후 설치해준다.yum install ant python-devel krb5-devel krb5-lib..
hue, 하둡관리, solr, hadoop, hadoopmanager
- Hue 설치(하둡 관리 기능)
-
- Lucene, Solr Korean Analyzer 3
-
幻想鄕.flamboyance by Lurid|2012/11/16 21:07
솔라의 애널라이저와 통신할 프로그램을 만들었다. 한나눔 형태소 분석기가 돌고 있는 쓰레드와, 소켓통신을 위한 쓰레드, 두 쓰레드간의 통신을 위한 파이프 스트림이 중심이다. 이렇게 하면 한나눔이 매번 사전을 새로 읽어와 트라이 구조로 만들 필요는 없어졌다. 다만 한나..
- Lucene, Solr Korean Analyzer 3
-
- Lucene, Solr Korean Analyzer 2
-
幻想鄕.flamboyance by Lurid|2012/11/05 22:27
한나눔 포팅 완료하였다. 토크나이즈의 기준을 잘못잡았었다 ㅠㅜㅠㅜㅠ. 그러나 한나눔이 무겁다보니 매번 애널라이저가 켜질 때 마다 객체를 생성하고 사전을 읽어오는 바람에 메모리 사용률이 높다. 가비지 컬렉터가 이 메모리 정리를 못따라가서 두 번 돌면 바로 뻗어버린다. ..
- Lucene, Solr Korean Analyzer 2
-
- Lucene/Solr Korean Analysis
-
幻想鄕.flamboyance by Lurid|2012/11/03 01:14
루씬 검색엔진에 웹인터페이스를 한번 래핑한 솔라를 공부하고있다. 루씬은 검색한 데이터를 Analyzer를 통해 인덱싱하여 검색할 수 있는 키워드를 생성하는데 동아시아의 3개국 언어에 대해 인덱싱을 기본적으로 제공한다. 그런데 이 기본으로 끼워주는 Analyzer-CJKToken..
- Lucene/Solr Korean Analysis
-
- solr를 이용한 또다른 ^^ 검색서비스 오픈
-
결론에 가보기 by 제우스|2009/02/25 11:06
solr와 함께 좌절중 이란 글이 작년 11월 이었으니 3개월후인 어제 무사히 오픈을 마무리 하였다. 참 힘들고 우여곡절도 많고 ^^ 이런것이 나름 노하우가 쌓인다고 하는것인가? 저번에 실패로 깨달은 것은 검색서버의 한계치가 있다는 것이었고 그 수치에 이미 회사의 서비스가 많이..
- solr를 이용한 또다른 ^^ 검색서비스 오픈
-
- solr 와 함께 좌절중..
-
결론에 가보기 by 제우스|2008/11/26 16:14
어제가 오픈일이었다. 새로운 검색서비스가. solr 1.2로 1600만건정도를 잘 색인하고 검색서비스를 제공하고 있었다.다른쪽에 추가적인 검색서비스가 필요하다고 해서 몇번의 회의를 하였었다.이미 기존의 서비스를 같이 해본 사람들이었고 스펙도 크게 다르지 않아서 방심을 ..
- solr 와 함께 좌절중..
-
- [SOLR] 루씬용 한글형태소 분석기 solr에 적용 성공
-
Enterprise Search Consulting by 슈퍼맨|2008/10/20 20:01
얼마전 루씬용 한글형태소 분석기를 solr에 적용시키지 못하였었는데 형태소분석기를 만드신 smlee0818님이 solr 1.3에서 구동테스트를 성공하셨다고 하여, 재도전 해보기로 하였다.이번에는 컴파일에 에러가 발생하지는..
- [SOLR] 루씬용 한글형태소 분석기 solr에 적용 성공
-
- [SOLR] 루씬용 한글형태소 분석기 solr에 적용..
-
Enterprise Search Consulting by 슈퍼맨|2008/10/16 11:16
smlee0818님의 블로그에 순수 java로 만든 한글 형태소분석기를 발표(?) 하였다. 지난번에도 이야기 했듯이 lucene, solr에서 사용가능한 제대로된 한글 형태소분석기를 찾던 중 이었으니, 반가운 소식이..
- [SOLR] 루씬용 한글형태소 분석기 solr에 적용..
-
- [SOLR]한글 웹문서 색인을 위한 Tokenizer, F..
-
Enterprise Search Consulting by 슈퍼맨|2008/10/02 09:22
HTML로 구성된 웹문서를 색인하기 위해서는 기본적으로 HTML테그의 내용을 제거하는 필터링 작업이 필요하다. solr는 이미 HTMLStripWhitespaceTokenizerFactory라는 HTML의 테그를 제거하고 색인..
- [SOLR]한글 웹문서 색인을 위한 Tokenizer, F..
-
- [SOLR]색인방법에 대한 개인적인 견해
-
Enterprise Search Consulting by 슈퍼맨|2008/09/30 09:54
나는 개인적으로 (여건이 가능하다면) ngram의 분석방법을 선호하는 편이다. 왜냐하면 형태소분석방법이 가지는 여러가지 장점에도 불구하고 오분석시에 나타나는 치명적인 오류를 개선할 방법이 재색인밖에는 없는 경우가 많아서이다.ngram의 오류는 주로 나오지 말아야 할 ..
- [SOLR]색인방법에 대한 개인적인 견해
-
- [SOLR] solr의 다양한 가중치 적용방법
-
Enterprise Search Consulting by 슈퍼맨|2008/09/24 16:56
boost기법이라 하면 검색엔진에서 검색어, 문서, 필드별로 별도의 추가(혹은 감소)가중치를 적용하는 방법을 이야기하며, 이를 가지고 업무환경에 적합한 검색결과를 얻을 수 있도록 하는 것을 말한다. 예를들어 문서의 "제목"은 "본문"보다 가..
- [SOLR] solr의 다양한 가중치 적용방법
-
- [SOLR] SOLR 새버전(1.3) 배포
-
Enterprise Search Consulting by 슈퍼맨|2008/09/18 13:32
2008년 9월 15일에 solr 1.3버전이 배포되었으며, 다운로드는 Apache Mirror페이지에서 받을 수 있다. Release Notes를 대충봐도 정말 많은 새로운 기능과 bug fix가 이루어진것을 알 수 있다. 그럼 대강 어떤 내용들이 바뀌었는지 대강 살펴보자. 빠진 내용이 있으니 절대로 ..
solr, SearchEngine, lucene, 쏠라, 루씬
- [SOLR] SOLR 새버전(1.3) 배포
-
- [SOLR]색인/검색 분석도구 - Analysis
-
Enterprise Search Consulting by 슈퍼맨|2008/09/11 10:13
solr에는 아주 괜찮은 분석도구가 몇가지 있는데 그 중에 하나가 지금 얘기하려는 "analysis"이다.이 도구는 색인과 검색시에 문장이 어떻게 tokenizing되는지를 실제로 확인시켜 줌으로써 분..
- [SOLR]색인/검색 분석도구 - Analysis