(주)피플러스 검색엔진
  • (02) 417-2251

SEARCH_PRJ

검색 질의어 분석엔진 개발

Search And BigData

본문

추진배경

  • 다양한 검색 질의어에 대한 도메인별 질의어 분석이 어려움.
  • 질의어 분석이 잘못될 경우 잘못된 검색 결과 도출
  • 질의어에 대한 분석이 잘못되어 검색이 될 경우 고객 VOC 발생할 수 있음
  • 검색 결과 품질에 대한 고도화
  • 입력되는 질의어에 대한 도메인별 질의어 분석

​추진방향 

  • 도메인별 어휘에 대한 질의 분석용 학습모델 사전 구축
  • 질의어 term 별 의미 분석
  • 질의어 단순 검색이 아닌 의미 분석을 통한 필터 검색이 가능해 짐
  • 질의 시 질의를 의미검색용 질의유형으로 분류하고, 질의유형별 엔진질의식 생성
  • 색인 시 의미검색을 위한 TERM분리 결과 생성 및 색인어 추가
  • 검색 프로세스에 의미분석을 적용하여 검색 풀질의 향상됨 

​추진목표

  • 검색 색인 프로세스 개선
  • 검색 질의 프로세스 개선
  • 질의어 의미 분석을 통한 검색 품질의 향상
  • 검색 품질의 향상으로 고객 VOC를 줄임
  • 검색품질의 향상으로 고객 만족도 증가


사전에 개채명 태깅으로 훈련된 학습모델을 이용하여 질의어의 개체명을 정확하게 인식하여 자동을 케테고리 분류 부스팅(boosting)을 해 줌으로써 사용자의 의도를 보다 정확하게 반영한 검색을 수행해 주게 된다.

61aad52c98958c43c11dff05785d1fc4_1460082669_2674.png

 


색인 시점에 자동으로 개체명 필드를 생성해 준다.

61aad52c98958c43c11dff05785d1fc4_1460082733_4552.png

 

 

Solr의 SearchHandler 를 Wrapping 하여 개체명 인식기를 이용한 질의어 분석 프로세스를 처리해 준다.  질의어에서 인식된 개체명은 자동으로 개체명의 해당 필드를 부스팅 해 준다 

61aad52c98958c43c11dff05785d1fc4_1460082797_6636.png