효과적인 검색
목차는 기존 문서에서의 탐색에 대한 논의, 그리고 그동안의 이슈, 앞으로의 이슈 등으로 세가지 방안으로 구분한다.
- 기존 문서에서의 효과적인 탐색
- 효과적인 탐색은 가장 중요한 분야중에 하나
- 여러가지 기법이 있지만 주요 기법은 recall & precision
- 간략한 탐색의 문제점 제시
- 작은 하나의 실수는 평균 정확도에 작은 영향을 미치지만 사용자에게는 큰 타격을 준다.
- 그리고 기반하는 데이터 중에 다수는 잘못된 정보를 가지고 있는 경우도 있다.
- 그동안의 이슈
- 검색의 성능에 대한 이야기
- Precision vs recall
- 정확률은 쉽게 구할 수 있지만 재현률은 구하기가 어렵다
- 일반 사용자들에게 정확률이나 재현률은 별로 의미 없는 경우도 많다
- 사용자가 정확률이나 재현률을 중요하게 생각하지 않는다면 IR시스템이 effectiveness를 측정하는 것은 무의미
- User-oriented measure
- 실제 사용자는 homogeneous 하지 않음
- 사용자 중심의 측정법
- Coverage ratio
- Novelty ratio
- Relative recall
- Recall effect
- 앞으로의 이슈
- 측정법
- Image, video
- 자연어 검색
- 여러가지 언어