Новые технологии информационного сервиса в Internet

Индексирование и Поиск


Модели индексирования и поиска:

  • векторная модель информационного потока
  • нечеткие множества
  • вероятностная модель
  • Типы информационно поисковых языков:

  • традиционные ИПЯ
  • взвешивание терминов
  • ИПЯ типа "Like this"
  • Способы коррекции результатов поиска

  • фильтрация
  • коррекция по релевантности
  • кластеризация
  • Векторная модель:




    Запрос к системе:

    Lxq=r

    где

    q -вектор запроса

    r - вектор отклика

    Традиционный ИПЯ:

    ((информационная and система) or ИПС) not СУБД

    Найти все документы, в которых встречается термин

    "информационная" и "система", либо термин "ИПС", но не встречается

    термин "СУБД".

    Недостатки:

    Плохая масштабируемость выдачи. OR приводит к слишком

    большому расширению списка релевантных документов, а AND резко

    сужает отклик.

    Модификации:

    Взвешенный запрос (каждому термину приписывают некоторый

    вес)



    Содержание раздела