Інформаційно –пошукові системи (ІПС) — це різновид автоматизованих інформаційних систем, в яких завершальна обробка даних не передбачається. Ці системи призначені для пошуку текстів (документів, їх частин, фактографічних записів) в сховищах (базах даних) за формальними характеристиками. Тому в роботі ІПС можна виділити два основних етапи: перший — збір і зберігання інформації, другий — пошук і видача інформації користувачам.
В економіці ІПС можуть використовуватися для зберігання і пошуку нормативних, планових, бухгалтерських та інших документів, даних для наукових досліджень.
ІПС відрізняються одна від одної за багатьма ознаками, але при вирішенні задач збору, зберігання і видачі інформації мають такі спільні процедури:
аналіз документів і їх добір;
створення пошукового образу документів (ПОД);-
запис документів і їх пошукових образів на прийняті носії;
зберігання документів і ПОД;
аналіз запитів;
видача документів користувачам.
ІПС можна класифікувати за такими ознаками:
родом виконуваних операцій;
режимом пошуку;
типом інформаційно-пошукової мови (ІПМ);
типом критерію відповідності;
ступенем автоматизації.
За першою ознакою ІПС діляться на документальні, фактографічні, логічні і комплексні.
Документальні ІПС на інформаційні запити видають адреси зберігання пошукових образів, оригінали чи копії документів з необхідною інформацією.
Фактографічні ІПС у відповідь на введені в них інформаційні запити безпосередньо видають відповідні фактичні дані (структурний склад, формули, характеристики матеріалів і тому подібне).
Логічні ІПС видають на запит не лише введену раніше інформацію, але, якщо необхідно, виконують логічну переробку цієї інформації для одержання нової, що явно в систему не вводилась.
Комплексні ІПС містять сукупність елементів документальних, фактографічних і логічних ІПС.
За режимом пошуку ІПС діляться на системи, що працюють в режимі вибіркового розподілу інформації, тобто за постійними інформаційними запитами в масивах постійно поповнюваних документів, і системи ретроспективного пошуку за разовими змінними запитами абонентів з пошуком документів з даної тематики в масивах.
За типом інформаційно-пошукової мови ІПС класифікуються на системи з природними (людськими) і інформаційними мовами. Інформаційно-пошукові мови — це синтетично створені мови для ідентифікації і пошуку документів за запитом (наприклад, дескрипторна мова).
За критерієм відповідності, тобто сукупністю правил визначення ступеня формальної відповідності між ПОД (ПОД — виражений у термінах мови ІПС основний зміст документа, що займає значно менше машинної пам’яті від повного змісту документа) і пошуковим розпорядженням ПР (ПР — виражений у термінах ІПС пошуковий запит), ІПС поділяються на системи з використанням логічних схем (І, ЧИ, НЕ); з використанням аналітичних функцій (статистичні і векторні критерії); з використанням «вагових» функцій чи коефіцієнтів; з аналізом критерію відповідності на збіг чи часткове входження (пошукового розпорядження в ПОД).
За ступенем автоматизації ІПС класифікуються на системи з автоматичною класифікацією масивів (формування в ПОД породження класів за мітками, на основі асоціативних зв’язків між термінами в ПОД), системи з автоматичним пошуком для сортування і порівняння ПОД з пошуковим розпорядженням, системи з автоматичним індексуванням для автоматизації процесів згортання при реферуванні, анотуванні, виборі ключових слів і т. ін., системи з автоматичною видачею різновидів інформації (бібліографічних описів, ПОД, копій документів), системи з автоматичним управлінням (при наявності зворотного зв’язку і зміни режимів пошуку в ІПС).
Як уже зазначалося, на основі ІПМ використовують два основних режими чи методи організації пошуку: з вибірковим розподілом інформації і з ретроспективним пошуком.
При цьому застосовують різні мовні засоби, залежно від категорії користувачів і можливостей мов. Використовують мови, що забезпечують тільки можливості запитів, тобто виведення даних на екран чи друк в необхідному форматі; комплексні мови запитів-обновлень, що як більш розвинені мови дозволяють формулювати запити, які стосуються декількох взаємозв’язаних записів і дозволяють поновляти дані так же легко, як і формулювати запити; генератори звітів, що дозволяють вибирати необхідні дані і форматувати їх у вигляді потрібних форм документів; графічні мови, що дозволяють виводити інформацію у вигляді різних графіків і діаграм та інших зображувальних засобів.
При створенні ІПС неминуче виникає потреба у створенні тезаурусу системи, тобто набору спеціальних термінів для кодування понять та зв’язків між ними. Тезаурус дозволяє виражати зміст документів та запитів формалізованою інформаційною мовою.
Найбільш поширеними в сучасних автоматизованих ІПС є тезауруси з використанням мов дескрипторного типу, на відміну від тезаурусів з мовами класифікаційного типу, що використовуються, наприклад, в бібліотечно-бібліографічній класифікації з фіксованим обмеженим списком слів і словосполучень. Дескрипторами можуть бути окремі слова або словосполучення із групи синонімічних чи близьких за значенням слів, що використовуються в системі для контрольованого індексування (кодування) змісту документів і запитів встановленням відповідності між текстом документа і набором ключових дескрипторів.