Перейти к основному содержимому

Настройка поиска по базе знаний

Цель

Оптимизировать поиск по базе знаний для более точных ответов AI-ассистента.

Предусловия

  • Наполненная база знаний (минимум 5-10 статей)
  • Доступ к настройкам организации

Архитектура поиска

SMAIWER использует многоуровневую систему поиска:

Запрос пользователя

1️⃣ Поиск по chunks (TF-IDF)
↓ (если не найдено)
2️⃣ Векторный поиск (ChromaDB)
↓ (если не найдено)
3️⃣ Полнотекстовый поиск

Релевантные статьи → AI для генерации ответа

Методы поиска

TF-IDF поиск

Как работает: Ищет статьи по совпадению ключевых слов с учётом их важности.

Преимущества:

  • Быстрый
  • Точный для конкретных терминов
  • Не требует дополнительных ресурсов

Когда эффективен:

  • Точные запросы: «как оформить возврат»
  • Технические термины: «API ключ»

Векторный поиск (ChromaDB)

Как работает: Преобразует текст в векторы и ищет семантически похожие.

Преимущества:

  • Понимает смысл, а не только слова
  • Находит синонимы и парафразы
  • Работает с неточными запросами

Когда эффективен:

  • Разговорные запросы: «хочу вернуть товар»
  • Синонимы: «оплата» = «платёж» = «деньги»

Настройка параметров

Открытие настроек

  1. Перейдите Настройки → База знаний → Поиск
  2. Или Настройки → AI → База знаний

Основные параметры

ПараметрПо умолчаниюОписание
Количество результатов3Сколько статей передать AI
Минимальная релевантность0.3Порог отсечения (0-1)
Приоритет методаTF-IDFКакой метод использовать первым
Использовать chunksДаИскать по chunks или полным статьям

Приоритет поиска

Настройка: "TF-IDF → Vector"

Логика:
1. Сначала ищем TF-IDF
2. Если нашли ≥ 3 результата с релевантностью ≥ 0.3 → используем их
3. Иначе дополняем векторным поиском

Настройка весов категорий

Увеличьте приоритет важных категорий:

Категория "Возвраты и обмены": вес 1.5
Категория "FAQ": вес 1.2
Категория "Общее": вес 1.0

Тестирование поиска

Инструмент тестирования

  1. Откройте База знаний → Тестирование поиска
  2. Введите тестовый запрос
  3. Просмотрите результаты и их релевантность

Пример тестирования

Запрос: "как вернуть деньги за товар"

Результаты:
1. "Возврат товара" — релевантность: 0.85 ✅
2. "Способы оплаты" — релевантность: 0.42 ⚠️
3. "Условия доставки" — релевантность: 0.28 ❌

Действие: Добавить теги "деньги, возврат" в статью "Возврат товара"

Метрики качества

МетрикаХорошоТребует улучшения
Средняя релевантность> 0.6< 0.4
Найдено результатов1-50 или > 10
Время поиска< 500ms> 2000ms

Улучшение качества поиска

Оптимизация статей

  1. Добавьте синонимы в теги:

    Статья: Возврат товара
    Теги: возврат, обмен, деньги назад, refund, отмена заказа
  2. Улучшите заголовки:

    ❌ Информация
    ✅ Как оформить возврат товара в течение 14 дней
  3. Структурируйте контент:

    • Используйте заголовки (H2, H3)
    • Добавляйте списки
    • Разбивайте на логические блоки

Добавление FAQ

Создайте статью с частыми вопросами:

# Частые вопросы о возвратах

## Сколько дней на возврат?
14 дней с момента покупки.

## Как вернуть деньги?
Деньги возвращаются в течение 3-5 рабочих дней...

## Что если товар повреждён?
При обнаружении повреждений...

Анализ неотвеченных вопросов

  1. Откройте Аналитика → Неотвеченные вопросы
  2. Просмотрите вопросы, на которые AI не нашёл ответ
  3. Создайте недостающие статьи

Переиндексация

После изменения статей запустите переиндексацию:

  1. База знаний → Переиндексация
  2. Нажмите «Запустить»
  3. Дождитесь завершения
Когда переиндексировать
  • После массового добавления статей
  • После изменения настроек chunking
  • При проблемах с поиском

Ожидаемый результат

  • AI находит релевантные статьи
  • Точные ответы на вопросы клиентов
  • Минимум неотвеченных вопросов

Связанные руководства