Индексация контента файлов
от 44labs
Технические данные
Дата публикации:
06.04.2026
Версия:
1.0.1
Адаптивность:
Да
Поддержка композита:
Да
Число установок:
Менее 50 раз
Совместимые редакции
- Программа для ЭВМ "1С-Битрикс: Управление сайтом". Лицензия Старт
- Программа для ЭВМ "1С-Битрикс: Управление сайтом". Лицензия Стандарт
- Программа для ЭВМ "1С-Битрикс: Управление сайтом". Лицензия Малый бизнес
- Программа для ЭВМ "1С-Битрикс24". Лицензия Интернет-магазин + CRM (12 мес.)
Описание
Модуль «Индексация контента файлов» предназначен для расширения стандартных поисковых возможностей платформы «1С-Битрикс: Управление сайтом». Он позволяет автоматически извлекать текстовое содержимое из файлов, прикрепленных к элементам информационных блоков, и добавлять этот текст в поисковый индекс. Благодаря этому, пользователи сайта могут находить нужные элементы, выполняя поиск по содержимому документов, а не только по названиям или описаниям.Ключевые возможности:
Автоматическая индексация контента: Модуль интегрируется с системным поиском и в процессе переиндексации сайта сканирует содержимое файлов.
Поддержка популярных форматов: Реализована поддержка индексации наиболее распространенных типов документов:
- Microsoft Word (.docx)
- Microsoft Excel (.xlsx)
- Текстовые файлы (.txt)
- HTML-файлы (.html, .htm)
Гибкая настройка инфоблоков: Вы можете точечно указать, для каких информационных блоков и каких именно свойств типа «Файл» необходимо выполнять индексацию.
Управление параметрами индексации: В настройках модуля можно задать ограничения на максимальный размер обрабатываемого файла и на количество извлекаемых символов, чтобы контролировать нагрузку на сервер.
Инструменты для администратора: Модуль предоставляет удобный интерфейс для администратора, включающий:
- Просмотр списка файлов, выбранных для индексации.
- Предварительный просмотр контента, который будет добавлен в поисковый индекс.
- Ведение подробного лог-файла для отслеживания процесса индексации и диагностики возможных проблем.
1. Установка модуля
Установите модуль стандартными средствами Битрикс.
Откройте страницу «Marketplace» -> «Установленные решения»
Найдите в списке модуль «Индексация контента файлов» (s44labs.filecontentindexing) и нажмите кнопку «Установить».
2. Настройка модуля
После установки модуль необходимо настроить.
Перейдите в раздел «Сервисы» -> «Индексация контента файлов».
Вкладка «Настройка индексации»:
•Максимальное число символов: Укажите максимальное количество символов, которое будет извлечено из одного файла. Оставьте поле пустым, чтобы не ограничивать объем текста. Рекомендуется устанавливать значение для контроля размера поискового индекса.
•Максимальный размер файла, Мб: Задайте максимальный размер файла в мегабайтах, который будет обрабатываться модулем. Файлы большего размера будут проигнорированы.
Вкладка «Настройка инфоблоков»:
•В этом разделе отображается список всех информационных блоков вашего сайта.
•Отметьте галочками те инфоблоки, файлы из которых должны быть проиндексированы.
•Для каждого выбранного инфоблока в выпадающем списке справа выберите одно или несколько свойств типа «Файл», содержимое которых нужно индексировать.
Вкладка «Просмотр файлов»:
•На этой вкладке отображается таблица со всеми файлами, которые подпадают под настроенные правила индексации.
•Вы можете проверить, какие файлы будут обработаны, а также посмотреть извлеченный из них текст, нажав на соответствующую кнопку в строке файла.
Вкладка «Лог индексации»:
•Для активации логирования установите галочку «Вести лог» на вкладке «Настройка индексации».
•На этой вкладке вы сможете просматривать записи о ходе процесса индексации, что полезно для отладки и мониторинга работы модуля.
Обязательно сохраните внесенные изменения и активируйте модуль.
3. Запуск индексации
После настройки модуля необходимо запустить полную переиндексацию сайта, чтобы содержимое файлов было добавлено в поисковый индекс.
1.Перейдите в раздел «Настройки» -> «Поиск» -> «Переиндексация»
2.Нажмите кнопку «Переиндексировать».
После завершения этого процесса содержимое файлов станет доступным для поиска на сайте.
Системные требования и рекомендации:
•Для корректной работы модуля на сервере должно быть установлено PHP-расширение mbstring.
•Для более быстрой и качественной обработки PDF-файлов рекомендуется установить на сервере утилиту pdftotext (входит в состав пакета poppler-utils для Linux-систем). Если утилита не найдена, модуль будет использовать встроенный парсер на PHP, что может замедлить процесс индексации больших PDF-документов.
Установите модуль стандартными средствами Битрикс.
Откройте страницу «Marketplace» -> «Установленные решения»
Найдите в списке модуль «Индексация контента файлов» (s44labs.filecontentindexing) и нажмите кнопку «Установить».
2. Настройка модуля
После установки модуль необходимо настроить.
Перейдите в раздел «Сервисы» -> «Индексация контента файлов».
Вкладка «Настройка индексации»:
•Максимальное число символов: Укажите максимальное количество символов, которое будет извлечено из одного файла. Оставьте поле пустым, чтобы не ограничивать объем текста. Рекомендуется устанавливать значение для контроля размера поискового индекса.
•Максимальный размер файла, Мб: Задайте максимальный размер файла в мегабайтах, который будет обрабатываться модулем. Файлы большего размера будут проигнорированы.
Вкладка «Настройка инфоблоков»:
•В этом разделе отображается список всех информационных блоков вашего сайта.
•Отметьте галочками те инфоблоки, файлы из которых должны быть проиндексированы.
•Для каждого выбранного инфоблока в выпадающем списке справа выберите одно или несколько свойств типа «Файл», содержимое которых нужно индексировать.
Вкладка «Просмотр файлов»:
•На этой вкладке отображается таблица со всеми файлами, которые подпадают под настроенные правила индексации.
•Вы можете проверить, какие файлы будут обработаны, а также посмотреть извлеченный из них текст, нажав на соответствующую кнопку в строке файла.
Вкладка «Лог индексации»:
•Для активации логирования установите галочку «Вести лог» на вкладке «Настройка индексации».
•На этой вкладке вы сможете просматривать записи о ходе процесса индексации, что полезно для отладки и мониторинга работы модуля.
Обязательно сохраните внесенные изменения и активируйте модуль.
3. Запуск индексации
После настройки модуля необходимо запустить полную переиндексацию сайта, чтобы содержимое файлов было добавлено в поисковый индекс.
1.Перейдите в раздел «Настройки» -> «Поиск» -> «Переиндексация»
2.Нажмите кнопку «Переиндексировать».
После завершения этого процесса содержимое файлов станет доступным для поиска на сайте.
Системные требования и рекомендации:
•Для корректной работы модуля на сервере должно быть установлено PHP-расширение mbstring.
•Для более быстрой и качественной обработки PDF-файлов рекомендуется установить на сервере утилиту pdftotext (входит в состав пакета poppler-utils для Linux-систем). Если утилита не найдена, модуль будет использовать встроенный парсер на PHP, что может замедлить процесс индексации больших PDF-документов.
Установите этот модуль прямо сейчас!
Для этого укажите адрес сайта:
пример: https://www.site.ru
