+7 499 938 8452 пн.-пт. 10:00 – 17:00

Индексация контента файлов

от 44labs

Скриншоты

Технические данные

Дата публикации:
06.04.2026
Версия:
1.0.1
Адаптивность:
Да
Поддержка композита:
Да
Число установок:
Менее 50 раз

Совместимые редакции

Описание

Модуль «Индексация контента файлов» предназначен для расширения стандартных поисковых возможностей платформы «1С-Битрикс: Управление сайтом». Он позволяет автоматически извлекать текстовое содержимое из файлов, прикрепленных к элементам информационных блоков, и добавлять этот текст в поисковый индекс. Благодаря этому, пользователи сайта могут находить нужные элементы, выполняя поиск по содержимому документов, а не только по названиям или описаниям.

Ключевые возможности:

Автоматическая индексация контента: Модуль интегрируется с системным поиском и в процессе переиндексации сайта сканирует содержимое файлов.

Поддержка популярных форматов: Реализована поддержка индексации наиболее распространенных типов документов:
- PDF
- Microsoft Word (.docx)
- Microsoft Excel (.xlsx)
- Текстовые файлы (.txt)
- HTML-файлы (.html, .htm)


Гибкая настройка инфоблоков: Вы можете точечно указать, для каких информационных блоков и каких именно свойств типа «Файл» необходимо выполнять индексацию.

Управление параметрами индексации: В настройках модуля можно задать ограничения на максимальный размер обрабатываемого файла и на количество извлекаемых символов, чтобы контролировать нагрузку на сервер.

Инструменты для администратора: Модуль предоставляет удобный интерфейс для администратора, включающий:
- Просмотр списка файлов, выбранных для индексации.
- Предварительный просмотр контента, который будет добавлен в поисковый индекс.
- Ведение подробного лог-файла для отслеживания процесса индексации и диагностики возможных проблем.
1. Установка модуля
Установите модуль стандартными средствами Битрикс.

Откройте страницу «Marketplace» -> «Установленные решения»

Найдите в списке модуль «Индексация контента файлов» (s44labs.filecontentindexing) и нажмите кнопку «Установить».

2. Настройка модуля
После установки модуль необходимо настроить.

Перейдите в раздел «Сервисы» -> «Индексация контента файлов».

Вкладка «Настройка индексации»:

•Максимальное число символов: Укажите максимальное количество символов, которое будет извлечено из одного файла. Оставьте поле пустым, чтобы не ограничивать объем текста. Рекомендуется устанавливать значение для контроля размера поискового индекса.

•Максимальный размер файла, Мб: Задайте максимальный размер файла в мегабайтах, который будет обрабатываться модулем. Файлы большего размера будут проигнорированы.


Вкладка «Настройка инфоблоков»:

•В этом разделе отображается список всех информационных блоков вашего сайта.

•Отметьте галочками те инфоблоки, файлы из которых должны быть проиндексированы.

•Для каждого выбранного инфоблока в выпадающем списке справа выберите одно или несколько свойств типа «Файл», содержимое которых нужно индексировать.


Вкладка «Просмотр файлов»:

•На этой вкладке отображается таблица со всеми файлами, которые подпадают под настроенные правила индексации.

•Вы можете проверить, какие файлы будут обработаны, а также посмотреть извлеченный из них текст, нажав на соответствующую кнопку в строке файла.


Вкладка «Лог индексации»:

•Для активации логирования установите галочку «Вести лог» на вкладке «Настройка индексации».

•На этой вкладке вы сможете просматривать записи о ходе процесса индексации, что полезно для отладки и мониторинга работы модуля.

Обязательно сохраните внесенные изменения и активируйте модуль.

3. Запуск индексации
После настройки модуля необходимо запустить полную переиндексацию сайта, чтобы содержимое файлов было добавлено в поисковый индекс.

1.Перейдите в раздел «Настройки» -> «Поиск» -> «Переиндексация»

2.Нажмите кнопку «Переиндексировать».

После завершения этого процесса содержимое файлов станет доступным для поиска на сайте.

Системные требования и рекомендации:
•Для корректной работы модуля на сервере должно быть установлено PHP-расширение mbstring.

•Для более быстрой и качественной обработки PDF-файлов рекомендуется установить на сервере утилиту pdftotext (входит в состав пакета poppler-utils для Linux-систем). Если утилита не найдена, модуль будет использовать встроенный парсер на PHP, что может замедлить процесс индексации больших PDF-документов.

Установите этот модуль прямо сейчас!

Для этого укажите адрес сайта:

пример: https://www.site.ru
Индексация контента файлов
Индексация контента файлов
5 500 руб