Агрегатор новостей Лайт для 1С-Битрикс

ОПИСАНИЕ РЕШЕНИЯ

Модуль агрегирует записи из RSS-каналов по ключевым выражениям, сохраняя их в инфоблок.

Вы задаете:
- перечень каналов,
- секцию инфоблока, в которую будет идти запись,
- интервал обновления.
Автоматическое обновление разделов готово!
Интересные и полезные для пользователей статьи из проверенных источников будут сами регулярно публиковаться в них.

Дополнительно вы можете настроить:
- перечень ключевых выражений для поиска;
- перечень стоп-слов для фильтрации новостей;
- выбор в каком формате сохранять новость - html или text.

Модуль позволяет добавить неограниченное количество агрегаторов RSS-каналов!

Кроме того, агрегатор добавляет из ленты изображения и полный текст новости, ориентированный на Яндекс.






Описание функциональных характеристик программного обеспечения

Основная функция модуля — парсинг контента (новостей) из rss фидов и генерация из них элементов инфоблоков.
Агрегатор парсит фиды с определённым интервалом, например раз в час. Если в фиде есть новые элементы, из них создаются элементы для инфоблока.

Агрегатор может выбирать только те новости, в которых присутствуют заданные ключевые выражения.
Можно задать стоп слова. Новости, в которых присутствуют стоп слова, будут отбрасываться.

Агрегатор может осуществлять поиск в тексте заданных фраз и превращать их в заданные ссылки. На одну фразу можно установить простановку нескольких ссылок и назначить им вес. Тогда какая именно ссылка будет проставлена на фразу выбирается случайным образом в зависимости от веса ссылки.
Также для ссылок можно задавать атрибут target — открытие ссылки в новом, либо в существующем окне. И атрибут onclick — можно вписать javascript код для действия по клику.

Агрегатор может осуществлять поиск в тексте заданных фраз и при нахождении фразы устнавливать для элемента инфоблока заданный тэг, соответствующий фразе.

Дополнительные настройки:

  • Сохранять в инфоблок новости в виде html или простого текста.
  • Импортировать с изображениями или без.
  • Вырезать или нет html теги.
  • Возможность не агрегировать новости, названия которых похожи на существующие. Сходство можно задавать в процентах. По умолчанию 100% — то есть новости не будут агрегироваться, если уже присутствуют элементы с полностью совпадающими названиями.
  • Агрегировать только за последние несколько дней.
  • Создавать элементы инфоблока неактивными.
  • Если заголовок новости слишком длинный, можно помещать его в описание.


Информация для установки программного обеспечения.

Для корректной работы модуля необходимо:

  • Установленная на сайте 1С-Битрикс: Управление сайтом.
  • Php с установленными модулями libxml и libcurl


Информация для эксплуатации программного обеспечения.

Настройки модуля в панели администрирования Битрикса: "Настройки продукта -> Настройки модуля -> Агрегатор новостей Лайт"

Настройки состоят из секций. Каждая секция соответствует одному инфоблоку, в который будут агрегироваться новости.

Адреса каналов RSS:
Ссылка на RSS.
Можно вставлять сразу несколько ссылок, каждую с новой строки.

Ключевые выражения:
Если заданы, то будет агрегироваться только те новости, в которых найдены ключевые выражения.
Каждую фразу нужно вставлять с новой строки.
Ключевые выражение ищутся в заголовке и описании новости. Можно установить галочку, чтобы искались и в подробном тексте.

Стоп слова:
Если заданы, то новости, в которых встретятся стоп слова, не будут агрегироваться.
Стоп слова ищутся в заголовке и описании новости. Можно установить галочку, чтобы искались и в подробном тексте.

Инфоблок для импорта новостей:
Инфоблок, в котором будут создаваться элементы агрегированных новостей.
Секция для импорта новостей:
Если у инфоблока есть разделы, можно агрегировать в выбранный раздел, либо в корень.
Интервал обновления новостей:
Интервал, с которым будет парситься rss для агрегации новых новостей.

Дополнительные настройки:
Импортировать как html / как текст — описание и детальный текст элементов будут сохранены в инфоблоке как html либо как текст.
Импортировать с изображениями — если к rss новости прикреплено изображение, оно может быть сохранено как превью и детальное изображение элемента инфоблока.
Удалять html теги — из описания и детального текста элементов будут вырезаны html теги. Не агрегировать новости, названия которых совпадают на n% с уже сохраненным — по умолчанию 100%. Можно задать значение от 1% до 100%. Агрегироваться будут те новости, процент похожести заголовков которых меньше чем заданный процент. Для вычисления похожести используется php функция "similar_text()".
Агрегировать за последние n дней — не будут агрегироваться новости, дата публикации которых старше количества дней.
Создавать элементы неактивными — элементы инфоблока будут неактивны.
Помещать длинные заголовки(>255 зн) в начало описания — длинные заголовки новостей будут обрезаны до 255 знаков. А полная версия заголовка будет вставлена в начало описания новости.

Чтобы сделать сайт еще удобнее, мы анализируем пользовательский опыт - собираем данные...
Подробнее
Чтобы сделать сайт еще удобнее, мы анализируем пользовательский опыт - собираем данные с помощью файлов cookie, журналов истории доступа и web-счетчиков. Согласно Федеральному закону «О персональных данных» мы обязаны сообщить вам об этом. Продолжая работу с ресурсом, вы выражаете согласие на обработку ваших данных. Более подробная информация размещена в разделе «Политика конфиденциальности»