Главная

Мониторинг выполнения скриптов

Шаблон предназначен для непрерывного мониторинга, анализа и отладки работы процессов в системе. Он позволяет отслеживать статусы выполнения скриптов и блоков, выявлять ошибки, оценивать производительность и нагрузку на ресурсы, а также анализировать зависимость проблем от конкретных пользователей, пространств или типов операций. Этот инструмент помогает обеспечить стабильность системы, снизить количество сбоев и оптимизировать время выполнения критически важных задач.

Примеры использования

Шаблон помогает решать конкретные задачи, связанные с управлением автоматизацией. Ниже приведены примеры, демонстрирующие, как можно использовать этот шаблон в работе.

Контроль стабильности системы — администраторы могут отслеживать общее количество запущенных и успешно выполненных скриптов, а также фиксировать наличие ошибок и текущих выполняющихся задач. Например, если количество выполняющихся скриптов неожиданно возрастает, это может сигнализировать о зависании или бесконечном цикле
Анализ причин ошибок — разработчики и DevOps-инженеры могут детально изучать типы ошибок, их распределение по скриптам и пространствам. Например, если возникает одна и та же ошибка, это указывает на неоптимизированный скрипт или системные проблемы
Оценка производительности — менеджеры проектов и аналитики могут анализировать минимальную, максимальную и среднюю длительность выполнения скриптов и блоков. Например, если средняя длительность выполнения скрипта составляет 169 мс, но есть случаи, где она достигает 2 секунд, это требует углубленного анализа
Выявление «узких мест» — аналитики по оптимизации могут использовать топ-списки по количеству выполнений, чтобы определить наиболее нагруженные блоки. Например, блок, выполненный многократно, с большим расходом оперативной памяти, является кандидатом на оптимизацию или пересмотр архитектуры
Управление исполнением в реальном времени — администраторы могут видеть список скриптов, которые находятся в состоянии «Выполняются», и сравнивать их фактическую длительность с нормативной. Например, если скрипт выполняется дольше нормы, это может быть сигналом для принятия мер

Структура отчета

После выполнения настроек формируется готовый к использованию отчет. Он состоит из одного основного дашборда — Мониторинг выполнения скриптов — который содержит несколько функциональных разделов для детального анализа.

Холст с данными

После загрузки данных они отображаются на холсте в виде панелей с метриками и визуализациями в дашборде Мониторинг выполнения скриптов.

Основная информация о скриптах

Назначение:
- Общая сводка по всем скриптам за выбранный период: количество запущенных, успешных, текущих и ошибочных выполнений
- Анализ временных рамок: первое и последнее выполнение, а также минимальная, максимальная и средняя длительность
Основные метрики:
- Количество запущенных скриптов — общее число инициированных запусков
- Количество выполненных скриптов — число завершенных без ошибок
- Время первого/последнего выполнения — помогает оценить активность за период
- Минимальная/максимальная/средняя длительность — ключевые показатели производительности
Виджеты:
- График распределения выполнений — визуализирует количество и среднюю длительность выполнений по месяцам
- Статус выполнения — диаграмма, показывающая соотношение успешных, ошибочных и текущих выполнений
- Количество выполнений по пространствам — диаграмма, отражающая нагрузку на различные пространства
- Количество выполнений по скриптам — топ-список самых часто запускаемых скриптов

В разделе вы можете:

Просматривать данные по конкретным нодам, пространствам, скриптам, типам блоков, статусам выполнения, датам, периодам, количествам выполнений по пространствам и количествам выполнений по скриптам с помощью фильтров
Просматривать подробную информацию о каждом выполнении в таблице

Основная информация об ошибках

Назначение:
- Анализ всех ошибок, произошедших при выполнении скриптов
- Выявление доминирующих типов ошибок и их распределения по скриптам и пространства
Основные метрики:
- Типы ошибок — перечень уникальных кодов ошибок и их частота
- Количество ошибок по пространствам — показывает, в каких пространствах чаще всего происходят сбои
- Количество ошибок по скриптам — помогает найти скрипты, требующие отладки
Виджеты:
- Диаграмма типов ошибок — круговая диаграмма, показывающая долю каждого типа ошибки
- Таблица ошибок — детальный список всех ошибок с указанием ID, пространства, скрипта, версии и времени
- Количество ошибок по пространствам — бар-диаграмма, отражающая количество ошибок для каждого пространства
- Количество ошибок по скриптам — топ-список скриптов, вызвавших наибольшее количество ошибок

В разделе вы можете:

Просматривать данные по конкретным нодам, пространствам, скриптам, типам блоков, статусам выполнения, датам, периодам, количествам ошибок по пространствам и количествам ошибок по скриптам с помощью фильтров
Просматривать детали конкретной ошибки в таблицах

Выполняющиеся скрипты

Назначение:
- Отслеживание скриптов, которые в данный момент находятся в процессе выполнения
- Сравнение фактической длительности с нормативной для выявления задержек
Основные метрики:
- Количество выполняющихся скриптов — общее число активных задач
- Длительность выполнения — текущее время выполнения каждого скрипта
- Нормальная длительность выполнения — эталонное значение для сравнения
- Отклонения — разница между фактической и нормальной длительностью, выделенная цветом (красный — превышение)
Виджеты:
- Таблица выполняющихся скриптов — список всех текущих выполнений с деталями: ID, нода, пространство, скрипт, версия, длительность, норма и отклонение

В разделе вы можете:

Просматривать данные по конкретным нодам, пространствам, скриптам, типам блоков, статусам выполнения, датам и периодам с помощью фильтров
Просматривать информацию о текущем выполнении скрипта и его параметрах

Использование результатов шаблонного отчета

После построения отчета важно извлечь полезные выводы: выявить причины сбоев, оптимизировать производительность, подготовить документацию. Ниже приведены рекомендации, как интерпретировать результаты и использовать их для улучшений.

Выявление отклонений и нестандартных ситуаций

Если один и тот же скрипт постоянно завершается с ошибкой — проблема в структуре данных или логике скрипта
Если скрипт выполняется значительно дольше нормы — возможна неоптимальная логика или нехватка ресурсов
Если один пользователь запускает подавляющее большинство блоков — необходимо проверить корректность автоматизации и наличие резервных механизмов

Действия, которые можно предпринять

Отладить и переписать скрипты, вызывающие повторяющиеся ошибки
Оптимизировать наиболее часто используемые блоки для сокращения времени выполнения
Настроить мониторинг для автоматического оповещения при превышении нормативной длительности выполнения
Провести аудит прав доступа и логики автоматических запусков, если один пользователь ответственен за большую часть нагрузки

Настройка шаблонного отчета

Чтобы начать работу с отчетом, загрузите его из Маркетплейса. Способы и этапы загрузки описаны на странице Шаблонные отчеты.

После загрузки отчета в пространство:

Перейдите в дашборд Мониторинг выполнения скриптов.
Нажмите Настройки.
В открывшемся окне настройки вы увидите четыре вкладки:
- Настройка отчета:
  - Часовой пояс: Установите нужный часовой пояс
  - Единица объема памяти: Выберите единицу измерения объема памяти
  - Обрезать вывод запросов (Более 100 символов): Укажите пороговое количество символов для обрезки длинных строк в выводе запросов
  - Нажмите Обновить настройки
- Настройка принудительной остановки скрипта:
  - Введите домен в формате https://…com/: Введите URL вашего домена
  - API-ключ: Введите API-ключ для доступа к системе
  - Пороговое число сбоев: Укажите количество сбоев, после которого скрипт будет принудительно остановлен
  - Лимит времени (мин): Укажите максимальное время выполнения скрипта в минутах, после которого он будет остановлен
  - Нажмите Обновить домен и Обновить лимит сбоев
- Настройка алертинга:
  - Имя пространства: Фильтр для выбора пространства
  - Имя скрипта: Фильтр для выбора скрипта
  - Назначить ответственных: Выберите сотрудников, которые будут получать уведомления
  - Ввести почту (вручную): Введите email адреса для уведомлений вручную
  - Удалить ответственных: Удалите назначенные email адреса
  В таблице ниже отображаются все скрипты, для которых настроен алертинг, с указанием пространства, имени скрипта, сотрудников и почты
- Настройка еженедельной сводки:
  - Добавить ответственных: Добавьте сотрудников, которые будут получать еженедельную сводку
  - Удалить ответственного: Удалите назначенного сотрудника
  В таблице ниже отображаются все ответственные, которым будет отправляться еженедельная сводка
После настройки закройте окно и нажмите Обновить период мониторинга в левой панели, чтобы применить изменения и обновить данные.

Пример анализа выполнения скриптов с помощью шаблона

В этом разделе мы покажем, как с помощью шаблона «Мониторинг выполнения скриптов» проанализировать реальные данные о работе автоматизированных процессов и выявить ключевые проблемы, возможности для оптимизации и пути улучшения стабильности.

В нашу модель данных загружены логи выполнения скриптов за последние три месяца.

С помощью шаблона мы получим:

Структурированные данные о том, как выполняются скрипты
Автоматически построенные визуализации с выявленными трендами и аномалиями
Подготовленные данные для последующего отладки, оптимизации и документирования

Загрузка и настройка данных

Чтобы запустить анализ:

Перейдем в дашборд Мониторинг выполнения скриптов.
Нажмем Настройки.
Вкладка Настройка отчета: Убедимся, что часовой пояс установлен правильно, и нажмем Обновить настройки.
Вкладка Настройка принудительной остановки скрипта: Введем домен и API-ключ, установим порог сбоев и лимит времени, нажмем Обновить домен и Обновить лимит сбоев.
Закроем окно настроек.
В левой панели установим Период мониторинга (кол-во месяцев) на 3 и нажмем Обновить период мониторинга.
После загрузки данных проанализируем основную информацию на дашборде.

Детальный анализ по секциям

Анализ скриптов

Общая статистика: За период было запущено 571k скриптов, из них 559k выполнены успешно. 10.8k завершились с ошибкой, 15 находятся в процессе выполнения.

Анализ ошибок: Наиболее распространенной ошибкой является ai_llm_model_not_found, что указывает на проблемы с доступностью или конфигурацией LLM-моделей. Второе место занимает script_start_error, что может свидетельствовать о проблемах при инициализации скриптов. Ошибки типа Syntax error и Broken pipe также встречаются, но реже. По пространствам наибольшее количество ошибок наблюдается в TM Test и Кейс (новая активность). Топ-скрипты по количеству ошибок: TM. 04. Instructions и TM. 05. Generate operation data.

Текущие выполнения: В данный момент выполняется 18 скриптов. Большинство из них превышают нормативное время выполнения: например, скрипт Получение списка групп и пользователей в Jira работает уже более 8 часов, хотя норма составляет 2 секунды 154 миллисекунды. Скрипт Получение данных AmoCRM выполняется более 6 часов, при норме в 1 секунду 92 миллисекунды. Единственный скрипт, который находится в пределах нормы — TM. 04. Instructions, его длительность — 51 минута 52 секунды, а норма — 2 часа 11 минут 36 секунд 825 миллисекунд.

Вывод:

Необходимо проверить доступность и конфигурацию LLM-моделей, так как основная масса ошибок (ai_llm_model_not_found) связана именно с ними
Скрипты, которые выполняются значительно дольше нормы, требуют глубокого анализа кода и логики — возможно, они зависают из-за внешних вызовов или неоптимальных запросов
Рекомендуется настроить автоматическое оповещение при превышении нормы длительности выполнения, особенно для критически важных процессов

Возможности для улучшения и оптимизации

Область	Текущее состояние	Рекомендация
Скрипты	10.8k с ошибкой, 12 скриптов выполняются	Отладить скрипты, настроить мониторинг и оповещения
Производительность	Нормальная длительность 289 мс, фактическая больше	Провести профилирование, выявить узкие места в коде
Автоматизация	Высокая степень автоматизации	Проверить корректность логики автоматических запусков

Итоговый вывод

Система автоматизации работает, но содержит риски, связанные с нестабильностью и производительностью:

Наличие ошибок в критически важных скриптах может привести к сбоям в бизнес-процессах
Значительные отклонения в длительности выполнения указывают на необходимость оптимизации
Высокая нагрузка на отдельные скрипты требует внимания для предотвращения будущих проблем

Шаблон «Мониторинг выполнения скриптов» позволил не только выявить эти проблемы, но и предложить конкретные, измеримые действия для их устранения. Регулярное использование отчета (ежедневно/еженедельно) обеспечит стабильную и эффективную работу автоматизированных процессов.

Была ли статья полезна?

Конвертация схемы BPMN в регламент процесса

JS-трекер