Мониторинг выполнения скриптовLTS
- Мониторинг выполнения скриптов
- Примеры использования
- Структура отчета
- Холст с данными
- Использование результатов шаблонного отчета
- Выявление отклонений и нестандартных ситуаций
- Действия, которые можно предпринять
- Рекомендации по применению в ежедневной работе
- Настройка шаблонного отчета
- Пример анализа выполнения скриптов с помощью шаблона
- Загрузка и настройка данных
- Детальный анализ по секциям
- Возможности для улучшения и оптимизации
- Итоговый вывод
Шаблон предназначен для непрерывного мониторинга, анализа и отладки работы процессов в системе. Он позволяет отслеживать статусы выполнения скриптов и блоков, выявлять ошибки, оценивать производительность и нагрузку на ресурсы, а также анализировать зависимость проблем от конкретных пользователей, пространств или типов операций. Этот инструмент помогает обеспечить стабильность системы, снизить количество сбоев и оптимизировать время выполнения критически важных задач.
Примеры использования
Шаблон помогает решать конкретные задачи, связанные с управлением автоматизацией. Ниже приведены примеры, демонстрирующие, как можно использовать этот шаблон в работе.
- Контроль стабильности системы — администраторы могут отслеживать общее количество запущенных и успешно выполненных скриптов, а также фиксировать наличие ошибок и текущих выполняющихся задач. Например, если количество выполняющихся скриптов неожиданно возрастает, это может сигнализировать о зависании или бесконечном цикле
- Анализ причин ошибок — разработчики и DevOps-инженеры могут детально изучать типы ошибок, их распределение по скриптам и пространствам. Например, если возникает одна и та же ошибка, это указывает на неоптимизированный скрипт или системные проблемы
- Оценка производительности — менеджеры проектов и аналитики могут анализировать минимальную, максимальную и среднюю длительность выполнения скриптов и блоков. Например, если средняя длительность выполнения скрипта составляет 169 мс, но есть случаи, где она достигает 2 секунд, это требует углубленного анализа
- Выявление «узких мест» — аналитики по оптимизации могут использовать топ-списки по количеству выполнений, чтобы определить наиболее нагруженные блоки. Например, блок, выполненный многократно, с большим расходом оперативной памяти, является кандидатом на оптимизацию или пересмотр архитектуры
- Управление исполнением в реальном времени — администраторы могут видеть список скриптов, которые находятся в состоянии «Выполняются», и сравнивать их фактическую длительность с нормативной. Например, если скрипт выполняется дольше нормы, это может быть сигналом для принятия мер
Структура отчета
После выполнения настроек формируется готовый к использованию отчет. Он состоит из одного основного дашборда — Мониторинг выполнения скриптов — который содержит несколько функциональных разделов для детального анализа.
Холст с данными
После загрузки данных они отображаются на холсте в виде панелей с метриками и визуализациями в дашборде Мониторинг выполнения скриптов.
Основная информация о скриптах
- Назначение:
- Общая сводка по всем скриптам за выбранный период: количество запущенных, успешных, текущих и ошибочных выполнений
- Анализ временных рамок: первое и последнее выполнение, а также минимальная, максимальная и средняя длительность
- Основные метрики:
- Количество запущенных скриптов — общее число инициированных запусков
- Количество выполненных скриптов — число завершенных без ошибок
- Время первого/последнего выполнения — помогает оценить активность за период
- Минимальная/максимальная/средняя длительность — ключевые показатели производительности
- Виджеты:
- График распределения выполнений — визуализирует количество и среднюю длительность выполнений по месяцам
- Статус выполнения — диаграмма, показывающая соотношение успешных, ошибочных и текущих выполнений
- Количество выполнений по пространствам — диаграмма, отражающая нагрузку на различные пространства
- Количество выполнений по скриптам — топ-список самых часто запускаемых скриптов
В разделе вы можете:
- Просматривать данные по конкретным нодам, пространствам, скриптам, типам блоков, статусам выполнения, датам, периодам, количествам выполнений по пространствам и количествам выполнений по скриптам с помощью фильтров
- Просматривать подробную информацию о каждом выполнении в таблице
Основная информация об ошибках
- Назначение:
- Анализ всех ошибок, произошедших при выполнении скриптов
- Выявление доминирующих типов ошибок и их распределения по скриптам и пространства
- Основные метрики:
- Типы ошибок — перечень уникальных кодов ошибок и их частота
- Количество ошибок по пространствам — показывает, в каких пространствах чаще всего происходят сбои
- Количество ошибок по скриптам — помогает найти скрипты, требующие отладки
- Виджеты:
- Диаграмма типов ошибок — круговая диаграмма, показывающая долю каждого типа ошибки
- Таблица ошибок — детальный список всех ошибок с указанием ID, пространства, скрипта, версии и времени
- Количество ошибок по пространствам — бар-диаграмма, отражающая количество ошибок для каждого пространства
- Количество ошибок по скриптам — топ-список скриптов, вызвавших наибольшее количество ошибок
В разделе вы можете:
- Просматривать данные по конкретным нодам, пространствам, скриптам, типам блоков, статусам выполнения, датам, периодам, количествам ошибок по пространствам и количествам ошибок по скриптам с помощью фильтров
- Просматривать детали конкретной ошибки в таблицах
Выполняющиеся скрипты
- Назначение:
- Отслеживание скриптов, которые в данный момент находятся в процессе выполнения
- Сравнение фактической длительности с нормативной для выявления задержек
- Основные метрики:
- Количество выполняющихся скриптов — общее число активных задач
- Длительность выполнения — текущее время выполнения каждого скрипта
- Нормальная длительность выполнения — эталонное значение для сравнения
- Отклонения — разница между фактической и нормальной длительностью, выделенная цветом (красный — превышение)
- Виджеты:
- Таблица выполняющихся скриптов — список всех текущих выполнений с деталями: ID, нода, пространство, скрипт, версия, длительность, норма и отклонение
В разделе вы можете:
- Просматривать данные по конкретным нодам, пространствам, скриптам, типам блоков, статусам выполнения, датам и периодам с помощью фильтров
- Просматривать информацию о текущем выполнении скрипта и его параметрах
Использование результатов шаблонного отчета
После построения отчета важно извлечь полезные выводы: выявить причины сбоев, оптимизировать производительность, подготовить документацию. Ниже приведены рекомендации, как интерпретировать результаты и использовать их для улучшений.
Выявление отклонений и нестандартных ситуаций
- Если один и тот же скрипт постоянно завершается с ошибкой — проблема в структуре данных или логике скрипта
- Если скрипт выполняется значительно дольше нормы — возможна неоптимальная логика или нехватка ресурсов
- Если один пользователь запускает подавляющее большинство блоков — необходимо проверить корректность автоматизации и наличие резервных механизмов
Действия, которые можно предпринять
- Отладить и переписать скрипты, вызывающие повторяющиеся ошибки
- Оптимизировать наиболее часто используемые блоки для сокращения времени выполнения
- Настроить мониторинг для автоматического оповещения при превышении нормативной длительности выполнения
- Провести аудит прав доступа и логики автоматических запусков, если один пользователь ответственен за большую часть нагрузки
Рекомендации по применению в ежедневной работе
- Ежедневно просматривать разделы Выполняющиеся скрипты и Основная информация об ошибках — это поможет вовремя замечать сбои
- Еженедельно анализировать топ-списки по блокам и скриптам — чтобы выявлять системные проблемы и возможности для оптимизации
- При внедрении новых скриптов использовать отчет как инструмент тестирования — чтобы убедиться, что они работают стабильно и эффективно
- При переходе на новые версии системы — сравнивать метрики до и после обновления, чтобы оценить влияние изменений
Настройка шаблонного отчета
Чтобы начать работу с отчетом, загрузите его из Маркетплейса. Способы и этапы загрузки описаны на странице Шаблонные отчеты.
После загрузки отчета в пространство:
- Перейдите в дашборд Мониторинг выполнения скриптов.
- Нажмите Настройки.
- В открывшемся окне настройки вы увидите четыре вкладки:
- Настройка отчета:
- Часовой пояс: Установите нужный часовой пояс
- Единица объема памяти: Выберите единицу измерения объема памяти
- Обрезать вывод запросов (Более 100 символов): Укажите пороговое количество символов для обрезки длинных строк в выводе запросов
- Нажмите Обновить настройки
- Настройка принудительной остановки скрипта:
- Введите домен в формате https://…com/: Введите URL вашего домена
- API-ключ: Введите API-ключ для доступа к системе
- Пороговое число сбоев: Укажите количество сбоев, после которого скрипт будет принудительно остановлен
- Лимит времени (мин): Укажите максимальное время выполнения скрипта в минутах, после которого он будет остановлен
- Нажмите Обновить домен и Обновить лимит сбоев
- Настройка алертинга:
- Имя пространства: Фильтр для выбора пространства
- Имя скрипта: Фильтр для выбора скрипта
- Назначить ответственных: Выберите сотрудников, которые будут получать уведомления
- Ввести почту (вручную): Введите email адреса для уведомлений вручную
- Удалить ответственных: Удалите назначенные email адреса
- Настройка еженедельной сводки:
- Добавить ответственных: Добавьте сотрудников, которые будут получать еженедельную сводку
- Удалить ответственного: Удалите назначенного сотрудника
- Настройка отчета:
- После настройки закройте окно и нажмите Обновить период мониторинга в левой панели, чтобы применить изменения и обновить данные.
Пример анализа выполнения скриптов с помощью шаблона
В этом разделе мы покажем, как с помощью шаблона «Мониторинг выполнения скриптов» проанализировать реальные данные о работе автоматизированных процессов и выявить ключевые проблемы, возможности для оптимизации и пути улучшения стабильности.
В нашу модель данных загружены логи выполнения скриптов за последние три месяца.
С помощью шаблона мы получим:
- Структурированные данные о том, как выполняются скрипты
- Автоматически построенные визуализации с выявленными трендами и аномалиями
- Подготовленные данные для последующего отладки, оптимизации и документирования
Загрузка и настройка данных
Чтобы запустить анализ:
- Перейдем в дашборд Мониторинг выполнения скриптов.
- Нажмем Настройки.
- Вкладка Настройка отчета: Убедимся, что часовой пояс установлен правильно, и нажмем Обновить настройки.
- Вкладка Настройка принудительной остановки скрипта: Введем домен и API-ключ, установим порог сбоев и лимит времени, нажмем Обновить домен и Обновить лимит сбоев.
- Закроем окно настроек.
- В левой панели установим Период мониторинга (кол-во месяцев) на 3 и нажмем Обновить период мониторинга.
- После загрузки данных проанализируем основную информацию на дашборде.
Детальный анализ по секциям
Анализ скриптов
Общая статистика: За период было запущено 571k скриптов, из них 559k выполнены успешно. 10.8k завершились с ошибкой, 15 находятся в процессе выполнения.
Анализ ошибок: Наиболее распространенной ошибкой является ai_llm_model_not_found, что указывает на проблемы с доступностью или конфигурацией LLM-моделей. Второе место занимает script_start_error, что может свидетельствовать о проблемах при инициализации скриптов. Ошибки типа Syntax error и Broken pipe также встречаются, но реже. По пространствам наибольшее количество ошибок наблюдается в TM Test и Кейс (новая активность). Топ-скрипты по количеству ошибок: TM. 04. Instructions и TM. 05. Generate operation data.
Текущие выполнения: В данный момент выполняется 18 скриптов. Большинство из них превышают нормативное время выполнения: например, скрипт Получение списка групп и пользователей в Jira работает уже более 8 часов, хотя норма составляет 2 секунды 154 миллисекунды. Скрипт Получение данных AmoCRM выполняется более 6 часов, при норме в 1 секунду 92 миллисекунды. Единственный скрипт, который находится в пределах нормы — TM. 04. Instructions, его длительность — 51 минута 52 секунды, а норма — 2 часа 11 минут 36 секунд 825 миллисекунд.
Вывод:
- Необходимо проверить доступность и конфигурацию LLM-моделей, так как основная масса ошибок (
ai_llm_model_not_found) связана именно с ними - Скрипты, которые выполняются значительно дольше нормы, требуют глубокого анализа кода и логики — возможно, они зависают из-за внешних вызовов или неоптимальных запросов
- Рекомендуется настроить автоматическое оповещение при превышении нормы длительности выполнения, особенно для критически важных процессов
Возможности для улучшения и оптимизации
| Область | Текущее состояние | Рекомендация |
|---|---|---|
| Скрипты | 10.8k с ошибкой, 12 скриптов выполняются | Отладить скрипты, настроить мониторинг и оповещения |
| Производительность | Нормальная длительность 289 мс, фактическая больше | Провести профилирование, выявить узкие места в коде |
| Автоматизация | Высокая степень автоматизации | Проверить корректность логики автоматических запусков |
Итоговый вывод
Система автоматизации работает, но содержит риски, связанные с нестабильностью и производительностью:
- Наличие ошибок в критически важных скриптах может привести к сбоям в бизнес-процессах
- Значительные отклонения в длительности выполнения указывают на необходимость оптимизации
- Высокая нагрузка на отдельные скрипты требует внимания для предотвращения будущих проблем
Шаблон «Мониторинг выполнения скриптов» позволил не только выявить эти проблемы, но и предложить конкретные, измеримые действия для их устранения. Регулярное использование отчета (ежедневно/еженедельно) обеспечит стабильную и эффективную работу автоматизированных процессов.
Была ли статья полезна?