Работа с поврежденными архивами мониторинга
8 800 555-89-02
Войти
infomaximum_logoДокументация
CTRL+K
Standalone2509
LTS
SaaS

Работа с поврежденными архивами мониторингаLTS

В этой статье

В Proceset сбор пользовательской активности осуществляется агентом мониторинга, который ежедневно отправляет на сервер архивы с данными. После приема сервер выполняет первичную валидацию архивов. Те, которые не соответствуют требованиям (например, поврежденный manifest.json, несуществующий пользователь, ошибки структуры), не попадают в ClickHouse и помещаются в специальную очередь corrupted.

Диагностика поврежденных архивов

Для работы с поврежденными архивами используется GraphQL API.

Получение статистики по очереди corrupted

Чтобы вывести количество архивов в очереди, выполните запрос:

{
  monitoring_diagnostics {
    corrupted_file_query {
      corrupted_file_statistic {
        all_size
        node_id
      }
    }
  }
}

Где:

  • all_size — общее количество архивов в очереди corrupted
  • node_id — идентификатор узла, на котором накоплены поврежденные файлы

Список поврежденных архивов с детализацией

Чтобы получить список поврежденных архивов:

{
  monitoring_diagnostics {
    corrupted_file_query {
      corrupted_file_column_families {
        min_id
        max_id
        column_family_name
        node_id
        size
        corrupted_file_data_list {
          id
          source_file_name
        }
      }
    }
  }
}

Где:

  • min_id, max_id — диапазон идентификаторов архивов в группе
  • column_family_name — название группы
  • node_id — идентификатор сервера
  • size — количество архивов в группе
  • corrupted_file_data_list — список файлов:
    • id — уникальный ID архива
    • source_file_name — исходное имя файла (например, archive_20251114_012345.zip)

Общая статистика очереди обработки архивов

Чтобы отличить проблемы с corrupted от общей нагрузки на систему:

{
  monitoring_diagnostics {
    agent_file_query {
      agent_file_queue_statistic {
        all_queue_size
        wait_processing_size
        processed_size
      }
    }
  }
}

Где:

  • all_queue_size — всего архивов в очереди
  • wait_processing_size — архивов, ожидающих обработки
  • processed_size — успешно обработанных и загруженных в ClickHouse

Выгрузка архива

Для выгрузки архива из очереди corrupted необходимы идентификаторы, полученные из запроса на получение списка поврежденных архивов:

  • id архива
  • node_id сервера
{
  monitoring_diagnostics {
    corrupted_file_query {
      corrupted_file_by_id(id: $id, runtimeNodeId: "$node_id")
    }
  }
}

После выполнения запроса:

  1. Удалите букву i в адресной строке браузера из graphiql.
  2. Нажмите Enter.
  3. Начнется автоматическая загрузка архива в браузере — файл скачается с именем corrupted_<id>.zip.

Повторная обработка поврежденных архивов

Если вы уверены, что архивы попали в corrupted ошибочно, можно запустить массовую повторную обработку.

Важно

Перед выполнением запроса убедитесь, что в очереди corrupted больше 100 000 архивов.

mutation {
  computer_activity {
    reload_corrupted_activities(is_delete_on_fail: true)
  }
}

Где у параметра is_delete_on_fail может быть установлено два значения:

  • true — если архив не удается разобрать, то он безвозвратно удаляется
  • false — если архив не удается разобрать, то он возвращается в очередь corrupted

Была ли статья полезна?

Да
Нет
Предыдущая
Архивация активности
infomaximum_logo_icon
430006, Саранск,
Северо-восточное шоссе, д. 3
ОКВЭД 62.01
ИНН 1328909857
Код вида деятельности
в области ИТ 15.02 и 17.01
Языки программирования
Мы используем файлы cookies, чтобы сайт был лучше для вас.
Ищете ответ? Наш чат‑бот с ИИ понимает контекст документации и предлагает самые точные результаты.
infomaximum_logo