Maintenance#
CedrusData Catalog предоставляет возможность обслуживания объектов Iceberg.
Общая информация#
В зависимости от типа операции, объектами обслуживания могут быть таблицы, представления и материализованные представления.
Выполнение операций происходит асинхронно. После запуска операции обслуживания вы получаете уникальный идентификатор, который может быть использован в команде CLI maintenance get для получения текущего статуса операции.
В случае успешного завершения операция возвращает результат работы в виде пар ключ-значение. CedrusData Catalog сохраняет информацию об операциях в базу данных, периодически удаляя устаревшие записи.
Ознакомьтесь с дополнительными параметрами конфигурации maintenance операций: Конфигурация Iceberg.
Группы объектов обслуживания#
Операции обслуживания могут быть запущены для группы объектов. Например, для всех объектов конкретного каталога или namespace.
Для этого необходимо создать именованную группу объектов с помощью команды CLI object-group create, и наполнить ее целевыми объектами с помощью команды CLI object-group add-item.
Целевые объекты могут быть заданы следующим образом:
Все объекты каталога:
--namespace-name=*, --object-name=*
Все объекты namespace:
--namespace-name=<имя_namespace> --object-name=*
Конкретный объект:
--namespace-name=<имя_namespace> --object-name=<имя_объекта>
После наполнения именованной группы вы можете запустить maintenance-операцию для всех объектов группы одной командой.
Поддерживаемые операции#
expire-snapshots
#
Удаляет устаревшие snapshot. Используйте команду CLI maintenance expire-snapshots для запуска операции.
Поддерживаемые типы объектов: таблицы, материализованные представления.
Параметры:
older-than
— файлы старше скольки дней можно удалять; значение по умолчанию —5
(пять дней)retain-last
— сколько последних snapshot необходимо сохранить вне зависимости от значения параметраolder-than
; значение по умолчанию:1
Результаты:
system.processed-objects
— количество обработанных объектов Icebergexpired-snapshots
— количество удаленных snapshotdeleted-files
— количество удаленных файлов
remove-orphan-files
#
Удаляет файлы данных и метаданных, на которые не ссылается ни один snapshot. Используйте команду CLI maintenance remove-orphan-files для запуска операции.
Поддерживаемые типы объектов: таблицы, материализованные представления.
Параметры:
older-than
— файлы старше скольки дней можно удалять; значение по умолчанию —3
(три дня)
Результаты:
system.processed-objects
— количество обработанных объектов Icebergdeleted-files
— количество удаленных файлов