Эффективный HPO с EvoX
В этой главе мы рассмотрим, как использовать EvoX для оптимизации гиперпараметров (HPO).
HPO играет решающую роль во многих задачах машинного обучения, но часто игнорируется из-за высокой вычислительной стоимости (процесс может занимать несколько дней), а также сложностей, связанных с развертыванием.
С помощью EvoX мы можем упростить развертывание HPO, используя HPOProblemWrapper, и добиться эффективных вычислений благодаря методу vmap и ускорению на GPU.
Преобразование Workflow в Problem

Ключом к развертыванию HPO в EvoX является преобразование workflows в problems с помощью HPOProblemWrapper. После преобразования мы можем работать с workflows как со стандартными problems. Входными данными для «задачи HPO» являются гиперпараметры, а выходными — метрики оценки.
Ключевой компонент — HPOProblemWrapper
Чтобы HPOProblemWrapper распознал гиперпараметры, нам нужно обернуть их с помощью Parameter. Благодаря этому простому шагу гиперпараметры будут идентифицированы автоматически.
class ExampleAlgorithm(Algorithm):
def __init__(self,...):
self.omega = Parameter([1.0, 2.0]) # wrap the hyper-parameters with `Parameter`
self.beta = Parameter(0.1)
pass
def step(self):
# run algorithm step depending on the value of self.omega and self.beta
pass
Использование HPOFitnessMonitor
Мы предоставляем HPOFitnessMonitor, который поддерживает расчет метрик «IGD» и «HV» для многокритериальных задач, а также минимальное значение для однокритериальных задач.
Важно отметить, что HPOFitnessMonitor — это базовый монитор, разработанный для задач HPO. Вы также можете гибко создавать свои собственные мониторы, используя подход, описанный в разделе Deploy HPO with Custom Algorithms.
Простой пример
Здесь мы продемонстрируем простой пример использования EvoX для HPO. В частности, мы будем использовать алгоритм PSO для оптимизации гиперпараметров алгоритма PSO при решении задачи сферы.
Обратите внимание, что эта глава содержит лишь краткий обзор развертывания HPO. Для получения более подробного руководства обратитесь к разделу Deploy HPO with Custom Algorithms.
Для начала импортируем необходимые модули.
import torch
from evox.algorithms.pso_variants.pso import PSO
from evox.core import Problem
from evox.problems.hpo_wrapper import HPOFitnessMonitor, HPOProblemWrapper
from evox.workflows import EvalMonitor, StdWorkflow
Далее мы определим простую задачу Sphere.
class Sphere(Problem):
def __init__(self):
super().__init__()
def evaluate(self, x: torch.Tensor):
return (x * x).sum(-1)
Затем мы можем использовать StdWorkflow, чтобы обернуть problem, algorithm и monitor. После этого мы используем HPOProblemWrapper для преобразования StdWorkflow в задачу HPO.
# the inner loop is a PSO algorithm with a population size of 50
torch.set_default_device("cuda" if torch.cuda.is_available() else "cpu")
inner_algo = PSO(50, -10 * torch.ones(10), 10 * torch.ones(10))
inner_prob = Sphere()
inner_monitor = HPOFitnessMonitor()
inner_workflow = StdWorkflow(inner_algo, inner_prob, monitor=inner_monitor)
# Transform the inner workflow to an HPO problem
hpo_prob = HPOProblemWrapper(iterations=30, num_instances=128, workflow=inner_workflow, copy_init_state=True)
HPOProblemWrapper принимает 4 аргумента:
iterations: Количество итераций, которые будут выполнены в процессе оптимизации.num_instances: Количество экземпляров, которые будут выполняться параллельно в процессе оптимизации.workflow: Workflow, который будет использоваться в процессе оптимизации.copy_init_state: Нужно ли копировать начальное состояние workflow для каждой оценки. По умолчаниюTrue. Если ваш workflow содержит операции, которые изменяют тензоры в начальном состоянии на месте (IN-PLACE), этот параметр должен быть установлен вTrue. В противном случае можно установитьFalseдля экономии памяти.
Мы можем проверить, правильно ли HPOProblemWrapper распознает определенные нами гиперпараметры. Поскольку в 5 экземплярах гиперпараметры не изменяются, они должны оставаться идентичными для всех экземпляров.
params = hpo_prob.get_init_params()
print("init params:\n", params)
Мы также можем определить собственный набор значений гиперпараметров. Важно убедиться, что количество наборов гиперпараметров совпадает с количеством экземпляров в HPOProblemWrapper. Кроме того, пользовательские гиперпараметры должны быть предоставлены в виде словаря, значения которого обернуты с помощью Parameter.
params = hpo_prob.get_init_params()
# since we have 128 instances, we need to pass 128 sets of hyperparameters
params["algorithm.w"] = torch.nn.Parameter(torch.rand(128, 1), requires_grad=False)
params["algorithm.phi_p"] = torch.nn.Parameter(torch.rand(128, 1), requires_grad=False)
params["algorithm.phi_g"] = torch.nn.Parameter(torch.rand(128, 1), requires_grad=False)
result = hpo_prob.evaluate(params)
print("The result of the first 3 parameter sets:\n", result[:3])
Теперь мы используем алгоритм PSO для оптимизации гиперпараметров алгоритма PSO.
Важно убедиться, что размер популяции PSO совпадает с количеством экземпляров; в противном случае могут возникнуть непредвиденные ошибки.
Кроме того, решение необходимо преобразовать во внешнем workflow, так как HPOProblemWrapper требует, чтобы входные данные были в формате словаря.
class solution_transform(torch.nn.Module):
def forward(self, x: torch.Tensor):
return {
"algorithm.w": x[:, 0],
"algorithm.phi_p": x[:, 1],
"algorithm.phi_g": x[:, 2],
}
outer_algo = PSO(128, 0 * torch.ones(3), 3 * torch.ones(3)) # search each hyperparameter in the range [0, 3]
monitor = EvalMonitor(full_sol_history=False)
outer_workflow = StdWorkflow(outer_algo, hpo_prob, monitor=monitor, solution_transform=solution_transform())
outer_workflow.init_step()
compiled_step = torch.compile(outer_workflow.step)
for _ in range(100):
compiled_step()
monitor = outer_workflow.get_submodule("monitor")
print("params:\n", monitor.topk_solutions, "\n")
print("result:\n", monitor.topk_fitness)
monitor.plot()