У меня есть нейронная сеть, которая выводит output
. Я хочу преобразиться output
до того, как произойдет потеря и обратное продвижение.
Вот мой общий код:
with torch.set_grad_enabled(training):
outputs = net(x_batch[:, 0], x_batch[:, 1]) # the prediction of the NN
# My issue is here:
outputs = transform_torch(outputs)
loss = my_loss(outputs, y_batch)
if training:
scheduler.step()
loss.backward()
optimizer.step()
У меня есть функция преобразования, через которую я пропускаю свой вывод:
def transform_torch(predictions):
torch_dimensions = predictions.size()
torch_grad = predictions.grad_fn
cuda0 = torch.device('cuda:0')
new_tensor = torch.ones(torch_dimensions, dtype=torch.float64, device=cuda0, requires_grad=True)
for i in range(int(len(predictions))):
a = predictions[i]
# with torch.no_grad(): # Note: no training happens if this line is kept in
new_tensor[i] = torch.flip(torch.cumsum(torch.flip(a, dims = [0]), dim = 0), dims = [0])
return new_tensor
Моя проблема в том, что я получаю ошибку в предпоследней строке:
RuntimeError: a view of a leaf Variable that requires grad is being used in an in-place operation.
Есть какие-нибудь предложения? Я уже пробовал использовать "с torch.no_grad():" (прокомментировал), но это приводит к очень плохой подготовке, и я считаю, что градиенты не возвращаются должным образом после функции преобразования.
Спасибо!