Переобучите модель БЕРТА

0

Вопрос

Я обучил модель BERT с использованием pytorch примерно миллиону текстовых данных для задачи классификации. После тестирования этой модели с новыми данными я получаю ложные срабатывания и Ложные отрицательные результаты. Теперь я хочу переобучить существующую модель только с помощью FN и FP. Я не хочу добавлять FN и FP в существующий набор данных, а затем снова обучать всю модель. Как мне переобучить эту модель bert только с помощью этих FN и Fp по сравнению с ранее обученной моделью.

1

Лучший ответ

0

Не зная кода для вашего цикла обучения, идея должна выглядеть примерно так после тренировки:

results = model(data)
wrong_datapoints = []
for i, result in enumerate(results)

    if result != labels[i]:
        wrong_datapoints.append((data[i],labels[i]))


(data_new, labels_new) = list(zip(*wrong_datapoints))

model.train(data_new, labels_new)

Если вам нужно что-то более конкретное, вам придется предоставить код вашего текущего цикла поезда.

2021-11-23 12:46:43

спасибо вам за обратную связь. Но я хочу сохранить его модельную версию, так как мы тренируем его каждую неделю, мы моделируем его версию. А также повторение миллиона записей займет много времени. Я думал о загрузке предыдущей версии файла bin(v1.0), а затем переподготовить его только с новыми точками данных, чтобы создать другую версию v2.0
Patricia

Возможно, вы захотите уточнить свой вопрос, чтобы заявить об этом. Однако управление версиями не устраняет необходимости отслеживать результаты точек данных после обучения, требуя одного цикла по данным о поездах после завершения обучения. В конце концов, вам нужно определить, что такое "новые точки данных".
Kroshtan

На других языках

Эта страница на других языках

Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................