Я пытаюсь создать модель CNN для двоичной классификации набора данных без изображений. Моя модель/ код работает и дает очень хорошие результаты (точность высока), но я не могу понять input_shape
параметр для 1-го слоя Conv1D
.
Форма X или ввода (здесь x_train_df
) является (2000, 28). Он имеет 28 функций и 2000 образцов. И форма Y или надписи (здесь y_train_df
) является (2000, 1).
model = Sequential()
model.add(Conv1D(filters = 64, kernel_size = 3, activation = 'relu', input_shape = (x_train_df.shape[1], 1)))
model.add(Conv1D(filters = 64, kernel_size = 3, activation = 'relu'))
model.add(MaxPooling1D(pool_size = 2))
model.add(Flatten())
model.add(Dense(100, activation = 'relu'))
model.add(Dense(1, activation = 'sigmoid'))
optimzr = Adam(learning_rate=0.005)
model.compile(loss='binary_crossentropy', optimizer=optimzr, metrics=[[tf.keras.metrics.AUC(curve="ROC", name = 'auc')], [tf.keras.metrics.AUC(curve="PR", name = 'pr')]])
# running the fitting
model.fit(x_train_df, y_train_df, epochs = 2, batch_size = 32, validation_data = (x_val_df, y_val_df), verbose = 2)
Я дал input_shape
как (28, 1) (взята ссылка из этого вопроса).
Но в документации уровня Conv1D написано, что,
При использовании этого слоя в качестве первого слоя в модели укажите аргумент input_shape (кортеж целых чисел или их нет, например (10, 128) для последовательностей из 10 векторов 128-мерных векторов.
Из этого я понял, что размерность input_shape должна быть (2000, 1), так как у меня 2000 одномерных векторов. Но давая это как input_shape
показывает ошибку в виде,
Ошибка значения: Ввод 0 слоя "sequential_25" несовместим со слоем: ожидаемая форма=(Нет, 2000, 1), найденная форма=(Нет, 28)
Поэтому мой вопрос в том, что должно быть правильным input_shape
?
ValueError: logits and labels must have the same shape, received ((None, 1) vs (None, 2000)).
Поэтому я изменил формы на (2000, 28, 1) дляx_train_df
и (2000, 1, 1) дляy_train_df
как показано в этом и в том, что сработало. Я в замешательстве по этому поводу. Было бы очень полезно, если бы вы могли объяснить, как изменить код в вопросе.