Ошибка типа: аргумент float() должен быть строкой или числом, а не 'BatchDataset' при увеличении данных с помощью fit_generator()

Question 1

У меня возникли проблемы с применением увеличения данных при обучении модели. В частности, об использовании метода fit_generator ().

Первоначально я успешно запустил свою модель без увеличения, используя метод fit (), однако, по мнению других, рекомендуется использовать fit_generator(). Похоже, что оба метода требуют одинакового ввода, когда дело доходит до изображений и меток, но при запуске кода ниже я получаю следующую ОШИБКУ:

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
/tmp/ipykernel_35/139227558.py in <module>
    105 
    106 # train the network
--> 107 model.fit_generator(aug.flow(train_ds,  batch_size=batch_size),
    108         validation_data=val_ds, steps_per_epoch=len(train_ds[0]) // batch_size,
    109     epochs=epochs)

/opt/conda/lib/python3.7/site-packages/keras/preprocessing/image.py in flow(self, x, y, batch_size, shuffle, sample_weight, seed, save_to_dir, save_prefix, save_format, subset)
    894         save_prefix=save_prefix,
    895         save_format=save_format,
--> 896         subset=subset)
    897 
    898   def flow_from_directory(self,

/opt/conda/lib/python3.7/site-packages/keras/preprocessing/image.py in __init__(self, x, y, image_data_generator, batch_size, shuffle, sample_weight, seed, data_format, save_to_dir, save_prefix, save_format, subset, dtype)
    472         save_format=save_format,
    473         subset=subset,
--> 474         **kwargs)
    475 
    476 

/opt/conda/lib/python3.7/site-packages/keras_preprocessing/image/numpy_array_iterator.py in __init__(self, x, y, image_data_generator, batch_size, shuffle, sample_weight, seed, data_format, save_to_dir, save_prefix, save_format, subset, dtype)
    119                     y = y[split_idx:]
    120 
--> 121         self.x = np.asarray(x, dtype=self.dtype)
    122         self.x_misc = x_misc
    123         if self.x.ndim != 4:

/opt/conda/lib/python3.7/site-packages/numpy/core/_asarray.py in asarray(a, dtype, order)
     81 
     82     """
---> 83     return array(a, dtype, copy=False, order=order)
     84 
     85 

TypeError: float() argument must be a string or a number, not 'BatchDataset'

Я завершил google, пытаясь исправить ошибку TypeError: аргумент float() должен быть строкой или числом, а не ошибкой "BatchDataset", но безрезультатно. У кого-нибудь есть предложения, как двигаться дальше?

import pathlib
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.models import Sequential
import matplotlib.pyplot as plt

# Set data directory
data_dir = pathlib.Path("../input/validatedweaponsv6/images/")

# Set image size
img_height = 120
img_width = 120

# Hyperparameters
batch_size = 128
epochs = 50
learning_rate = 0.001

# Create the training dataset
train_ds = tf.keras.utils.image_dataset_from_directory(
    data_dir,
    label_mode='categorical',
    validation_split=0.2,
    subset="training",
    shuffle=True,
    seed=123,
    image_size=(img_height, img_width),
    batch_size=batch_size)

# Create the validation dataset
val_ds = tf.keras.utils.image_dataset_from_directory(
    data_dir,
    label_mode='categorical',
    validation_split=0.2,
    subset="validation",
    shuffle=True,
    seed=123,
    image_size=(img_height, img_width),
    batch_size=batch_size)

# Create sequential model
model = Sequential([

    # Preprocessing
    layers.Rescaling(1./127.5, offset=-1,
                     input_shape=(img_height, img_width, 3)),

    # Encoder
    layers.Conv2D(8, 3, activation='relu'),
    layers.MaxPooling2D(),
    layers.Conv2D(16, 3, activation='relu'),
    layers.MaxPooling2D(),
    layers.Conv2D(32, 3, activation='relu'),
    # layers.Conv2D(2, 3, activation='relu'), ???
    layers.Flatten(),

    # Decoder
    layers.Dense(64, activation='relu'),
    layers.Dropout(0.5),
    layers.Dense(2, activation='softmax')
])

# Print the model to see the different output shapes
print(model.summary())

# Compile model
model.compile(loss='categorical_crossentropy',
              optimizer=keras.optimizers.SGD(learning_rate=learning_rate), metrics=['accuracy'])

# construct the training image generator for data augmentation
aug = tf.keras.preprocessing.image.ImageDataGenerator(rotation_range=20, zoom_range=0.15,
    width_shift_range=0.2, height_shift_range=0.2, shear_range=0.15,
    horizontal_flip=True, fill_mode="nearest")

# train the network
model.fit_generator(aug.flow(train_ds,  batch_size=batch_size),
validation_data=val_ds, steps_per_epoch=len(train_ds[0]) // batch_size,
epochs=epochs)

# Print scores
score = model.evaluate(train_ds, verbose=0)
print('Validation loss:', score[0])
print('Validation accuracy:', score[1])

# Show loss and accuracy models
show_history(history)

Спасибо, что посмотрели мой пост! :)

Question 2

Во-первых, статье, на которую вы ссылались, 3 года и она немного устарела. Начиная с tensorflow 2.1.0, метод .fit также принимает генераторы, и в настоящее время он полностью заменил .fit_generator. Я предлагаю вам обновить свой тензорный поток, если это возможно.

Во-вторых, ошибка, по-видимому, не в методе fit_generator, а в том, как вы определяете наборы данных. Они просто сначала вызвали fit_generator, и именно поэтому сообщение об ошибке отследит вас там.

Что касается самой ошибки, я не понимаю, в чем заключается вложенность генераторов, и я думаю, что это может вызвать проблемы здесь. Вы пытаетесь передать пакетированный набор данных, полученный из каталога tf.keras.utils.image_dataset_from_directory, другому генератору, что кажется невозможным.

Если я правильно понял, у вас есть только одна метка на каждом изображении, и изображения каждого класса хранятся в отдельных папках, поэтому я предлагаю вам использовать метод flow_from_directory tf.keras.preprocessing.image.Непосредственно обработчик изображений. Этот генератор будет как считывать, так и дополнять изображения, поэтому вы можете удалить часть каталога tf.keras.utils.image_dataset_from_directory.

Чтобы использовать этот генератор, вам необходимо иметь изображения в виде:

корневой каталог
- папка class1
- папка class2
- и т.д.

и ваш код будет примерно таким:

gen = tf.keras.preprocessing.image.ImageDataGenerator( #desired augmentation, ...) 
train_generator = gen.flow_from_directory(directory = root_directory,
target_size=(256, 256), classes= *list of class names*,
class_mode='categorical', batch_size=32, shuffle=True, ...)
model.fit(train_generator, ...)

Вы также можете передать аргумент "validation_split", чтобы получить отдельные наборы данных для обучения и проверки. Подробнее о методе ImageDataGenerator и flow_from_directory читайте в официальной документации.

Mayis · Answer 1 · 2021-11-19T18:51:15

Во-первых, статье, на которую вы ссылались, 3 года и она немного устарела. Начиная с tensorflow 2.1.0, метод .fit также принимает генераторы, и в настоящее время он полностью заменил .fit_generator. Я предлагаю вам обновить свой тензорный поток, если это возможно.

Во-вторых, ошибка, по-видимому, не в методе fit_generator, а в том, как вы определяете наборы данных. Они просто сначала вызвали fit_generator, и именно поэтому сообщение об ошибке отследит вас там.

Что касается самой ошибки, я не понимаю, в чем заключается вложенность генераторов, и я думаю, что это может вызвать проблемы здесь. Вы пытаетесь передать пакетированный набор данных, полученный из каталога tf.keras.utils.image_dataset_from_directory, другому генератору, что кажется невозможным.

Если я правильно понял, у вас есть только одна метка на каждом изображении, и изображения каждого класса хранятся в отдельных папках, поэтому я предлагаю вам использовать метод flow_from_directory tf.keras.preprocessing.image.Непосредственно обработчик изображений. Этот генератор будет как считывать, так и дополнять изображения, поэтому вы можете удалить часть каталога tf.keras.utils.image_dataset_from_directory.

Чтобы использовать этот генератор, вам необходимо иметь изображения в виде:

корневой каталог
- папка class1
- папка class2
- и т.д.

и ваш код будет примерно таким:

gen = tf.keras.preprocessing.image.ImageDataGenerator( #desired augmentation, ...) 
train_generator = gen.flow_from_directory(directory = root_directory,
target_size=(256, 256), classes= *list of class names*,
class_mode='categorical', batch_size=32, shuffle=True, ...)
model.fit(train_generator, ...)

Вы также можете передать аргумент "validation_split", чтобы получить отдельные наборы данных для обучения и проверки. Подробнее о методе ImageDataGenerator и flow_from_directory читайте в официальной документации.

Ошибка типа: аргумент float() должен быть строкой или числом, а не 'BatchDataset' при увеличении данных с помощью fit_generator()

Вопрос

Лучший ответ

На других языках

Эта страница на других языках

Популярное в этой категории

Популярные вопросы в этой категории