7 月之前 · 482fda832e
--- a/train_alexnet.py
+++ b/train_alexnet.py
@@ -9,13 +9,6 @@ from tensorflow.keras.preprocessing import image_dataset_from_directory
 
				 
			
 
				 
			
 
				 def load_data(train_dir, val_dir, img_size=(224, 224), batch_size=32):
			
 
				-    # Define data augmentation for the training set
			
 
				-    # train_datagen = tf.keras.Sequential([
			
 
				-    #     tf.keras.layers.RandomFlip('horizontal'),
			
 
				-    #     tf.keras.layers.RandomRotation(0.2),
			
 
				-    #     tf.keras.layers.RandomZoom(0.2),
			
 
				-    #     tf.keras.layers.RandomContrast(0.2),
			
 
				-    # ])
			
 
				     def augment(image):
			
 
				         # Random horizontal flip
			
 
				         image = tf.image.random_flip_left_right(image)
			
@@ -28,29 +21,33 @@ def load_data(train_dir, val_dir, img_size=(224, 224), batch_size=32):
 
				     # Load training dataset
			
 
				     train_dataset = image_dataset_from_directory(
			
 
				         train_dir,
			
 
				-        image_size=img_size,  # Resize images to (224, 224)
			
 
				+        image_size=img_size,
			
 
				         batch_size=batch_size,
			
 
				-        label_mode='categorical',  # Return integer labels
			
 
				+        label_mode='categorical',
			
 
				         shuffle=True
			
 
				     )
			
 
				 
			
 
				     # Load validation dataset
			
 
				     val_dataset = image_dataset_from_directory(
			
 
				         val_dir,
			
 
				-        image_size=img_size,  # Resize images to (224, 224)
			
 
				+        image_size=img_size,
			
 
				         batch_size=batch_size,
			
 
				-        label_mode='categorical',  # Return integer labels
			
 
				+        label_mode='categorical',
			
 
				         shuffle=False
			
 
				     )
			
 
				 
			
 
				-    # Normalize the datasets (rescale pixel values to [0, 1])
			
 
				+    # Define mean and std for standardization (ImageNet values)
			
 
				+    mean = tf.constant([0.485, 0.456, 0.406])
			
 
				+    std = tf.constant([0.229, 0.224, 0.225])
			
 
				+
			
 
				+    # Normalize and standardize the datasets
			
 
				     train_dataset = train_dataset.map(
			
 
				-        lambda x, y: (augment(x) / 255.0, y),
			
 
				+        lambda x, y: ((augment(x) / 255.0 - mean) / std, y),
			
 
				         num_parallel_calls=tf.data.AUTOTUNE
			
 
				     )
			
 
				 
			
 
				     val_dataset = val_dataset.map(
			
 
				-        lambda x, y: (x / 255.0, y),
			
 
				+        lambda x, y: ((x / 255.0 - mean) / std, y),
			
 
				         num_parallel_calls=tf.data.AUTOTUNE
			
 
				     )
			
 
				 
			
@@ -105,7 +102,7 @@ def train_model(args, train_data, val_data):
 
				 
			
 
				     # Define ModelCheckpoint callback to save weights for each epoch
			
 
				     checkpoint_callback = ModelCheckpoint(
			
 
				-        filepath=os.path.join(args.output_dir, 'alexnet_loss_{val_loss:.4f}_{epoch:03d}.h5'),
			
 
				+        filepath=os.path.join(args.output_dir, 'alexnet_{epoch:03d}.h5'),
			
 
				         save_weights_only=False,
			
 
				         save_freq='epoch',  # Save after every epoch
			
 
				         monitor='val_loss',  # Monitor the validation loss