8 months ago · 35b7cbb676
--- a/train_alexnet.py
+++ b/train_alexnet.py
@@ -67,10 +67,18 @@ def train_model(args, train_data, val_data):
 
				 
			
 
				     # 调整学习率
			
 
				     learning_rate = args.lr if args.lr else 1e-2
			
 
				-    # optimizer = SGD(learning_rate=learning_rate, momentum=args.momentum)
			
 
				+
			
 
				+    # Select optimizer based on args.opt
			
 
				+    if args.opt == 'sgd':
			
 
				+        optimizer = SGD(learning_rate=learning_rate,
			
 
				+                                            momentum=args.momentum if args.momentum else 0.0)
			
 
				+    elif args.opt == 'adam':
			
 
				+        optimizer = Adam(learning_rate=learning_rate)
			
 
				+    else:
			
 
				+        optimizer = Adam(learning_rate=learning_rate)  # Default to Adam if unspecified
			
 
				 
			
 
				     # Compile model
			
 
				-    model.compile(optimizer=Adam(learning_rate=0.0001), loss='categorical_crossentropy', metrics=['accuracy'])
			
 
				+    model.compile(optimizer=optimizer, loss='categorical_crossentropy', metrics=['accuracy'])
			
 
				 
			
 
				     # Check if a checkpoint exists and determine the initial_epoch
			
 
				     latest_checkpoint = tf.train.latest_checkpoint(args.output_dir)
			
@@ -119,16 +127,6 @@ def get_args_parser(add_help=True):
 
				     parser.add_argument("--opt", default="sgd", type=str, help="optimizer")
			
 
				     parser.add_argument("--lr", default=0.1, type=float, help="initial learning rate")
			
 
				     parser.add_argument("--momentum", default=0.9, type=float, metavar="M", help="momentum")
			
 
				-    parser.add_argument("--lr-scheduler", default="steplr", type=str, help="the lr scheduler (default: steplr)")
			
 
				-    parser.add_argument("--lr-warmup-epochs", default=0, type=int, help="the number of epochs to warmup (default: 0)")
			
 
				-    parser.add_argument(
			
 
				-        "--lr-warmup-method", default="constant", type=str, help="the warmup method (default: constant)"
			
 
				-    )
			
 
				-    parser.add_argument("--lr-warmup-decay", default=0.01, type=float, help="the decay for lr")
			
 
				-    parser.add_argument("--lr-step-size", default=30, type=int, help="decrease lr every step-size epochs")
			
 
				-    parser.add_argument("--lr-gamma", default=0.1, type=float, help="decrease lr by a factor of lr-gamma")
			
 
				-    parser.add_argument("--lr-min", default=0.0, type=float, help="minimum lr of lr schedule (default: 0.0)")
			
 
				-    parser.add_argument("--start-epoch", default=0, type=int, metavar="N", help="start epoch")
			
 
				 
			
 
				     parser.add_argument(
			
 
				         "--input-size", default=224, type=int, help="the random crop size used for training (default: 224)"
			
--- a/train_vgg16.py
+++ b/train_vgg16.py
@@ -46,8 +46,17 @@ def train_model(args, train_generator, val_generator):
 
				     # 调整学习率
			
 
				     learning_rate = args.lr if args.lr else 1e-2
			
 
				 
			
 
				+    # Select optimizer based on args.opt
			
 
				+    if args.opt == 'sgd':
			
 
				+        optimizer = tf.keras.optimizers.SGD(learning_rate=learning_rate,
			
 
				+                                            momentum=args.momentum if args.momentum else 0.0)
			
 
				+    elif args.opt == 'adam':
			
 
				+        optimizer = tf.keras.optimizers.Adam(learning_rate=learning_rate)
			
 
				+    else:
			
 
				+        optimizer = tf.keras.optimizers.Adam(learning_rate=learning_rate)  # Default to Adam if unspecified
			
 
				+
			
 
				     # 编译模型
			
 
				-    model.compile(optimizer=tf.keras.optimizers.Adam(),
			
 
				+    model.compile(optimizer=optimizer,
			
 
				                   loss='categorical_crossentropy',
			
 
				                   metrics=['accuracy'])
			
 
				 
			
@@ -91,16 +100,6 @@ def get_args_parser(add_help=True):
 
				     parser.add_argument("--opt", default="sgd", type=str, help="optimizer")
			
 
				     parser.add_argument("--lr", default=0.1, type=float, help="initial learning rate")
			
 
				     parser.add_argument("--momentum", default=0.9, type=float, metavar="M", help="momentum")
			
 
				-    parser.add_argument("--lr-scheduler", default="steplr", type=str, help="the lr scheduler (default: steplr)")
			
 
				-    parser.add_argument("--lr-warmup-epochs", default=0, type=int, help="the number of epochs to warmup (default: 0)")
			
 
				-    parser.add_argument(
			
 
				-        "--lr-warmup-method", default="constant", type=str, help="the warmup method (default: constant)"
			
 
				-    )
			
 
				-    parser.add_argument("--lr-warmup-decay", default=0.01, type=float, help="the decay for lr")
			
 
				-    parser.add_argument("--lr-step-size", default=30, type=int, help="decrease lr every step-size epochs")
			
 
				-    parser.add_argument("--lr-gamma", default=0.1, type=float, help="decrease lr by a factor of lr-gamma")
			
 
				-    parser.add_argument("--lr-min", default=0.0, type=float, help="minimum lr of lr schedule (default: 0.0)")
			
 
				-    parser.add_argument("--start-epoch", default=0, type=int, metavar="N", help="start epoch")
			
 
				 
			
 
				     parser.add_argument(
			
 
				         "--input-size", default=224, type=int, help="the random crop size used for training (default: 224)"