преди 1 година · 6d2950d785
--- a/block/loss_get.py
+++ b/block/loss_get.py
@@ -2,6 +2,9 @@ import torch
 
																 def loss_get(args):
															
 
																-    choice_dict = {'bce': 'torch.nn.BCEWithLogitsLoss()'}
															
 
																+    choice_dict = {
															
 
																+        'bce': 'torch.nn.BCEWithLogitsLoss()',
															
 
																+        'cross':'torch.nn.CrossEntropyLoss()'
															
 
																+    }
															
 
																     loss = eval(choice_dict[args.loss])
															
 
																     return loss
															
--- a/block/train_get.py
+++ b/block/train_get.py
@@ -1,9 +1,13 @@
 
																+import os
															
 
																+
															
 
																 import cv2
															
 
																 import tqdm
															
 
																 import wandb
															
 
																 import torch
															
 
																 import numpy as np
															
 
																-import albumentations
															
 
																+# import albumentations
															
 
																+from PIL import Image
															
 
																+from torchvision import transforms
															
 
																 from block.val_get import val_get
															
 
																 from block.model_ema import model_ema
															
 
																 from block.lr_get import adam, lr_adjust
															
@@ -26,13 +30,26 @@ def train_get(args, data_dict, model_dict, loss):
 
																     if args.ema:
															
 
																         ema.updates = model_dict['ema_updates']
															
 
																     # 数据集
															
 
																-    train_dataset = torch_dataset(args, 'train', data_dict['train'], data_dict['class'])
															
 
																+    print("加载训练集至内存中...")
															
 
																+    train_transform = transforms.Compose([
															
 
																+        transforms.RandomHorizontalFlip(),  # 随机水平翻转
															
 
																+        transforms.RandomCrop(32, padding=4),  # 随机裁剪并填充
															
 
																+        transforms.ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2, hue=0.1),  # 颜色抖动
															
 
																+        transforms.ToTensor(),  # 将图像转换为PyTorch张量
															
 
																+        transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])  # 标准化
															
 
																+    ])
															
 
																+    train_dataset = CustomDataset(data_dir=args.train_dir, transform=train_transform)
															
 
																     train_sampler = torch.utils.data.distributed.DistributedSampler(train_dataset) if args.distributed else None
															
 
																     train_shuffle = False if args.distributed else True  # 分布式设置sampler后shuffle要为False
															
 
																     train_dataloader = torch.utils.data.DataLoader(train_dataset, batch_size=args.batch, shuffle=train_shuffle,
															
 
																                                                    drop_last=True, pin_memory=args.latch, num_workers=args.num_worker,
															
 
																                                                    sampler=train_sampler)
															
 
																-    val_dataset = torch_dataset(args, 'test', data_dict['test'], data_dict['class'])
															
 
																+    print("加载验证集至内存中...")
															
 
																+    val_transform = transforms.Compose([
															
 
																+        transforms.ToTensor(),  # 将图像转换为PyTorch张量
															
 
																+        transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])  # 标准化
															
 
																+    ])
															
 
																+    val_dataset = CustomDataset(data_dir=args.test_dir, transform=val_transform)
															
 
																     val_sampler = None  # 分布式时数据合在主GPU上进行验证
															
 
																     val_batch = args.batch // args.device_number  # 分布式验证时batch要减少为一个GPU的量
															
 
																     val_dataloader = torch.utils.data.DataLoader(val_dataset, batch_size=val_batch, shuffle=False,
															
@@ -106,8 +123,8 @@ def train_get(args, data_dict, model_dict, loss):
 
																         torch.cuda.empty_cache()
															
 
																         # 验证
															
 
																         if args.local_rank == 0:  # 分布式时只验证一次
															
 
																-            val_loss, accuracy, precision, recall, m_ap = val_get(args, val_dataloader, model, loss, ema,
															
 
																-                                                                  len(data_dict['test']))
															
 
																+            val_loss, accuracy = val_get(args, val_dataloader, model, loss, ema,
															
 
																+                                         len(data_dict['test']))
															
 
																         # 保存
															
 
																         if args.local_rank == 0:  # 分布式时只保存一次
															
 
																             model_dict['model'] = model.module if args.distributed else model
															
@@ -118,15 +135,12 @@ def train_get(args, data_dict, model_dict, loss):
 
																             model_dict['train_loss'] = train_loss
															
 
																             model_dict['val_loss'] = val_loss
															
 
																             model_dict['val_accuracy'] = accuracy
															
 
																-            model_dict['val_precision'] = precision
															
 
																-            model_dict['val_recall'] = recall
															
 
																-            model_dict['val_m_ap'] = m_ap
															
 
																             torch.save(model_dict, args.save_path_last if not args.prune else 'prune_last.pt')  # 保存最后一次训练的模型
															
 
																-            if m_ap > 0.5 and m_ap > model_dict['standard']:
															
 
																-                model_dict['standard'] = m_ap
															
 
																+            if accuracy > 0.5 and accuracy > model_dict['standard']:
															
 
																+                model_dict['standard'] = accuracy
															
 
																                 save_path = args.save_path if not args.prune else args.prune_save
															
 
																                 torch.save(model_dict, save_path)  # 保存最佳模型
															
 
																-                print(f'| 保存最佳模型:{save_path} | val_m_ap:{m_ap:.4f} |')
															
 
																+                print(f'| 保存最佳模型:{save_path} | accuracy:{accuracy:.4f} |')
															
 
																             # wandb
															
 
																             if args.wandb:
															
 
																                 wandb_log = {}
															
@@ -134,44 +148,80 @@ def train_get(args, data_dict, model_dict, loss):
 
																                     wandb_log.update({f'image/train_image': wandb_image_list})
															
 
																                 wandb_log.update({'metric/train_loss': train_loss,
															
 
																                                   'metric/val_loss': val_loss,
															
 
																-                                  'metric/val_m_ap': m_ap,
															
 
																-                                  'metric/val_accuracy': accuracy,
															
 
																-                                  'metric/val_precision': precision,
															
 
																-                                  'metric/val_recall': recall})
															
 
																+                                  'metric/val_accuracy': accuracy
															
 
																+                                  })
															
 
																                 args.wandb_run.log(wandb_log)
															
 
																         torch.distributed.barrier() if args.distributed else None  # 分布式时每轮训练后让所有GPU进行同步，快的GPU会在此等待
															
 
																-class torch_dataset(torch.utils.data.Dataset):
															
 
																-    def __init__(self, args, tag, data, class_name):
															
 
																-        self.tag = tag
															
 
																-        self.data = data
															
 
																-        self.class_name = class_name
															
 
																-        self.noise_probability = args.noise
															
 
																-        self.noise = albumentations.Compose([
															
 
																-            albumentations.GaussianBlur(blur_limit=(5, 5), p=0.2),
															
 
																-            albumentations.GaussNoise(var_limit=(10.0, 30.0), p=0.2)])
															
 
																-        self.transform = albumentations.Compose([
															
 
																-            albumentations.LongestMaxSize(args.input_size),
															
 
																-            albumentations.PadIfNeeded(min_height=args.input_size, min_width=args.input_size,
															
 
																-                                       border_mode=cv2.BORDER_CONSTANT, value=(128, 128, 128))])
															
 
																-        self.rgb_mean = (0.406, 0.456, 0.485)
															
 
																-        self.rgb_std = (0.225, 0.224, 0.229)
															
 
																+# class torch_dataset(torch.utils.data.Dataset):
															
 
																+#     def __init__(self, args, tag, data, class_name):
															
 
																+#         self.tag = tag
															
 
																+#         self.data = data
															
 
																+#         self.class_name = class_name
															
 
																+#         self.noise_probability = args.noise
															
 
																+#         self.noise = albumentations.Compose([
															
 
																+#             albumentations.GaussianBlur(blur_limit=(5, 5), p=0.2),
															
 
																+#             albumentations.GaussNoise(var_limit=(10.0, 30.0), p=0.2)])
															
 
																+#         self.transform = albumentations.Compose([
															
 
																+#             albumentations.LongestMaxSize(args.input_size),
															
 
																+#             albumentations.PadIfNeeded(min_height=args.input_size, min_width=args.input_size,
															
 
																+#                                        border_mode=cv2.BORDER_CONSTANT, value=(128, 128, 128))])
															
 
																+#         self.rgb_mean = (0.406, 0.456, 0.485)
															
 
																+#         self.rgb_std = (0.225, 0.224, 0.229)
															
 
																+#
															
 
																+#     def __len__(self):
															
 
																+#         return len(self.data)
															
 
																+#
															
 
																+#     def __getitem__(self, index):
															
 
																+#         # print(self.data[index][0])
															
 
																+#         image = cv2.imread(self.data[index][0])  # 读取图片
															
 
																+#         if self.tag == 'train' and torch.rand(1) < self.noise_probability:  # 使用数据加噪
															
 
																+#             image = self.noise(image=image)['image']
															
 
																+#         image = self.transform(image=image)['image']  # 缩放和填充图片
															
 
																+#         image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)  # 转为RGB通道
															
 
																+#         image = self._image_deal(image)  # 归一化、转换为tensor、调维度
															
 
																+#         label = torch.tensor(self.data[index][1], dtype=torch.float32)  # 转换为tensor
															
 
																+#         return image, label
															
 
																+#
															
 
																+#     def _image_deal(self, image):  # 归一化、转换为tensor、调维度
															
 
																+#         image = torch.tensor(image / 255, dtype=torch.float32).permute(2, 0, 1)
															
 
																+#         return image
															
 
																+
															
 
																+
															
 
																+class CustomDataset(torch.utils.data.Dataset):
															
 
																+    def __init__(self, data_dir, image_size=(32, 32), transform=None):
															
 
																+        self.data_dir = data_dir
															
 
																+        self.image_size = image_size
															
 
																+        self.transform = transform
															
 
																+
															
 
																+        self.images = []
															
 
																+        self.labels = []
															
 
																+
															
 
																+        # 遍历指定目录下的子目录，每个子目录代表一个类别
															
 
																+        class_dirs = sorted(os.listdir(data_dir))
															
 
																+        for index, class_dir in enumerate(class_dirs):
															
 
																+            class_path = os.path.join(data_dir, class_dir)
															
 
																+
															
 
																+            # 遍历当前类别目录下的图像文件
															
 
																+            for image_file in os.listdir(class_path):
															
 
																+                image_path = os.path.join(class_path, image_file)
															
 
																+
															
 
																+                # 使用PIL加载图像并调整大小
															
 
																+                image = Image.open(image_path).convert('RGB')
															
 
																+                image = image.resize(image_size)
															
 
																+
															
 
																+                self.images.append(np.array(image))
															
 
																+                self.labels.append(index)
															
 
																     def __len__(self):
															
 
																-        return len(self.data)
															
 
																-
															
 
																-    def __getitem__(self, index):
															
 
																-        # print(self.data[index][0])
															
 
																-        image = cv2.imread(self.data[index][0])  # 读取图片
															
 
																-        if self.tag == 'train' and torch.rand(1) < self.noise_probability:  # 使用数据加噪
															
 
																-            image = self.noise(image=image)['image']
															
 
																-        image = self.transform(image=image)['image']  # 缩放和填充图片
															
 
																-        image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)  # 转为RGB通道
															
 
																-        image = self._image_deal(image)  # 归一化、转换为tensor、调维度
															
 
																-        label = torch.tensor(self.data[index][1], dtype=torch.float32)  # 转换为tensor
															
 
																-        return image, label
															
 
																+        return len(self.images)
															
 
																-    def _image_deal(self, image):  # 归一化、转换为tensor、调维度
															
 
																-        image = torch.tensor(image / 255, dtype=torch.float32).permute(2, 0, 1)
															
 
																-        return image
															
 
																+    def __getitem__(self, idx):
															
 
																+        image = self.images[idx]
															
 
																+        label = self.labels[idx]
															
 
																+
															
 
																+        if self.transform:
															
 
																+            image = self.transform(Image.fromarray(image))
															
 
																+
															
 
																+        return image, label
															
--- a/block/val_get.py
+++ b/block/val_get.py
@@ -1,6 +1,5 @@
 
																 import tqdm
															
 
																 import torch
															
 
																-from block.metric_get import metric
															
 
																 def val_get(args, val_dataloader, model, loss, ema, data_len):
															
@@ -8,23 +7,26 @@ def val_get(args, val_dataloader, model, loss, ema, data_len):
 
																     tqdm_show = tqdm.tqdm(total=tqdm_len)
															
 
																     with torch.no_grad():
															
 
																         model = ema.ema if args.ema else model.eval()
															
 
																-        pred_all = []  # 记录所有预测
															
 
																-        true_all = []  # 记录所有标签
															
 
																+        correct = 0
															
 
																+        total = 0
															
 
																+        loss_all = 0
															
 
																+        epoch = 0
															
 
																         for index, (image_batch, true_batch) in enumerate(val_dataloader):
															
 
																             image_batch = image_batch.to(args.device, non_blocking=args.latch)
															
 
																             pred_batch = model(image_batch).detach().cpu()
															
 
																             loss_batch = loss(pred_batch, true_batch)
															
 
																-            pred_all.extend(pred_batch)
															
 
																-            true_all.extend(true_batch)
															
 
																+            # 获取指标项
															
 
																+            _, predicted = torch.max(pred_batch, 1)
															
 
																+            total += true_batch.size(0)
															
 
																+            correct += (predicted == true_batch).sum().item()
															
 
																+            loss_all += loss_batch.item()
															
 
																+            epoch = epoch + 1
															
 
																+            # 更新进度条数据
															
 
																             tqdm_show.set_postfix({'val_loss': loss_batch.item()})  # 添加显示
															
 
																             tqdm_show.update(1)  # 更新进度条
															
 
																         # tqdm
															
 
																         tqdm_show.close()
															
 
																         # 计算指标
															
 
																-        pred_all = torch.stack(pred_all, dim=0)
															
 
																-        true_all = torch.stack(true_all, dim=0)
															
 
																-        loss_all = loss(pred_all, true_all).item()
															
 
																-        accuracy, precision, recall, m_ap = metric(pred_all, true_all, args.class_threshold)
															
 
																-        print(f'\n| 验证 | val_loss:{loss_all:.4f} | 阈值:{args.class_threshold:.2f} | val_accuracy:{accuracy:.4f} |'
															
 
																-              f' val_precision:{precision:.4f} | val_recall:{recall:.4f} | val_m_ap:{m_ap:.4f} |')
															
 
																-    return loss_all, accuracy, precision, recall, m_ap
															
 
																+        accuracy = correct / total
															
 
																+        print(f'\n| 验证 | val_loss:{loss_all/epoch:.4f} | val_accuracy:{accuracy:.4f} |')
															
 
																+    return loss_all, accuracy
															
--- a/flask_request.py
+++ b/flask_request.py
@@ -1,23 +0,0 @@
 
																-# 启用flask_start的服务后，将数据以post的方式调用服务得到结果
															
 
																-import json
															
 
																-import base64
															
 
																-import requests
															
 
																-
															
 
																-
															
 
																-def image_encode(image_path):
															
 
																-    with open(image_path, 'rb')as f:
															
 
																-        image_byte = f.read()
															
 
																-    image_base64 = base64.b64encode(image_byte)
															
 
																-    image = image_base64.decode()
															
 
																-    return image
															
 
																-
															
 
																-
															
 
																-if __name__ == '__main__':
															
 
																-    url = 'http://0.0.0.0:9999/test/'  # 根据flask_start中的设置: http://host:port/name/
															
 
																-    image_path = 'demo.jpg'
															
 
																-    image = image_encode(image_path)
															
 
																-    request_dict = {'image': image}
															
 
																-    request = json.dumps(request_dict)
															
 
																-    response = requests.post(url, data=request)
															
 
																-    result = response.json()
															
 
																-    print(result)
															
--- a/flask_start.py
+++ b/flask_start.py
@@ -1,40 +0,0 @@
 
																-# pip install flask -i https://pypi.tuna.tsinghua.edu.cn/simple
															
 
																-# 用flask将程序包装成一个服务，并在服务器上启动
															
 
																-import cv2
															
 
																-import json
															
 
																-import flask
															
 
																-import base64
															
 
																-import argparse
															
 
																-import numpy as np
															
 
																-
															
 
																-# -------------------------------------------------------------------------------------------------------------------- #
															
 
																-# 设置
															
 
																-parser = argparse.ArgumentParser('|在服务器上启动flask服务|')
															
 
																-# ...
															
 
																-args, _ = parser.parse_known_args()  # 防止传入参数冲突，替代args = parser.parse_args()
															
 
																-app = flask.Flask(__name__)  # 创建一个服务框架
															
 
																-
															
 
																-
															
 
																-# -------------------------------------------------------------------------------------------------------------------- #
															
 
																-# 程序
															
 
																-def image_decode(image):
															
 
																-    image_base64 = image.encode()  # base64
															
 
																-    image_byte = base64.b64decode(image_base64)  # base64->字节类型
															
 
																-    array = np.frombuffer(image_byte, dtype=np.uint8)  # 字节类型->一行数组
															
 
																-    image = cv2.imdecode(array, cv2.IMREAD_COLOR)  # 一行数组->BGR图片
															
 
																-    return image
															
 
																-
															
 
																-
															
 
																-@app.route('/test/', methods=['POST'])  # 每当调用服务时会执行一次flask_app函数
															
 
																-def flask_app():
															
 
																-    request_json = flask.request.get_data()
															
 
																-    request_dict = json.loads(request_json)
															
 
																-    image = image_decode(request_dict['image'])
															
 
																-    # ...
															
 
																-    result = image.shape
															
 
																-    return result
															
 
																-
															
 
																-
															
 
																-if __name__ == '__main__':
															
 
																-    print('| 使用flask启动服务 |')
															
 
																-    app.run(host='0.0.0.0', port=9999, debug=False)  # 启动服务
															
--- a/model/__init__.py
+++ b/model/__init__.py
@@ -1,3 +1 @@
 
																-from .timm_model import timm_model
															
 
																-from .yolov7_cls import yolov7_cls
															
 
																-from .layer import cbs, elan, mp, sppcspc, linear_head
															
 
																+from .layer import cbs, elan, mp, sppcspc, linear_head
															
--- a/run.py
+++ b/run.py
@@ -32,15 +32,11 @@ parser.add_argument('--wandb_name', default='train', type=str, help='|wandb项
 
																 parser.add_argument('--wandb_image_num', default=16, type=int, help='|wandb保存图片的数量|')
															
 
																 # new_added
															
 
																-parser.add_argument('--data_path', default='/home/yhsun/classification-main/dataset', type=str, help='Root path to datasets')
															
 
																+parser.add_argument('--data_path', default='./dataset', type=str,
															
 
																+                    help='Root path to datasets')
															
 
																 parser.add_argument('--dataset_name', default='CIFAR-10', type=str, help='Specific dataset name')
															
 
																 parser.add_argument('--input_channels', default=3, type=int)
															
 
																 parser.add_argument('--output_num', default=10, type=int)
															
 
																-# parser.add_argument('--input_size', default=32, type=int)
															
 
																-#黑盒水印植入,这里需要调用它，用于处理部分数据的
															
 
																-parser.add_argument('--trigger_label', type=int, default=2, help='The NO. of trigger label (int, range from 0 to 10, default: 0)')
															
 
																-#这里可以直接选择水印控制,看看如何选择调用进来
															
 
																-parser.add_argument('--watermarking_portion', type=float, default=0.1, help='poisoning portion (float, range from 0 to 1, default: 0.1)')
															
 
																 # 待修改
															
 
																 parser.add_argument('--input_size', default=32, type=int, help='|输入图片大小|')
															
@@ -48,48 +44,43 @@ parser.add_argument('--input_size', default=32, type=int, help='|输入图片大
 
																 parser.add_argument('--output_class', default=10, type=int, help='|输出的类别数|')
															
 
																 parser.add_argument('--weight', default='last.pt', type=str, help='|已有模型的位置，没找到模型会创建剪枝/新模型|')
															
 
																-
															
 
																 # 剪枝的处理部分
															
 
																 parser.add_argument('--prune', default=False, type=bool, help='|模型剪枝后再训练(部分模型有)，需要提供prune_weight|')
															
 
																 parser.add_argument('--prune_weight', default='best.pt', type=str, help='|模型剪枝的参考模型，会创建剪枝模型和训练模型|')
															
 
																 parser.add_argument('--prune_ratio', default=0.5, type=float, help='|模型剪枝时的保留比例|')
															
 
																 parser.add_argument('--prune_save', default='prune_best.pt', type=str, help='|保存最佳模型，每轮还会保存prune_last.pt|')
															
 
																-
															
 
																-# 模型处理的部分了
															
 
																-parser.add_argument('--timm', default=False, type=bool, help='|是否使用timm库创建模型|')
															
 
																-parser.add_argument('--model', default='mobilenetv2', type=str, help='|自定义模型选择，timm为True时为timm库中模型|')
															
 
																-parser.add_argument('--model_type', default='s', type=str, help='|自定义模型型号|')
															
 
																-parser.add_argument('--save_path', default='./checkpoints/mobilenetv2/best.pt', type=str, help='|保存最佳模型，除此之外每轮还会保存last.pt|')
															
 
																-parser.add_argument('--save_path_last', default='./checkpoints/mobilenetv2/last.pt', type=str, help='|保存最佳模型，除此之外每轮还会保存last.pt|')
															
 
																+# 模型选择
															
 
																+parser.add_argument('--model', default='VGG19', type=str, help='|自定义模型选择|')
															
 
																 # 训练控制
															
 
																 parser.add_argument('--epoch', default=20, type=int, help='|训练总轮数(包含之前已训练轮数)|')
															
 
																-parser.add_argument('--batch', default=100, type=int, help='|训练批量大小，分布式时为总批量|')
															
 
																-parser.add_argument('--loss', default='bce', type=str, help='|损失函数|')
															
 
																+parser.add_argument('--batch', default=500, type=int, help='|训练批量大小，分布式时为总批量|')
															
 
																+parser.add_argument('--loss', default='cross', type=str, help='|损失函数|')
															
 
																 parser.add_argument('--warmup_ratio', default=0.01, type=float, help='|预热训练步数占总步数比例，最少5步，基准为0.01|')
															
 
																-parser.add_argument('--lr_start', default=0.001, type=float, help='|初始学习率，adam算法，批量小时要减小，基准为0.001|')
															
 
																+parser.add_argument('--lr_start', default=0.01, type=float, help='|初始学习率，adam算法，批量小时要减小，基准为0.001|')
															
 
																 parser.add_argument('--lr_end_ratio', default=0.01, type=float, help='|最终学习率=lr_end_ratio*lr_start，基准为0.01|')
															
 
																-parser.add_argument('--lr_end_epoch', default=100, type=int, help='|最终学习率达到的轮数，每一步都调整，余玄下降法|')
															
 
																+parser.add_argument('--lr_end_epoch', default=100, type=int, help='|最终学习率达到的轮数，每一步都调整，余弦下降法|')
															
 
																 parser.add_argument('--regularization', default='L2', type=str, help='|正则化，有L2、None|')
															
 
																 parser.add_argument('--r_value', default=0.0005, type=float, help='|正则化权重系数，基准为0.0005|')
															
 
																 parser.add_argument('--device', default='cuda', type=str, help='|训练设备|')
															
 
																 parser.add_argument('--latch', default=True, type=bool, help='|模型和数据是否为锁存，True为锁存|')
															
 
																 parser.add_argument('--num_worker', default=0, type=int, help='|CPU处理数据的进程数，0只有一个主进程，一般为0、2、4、8|')
															
 
																 parser.add_argument('--ema', default=True, type=bool, help='|使用平均指数移动(EMA)调整参数|')
															
 
																-parser.add_argument('--amp', default=True, type=bool, help='|混合float16精度训练，CPU时不可用，出现nan可能与GPU有关|')
															
 
																+parser.add_argument('--amp', default=False, type=bool, help='|混合float16精度训练，CPU时不可用，出现nan可能与GPU有关|')
															
 
																 parser.add_argument('--noise', default=0.5, type=float, help='|训练数据加噪概率|')
															
 
																 parser.add_argument('--class_threshold', default=0.5, type=float, help='|计算指标时，大于阈值判定为图片有该类别|')
															
 
																 parser.add_argument('--distributed', default=False, type=bool, help='|单机多卡分布式训练，分布式训练时batch为总batch|')
															
 
																 parser.add_argument('--local_rank', default=0, type=int, help='|分布式训练使用命令后会自动传入的参数|')
															
 
																 args = parser.parse_args()
															
 
																-args.device_number = max(torch.cuda.device_count(), 2)  # 使用的GPU数，可能为CPU
															
 
																+args.device_number = max(torch.cuda.device_count(), 1)  # 使用的GPU数，可能为CPU
															
 
																 # 创建模型对应的检查点目录
															
 
																-checkpoint_dir = os.path.join('/home/yhsun/classification-main/checkpoints', args.model)
															
 
																-if not os.path.exists(checkpoint_dir):
															
 
																-    os.makedirs(checkpoint_dir)
															
 
																-print(f"模型保存路径已创建: {args.model}")
															
 
																+checkpoint_dir = os.path.join('./checkpoints', args.model)
															
 
																+os.makedirs(checkpoint_dir, exist_ok=True)
															
 
																+print(f"模型保存路径已创建: {checkpoint_dir}")
															
 
																+args.save_path = os.path.join(checkpoint_dir, 'best.pt')  # 保存最佳训练模型
															
 
																+args.save_path_last = os.path.join(checkpoint_dir, 'last.pt')  # 保存最后训练模型
															
 
																 # 为CPU设置随机种子
															
 
																 torch.manual_seed(999)
															
@@ -117,21 +108,15 @@ if args.distributed:
 
																 if args.local_rank == 0:
															
 
																     print(f'| args:{args} |')
															
 
																     assert os.path.exists(f'{args.data_path}/{args.dataset_name}'), '! data_path中缺少:{args.dataset_name} !'
															
 
																-    assert os.path.exists(f'{args.data_path}/{args.dataset_name}/train.txt'), '! data_path中缺少:train.txt !'
															
 
																-    assert os.path.exists(f'{args.data_path}/{args.dataset_name}/test.txt'), '! data_path中缺少:test.txt !'
															
 
																-    assert os.path.exists(f'{args.data_path}/{args.dataset_name}/class.txt'), '! data_path中缺少:class.txt !'
															
 
																+    args.train_dir = f'{args.data_path}/{args.dataset_name}/train_cifar10_JPG'
															
 
																+    args.test_dir = f'{args.data_path}/{args.dataset_name}/test_cifar10_JPG'
															
 
																     if os.path.exists(args.weight):  # 优先加载已有模型args.weight继续训练
															
 
																         print(f'| 加载已有模型:{args.weight} |')
															
 
																     elif args.prune:
															
 
																         print(f'| 加载模型+剪枝训练:{args.prune_weight} |')
															
 
																-    elif args.timm:  # 创建timm库中模型args.timm
															
 
																-        import timm
															
 
																-
															
 
																-        assert timm.list_models(args.model), f'! timm中没有模型:{args.model}，使用timm.list_models()查看所有模型 !'
															
 
																-        print(f'| 创建timm库中模型:{args.model} |')
															
 
																     else:  # 创建自定义模型args.model
															
 
																         assert os.path.exists(f'model/{args.model}.py'), f'! 没有自定义模型:{args.model} !'
															
 
																-        print(f'| 创建自定义模型:{args.model} | 型号:{args.model_type} |')
															
 
																+        print(f'| 创建自定义模型:{args.model} |')
															
 
																 # -------------------------------------------------------------------------------------------------------------------- #
															
 
																 if __name__ == '__main__':
															
 
																     # 摘要