fix xseg training

2025-08-20 13:33:24 -07:00 · 2020-12-11 15:47:11 +04:00 · 2020-12-11 15:47:11 +04:00 · 254a7cf5cf
commit 254a7cf5cf
parent 35945b257c
2 changed files with 62 additions and 62 deletions
--- a/facelib/XSegNet.py
+++ b/facelib/XSegNet.py
@ -30,6 +30,9 @@ class XSegNet(object):
        nn.initialize(data_format=data_format)
        tf = nn.tf
        model_name = f'{name}_{resolution}'
        self.model_filename_list = []
        with tf.device ('/CPU:0'):
            #Place holders on CPU
            self.input_t  = tf.placeholder (nn.floatx, nn.get4Dshape(resolution,resolution,3) )
@ -39,18 +42,17 @@ class XSegNet(object):
        with tf.device ('/CPU:0' if place_model_on_cpu else '/GPU:0'):
            self.model = nn.XSeg(3, 32, 1, name=name)
            self.model_weights = self.model.get_weights()
        model_name = f'{name}_{resolution}'
        self.model_filename_list = [ [self.model, f'{model_name}.npy'] ]
            if training:
                if optimizer is None:
                    raise ValueError("Optimizer should be provided for training mode.")                
                self.opt = optimizer              
                self.opt.initialize_variables (self.model_weights, vars_on_cpu=place_model_on_cpu)                    
                self.model_filename_list += [ [self.opt, f'{model_name}_opt.npy' ] ]
-        else:
+                
        self.model_filename_list += [ [self.model, f'{model_name}.npy'] ]
        if not training:
            with tf.device ('/CPU:0' if run_on_cpu else '/GPU:0'):
                _, pred = self.model(self.input_t)
--- a/models/Model_XSeg/Model.py
+++ b/models/Model_XSeg/Model.py
@ -81,8 +81,9 @@ class XSegModel(ModelBase):
            gpu_loss_gvs = []
            for gpu_id in range(gpu_count):
                with tf.device( f'/GPU:{gpu_id}' if len(devices) != 0 else f'/CPU:0' ):
                with tf.device( f'/GPU:{gpu_id}' if len(devices) != 0 else f'/CPU:0' ):
                    with tf.device(f'/CPU:0'):
                        # slice on CPU, otherwise all batch data will be transfered to GPU first
                        batch_slice = slice( gpu_id*bs_per_gpu, (gpu_id+1)*bs_per_gpu )
@ -100,10 +101,10 @@ class XSegModel(ModelBase):
            # Average losses and gradients, and create optimizer update ops
-            with tf.device (models_opt_device):
+            with tf.device(f'/CPU:0'):
-                pred = nn.concat(gpu_pred_list, 0)                
+            #with tf.device (models_opt_device):
-                loss = tf.reduce_mean(gpu_losses)
+                pred = tf.concat(gpu_pred_list, 0)
-                
+                loss = tf.concat(gpu_losses, 0)
                loss_gv_op = self.model.opt.get_update_op (nn.average_gv_list (gpu_loss_gvs))
@ -157,12 +158,9 @@ class XSegModel(ModelBase):
    #override
    def onTrainOneIter(self):
        image_np, mask_np = self.generate_next_samples()[0]
        loss = self.train (image_np, mask_np)
-
+        return ( ('loss', np.mean(loss) ), )
        return ( ('loss', loss ), )
    #override
    def onGetPreview(self, samples):