3 maanden geleden · a3b33a3d1a
--- a/GFS-Client/save_result.py
+++ b/GFS-Client/save_result.py
@@ -121,19 +121,19 @@ def post_process_in_2d(instances_with_pixel_boxes, x_m_per_px, y_m_per_px, iou_t
 
				         metric_height = px_height * y_m_per_px
			
 
				         extent_2d = [metric_width, metric_height]
			
 
				         
			
 
				-        if is_box_dimension_plausible_2d(extent_2d, inst['label']):
			
 
				+        if is_box_dimension_plausible_2d(extent_2d, inst['category']):
			
 
				             plausible_instances.append(inst)
			
 
				         else:
			
 
				-             print(f"  - 过滤掉一个2D尺寸异常的 '{inst['label']}' 实例，尺寸: {[f'{x:.2f}' for x in extent_2d]}")
			
 
				+             print(f"  - 过滤掉一个2D尺寸异常的 '{inst['category']}' 实例，尺寸: {[f'{x:.2f}' for x in extent_2d]}")
			
 
				 
			
 
				     if not plausible_instances:
			
 
				         return []
			
 
				 
			
 
				     # 2. 按类别分组进行后处理
			
 
				     final_instances = []
			
 
				-    plausible_instances.sort(key=lambda x: x['label'])
			
 
				+    plausible_instances.sort(key=lambda x: x['category'])
			
 
				     
			
 
				-    for class_name, group in groupby(plausible_instances, key=lambda x: x['label']):
			
 
				+    for class_name, group in groupby(plausible_instances, key=lambda x: x['category']):
			
 
				         class_instances = list(group)
			
 
				         
			
 
				         # --- SPECIAL MERGING LOGIC FOR BEDS ---
			
@@ -173,18 +173,34 @@ def post_process_in_2d(instances_with_pixel_boxes, x_m_per_px, y_m_per_px, iou_t
 
				             for group_indices in groups:
			
 
				                 instances_in_group = [class_instances[i] for i in group_indices]
			
 
				                 
			
 
				-                # Create the merged bounding box
			
 
				-                min_x = min(inst['bbox_2d_pixels'][0] for inst in instances_in_group)
			
 
				-                min_y = min(inst['bbox_2d_pixels'][1] for inst in instances_in_group)
			
 
				-                max_x = max(inst['bbox_2d_pixels'][2] for inst in instances_in_group)
			
 
				-                max_y = max(inst['bbox_2d_pixels'][3] for inst in instances_in_group)
			
 
				+                # Create the merged 2D bounding box
			
 
				+                min_x_2d = min(inst['bbox_2d_pixels'][0] for inst in instances_in_group)
			
 
				+                min_y_2d = min(inst['bbox_2d_pixels'][1] for inst in instances_in_group)
			
 
				+                max_x_2d = max(inst['bbox_2d_pixels'][2] for inst in instances_in_group)
			
 
				+                max_y_2d = max(inst['bbox_2d_pixels'][3] for inst in instances_in_group)
			
 
				                 
			
 
				+                # --- Create the merged 3D bounding box ---
			
 
				+                all_3d_corners = np.vstack([inst['bbox'] for inst in instances_in_group])
			
 
				+                min_3d = np.min(all_3d_corners, axis=0)
			
 
				+                max_3d = np.max(all_3d_corners, axis=0)
			
 
				+                merged_3d_bbox = [
			
 
				+                    [min_3d[0], min_3d[1], min_3d[2]],
			
 
				+                    [max_3d[0], min_3d[1], min_3d[2]],
			
 
				+                    [min_3d[0], max_3d[1], min_3d[2]],
			
 
				+                    [max_3d[0], max_3d[1], min_3d[2]],
			
 
				+                    [min_3d[0], min_3d[1], max_3d[2]],
			
 
				+                    [max_3d[0], min_3d[1], max_3d[2]],
			
 
				+                    [min_3d[0], max_3d[1], max_3d[2]],
			
 
				+                    [max_3d[0], max_3d[1], max_3d[2]],
			
 
				+                ]
			
 
				+
			
 
				                 # Aggregate score and find a representative instance for metadata
			
 
				                 total_score = sum(inst['score'] for inst in instances_in_group)
			
 
				                 representative_instance = max(instances_in_group, key=lambda x: x['score'])
			
 
				                 
			
 
				                 new_instance = representative_instance.copy()
			
 
				-                new_instance['bbox_2d_pixels'] = [min_x, min_y, max_x, max_y]
			
 
				+                new_instance['bbox_2d_pixels'] = [min_x_2d, min_y_2d, max_x_2d, max_y_2d]
			
 
				+                new_instance['bbox'] = merged_3d_bbox # Assign the new merged 3D bbox
			
 
				                 new_instance['score'] = total_score
			
 
				                 merged_instances.append(new_instance)
			
 
				             
			
@@ -242,13 +258,16 @@ def build_floor_transform_matrix(j_info: dict, floor_id: int):
 
				     return np.linalg.inv(tab_array).tolist(), res_width, res_height
			
 
				 
			
 
				 
			
 
				-def process_and_draw_bboxes(picture_name, floor_path, instances_path, floor_id, output_image_path, output_json_path):
			
 
				+def process_and_draw_bboxes(picture_name, floor_path, raw_bbox_data, floor_id, output_image_path, output_json_path, output_3d_json_path):
			
 
				     try:
			
 
				         img = cv2.imread(picture_name)
			
 
				         if img is None: raise FileNotFoundError(f"无法加载背景图片: {picture_name}")
			
 
				         
			
 
				         with open(floor_path, 'r', encoding='utf-8') as f: j_info = json.load(f)
			
 
				-        with open(instances_path, 'r', encoding='utf-8') as f: raw_bbox_data = json.load(f)
			
 
				+
			
 
				+        if not raw_bbox_data:
			
 
				+            print("警告: 未提供任何原始3D包围盒数据。")
			
 
				+            return None, None
			
 
				 
			
 
				         matrix, res_w, res_h = build_floor_transform_matrix(j_info, floor_id)
			
 
				         if res_w is None: raise ValueError(f"未在 {floor_path} 中找到 ID 为 {floor_id} 的楼层信息。")
			
@@ -261,11 +280,11 @@ def process_and_draw_bboxes(picture_name, floor_path, instances_path, floor_id,
 
				 
			
 
				         instances_with_pixel_boxes = []
			
 
				         for item in raw_bbox_data:
			
 
				-            corners = item.get("corners", [])
			
 
				-            if len(corners) < 4: continue
			
 
				+            corners = item.get("bbox", [])
			
 
				+            if len(corners) < 8: continue
			
 
				             
			
 
				             points_2d = []
			
 
				-            for i in range(4):
			
 
				+            for i in range(8):
			
 
				                 norm_pt = M @ np.array([corners[i][0], corners[i][1], 1.0])
			
 
				                 points_2d.append([int(norm_pt[0] * res_w), int(norm_pt[1] * res_h)])
			
 
				             
			
@@ -279,10 +298,10 @@ def process_and_draw_bboxes(picture_name, floor_path, instances_path, floor_id,
 
				         print("2D后处理完成。")
			
 
				         
			
 
				         img_height, img_width, _ = img.shape
			
 
				-        shapes = []
			
 
				+        shapes_2d = []
			
 
				         for item in filtered_bbox_data:
			
 
				             min_x, min_y, max_x, max_y = item['bbox_2d_pixels']
			
 
				-            category = item["label"]
			
 
				+            category = item["category"]
			
 
				             color_rgb = item["color"]
			
 
				             color_bgr = (color_rgb[2], color_rgb[1], color_rgb[0])
			
 
				 
			
@@ -296,7 +315,7 @@ def process_and_draw_bboxes(picture_name, floor_path, instances_path, floor_id,
 
				             bbox_poly = [min_x, min_y, max_x, min_y, max_x, max_y, min_x, max_y]
			
 
				             class_info = CLASS_MAPPING.get(category, {'id': '-1', 'name': '未知'})
			
 
				 
			
 
				-            shapes.append({
			
 
				+            shapes_2d.append({
			
 
				                 "bbox": bbox_poly,
			
 
				                 "category": category,
			
 
				                 "color": color_rgb,
			
@@ -304,20 +323,41 @@ def process_and_draw_bboxes(picture_name, floor_path, instances_path, floor_id,
 
				                 "name": class_info['name']
			
 
				             })
			
 
				 
			
 
				-        output_json_data = {
			
 
				-            "shapes": shapes,
			
 
				+        # --- Save 2D Results ---
			
 
				+        output_2d_json_data = {
			
 
				+            "shapes": shapes_2d,
			
 
				             "imageHeight": img_height,
			
 
				             "imagePath": os.path.basename(picture_name),
			
 
				             "imageWidth": img_width,
			
 
				             "version": "4Dage_Furniture_Detection_0.0.1"
			
 
				         }
			
 
				-
			
 
				         os.makedirs(os.path.dirname(output_image_path), exist_ok=True)
			
 
				         os.makedirs(os.path.dirname(output_json_path), exist_ok=True)
			
 
				         cv2.imwrite(output_image_path, img)
			
 
				         with open(output_json_path, 'w', encoding='utf-8') as f:
			
 
				-            json.dump(output_json_data, f, ensure_ascii=False, indent=4)
			
 
				+            json.dump(output_2d_json_data, f, ensure_ascii=False, indent=4)
			
 
				         print(f"\n处理完成！2D结果已保存到: {output_image_path} 和 {output_json_path}")
			
 
				+        
			
 
				+        # --- Save Final 3D Results ---
			
 
				+        shapes_3d = []
			
 
				+        for item in filtered_bbox_data:
			
 
				+            shapes_3d.append({
			
 
				+                "bbox": item['bbox'],
			
 
				+                "category": item['category'],
			
 
				+                "color": item['color'],
			
 
				+                "label": item['label'],
			
 
				+                "name": item['name'],
			
 
				+            })
			
 
				+        
			
 
				+        output_3d_json_data = {
			
 
				+            "shapes": shapes_3d,
			
 
				+            "version": "4Dage_Furniture_Detection_0.0.1_3D_final"
			
 
				+        }
			
 
				+        os.makedirs(os.path.dirname(output_3d_json_path), exist_ok=True)
			
 
				+        with open(output_3d_json_path, 'w', encoding='utf-8') as f:
			
 
				+            json.dump(output_3d_json_data, f, ensure_ascii=False, indent=4)
			
 
				+        print(f"对应的3D结果已保存到: {output_3d_json_path}")
			
 
				+
			
 
				         return output_json_path, output_image_path
			
 
				 
			
 
				     except Exception as e:
			
@@ -331,7 +371,6 @@ def process_and_draw_bboxes(picture_name, floor_path, instances_path, floor_id,
 
				 def visualize_point_cloud_segmentation(coords_file, preds_file, classes_to_show='all',
			
 
				                                        classes_to_ignore=None,
			
 
				                                        save_pcd_path=None,
			
 
				-                                       save_3d_json_path=None,
			
 
				                                        if_save_ply=False,
			
 
				                                        if_save_vision=False):
			
 
				     CLASS_NAMES = [
			
@@ -387,20 +426,20 @@ def visualize_point_cloud_segmentation(coords_file, preds_file, classes_to_show=
 
				             try:
			
 
				                 aabb = instance_pcd.get_axis_aligned_bounding_box()
			
 
				                 points_np = np.asarray(instance_pcd.points)
			
 
				+                class_info = CLASS_MAPPING.get(class_name, {'id': '-1', 'name': '未知'})
			
 
				                 final_instances_data.append({
			
 
				-                    "label": class_name, "color": COLOR_MAP[pred_idx].tolist(),
			
 
				-                    "corners": np.asarray(aabb.get_box_points()).tolist(), "score": len(points_np)
			
 
				+                    "category": class_name,
			
 
				+                    "label": class_info['id'],
			
 
				+                    "name": class_info['name'],
			
 
				+                    "color": COLOR_MAP[pred_idx].tolist(),
			
 
				+                    "bbox": np.asarray(aabb.get_box_points()).tolist(),
			
 
				+                    "score": len(points_np)
			
 
				                 })
			
 
				                 all_instance_points.append(points_np)
			
 
				                 all_instance_colors.append(np.tile(COLOR_MAP[pred_idx] / 255.0, (len(points_np), 1)))
			
 
				             except RuntimeError: continue
			
 
				 
			
 
				     print("\n所有原始实例处理完毕。")
			
 
				-    if save_3d_json_path:
			
 
				-        os.makedirs(os.path.dirname(save_3d_json_path), exist_ok=True)
			
 
				-        with open(save_3d_json_path, 'w', encoding='utf-8') as f:
			
 
				-            json.dump(final_instances_data, f, ensure_ascii=False, indent=4)
			
 
				-        print(f"原始3D实例JSON信息已保存至: {save_3d_json_path}")
			
 
				 
			
 
				     if if_save_ply and save_pcd_path and all_instance_points:
			
 
				         instance_pcd = o3d.geometry.PointCloud()
			
@@ -414,7 +453,7 @@ def visualize_point_cloud_segmentation(coords_file, preds_file, classes_to_show=
 
				                                       colors=o3d.utility.Vector3dVector(COLOR_MAP[predictions] / 255.0))
			
 
				         o3d.visualization.draw_geometries([pcd], window_name="原始点云", width=1280, height=720)
			
 
				 
			
 
				-    return save_3d_json_path
			
 
				+    return final_instances_data
			
 
				 
			
 
				 
			
 
				 if __name__ == "__main__":
			
@@ -440,23 +479,28 @@ if __name__ == "__main__":
 
				 
			
 
				     output_dir = os.path.join(scene_folder, 'result_2d_filtered')
			
 
				     os.makedirs(output_dir, exist_ok=True)
			
 
				-    raw_instances3d_json_path = os.path.join(output_dir, 'instances3d_raw.json')
			
 
				+    
			
 
				     final_instances2d_json_path = os.path.join(output_dir, 'instances2d_final.json')
			
 
				+    final_instances3d_json_path = os.path.join(output_dir, 'instances3d_final.json')
			
 
				     instances_ply_path = os.path.join(output_dir, 'instances_raw.ply')
			
 
				     segment_onfloor_png_path = os.path.join(output_dir, 'segment_onfloor_final.png')
			
 
				 
			
 
				-    saved_3d_json = visualize_point_cloud_segmentation(
			
 
				+    raw_3d_instances = visualize_point_cloud_segmentation(
			
 
				         coords_file=coords_file, preds_file=preds_file,
			
 
				         classes_to_ignore=['curtain', 'bookshelf', 'floor', 'wall', 'sink', 'toilet', 'bathtub', 'shower curtain', 'picture'],
			
 
				-        save_3d_json_path=raw_instances3d_json_path, save_pcd_path=instances_ply_path, if_save_ply=False
			
 
				+        save_pcd_path=instances_ply_path, if_save_ply=False
			
 
				     )
			
 
				 
			
 
				-    if saved_3d_json and all(os.path.exists(f) for f in [floor_plan_image, scene_info_json]):
			
 
				+    if raw_3d_instances and all(os.path.exists(f) for f in [floor_plan_image, scene_info_json]):
			
 
				         print("\n--- 开始进行2D投影和后处理 ---")
			
 
				         process_and_draw_bboxes(
			
 
				-            picture_name=floor_plan_image, floor_path=scene_info_json,
			
 
				-            instances_path=saved_3d_json, floor_id=0,
			
 
				-            output_image_path=segment_onfloor_png_path, output_json_path=final_instances2d_json_path
			
 
				+            picture_name=floor_plan_image, 
			
 
				+            floor_path=scene_info_json,
			
 
				+            raw_bbox_data=raw_3d_instances, 
			
 
				+            floor_id=0,
			
 
				+            output_image_path=segment_onfloor_png_path, 
			
 
				+            output_json_path=final_instances2d_json_path,
			
 
				+            output_3d_json_path=final_instances3d_json_path
			
 
				         )
			
 
				     else:
			
 
				-        print("\nSkipping 2D projection due to missing files.")
			
 
				+        print("\nSkipping 2D projection due to missing files or no raw instances detected.")