update tests

leeclemnet · leeclemnet · commit 2071af7b776f · 2026-04-06T14:58:07.000-02:30
diff --git a/inference_models/tests/integration_tests/models/conftest.py b/inference_models/tests/integration_tests/models/conftest.py
@@ -73,7 +73,9 @@
 COIN_COUNTING_YOLACT_ONNX_STATIC_BS_STATIC_CROP_STRETCH_URL = "https://storage.googleapis.com/roboflow-tests-assets/rf-platform-models/yolact-static-bs-static-crop-stretch-onnx.zip"
 COIN_COUNTING_YOLACT_ONNX_STATIC_BS_STRETCH_URL = "https://storage.googleapis.com/roboflow-tests-assets/rf-platform-models/yolact-static-bs-stretch-onnx.zip"
 
-COIN_COUNTING_YOLOLITE_N_ONNX_DYNAMIC_BS_LETTERBOX_URL = "https://storage.googleapis.com/roboflow-tests-assets/rf-platform-models/coin-counting-yololite-n-onnx-dynamic-bs-letterbox.zip"
+COIN_COUNTING_YOLOLITE_EDGE_N_ONNX_STATIC_BS_STRETCH_URL = "https://storage.googleapis.com/roboflow-tests-assets/rf-platform-models/coin-counting-yololite-edge-n-onnx-static-bs-stretch.zip"
+COIN_COUNTING_YOLOLITE_EDGE_N_ONNX_DYNAMIC_BS_STRETCH_URL = "https://storage.googleapis.com/roboflow-tests-assets/rf-platform-models/coin-counting-yololite-edge-n-onnx-dynamic-bs-stretch.zip"
+COIN_COUNTING_YOLOLITE_EDGE_N_ONNX_DYNAMIC_BS_STRETCH_FUSED_NMS_URL = "https://storage.googleapis.com/roboflow-tests-assets/rf-platform-models/coin-counting-yololite-edge-n-onnx-dynamic-bs-stretch-fused-nms.zip"
 
 ASL_YOLOV8N_SEG_ONNX_DYNAMIC_BS_STRETCH_URL = "https://storage.googleapis.com/roboflow-tests-assets/rf-platform-models/yolov8n-seg-onnx-dynamic-bs-stretch.zip"
 ASL_YOLOV8N_SEG_ONNX_DYNAMIC_BS_STRETCH_FUSED_NMS_URL = "https://storage.googleapis.com/roboflow-tests-assets/rf-platform-models/yolov8n-seg-onnx-dynamic-bs-stretch-fused-nms.zip"
@@ -700,10 +702,26 @@ def coin_counting_yolo_nas_onnx_static_bs_center_crop_package() -> str:
 
 
 @pytest.fixture(scope="module")
-def coin_counting_yololite_n_onnx_dynamic_bs_letterbox_package() -> str:
+def coin_counting_yololite_edge_n_onnx_static_bs_stretch_package() -> str:
     return download_model_package(
-        model_package_zip_url=COIN_COUNTING_YOLOLITE_N_ONNX_DYNAMIC_BS_LETTERBOX_URL,
-        package_name="coin-counting-yololite-n-onnx-dynamic-bs-letterbox",
+        model_package_zip_url=COIN_COUNTING_YOLOLITE_EDGE_N_ONNX_STATIC_BS_STRETCH_URL,
+        package_name="coin-counting-yololite-edge-n-onnx-static-bs-stretch",
+    )
+
+
+@pytest.fixture(scope="module")
+def coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_package() -> str:
+    return download_model_package(
+        model_package_zip_url=COIN_COUNTING_YOLOLITE_EDGE_N_ONNX_DYNAMIC_BS_STRETCH_URL,
+        package_name="coin-counting-yololite-edge-n-onnx-dynamic-bs-stretch",
+    )
+
+
+@pytest.fixture(scope="module")
+def coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_fused_nms_package() -> str:
+    return download_model_package(
+        model_package_zip_url=COIN_COUNTING_YOLOLITE_EDGE_N_ONNX_DYNAMIC_BS_STRETCH_FUSED_NMS_URL,
+        package_name="coin-counting-yololite-edge-n-onnx-dynamic-bs-stretch-fused-nms",
     )
 
 
diff --git a/inference_models/tests/integration_tests/models/test_yololite_object_detection_predictions_onnx.py b/inference_models/tests/integration_tests/models/test_yololite_object_detection_predictions_onnx.py
@@ -3,32 +3,58 @@
 import torch
 
 
+# ── Static non-fused (batch=1) ──────────────────────────────────────────────
+
+
 @pytest.mark.slow
 @pytest.mark.onnx_extras
-def test_onnx_package_with_dynamic_batch_size_and_letterbox_numpy(
-    coin_counting_yololite_n_onnx_dynamic_bs_letterbox_package: str,
+def test_static_non_fused_numpy(
+    coin_counting_yololite_edge_n_onnx_static_bs_stretch_package: str,
     coins_counting_image_numpy: np.ndarray,
 ) -> None:
-    # given
     from inference_models.models.yololite.yololite_object_detection_onnx import (
         YOLOLiteForObjectDetectionOnnx,
     )
 
     model = YOLOLiteForObjectDetectionOnnx.from_pretrained(
-        model_name_or_path=coin_counting_yololite_n_onnx_dynamic_bs_letterbox_package,
+        model_name_or_path=coin_counting_yololite_edge_n_onnx_static_bs_stretch_package,
         onnx_execution_providers=["CUDAExecutionProvider", "CPUExecutionProvider"],
     )
+    predictions = model(
+        coins_counting_image_numpy, confidence=0.25, iou_threshold=0.45
+    )
+
+    assert len(predictions) == 1
+    assert predictions[0].xyxy.shape[1] == 4
+    assert len(predictions[0].confidence) > 0
+    assert torch.all(predictions[0].confidence >= 0.25)
+    assert torch.all(predictions[0].confidence <= 1.0)
+
+
+# ── Dynamic non-fused ────────────────────────────────────────────────────────
+
+
+@pytest.mark.slow
+@pytest.mark.onnx_extras
+def test_dynamic_non_fused_numpy(
+    coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_package: str,
+    coins_counting_image_numpy: np.ndarray,
+) -> None:
+    from inference_models.models.yololite.yololite_object_detection_onnx import (
+        YOLOLiteForObjectDetectionOnnx,
+    )
 
-    # when
+    model = YOLOLiteForObjectDetectionOnnx.from_pretrained(
+        model_name_or_path=coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_package,
+        onnx_execution_providers=["CUDAExecutionProvider", "CPUExecutionProvider"],
+    )
     predictions = model(
         coins_counting_image_numpy,
         confidence=0.25,
         iou_threshold=0.45,
         max_detections=100,
     )
 
-    # then
-    assert isinstance(predictions, list)
     assert len(predictions) == 1
     assert predictions[0].xyxy.shape[1] == 4
     assert predictions[0].xyxy.dtype == torch.int32
@@ -41,38 +67,30 @@ def test_onnx_package_with_dynamic_batch_size_and_letterbox_numpy(
 
 @pytest.mark.slow
 @pytest.mark.onnx_extras
-def test_onnx_package_with_dynamic_batch_size_and_letterbox_batch_numpy(
-    coin_counting_yololite_n_onnx_dynamic_bs_letterbox_package: str,
+def test_dynamic_non_fused_batch_numpy(
+    coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_package: str,
     coins_counting_image_numpy: np.ndarray,
 ) -> None:
-    # given
     from inference_models.models.yololite.yololite_object_detection_onnx import (
         YOLOLiteForObjectDetectionOnnx,
     )
 
     model = YOLOLiteForObjectDetectionOnnx.from_pretrained(
-        model_name_or_path=coin_counting_yololite_n_onnx_dynamic_bs_letterbox_package,
+        model_name_or_path=coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_package,
         onnx_execution_providers=["CUDAExecutionProvider", "CPUExecutionProvider"],
     )
-
-    # when
     predictions = model(
         [coins_counting_image_numpy, coins_counting_image_numpy],
         confidence=0.25,
         iou_threshold=0.45,
         max_detections=100,
     )
 
-    # then
-    assert isinstance(predictions, list)
     assert len(predictions) == 2
     for pred in predictions:
         assert pred.xyxy.shape[1] == 4
-        assert pred.xyxy.dtype == torch.int32
         assert len(pred.confidence) > 0
         assert torch.all(pred.confidence >= 0.25)
-        assert torch.all(pred.confidence <= 1.0)
-    # Both images are identical, so detections should match
     assert predictions[0].xyxy.shape == predictions[1].xyxy.shape
     assert torch.allclose(
         predictions[0].confidence, predictions[1].confidence, atol=0.01
@@ -81,98 +99,145 @@ def test_onnx_package_with_dynamic_batch_size_and_letterbox_batch_numpy(
 
 @pytest.mark.slow
 @pytest.mark.onnx_extras
-def test_onnx_package_with_dynamic_batch_size_and_letterbox_torch(
-    coin_counting_yololite_n_onnx_dynamic_bs_letterbox_package: str,
+def test_dynamic_non_fused_torch(
+    coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_package: str,
     coins_counting_image_torch: torch.Tensor,
 ) -> None:
-    # given
     from inference_models.models.yololite.yololite_object_detection_onnx import (
         YOLOLiteForObjectDetectionOnnx,
     )
 
     model = YOLOLiteForObjectDetectionOnnx.from_pretrained(
-        model_name_or_path=coin_counting_yololite_n_onnx_dynamic_bs_letterbox_package,
+        model_name_or_path=coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_package,
         onnx_execution_providers=["CUDAExecutionProvider", "CPUExecutionProvider"],
     )
-
-    # when
     predictions = model(
-        coins_counting_image_torch,
-        confidence=0.25,
-        iou_threshold=0.45,
-        max_detections=100,
+        coins_counting_image_torch, confidence=0.25, iou_threshold=0.45
     )
 
-    # then
-    assert isinstance(predictions, list)
     assert len(predictions) == 1
     assert predictions[0].xyxy.shape[1] == 4
-    assert predictions[0].xyxy.dtype == torch.int32
     assert len(predictions[0].confidence) > 0
     assert torch.all(predictions[0].confidence >= 0.25)
 
 
 @pytest.mark.slow
 @pytest.mark.onnx_extras
-def test_onnx_high_confidence_threshold_returns_fewer_detections(
-    coin_counting_yololite_n_onnx_dynamic_bs_letterbox_package: str,
+def test_dynamic_non_fused_high_confidence_returns_fewer(
+    coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_package: str,
     coins_counting_image_numpy: np.ndarray,
 ) -> None:
-    # given
     from inference_models.models.yololite.yololite_object_detection_onnx import (
         YOLOLiteForObjectDetectionOnnx,
     )
 
     model = YOLOLiteForObjectDetectionOnnx.from_pretrained(
-        model_name_or_path=coin_counting_yololite_n_onnx_dynamic_bs_letterbox_package,
+        model_name_or_path=coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_package,
         onnx_execution_providers=["CUDAExecutionProvider", "CPUExecutionProvider"],
     )
+    low = model(coins_counting_image_numpy, confidence=0.1, iou_threshold=0.45)
+    high = model(coins_counting_image_numpy, confidence=0.8, iou_threshold=0.45)
+
+    assert len(low[0].confidence) >= len(high[0].confidence)
+
+
+@pytest.mark.slow
+@pytest.mark.onnx_extras
+def test_dynamic_non_fused_class_agnostic_nms(
+    coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_package: str,
+    coins_counting_image_numpy: np.ndarray,
+) -> None:
+    from inference_models.models.yololite.yololite_object_detection_onnx import (
+        YOLOLiteForObjectDetectionOnnx,
+    )
 
-    # when
-    low_conf_predictions = model(
-        coins_counting_image_numpy, confidence=0.1, iou_threshold=0.45
+    model = YOLOLiteForObjectDetectionOnnx.from_pretrained(
+        model_name_or_path=coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_package,
+        onnx_execution_providers=["CUDAExecutionProvider", "CPUExecutionProvider"],
     )
-    high_conf_predictions = model(
-        coins_counting_image_numpy, confidence=0.8, iou_threshold=0.45
+    standard = model(
+        coins_counting_image_numpy, confidence=0.25, iou_threshold=0.45,
+        class_agnostic_nms=False,
+    )
+    agnostic = model(
+        coins_counting_image_numpy, confidence=0.25, iou_threshold=0.45,
+        class_agnostic_nms=True,
     )
 
-    # then
-    assert len(low_conf_predictions[0].confidence) >= len(
-        high_conf_predictions[0].confidence
+    assert len(agnostic[0].confidence) <= len(standard[0].confidence)
+
+
+# ── NMS-fused ────────────────────────────────────────────────────────────────
+
+
+@pytest.mark.slow
+@pytest.mark.onnx_extras
+def test_fused_nms_numpy(
+    coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_fused_nms_package: str,
+    coins_counting_image_numpy: np.ndarray,
+) -> None:
+    from inference_models.models.yololite.yololite_object_detection_onnx import (
+        YOLOLiteForObjectDetectionOnnx,
+    )
+
+    model = YOLOLiteForObjectDetectionOnnx.from_pretrained(
+        model_name_or_path=coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_fused_nms_package,
+        onnx_execution_providers=["CUDAExecutionProvider", "CPUExecutionProvider"],
     )
+    predictions = model(coins_counting_image_numpy, confidence=0.25)
+
+    assert len(predictions) == 1
+    assert predictions[0].xyxy.shape[1] == 4
+    assert predictions[0].xyxy.dtype == torch.int32
+    assert len(predictions[0].confidence) > 0
+    assert torch.all(predictions[0].confidence >= 0.25)
+    assert torch.all(predictions[0].confidence <= 1.0)
 
 
 @pytest.mark.slow
 @pytest.mark.onnx_extras
-def test_onnx_class_agnostic_nms(
-    coin_counting_yololite_n_onnx_dynamic_bs_letterbox_package: str,
+def test_fused_nms_batch_numpy(
+    coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_fused_nms_package: str,
     coins_counting_image_numpy: np.ndarray,
 ) -> None:
-    # given
     from inference_models.models.yololite.yololite_object_detection_onnx import (
         YOLOLiteForObjectDetectionOnnx,
     )
 
     model = YOLOLiteForObjectDetectionOnnx.from_pretrained(
-        model_name_or_path=coin_counting_yololite_n_onnx_dynamic_bs_letterbox_package,
+        model_name_or_path=coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_fused_nms_package,
         onnx_execution_providers=["CUDAExecutionProvider", "CPUExecutionProvider"],
     )
+    predictions = model(
+        [coins_counting_image_numpy, coins_counting_image_numpy], confidence=0.25,
+    )
 
-    # when
-    standard_predictions = model(
-        coins_counting_image_numpy,
-        confidence=0.25,
-        iou_threshold=0.45,
-        class_agnostic_nms=False,
+    assert len(predictions) == 2
+    for pred in predictions:
+        assert pred.xyxy.shape[1] == 4
+        assert len(pred.confidence) > 0
+        assert torch.all(pred.confidence >= 0.25)
+    assert predictions[0].xyxy.shape == predictions[1].xyxy.shape
+    assert torch.allclose(
+        predictions[0].confidence, predictions[1].confidence, atol=0.01
     )
-    agnostic_predictions = model(
-        coins_counting_image_numpy,
-        confidence=0.25,
-        iou_threshold=0.45,
-        class_agnostic_nms=True,
+
+
+@pytest.mark.slow
+@pytest.mark.onnx_extras
+def test_fused_nms_high_confidence_returns_fewer(
+    coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_fused_nms_package: str,
+    coins_counting_image_numpy: np.ndarray,
+) -> None:
+    from inference_models.models.yololite.yololite_object_detection_onnx import (
+        YOLOLiteForObjectDetectionOnnx,
     )
 
-    # then - class-agnostic NMS should suppress more overlapping boxes
-    assert len(agnostic_predictions[0].confidence) <= len(
-        standard_predictions[0].confidence
+    model = YOLOLiteForObjectDetectionOnnx.from_pretrained(
+        model_name_or_path=coin_counting_yololite_edge_n_onnx_dynamic_bs_stretch_fused_nms_package,
+        onnx_execution_providers=["CUDAExecutionProvider", "CPUExecutionProvider"],
     )
+    low = model(coins_counting_image_numpy, confidence=0.1)
+    high = model(coins_counting_image_numpy, confidence=0.8)
+
+    assert len(low[0].confidence) >= len(high[0].confidence)