fix: allow users to set the area threshold for picture descriptions (#165)

Signed-off-by: Michele Dolfi <dol@zurich.ibm.com> Signed-off-by: Michele Dolfi <97102151+dolfim-ibm@users.noreply.github.com> Co-authored-by: Cesar Berrospi Ramis <75900930+ceberam@users.noreply.github.com>
2025-11-29 08:33:50 +00:00 · 2025-04-30 12:37:24 +02:00
parent 919cf5c041
commit 509f4889f8
3 changed files with 13 additions and 0 deletions
--- a/docling_serve/datamodel/convert.py
+++ b/docling_serve/datamodel/convert.py
@@ -9,6 +9,7 @@ from docling.datamodel.pipeline_options import (
    EasyOcrOptions,
    PdfBackend,
    PdfPipeline,
+    PictureDescriptionBaseOptions,
    TableFormerMode,
    TableStructureOptions,
 )
@@ -339,6 +340,14 @@ class ConvertDocumentsOptions(BaseModel):
        ),
    ] = False

+    picture_description_area_threshold: Annotated[
+        float,
+        Field(
+            description="Minimum percentage of the area for a picture to be processed with the models.",
+            examples=[PictureDescriptionBaseOptions().picture_area_threshold],
+        ),
+    ] = PictureDescriptionBaseOptions().picture_area_threshold
+
    picture_description_local: Annotated[
        Optional[PictureDescriptionLocal],
        Field(
--- a/docling_serve/docling_conversion.py
+++ b/docling_serve/docling_conversion.py
@@ -150,6 +150,9 @@ def _parse_standard_pdf_opts(
                request.picture_description_api.model_dump()
            )
        )
+    pipeline_options.picture_description_options.picture_area_threshold = (
+        request.picture_description_area_threshold
+    )

    return pipeline_options