oxidize-pdf 2.16.3

Pure Rust PDF library for AI/RAG: structure-aware chunking with bounding boxes, heading context, and token estimates. No Python, no ML, no C bindings.
Documentation
1
2
3
4
{"id": "ens-0077", "metadata": {"country": "ES", "document_name": "BOE Real Decreto 311/2022 (Esquema Nacional de Seguridad)", "element_types": ["paragraph"], "heading_context": "3. Marco organizativo [ORG]", "is_oversized": false, "language": "es", "page_numbers": [31], "source_url": "https://www.boe.es/boe/dias/2022/05/04/pdfs/BOE-A-2022-7191.pdf", "token_estimate": 18}, "text": "El marco organizativo está constituido por un conjunto de medidas relacionadas con \nla organización global de la seguridad."}
{"id": "ens-0087", "metadata": {"country": "ES", "document_name": "BOE Real Decreto 311/2022 (Esquema Nacional de Seguridad)", "element_types": ["paragraph"], "heading_context": "4. Marco operacional [op]", "is_oversized": false, "language": "es", "page_numbers": [34], "source_url": "https://www.boe.es/boe/dias/2022/05/04/pdfs/BOE-A-2022-7191.pdf", "token_estimate": 24}, "text": "El marco operacional está constituido por las medidas a tomar para proteger la \noperación del sistema como conjunto integral de componentes para un fin."}
{"id": "ens-0069", "metadata": {"country": "ES", "document_name": "BOE Real Decreto 311/2022 (Esquema Nacional de Seguridad)", "element_types": ["title"], "heading_context": "1. Para la selección de las medidas de seguridad se seguirán los pasos siguientes:", "is_oversized": false, "language": "es", "page_numbers": [27], "source_url": "https://www.boe.es/boe/dias/2022/05/04/pdfs/BOE-A-2022-7191.pdf", "token_estimate": 14}, "text": "1. Para la selección de las medidas de seguridad se seguirán los pasos siguientes:"}
{"id": "ens-0130", "metadata": {"country": "ES", "document_name": "BOE Real Decreto 311/2022 (Esquema Nacional de Seguridad)", "element_types": ["paragraph"], "heading_context": "1. Los indicadores críticos de seguridad a emplear.", "is_oversized": false, "language": "es", "page_numbers": [47], "source_url": "https://www.boe.es/boe/dias/2022/05/04/pdfs/BOE-A-2022-7191.pdf", "token_estimate": 22}, "text": "2. La política de aplicación de parches de seguridad de los componentes software \nrelacionados en las listas de [op.exp.1.r4], [op.ext.3.r3] y [mp.sw.1.r5])."}