AEPD
Pricing
from $1.00 / 1,000 results
AEPD
Este actor automatiza la búsqueda en el buscador de la AEPD y la extracción del texto de sus documentos.
Pricing
from $1.00 / 1,000 results
Rating
0.0
(0)
Developer
Miguel González
Maintained by CommunityActor stats
0
Bookmarked
2
Total users
1
Monthly active users
7 hours ago
Last modified
Categories
Share
AEPD — Buscador de resoluciones e informes
Actor de Apify que automatiza la búsqueda en el buscador de la Agencia Española de Protección de Datos (aepd.es/buscador). Permite buscar resoluciones, informes, guías, notas de prensa y otros documentos por texto libre y filtrarlos por tipo de documento, concepto jurídico, sector y rango de años.
Para cada documento encontrado extrae sus metadatos (título, tipo, fecha, URL) y el resumen indexado por Solr. Además puede extraer el texto íntegro de páginas HTML o usar el resumen de Solr para los PDFs de resoluciones.
Características
- Búsqueda por múltiples términos en una sola ejecución (hasta 50).
- Filtros: tipo de documento (resolución, informe, guía…), concepto jurídico, sector y rango de años.
- Metadatos completos: título, tipo inferido, fecha ISO, URL y resumen (extracto de Solr).
- Extracción bajo demanda del texto íntegro de páginas HTML (
documentUrls). - Modo "párrafos": devuelve solo los N pasajes más relevantes (útil con LLMs).
Entrada (Input)
Debes indicar al menos uno de estos campos: searchTerms, documentUrls o un filtro de faceta (documentTypes, conceptos, sectorial, fechaDesde/fechaHasta).
| Campo | Tipo | Descripción |
|---|---|---|
searchTerms | string[] | Términos a buscar en texto libre (máx. 50). Cada término se ejecuta por separado. Si se deja vacío con filtros activos, devuelve todos los documentos que los cumplan. |
documentUrls | string[] | URLs de páginas de la AEPD de las que extraer el texto íntegro (máx. 50). Las resoluciones son PDFs; para esas se usa el resumen de Solr. |
documentTypes | string[] | Tipo de documento. Se acepta el nombre normalizado (resolucion, informe…) o el código numérico de la faceta (1387, 1361…). |
conceptos | string[] | IDs numéricos del concepto jurídico (p. ej. 1568 = Videovigilancia, 1513 = Privacidad). |
sectorial | string[] | IDs numéricos del sector (p. ej. 2404 = Financiero, 2398 = Información y comunicaciones). |
fechaDesde | string | Año mínimo de publicación (formato YYYY). |
fechaHasta | string | Año máximo de publicación (formato YYYY). |
extractText | boolean | Si true, descarga el texto íntegro de cada resultado. Por defecto false. |
paragraphs | integer | Si > 0, devuelve solo los N pasajes más relevantes en lugar del texto íntegro. |
paragraphTerms | string | Términos con los que localizar los pasajes (por defecto, el término de búsqueda). |
maxResults | integer | Máximo de documentos por término. Por defecto 20. |
Ejemplos de input
Buscar resoluciones sobre videovigilancia:
{"searchTerms": ["videovigilancia"],"documentTypes": ["1387"],"maxResults": 20}
Resoluciones de 2023–2024 con extracción de párrafos:
{"searchTerms": ["reconocimiento facial"],"documentTypes": ["1387"],"fechaDesde": "2023","fechaHasta": "2024","extractText": true,"paragraphs": 3}
Solo por filtros (sin texto libre) — todos los informes de 2024:
{"documentTypes": ["1361"],"fechaDesde": "2024","fechaHasta": "2024","maxResults": 50}
Extraer texto de documentos concretos:
{"documentUrls": ["https://www.aepd.es/prensa-y-comunicacion/notas-de-prensa/mi-nota.html"],"paragraphs": 2,"paragraphTerms": "videovigilancia"}
Salida (Output)
Cada documento se guarda en el dataset con esta forma:
{"searchTerm": "videovigilancia","title": "PS-00487-2023","documentType": "RESOLUCION","date": "2024-12-30","url": "https://www.aepd.es/documento/ps-00487-2023.pdf","isPdf": true,"summary": "Expediente N.º: EXP202307000 RESOLUCIÓN DE PROCEDIMIENTO SANCIONADOR..."}
Tipos de documento y códigos de faceta
| Código | Nombre |
|---|---|
1387 | RESOLUCIÓN |
1361 | INFORME |
1336 | DISCURSOS/INTERVENCIONES PÚBLICAS |
1372 | NOTAS/COMUNICADOS DE PRENSA |
1379 | PREGUNTAS FRECUENTES |
1377 | PÁGINA WEB |
1324 | BLOG |
1359 | GUÍAS |
1360 | INFOGRAFÍA |
1394 | VIDEOS |
1382 | PUBLICACIONES |
1371 | NOTAS TÉCNICAS |
1375 | OTROS |
2525 | CRITERIOS JURÍDICOS |
Conceptos jurídicos y códigos de faceta
Usa estos IDs en el campo conceptos para filtrar por materia jurídica.
| Código | Concepto | Docs |
|---|---|---|
1487 | Finanzas, fiscalidad y hacienda pública | 8.721 |
1568 | Videovigilancia | 7.164 |
1513 | Privacidad y principios de protección de datos | 6.192 |
1509 | Licitud del tratamiento (bases legitimadoras) | 5.465 |
1490 | Internet y nuevas tecnologías | 3.534 |
1550 | Telecomunicaciones | 3.262 |
1418 | Categorías especiales de datos | 2.003 |
1519 | Publicidad y marketing | 1.519 |
1594 | Comunicación de datos (Cesiones) | 876 |
1546 | Seguridad/Ciberseguridad | 873 |
1432 | Comercio y consumo | 795 |
1483 | Finalidades específicas | 613 |
1449 | Derechos | 553 |
1400 | Ámbito laboral y profesional | 361 |
1601 | Ficheros | 358 |
1500 | Legislación sectorial | 337 |
1522 | Reclamaciones, infracciones y sanciones | 310 |
1497 | Legislación de protección de datos | 230 |
1474 | Educación y menores | 191 |
1440 | Datos de carácter personal | 165 |
1543 | Responsable del tratamiento | 154 |
1412 | Brechas de seguridad | 135 |
1478 | Encargado del tratamiento | 135 |
1443 | Delegado de Protección de Datos | 77 |
1563 | Transparencia y gobierno abierto | 58 |
1555 | Transferencias internacionales de datos | 56 |
1447 | Delitos en Internet | 36 |
1438 | Cumplimiento (compliance) | 28 |
1395 | Administración electrónica (e-Administración/e-Government) | 27 |
1425 | Censos | 27 |
1589 | Buenas prácticas | 26 |
1541 | Responsabilidad social corporativa (RSC) | 18 |
1427 | Certificaciones y acreditaciones | 15 |
1429 | Códigos de conducta | 15 |
1406 | Autoridades de control | 14 |
1459 | Derechos digitales | 8 |
2337 | Aprendizaje automático | 3 |
1535 | Relaciones internacionales | 2 |
2336 | Algoritmos de entrenamiento | 1 |
1435 | Comité Europeo de Protección de Datos (EDPB) | 1 |
Sectorial y códigos de faceta
Usa estos IDs en el campo sectorial para filtrar por sector de actividad.
| Código | Sector | Docs |
|---|---|---|
2404 | Actividades financieras y de seguros | 9.920 |
2398 | Información y comunicaciones | 8.432 |
2420 | Administración Pública y defensa; Seguridad Social obligatoria | 2.706 |
2409 | Actividades profesionales, científicas y técnicas | 2.299 |
210 | Actividades sanitarias y de servicios sociales | 2.255 |
2430 | Otros servicios | 1.002 |
2375 | Suministro de energía eléctrica, gas, vapor y aire acondicionado | 520 |
2407 | Actividades inmobiliarias | 451 |
2422 | Educación | 448 |
2377 | Suministro de agua, saneamiento, gestión de residuos y descontaminación | 265 |
2413 | Actividades administrativas y servicios auxiliares | 54 |
184 | Transporte y almacenamiento | 45 |
2395 | Hostelería | 23 |
2386 | Comercio al por mayor y al por menor; reparación de vehículos | 17 |
2382 | Construcción | 4 |
2350 | Industria manufacturera | 4 |
Flujo recomendado en dos fases
Fase 1 — Búsqueda (rápida): obtén la lista de documentos con metadatos y el resumen de Solr (~500 chars por documento).
{"searchTerms": ["videovigilancia"],"documentTypes": ["1387"],"fechaDesde": "2024","maxResults": 20}
Fase 2 — Texto íntegro: pasa las url que quieras analizar en documentUrls. El actor descarga cada PDF y devuelve el texto completo (máx. 50 documentos por llamada).
{"documentUrls": ["https://www.aepd.es/documento/ps-00487-2023.pdf","https://www.aepd.es/documento/ai-00109-2024.pdf"],"paragraphs": 3,"paragraphTerms": "videovigilancia"}