AEPD avatar

AEPD

Pricing

from $1.00 / 1,000 results

Go to Apify Store
AEPD

AEPD

Este actor automatiza la búsqueda en el buscador de la AEPD y la extracción del texto de sus documentos.

Pricing

from $1.00 / 1,000 results

Rating

0.0

(0)

Developer

Miguel González

Miguel González

Maintained by Community

Actor stats

0

Bookmarked

2

Total users

1

Monthly active users

7 hours ago

Last modified

Categories

Share

AEPD — Buscador de resoluciones e informes

Actor de Apify que automatiza la búsqueda en el buscador de la Agencia Española de Protección de Datos (aepd.es/buscador). Permite buscar resoluciones, informes, guías, notas de prensa y otros documentos por texto libre y filtrarlos por tipo de documento, concepto jurídico, sector y rango de años.

Para cada documento encontrado extrae sus metadatos (título, tipo, fecha, URL) y el resumen indexado por Solr. Además puede extraer el texto íntegro de páginas HTML o usar el resumen de Solr para los PDFs de resoluciones.

Características

  • Búsqueda por múltiples términos en una sola ejecución (hasta 50).
  • Filtros: tipo de documento (resolución, informe, guía…), concepto jurídico, sector y rango de años.
  • Metadatos completos: título, tipo inferido, fecha ISO, URL y resumen (extracto de Solr).
  • Extracción bajo demanda del texto íntegro de páginas HTML (documentUrls).
  • Modo "párrafos": devuelve solo los N pasajes más relevantes (útil con LLMs).

Entrada (Input)

Debes indicar al menos uno de estos campos: searchTerms, documentUrls o un filtro de faceta (documentTypes, conceptos, sectorial, fechaDesde/fechaHasta).

CampoTipoDescripción
searchTermsstring[]Términos a buscar en texto libre (máx. 50). Cada término se ejecuta por separado. Si se deja vacío con filtros activos, devuelve todos los documentos que los cumplan.
documentUrlsstring[]URLs de páginas de la AEPD de las que extraer el texto íntegro (máx. 50). Las resoluciones son PDFs; para esas se usa el resumen de Solr.
documentTypesstring[]Tipo de documento. Se acepta el nombre normalizado (resolucion, informe…) o el código numérico de la faceta (1387, 1361…).
conceptosstring[]IDs numéricos del concepto jurídico (p. ej. 1568 = Videovigilancia, 1513 = Privacidad).
sectorialstring[]IDs numéricos del sector (p. ej. 2404 = Financiero, 2398 = Información y comunicaciones).
fechaDesdestringAño mínimo de publicación (formato YYYY).
fechaHastastringAño máximo de publicación (formato YYYY).
extractTextbooleanSi true, descarga el texto íntegro de cada resultado. Por defecto false.
paragraphsintegerSi > 0, devuelve solo los N pasajes más relevantes en lugar del texto íntegro.
paragraphTermsstringTérminos con los que localizar los pasajes (por defecto, el término de búsqueda).
maxResultsintegerMáximo de documentos por término. Por defecto 20.

Ejemplos de input

Buscar resoluciones sobre videovigilancia:

{
"searchTerms": ["videovigilancia"],
"documentTypes": ["1387"],
"maxResults": 20
}

Resoluciones de 2023–2024 con extracción de párrafos:

{
"searchTerms": ["reconocimiento facial"],
"documentTypes": ["1387"],
"fechaDesde": "2023",
"fechaHasta": "2024",
"extractText": true,
"paragraphs": 3
}

Solo por filtros (sin texto libre) — todos los informes de 2024:

{
"documentTypes": ["1361"],
"fechaDesde": "2024",
"fechaHasta": "2024",
"maxResults": 50
}

Extraer texto de documentos concretos:

{
"documentUrls": [
"https://www.aepd.es/prensa-y-comunicacion/notas-de-prensa/mi-nota.html"
],
"paragraphs": 2,
"paragraphTerms": "videovigilancia"
}

Salida (Output)

Cada documento se guarda en el dataset con esta forma:

{
"searchTerm": "videovigilancia",
"title": "PS-00487-2023",
"documentType": "RESOLUCION",
"date": "2024-12-30",
"url": "https://www.aepd.es/documento/ps-00487-2023.pdf",
"isPdf": true,
"summary": "Expediente N.º: EXP202307000 RESOLUCIÓN DE PROCEDIMIENTO SANCIONADOR..."
}

Tipos de documento y códigos de faceta

CódigoNombre
1387RESOLUCIÓN
1361INFORME
1336DISCURSOS/INTERVENCIONES PÚBLICAS
1372NOTAS/COMUNICADOS DE PRENSA
1379PREGUNTAS FRECUENTES
1377PÁGINA WEB
1324BLOG
1359GUÍAS
1360INFOGRAFÍA
1394VIDEOS
1382PUBLICACIONES
1371NOTAS TÉCNICAS
1375OTROS
2525CRITERIOS JURÍDICOS

Conceptos jurídicos y códigos de faceta

Usa estos IDs en el campo conceptos para filtrar por materia jurídica.

CódigoConceptoDocs
1487Finanzas, fiscalidad y hacienda pública8.721
1568Videovigilancia7.164
1513Privacidad y principios de protección de datos6.192
1509Licitud del tratamiento (bases legitimadoras)5.465
1490Internet y nuevas tecnologías3.534
1550Telecomunicaciones3.262
1418Categorías especiales de datos2.003
1519Publicidad y marketing1.519
1594Comunicación de datos (Cesiones)876
1546Seguridad/Ciberseguridad873
1432Comercio y consumo795
1483Finalidades específicas613
1449Derechos553
1400Ámbito laboral y profesional361
1601Ficheros358
1500Legislación sectorial337
1522Reclamaciones, infracciones y sanciones310
1497Legislación de protección de datos230
1474Educación y menores191
1440Datos de carácter personal165
1543Responsable del tratamiento154
1412Brechas de seguridad135
1478Encargado del tratamiento135
1443Delegado de Protección de Datos77
1563Transparencia y gobierno abierto58
1555Transferencias internacionales de datos56
1447Delitos en Internet36
1438Cumplimiento (compliance)28
1395Administración electrónica (e-Administración/e-Government)27
1425Censos27
1589Buenas prácticas26
1541Responsabilidad social corporativa (RSC)18
1427Certificaciones y acreditaciones15
1429Códigos de conducta15
1406Autoridades de control14
1459Derechos digitales8
2337Aprendizaje automático3
1535Relaciones internacionales2
2336Algoritmos de entrenamiento1
1435Comité Europeo de Protección de Datos (EDPB)1

Sectorial y códigos de faceta

Usa estos IDs en el campo sectorial para filtrar por sector de actividad.

CódigoSectorDocs
2404Actividades financieras y de seguros9.920
2398Información y comunicaciones8.432
2420Administración Pública y defensa; Seguridad Social obligatoria2.706
2409Actividades profesionales, científicas y técnicas2.299
210Actividades sanitarias y de servicios sociales2.255
2430Otros servicios1.002
2375Suministro de energía eléctrica, gas, vapor y aire acondicionado520
2407Actividades inmobiliarias451
2422Educación448
2377Suministro de agua, saneamiento, gestión de residuos y descontaminación265
2413Actividades administrativas y servicios auxiliares54
184Transporte y almacenamiento45
2395Hostelería23
2386Comercio al por mayor y al por menor; reparación de vehículos17
2382Construcción4
2350Industria manufacturera4

Flujo recomendado en dos fases

Fase 1 — Búsqueda (rápida): obtén la lista de documentos con metadatos y el resumen de Solr (~500 chars por documento).

{
"searchTerms": ["videovigilancia"],
"documentTypes": ["1387"],
"fechaDesde": "2024",
"maxResults": 20
}

Fase 2 — Texto íntegro: pasa las url que quieras analizar en documentUrls. El actor descarga cada PDF y devuelve el texto completo (máx. 50 documentos por llamada).

{
"documentUrls": [
"https://www.aepd.es/documento/ps-00487-2023.pdf",
"https://www.aepd.es/documento/ai-00109-2024.pdf"
],
"paragraphs": 3,
"paragraphTerms": "videovigilancia"
}