Ripley
Pricing
from $0.20 / 1,000 producto extraidos
Ripley
Scraper de Ripley Chile para extraer productos, precios, descuentos, marcas, disponibilidad, vendedores, imagenes y URLs desde simple.ripley.cl. Ideal para monitoreo de precios, retail intelligence, comparacion de productos y analisis del mercado chileno.
Pricing
from $0.20 / 1,000 producto extraidos
Rating
0.0
(0)
Developer
Scrapers Chile
Maintained by CommunityActor stats
0
Bookmarked
4
Total users
2
Monthly active users
3 days ago
Last modified
Categories
Share
Ripley Chile Scraper
Extrae productos publicos desde la busqueda de simple.ripley.cl y entrega un dataset listo para monitoreo de precios, retail intelligence, comparacion de productos y analisis del ecommerce chileno.
El Actor recibe un termino de busqueda, consulta la busqueda real de Ripley, recorre la paginacion disponible y guarda cada producto con campos normalizados y datos crudos para trazabilidad.
Que hace
- Busca productos por termino, marca o categoria comercial.
- Recorre la paginacion completa cuando hay mas resultados.
- Extrae precios actuales, precios normales, precio tarjeta, descuentos y disponibilidad.
- Incluye marca, vendedor, marketplace, categoria, URL, imagen, EAN, modelo y posicion.
- Guarda el producto original serializado en
raw_productpara auditoria y analisis avanzado. - Usa una sesion Playwright liviana para leer el JSON SSR que Ripley entrega en la pagina de resultados.
- Aplica fallback interno de navegacion si el modo rapido no encuentra el contrato JSON.
Casos de uso
- Monitoreo de precios de Ripley Chile por palabra clave.
- Seguimiento de descuentos, precio normal, precio oferta y precio con tarjeta.
- Comparacion de precios contra Falabella, Paris, Lider, Jumbo, Tottus u otros retailers.
- Retail intelligence para categorias como tecnologia, electrohogar, moda, hogar y belleza.
- Construccion de catalogos ecommerce, dashboards de disponibilidad y alertas de cambios de precio.
- Analisis de vendedores marketplace y participacion de marcas en resultados de busqueda.
Input
Ejemplo minimo:
{"term": "televisor"}
Ejemplo recomendado para prueba rapida:
{"term": "notebook","maxItems": 5,"concurrency": 1,"timeoutSecs": 45}
Ejemplo con paginacion acotada:
{"term": "zapatillas mujer","maxPages": 3,"pageSize": 58,"sort": "relevance_desc"}
Campos disponibles:
term: termino de busqueda principal.maxItems: limite de productos a guardar.maxPages: limite de paginas a recorrer.pageSize: productos por pagina. Ripley fija actualmente este valor en 58.concurrency: paginas procesadas en paralelo. El valor recomendado para estabilidad es 1 y el maximo permitido es 2.sort: ordenamiento. Por defectorelevance_desc.retries: reintentos por pagina.timeoutSecs: timeout por pagina.failOnNoResults: si esta activo, falla cuando no hay resultados.
No necesitas configurar proxies ni cambiar IPs. El Actor gestiona internamente la sesion necesaria para consultar Ripley cuando corre en Apify.
Output
Cada item del dataset representa un producto de Ripley:
{"product_id": "2000406105451P","name": "SMART TV SAMSUNG QLED 4K UHD 50 Q7FA VISION AI","brand": "SAMSUNG","price": 279990,"normal_price": 529990,"card_price": null,"discount_amount": 250000,"discount_percentage": 47,"currency": "CLP","is_available": true,"availability": "available","category": "Televisor","category_code": "R040302000000","seller_name": "Shop Ecsa","is_marketplace": false,"url": "https://simple.ripley.cl/smart-tv-samsung-qled-4k-uhd-50-q7fa-vision-ai-2000406105451p","image": "https://rimage.ripley.cl/home.ripley/Attachment/WOP/1/2000406105451/full_image-2000406105451","page": 1,"source_url": "https://simple.ripley.cl/search/televisor?sort=relevance_desc&page=1","raw_product": "{...}"}
Tambien se guarda un registro OUTPUT en Key-Value Store con:
- estado de la ejecucion;
- paginas recorridas;
- total reportado por Ripley;
- metadata de busqueda, categorias y filtros;
- productos crudos agregados.
Como funciona
Ripley entrega los resultados de busqueda dentro del JSON SSR de Next.js (findabilityProps). El endpoint directo desde HTTP desnudo puede ser bloqueado por Cloudflare, por eso el Actor abre paginas de busqueda reales y lee el contrato JSON que el propio sitio renderiza en el HTML inicial. Si el modo rapido no encuentra ese contrato, el Actor prueba una navegacion renderizada interna antes de fallar. No extrae datos desde tarjetas HTML: el parseo principal viene del contrato JSON de Ripley.
Este enfoque mantiene el scraper mas estable que un DOM scraper tradicional y permite paginar mas alla de la primera pagina.
Limitaciones conocidas
- Ripley puede ajustar su proteccion Cloudflare, sus nombres de campos o su contrato JSON SSR.
- Algunos productos no informan categoria descriptiva; en esos casos se conserva
category_code,ripley_category_idy el producto crudo. - La disponibilidad puede cambiar por ubicacion, stock, despacho o reglas internas de Ripley.
- Para extracciones grandes conviene mantener
concurrencyen 1. El maximo permitido es 2 porque Ripley puede bloquear patrones de navegacion agresivos. En Apify el Actor gestiona internamente sesiones estables para Ripley y rota la sesion si el sitio bloquea, corta o no entrega el JSON SSR.
Beneficios
- Dataset listo para BI, hojas de calculo, comparadores y alertas.
- Campos normalizados para analisis rapido.
- Datos crudos para auditoria, debugging y enriquecimiento posterior.
- Pensado para precios y productos del mercado chileno.
- Configurado para Apify con schema, README, metadata SEO y monetizacion por resultado.
Uso responsable
Este Actor trabaja con informacion publica de productos. No inicia sesion, no recolecta credenciales y no intenta acceder a datos privados. Ajusta limites y concurrencia segun el volumen necesario.