Ripley
Pricing
Pay per usage
Ripley
Scraper de Ripley Chile para extraer productos, precios, descuentos, marcas, disponibilidad, vendedores, imagenes y URLs desde simple.ripley.cl. Ideal para monitoreo de precios, retail intelligence, comparacion de productos y analisis del mercado chileno.
Pricing
Pay per usage
Rating
0.0
(0)
Developer
Scrapers Chile
Maintained by CommunityActor stats
0
Bookmarked
2
Total users
1
Monthly active users
13 hours ago
Last modified
Categories
Share
Ripley Chile Scraper
Extrae productos publicos desde la busqueda de simple.ripley.cl y entrega un dataset listo para monitoreo de precios, retail intelligence, comparacion de productos y analisis del ecommerce chileno.
El Actor recibe un termino de busqueda, consulta la busqueda real de Ripley, recorre la paginacion disponible y guarda cada producto con campos normalizados y datos crudos para trazabilidad.
Que hace
- Busca productos por termino, marca o categoria comercial.
- Recorre la paginacion completa cuando hay mas resultados.
- Extrae precios actuales, precios normales, precio tarjeta, descuentos y disponibilidad.
- Incluye marca, vendedor, marketplace, categoria, URL, imagen, EAN, modelo y posicion.
- Guarda el producto original serializado en
raw_productpara auditoria y analisis avanzado. - Usa una sesion Playwright liviana para activar el backend JSON de Ripley cuando Cloudflare bloquea el HTTP directo.
Casos de uso
- Monitoreo de precios de Ripley Chile por palabra clave.
- Seguimiento de descuentos, precio normal, precio oferta y precio con tarjeta.
- Comparacion de precios contra Falabella, Paris, Lider, Jumbo, Tottus u otros retailers.
- Retail intelligence para categorias como tecnologia, electrohogar, moda, hogar y belleza.
- Construccion de catalogos ecommerce, dashboards de disponibilidad y alertas de cambios de precio.
- Analisis de vendedores marketplace y participacion de marcas en resultados de busqueda.
Input
Ejemplo minimo:
{"term": "televisor"}
Ejemplo recomendado para prueba rapida:
{"term": "notebook","maxItems": 100,"concurrency": 4}
Ejemplo con paginacion acotada:
{"term": "zapatillas mujer","maxPages": 3,"pageSize": 48,"sort": "relevance_desc"}
Campos disponibles:
term: termino de busqueda principal.maxItems: limite de productos a guardar.maxPages: limite de paginas a recorrer.pageSize: productos por pagina. Ripley fija este valor en 48.concurrency: paginas procesadas en paralelo. Bajar a 1 o 2 si el sitio bloquea.sort: ordenamiento. Por defectorelevance_desc.retries: reintentos por pagina.timeoutSecs: timeout por pagina.failOnNoResults: si esta activo, falla cuando no hay resultados.proxyConfiguration: proxy opcional. En Apify se usa Residential CL por defecto.
Output
Cada item del dataset representa un producto de Ripley:
{"product_id": "2000406105451P","name": "SMART TV SAMSUNG QLED 4K UHD 50 Q7FA VISION AI","brand": "SAMSUNG","price": 279990,"normal_price": 529990,"card_price": null,"discount_amount": 250000,"discount_percentage": 47,"currency": "CLP","is_available": true,"availability": "available","category": "Televisor","category_code": "R040302000000","seller_name": "Shop Ecsa","is_marketplace": false,"url": "https://simple.ripley.cl/smart-tv-samsung-qled-4k-uhd-50-q7fa-vision-ai-2000406105451p","image": "https://rimage.ripley.cl/home.ripley/Attachment/WOP/1/2000406105451/full_image-2000406105451","raw_product": "{...}"}
Tambien se guarda un registro OUTPUT en Key-Value Store con:
- estado de la ejecucion;
- paginas recorridas;
- total reportado por Ripley;
- metadata de busqueda, categorias y filtros;
- productos crudos agregados.
Como funciona
Ripley expone los resultados mediante POST /api/v2/search. El endpoint directo desde HTTP desnudo puede ser bloqueado por Cloudflare, por eso el Actor abre paginas de busqueda reales y captura el JSON que el propio sitio genera. No extrae datos desde tarjetas HTML: el parseo principal viene del contrato JSON de Ripley.
Este enfoque mantiene el scraper mas estable que un DOM scraper tradicional y permite paginar mas alla de la primera pagina.
Limitaciones conocidas
- Ripley puede ajustar su proteccion Cloudflare, sus nombres de campos o su contrato
/api/v2/search. - Algunos productos no informan categoria descriptiva; en esos casos se conserva
category_code,ripley_category_idy el producto crudo. - La disponibilidad puede cambiar por ubicacion, stock, despacho o reglas internas de Ripley.
- Para extracciones grandes conviene mantener
concurrencyentre 2 y 4 y usar proxy residencial chileno.
Beneficios
- Dataset listo para BI, hojas de calculo, comparadores y alertas.
- Campos normalizados para analisis rapido.
- Datos crudos para auditoria, debugging y enriquecimiento posterior.
- Pensado para precios y productos del mercado chileno.
- Configurado para Apify con schema, README, metadata SEO y monetizacion por resultado.
Uso responsable
Este Actor trabaja con informacion publica de productos. No inicia sesion, no recolecta credenciales y no intenta acceder a datos privados. Ajusta limites y concurrencia segun el volumen necesario.