Ripley avatar

Ripley

Pricing

Pay per usage

Go to Apify Store
Ripley

Ripley

Scraper de Ripley Chile para extraer productos, precios, descuentos, marcas, disponibilidad, vendedores, imagenes y URLs desde simple.ripley.cl. Ideal para monitoreo de precios, retail intelligence, comparacion de productos y analisis del mercado chileno.

Pricing

Pay per usage

Rating

0.0

(0)

Developer

Scrapers Chile

Scrapers Chile

Maintained by Community

Actor stats

0

Bookmarked

2

Total users

1

Monthly active users

13 hours ago

Last modified

Categories

Share

Ripley Chile Scraper

Extrae productos publicos desde la busqueda de simple.ripley.cl y entrega un dataset listo para monitoreo de precios, retail intelligence, comparacion de productos y analisis del ecommerce chileno.

El Actor recibe un termino de busqueda, consulta la busqueda real de Ripley, recorre la paginacion disponible y guarda cada producto con campos normalizados y datos crudos para trazabilidad.

Que hace

  • Busca productos por termino, marca o categoria comercial.
  • Recorre la paginacion completa cuando hay mas resultados.
  • Extrae precios actuales, precios normales, precio tarjeta, descuentos y disponibilidad.
  • Incluye marca, vendedor, marketplace, categoria, URL, imagen, EAN, modelo y posicion.
  • Guarda el producto original serializado en raw_product para auditoria y analisis avanzado.
  • Usa una sesion Playwright liviana para activar el backend JSON de Ripley cuando Cloudflare bloquea el HTTP directo.

Casos de uso

  • Monitoreo de precios de Ripley Chile por palabra clave.
  • Seguimiento de descuentos, precio normal, precio oferta y precio con tarjeta.
  • Comparacion de precios contra Falabella, Paris, Lider, Jumbo, Tottus u otros retailers.
  • Retail intelligence para categorias como tecnologia, electrohogar, moda, hogar y belleza.
  • Construccion de catalogos ecommerce, dashboards de disponibilidad y alertas de cambios de precio.
  • Analisis de vendedores marketplace y participacion de marcas en resultados de busqueda.

Input

Ejemplo minimo:

{
"term": "televisor"
}

Ejemplo recomendado para prueba rapida:

{
"term": "notebook",
"maxItems": 100,
"concurrency": 4
}

Ejemplo con paginacion acotada:

{
"term": "zapatillas mujer",
"maxPages": 3,
"pageSize": 48,
"sort": "relevance_desc"
}

Campos disponibles:

  • term: termino de busqueda principal.
  • maxItems: limite de productos a guardar.
  • maxPages: limite de paginas a recorrer.
  • pageSize: productos por pagina. Ripley fija este valor en 48.
  • concurrency: paginas procesadas en paralelo. Bajar a 1 o 2 si el sitio bloquea.
  • sort: ordenamiento. Por defecto relevance_desc.
  • retries: reintentos por pagina.
  • timeoutSecs: timeout por pagina.
  • failOnNoResults: si esta activo, falla cuando no hay resultados.
  • proxyConfiguration: proxy opcional. En Apify se usa Residential CL por defecto.

Output

Cada item del dataset representa un producto de Ripley:

{
"product_id": "2000406105451P",
"name": "SMART TV SAMSUNG QLED 4K UHD 50 Q7FA VISION AI",
"brand": "SAMSUNG",
"price": 279990,
"normal_price": 529990,
"card_price": null,
"discount_amount": 250000,
"discount_percentage": 47,
"currency": "CLP",
"is_available": true,
"availability": "available",
"category": "Televisor",
"category_code": "R040302000000",
"seller_name": "Shop Ecsa",
"is_marketplace": false,
"url": "https://simple.ripley.cl/smart-tv-samsung-qled-4k-uhd-50-q7fa-vision-ai-2000406105451p",
"image": "https://rimage.ripley.cl/home.ripley/Attachment/WOP/1/2000406105451/full_image-2000406105451",
"raw_product": "{...}"
}

Tambien se guarda un registro OUTPUT en Key-Value Store con:

  • estado de la ejecucion;
  • paginas recorridas;
  • total reportado por Ripley;
  • metadata de busqueda, categorias y filtros;
  • productos crudos agregados.

Como funciona

Ripley expone los resultados mediante POST /api/v2/search. El endpoint directo desde HTTP desnudo puede ser bloqueado por Cloudflare, por eso el Actor abre paginas de busqueda reales y captura el JSON que el propio sitio genera. No extrae datos desde tarjetas HTML: el parseo principal viene del contrato JSON de Ripley.

Este enfoque mantiene el scraper mas estable que un DOM scraper tradicional y permite paginar mas alla de la primera pagina.

Limitaciones conocidas

  • Ripley puede ajustar su proteccion Cloudflare, sus nombres de campos o su contrato /api/v2/search.
  • Algunos productos no informan categoria descriptiva; en esos casos se conserva category_code, ripley_category_id y el producto crudo.
  • La disponibilidad puede cambiar por ubicacion, stock, despacho o reglas internas de Ripley.
  • Para extracciones grandes conviene mantener concurrency entre 2 y 4 y usar proxy residencial chileno.

Beneficios

  • Dataset listo para BI, hojas de calculo, comparadores y alertas.
  • Campos normalizados para analisis rapido.
  • Datos crudos para auditoria, debugging y enriquecimiento posterior.
  • Pensado para precios y productos del mercado chileno.
  • Configurado para Apify con schema, README, metadata SEO y monetizacion por resultado.

Uso responsable

Este Actor trabaja con informacion publica de productos. No inicia sesion, no recolecta credenciales y no intenta acceder a datos privados. Ajusta limites y concurrencia segun el volumen necesario.