Open Library Scraper avatar

Open Library Scraper

Pricing

Pay per usage

Go to Apify Store
Open Library Scraper

Open Library Scraper

Search and extract book data from Open Library: titles, authors, editions, subjects, and availability. Literary research at scale.

Pricing

Pay per usage

Rating

4.7

(3)

Developer

viralanalyzer

viralanalyzer

Maintained by Community

Actor stats

0

Bookmarked

2

Total users

1

Monthly active users

2 days ago

Last modified

Categories

Share

📚 Open Library Book Scraper — Book Data, Authors & Editions

🔗 View on Apify Store | 🇺🇸 English | 🇧🇷 Português

Scrape book data from Open Library — titles, authors, covers, editions, subjects, and more. Search by keyword, look up specific books by ISBN, or discover trending titles by subject. Uses the free Open Library API, no API key needed.

✨ Features

  • 🔍 Keyword search — Find books by title, author, or topic with full-text search
  • 📖 ISBN lookup — Fetch detailed book data by ISBN-10 or ISBN-13
  • 🔥 Trending by subject — Discover popular books in any subject (science fiction, computer science, history, etc.)
  • 🖼️ Cover images — Direct URLs to book cover images from Open Library
  • 📊 Edition counts — See how many editions each work has across languages
  • 👤 Author details — Author names resolved from Open Library's author API
  • 📄 Rich metadata — Subjects, publishers, languages, page counts
  • 🛡️ Anti-placeholder guardrails — Only real data, never fake results

📥 Input

ParameterTypeRequiredDefaultDescription
modeStringYessearchScraping mode: search, by_isbn, or trending
searchQueriesArrayOnly in search modeKeywords to search for (max 10 queries)
isbnsArrayOnly in by_isbn modeISBN-10 or ISBN-13 codes (max 50)
subjectStringOnly in trending modeSubject/topic (e.g., science_fiction, computer_science)
maxItemsIntegerNo50Maximum number of books to scrape (1–200)

Input Example

{
"mode": "search",
"searchQueries": ["artificial intelligence", "machine learning"],
"maxItems": 30
}

📤 Output

FieldTypeDescription
titleStringBook title
authorsArrayList of author names
firstPublishYearIntegerYear of first publication
coverUrlStringURL to book cover image
editionCountIntegerNumber of editions available
openLibraryUrlStringOpen Library page URL
isbnStringISBN code (when available)
subjectsArrayBook subjects/topics (up to 10)
languageArrayLanguages available
publisherArrayPublisher names
pageCountIntegerMedian page count
platformStringAlways openlibrary
scrapedAtStringTimestamp of data extraction (ISO 8601)

Output Example

{
"title": "Artificial Intelligence: A Modern Approach",
"authors": ["Stuart Russell", "Peter Norvig"],
"firstPublishYear": 1995,
"coverUrl": "https://covers.openlibrary.org/b/id/12547191-M.jpg",
"editionCount": 38,
"openLibraryUrl": "https://openlibrary.org/works/OL2896280W",
"isbn": "9780134610993",
"subjects": ["Artificial intelligence", "Computer science", "Machine learning", "Expert systems", "Natural language processing"],
"language": ["eng", "spa", "chi", "fre"],
"publisher": ["Pearson", "Prentice Hall"],
"pageCount": 1132,
"platform": "openlibrary",
"scrapedAt": "2026-03-06T14:30:00.000Z"
}

📋 Use Cases

  • 📊 Publishing market research — Analyze book trends by subject, language, and edition count
  • 📖 Reading list curation — Build curated book lists on specific topics or subjects
  • 🎓 Academic research — Collect metadata for bibliometric analysis or digital humanities projects
  • 🛒 Book recommendation engines — Feed cover images, subjects, and metadata into recommendation systems
  • 📰 Content creation — Generate "best books on X" articles with real data and cover images
  • 🔍 ISBN validation — Verify ISBN codes and enrich them with full book metadata

❓ FAQ

Q: What is the difference between search and trending modes? A: search uses Open Library's full-text search across all fields (title, author, subject). trending fetches books curated under a specific subject category by Open Library, showing popular works in that topic.

Q: Can I search by author name? A: Yes, in search mode you can include author names in your queries. For example, "Isaac Asimov" or "author:Asimov". The search matches across all book metadata fields.

Q: Why are some fields missing from certain results? A: Fields like isbn, subjects, language, publisher, and pageCount are conditionally included — they only appear when data is available. Open Library's coverage varies by book; older or less popular works may have sparser metadata.

Q: Does the ISBN lookup support both ISBN-10 and ISBN-13? A: Yes, both formats are supported. The actor automatically strips hyphens and spaces from ISBN codes before making the API call.

Q: How are trending books determined? A: Trending books come from Open Library's subject API, which returns works categorized under a given subject. The list reflects Open Library's own curation, not real-time popularity data.

💰 Pricing

This actor uses Pay Per Event (PPE) pricing:

MetricCost
Per book scraped$0.03

📝 Changelog

v1.0 (Current)

  • ✅ Search books by keyword with Open Library's full-text search
  • ✅ ISBN lookup with author name resolution
  • ✅ Trending books by subject via Open Library subject API
  • ✅ Cover image URLs for each book
  • ✅ Rich metadata: subjects, publishers, languages, page counts
  • ✅ Deduplication by title
  • ✅ Anti-placeholder guardrails — real data only
  • ✅ PPE billing via Actor.charge()

📚 Open Library Book Scraper — Dados de Livros, Autores e Edições

🇺🇸 English | 🇧🇷 Português

Extraia dados de livros da Open Library — títulos, autores, capas, edições, assuntos e mais. Pesquise por palavra-chave, busque livros específicos por ISBN, ou descubra títulos em tendência por assunto. Usa a API gratuita da Open Library, sem necessidade de chave de API.

✨ Funcionalidades

  • 🔍 Pesquisa por palavra-chave — Encontre livros por título, autor ou tópico com busca de texto completo
  • 📖 Busca por ISBN — Obtenha dados detalhados de livros por ISBN-10 ou ISBN-13
  • 🔥 Tendências por assunto — Descubra livros populares em qualquer assunto (ficção científica, ciência da computação, história, etc.)
  • 🖼️ Imagens de capa — URLs diretas para imagens de capa dos livros da Open Library
  • 📊 Contagem de edições — Veja quantas edições cada obra tem em diferentes idiomas
  • 👤 Detalhes de autores — Nomes de autores resolvidos pela API de autores da Open Library
  • 📄 Metadados completos — Assuntos, editoras, idiomas, número de páginas
  • 🛡️ Proteção anti-placeholder — Apenas dados reais, nunca resultados falsos

📥 Entrada

ParâmetroTipoObrigatórioPadrãoDescrição
modeStringSimsearchModo de extração: search, by_isbn ou trending
searchQueriesArrayApenas no modo searchPalavras-chave para pesquisar (máximo 10 consultas)
isbnsArrayApenas no modo by_isbnCódigos ISBN-10 ou ISBN-13 (máximo 50)
subjectStringApenas no modo trendingAssunto/tópico (ex.: science_fiction, computer_science)
maxItemsIntegerNão50Número máximo de livros para extrair (1–200)

Exemplo de Entrada

{
"mode": "search",
"searchQueries": ["artificial intelligence", "machine learning"],
"maxItems": 30
}

📤 Saída

CampoTipoDescrição
titleStringTítulo do livro
authorsArrayLista de nomes dos autores
firstPublishYearIntegerAno da primeira publicação
coverUrlStringURL da imagem de capa do livro
editionCountIntegerNúmero de edições disponíveis
openLibraryUrlStringURL da página na Open Library
isbnStringCódigo ISBN (quando disponível)
subjectsArrayAssuntos/tópicos do livro (até 10)
languageArrayIdiomas disponíveis
publisherArrayNomes das editoras
pageCountIntegerNúmero mediano de páginas
platformStringSempre openlibrary
scrapedAtStringTimestamp da extração dos dados (ISO 8601)

Exemplo de Saída

{
"title": "Artificial Intelligence: A Modern Approach",
"authors": ["Stuart Russell", "Peter Norvig"],
"firstPublishYear": 1995,
"coverUrl": "https://covers.openlibrary.org/b/id/12547191-M.jpg",
"editionCount": 38,
"openLibraryUrl": "https://openlibrary.org/works/OL2896280W",
"isbn": "9780134610993",
"subjects": ["Artificial intelligence", "Computer science", "Machine learning", "Expert systems", "Natural language processing"],
"language": ["eng", "spa", "chi", "fre"],
"publisher": ["Pearson", "Prentice Hall"],
"pageCount": 1132,
"platform": "openlibrary",
"scrapedAt": "2026-03-06T14:30:00.000Z"
}

📋 Casos de Uso

  • 📊 Pesquisa de mercado editorial — Analise tendências de livros por assunto, idioma e contagem de edições
  • 📖 Curadoria de listas de leitura — Monte listas curadas de livros sobre tópicos específicos
  • 🎓 Pesquisa acadêmica — Colete metadados para análise bibliométrica ou projetos de humanidades digitais
  • 🛒 Motores de recomendação de livros — Alimente imagens de capa, assuntos e metadados em sistemas de recomendação
  • 📰 Criação de conteúdo — Gere artigos "melhores livros sobre X" com dados reais e imagens de capa
  • 🔍 Validação de ISBN — Verifique códigos ISBN e enriqueça-os com metadados completos do livro

❓ Perguntas Frequentes

P: Qual é a diferença entre os modos search e trending? R: search usa a busca de texto completo da Open Library em todos os campos (título, autor, assunto). trending busca livros curados sob uma categoria de assunto específica pela Open Library, mostrando obras populares naquele tópico.

P: Posso pesquisar por nome de autor? R: Sim, no modo search você pode incluir nomes de autores nas suas consultas. Por exemplo, "Isaac Asimov" ou "author:Asimov". A busca corresponde a todos os campos de metadados do livro.

P: Por que alguns campos estão ausentes em certos resultados? R: Campos como isbn, subjects, language, publisher e pageCount são incluídos condicionalmente — eles só aparecem quando os dados estão disponíveis. A cobertura da Open Library varia por livro; obras mais antigas ou menos populares podem ter metadados mais escassos.

P: A busca por ISBN suporta tanto ISBN-10 quanto ISBN-13? R: Sim, ambos os formatos são suportados. O actor remove automaticamente hífens e espaços dos códigos ISBN antes de fazer a chamada à API.

P: Como os livros em tendência são determinados? R: Os livros em tendência vêm da API de assuntos da Open Library, que retorna obras categorizadas sob um determinado assunto. A lista reflete a curadoria da própria Open Library, não dados de popularidade em tempo real.

💰 Preços

Este actor usa precificação Pay Per Event (PPE):

MétricaCusto
Por livro extraído$0,03

🔗 Actors Relacionados

📝 Changelog

v1.0 (Atual)

  • ✅ Pesquisa de livros por palavra-chave com busca de texto completo da Open Library
  • ✅ Busca por ISBN com resolução de nomes de autores
  • ✅ Livros em tendência por assunto via API de assuntos da Open Library
  • ✅ URLs de imagens de capa para cada livro
  • ✅ Metadados completos: assuntos, editoras, idiomas, número de páginas
  • ✅ Deduplicação por título
  • ✅ Proteção anti-placeholder — apenas dados reais
  • ✅ Cobrança PPE via Actor.charge()