Pricing

$4.99/month + usage

Wikipedia_Scraper

Fetch Wikipedia page content for multiple URLs with optional keyword filtering. Returns structured JSON results and handles bulk requests asynchronously.

Pricing

$4.99/month + usage

Rating

0.0

(0)

Developer

ZeroBreak

Actor stats

Bookmarked

Total users

Monthly active users

a month ago

Last modified

Wikipedia Scraper

A production-ready Apify Actor for scraping structured Wikipedia data using direct URLs or keyword-based page scraping.

This actor communicates with a backend Wikipedia Scraper API and is suitable for Apify Cloud, AWS Lambda, or any HTTP-based automation workflow.

Features

Fetch Wikipedia pages for single or multiple URLs.
Optional keyword search to detect specific terms in page content.
Accepts input as plain URLs or objects with a url key.
Returns structured JSON results including:
- HTTP status
- Request details
- Content snippet or full data
- Errors if any
Fully asynchronous for high performance.
Automatically pushes results to the Apify Dataset.
Handles exceptions gracefully without stopping execution.

Input

The Actor accepts input in JSON format:

Example 1: List of URLs

{
  "urls": [
    "https://en.wikipedia.org/wiki/JavaScript",
    "https://en.wikipedia.org/wiki/Bangladesh"
  ],
  "keyword": "html"
}

Run the Actor

Save your input configuration
Click Run in Apify Console
Monitor logs for progress and errors

Access Results

All scraped data is stored in the Apify Dataset.
Each URL produces a separate dataset item.
Data is returned in structured JSON format.

Input

`queries` (optional)

List of keyword searches to discover Pinterest pins.

```json
{
  "urls": [
    "https://en.wikipedia.org/wiki/JavaScript",
  ],
  "keyword": "html"
}

How It Works

Reads input from Apify (urls and optional keyword)
Fetches Wikipedia pages asynchronously
Parses page content: title, first paragraph, and sections
Checks for keyword presence (if provided)
Pushes structured JSON results to the dataset
Logs errors and handles retries automatically

Error Handling

Automatic retries for temporary failures
Invalid or non-Wikipedia URLs are safely skipped
Clear error messages are logged via Actor.log

Use Cases

Research and collect Wikipedia content
Build datasets for machine learning or NLP
Keyword trend analysis across Wikipedia
Academic or reference data collection
Quick access to structured page information

Support

Extend or customize this Actor for your workflow
Logs and dataset entries help debug and monitor scraping

Wikipedia Search

comical_fahrenheit/wikipedia-search

Max N

Wikipedia-scraper

pluzgi/wikipedia-scraper

The scraper searches Wikipedia for a given term, extracts the titles and URLs of search results, and retrieves the last modification date from each page.

pluzgi

Wikipedia Scraper | $5 / 1k | Fast & Reliable

fatihtahta/wikipedia-scraper

Get full articles and detailed search results with the Wikipedia Scraper. Extract structured data including titles, summaries, citations, and full content. Ideal for market research, AI training, and competitive intelligence.

Fatih Tahta

5.0

Wikipedia Search & Content Scraper

tuningsearch/wikipedia-search-scraper

🔥 Only $0.5 per 1,000 results 🔥 **CHEAPEST** Wikipedia Search + Full Page Scraper! 🔍 Search 100 results per query across 70 languages 📄 Extract complete page content in Markdown format ⚡ Lightning-fast batch processing with zero failure charges!

tuningsearch

Wikipedia Phone Number Scraper

contacts-api/wikipedia-phone-number-scraper

Extract organization contact numbers using our Wikipedia Phone Number Scraper. Collect public phone numbers from Wikipedia pages for research and outreach.

Lead Heaven

Wikipedia Email Scraper - Advanced, Fast & Cheapest

contacts-api/wikipedia-email-scraper-fast-advanced-and-cheapest

📚 Wikipedia Email Scraper allows you to collect publicly available editor and organization emails from Wikipedia pages 🔎 Great for research and academic outreach 📧

Lead Heaven

Wikipedia Scraper

nexgendata/wikipedia-scraper

Scrape Wikipedia articles, infoboxes, references, and structured data. Extract knowledge base content for research, NLP training, and data enrichment.

Stephan Corbeil

Wikipedia MCP Server

agentify/wikipedia-mcp-server

MCP server for Wikipedia, providing LLMs and clients with real-time access to Wikipedia articles, summaries, sections, and related information via Apify Actor.

agentify

Wikipedia Article Extractor (AI-ready)

changeable_acacia/wikipedia-article-extractor-ai-ready

Extracts clean JSON from any Wikipedia article for AI/RAG use.

SABYASACHI TRIPATHY

Wikipedia Article Search

ryanclinton/wikipedia-article-search

Search Wikipedia articles across 15+ languages. Returns titles, extracts, descriptions, word counts, page sizes, timestamps, Wikidata IDs, thumbnails, article URLs. Enriches with REST API summaries. Free, no key needed.