Pricing

from $0.50 / 1,000 results

Try for free

Go to Apify Store

Wikipedia Article Scraper

Try for free

Extract structured data from Wikipedia articles. Get summaries, categories, images, metadata, and descriptions using Wikipedia's official API. Supports 300+ languages.

Pricing

from $0.50 / 1,000 results

Rating

5.0

(27)

Developer

Crawler Bros

Actor stats

Bookmarked

Total users

Monthly active users

a month ago

Last modified

Features

Extract article titles, summaries, and descriptions
Get categories, images, and thumbnails
Support for 300+ Wikipedia languages
Two modes: scrape by URL or search by keyword
Uses official Wikipedia REST + MediaWiki APIs
No proxy or cookies required
Lightweight HTTP-only (no browser)
Proper rate limiting and User-Agent identification

Input

Field	Type	Default	Description
`articleUrls`	Array	—	Wikipedia article URLs to scrape
`searchQueries`	Array	—	Search terms to find articles
`maxArticlesPerQuery`	Integer	5	Max articles per search query (1-50)
`language`	String	"en"	Wikipedia language code

Example: Scrape by URL

{
    "articleUrls": [
        "https://en.wikipedia.org/wiki/Python_(programming_language)",
        "https://en.wikipedia.org/wiki/Artificial_intelligence"
    ]
}

Example: Search by Keyword

{
    "searchQueries": ["machine learning", "quantum computing"],
    "maxArticlesPerQuery": 3,
    "language": "en"
}

Output

Field	Type	Description
`title`	String	Article title
`url`	String	Full Wikipedia URL
`summary`	String	Lead section extract (first few paragraphs)
`description`	String	Wikidata short description
`categories`	Array	Article categories
`thumbnail`	Object	Thumbnail image with source, width, height
`images`	Array	Image filenames from the article
`lastModified`	String	Last edit timestamp
`language`	String	Language code
`pageId`	Integer	Wikipedia page ID
`scrapedAt`	String	ISO timestamp when scraped

Use Cases

Research — collect structured article data for academic or business research
Content enrichment — augment your database with Wikipedia descriptions and metadata
Knowledge graphs — build knowledge bases from Wikipedia's categorized data
Education — gather article summaries for educational content
SEO — analyze Wikipedia's coverage of topics in your niche
Data science — use Wikipedia data for NLP training and analysis

FAQ

Is a proxy required?

No. Wikipedia's API is freely accessible. No proxy, cookies, or authentication needed.

What languages are supported?

All 300+ Wikipedia language editions. Set the language parameter to any valid code: en, fr, de, es, ja, zh, ru, pt, it, ar, ko, nl, pl, etc.

Are there rate limits?

Wikipedia asks for polite access with proper User-Agent headers. The scraper includes built-in delays (0.3-0.5s between requests) to respect Wikipedia's guidelines.

Can I scrape article content (full text)?

This scraper extracts the lead section summary. For full article text, the summary field contains a clean text extract of the opening paragraphs which is suitable for most use cases.

Wikipedia Article Scraper

cloud9_ai/wikipedia-scraper

Scrape Wikipedia articles by search keyword or exact title. Returns summaries, full article text, categories, and links. Supports 300+ languages.

cloud9

Wikipedia Data Extractor - Articles & Summaries

vernacular_reservoir/wikipedia-data-extractor

Extract structured data from Wikipedia articles by topic or keyword. Get title, summary, description, thumbnail, coordinates and related links. Supports all Wikipedia languages. No API key required.

Aleksandrs

Wikipedia Scraper - Articles, Summaries & Search

makework36/wikipedia-scraper

Scrape Wikipedia articles, summaries, and search results. Supports summary, search, and random article modes via the Wikipedia REST API. Pure HTTP, no browser needed.

deusex machine

Wikipedia Scraper

automation-lab/wikipedia-scraper

Search and extract Wikipedia articles — titles, summaries, full content, categories, and images. Uses the free MediaWiki API.

Stas Persiianenko

Wikipedia Article Extractor

glassventures/wikipedia-article-extractor

Extract Wikipedia articles via MediaWiki API. Get full text, summaries, sections, categories, images, links. Multi-language. Perfect for AI/ML training data and RAG.

Glass Ventures

Wikipedia Article Extractor (AI-ready)

changeable_acacia/wikipedia-article-extractor-ai-ready

Extracts clean JSON from any Wikipedia article for AI/RAG use.

SABYASACHI TRIPATHY

Wikipedia MCP Server

agentify/wikipedia-mcp-server

MCP server for Wikipedia, providing LLMs and clients with real-time access to Wikipedia articles, summaries, sections, and related information via Apify Actor.

agentify

Wikipedia Article Search

ryanclinton/wikipedia-article-search

Search and retrieve structured data from Wikipedia articles across 15 language editions. This Apify actor queries the MediaWiki Search API to find relevant articles, then enriches each result with plain-text summaries, descriptions, Wikidata IDs, and thumbnail images via the Wikipedia REST API.

Ryan Clinton

Wikipedia Article Scraper - Search & Extract Content

klondikeking/wikipedia-article-scraper

Search and extract Wikipedia article metadata, summaries, and content via the official MediaWiki API. No scraping overhead — pure API integration with high reliability.