Reddit Scraper avatar
Reddit Scraper

Pricing

Pay per usage

Go to Apify Store
Reddit Scraper

Reddit Scraper

Scrape Reddit posts, comment trees, and sentiment from any subreddit or search query. No API key needed.

Pricing

Pay per usage

Rating

0.0

(0)

Developer

ViralScope Labs

ViralScope Labs

Maintained by Community

Actor stats

0

Bookmarked

2

Total users

1

Monthly active users

3 hours ago

Last modified

Share

🇺🇸 English | 🇧🇷 Português

Scrape Reddit posts, comment trees, and sentiment from any subreddit or global search query. Get scores, upvote ratios, flair, and full recursive comment trees. No API key needed.

✨ Features

  • 🔍 Subreddit scraping — hot, new, top, rising, controversial posts
  • 🌐 Global search — search across all of Reddit
  • 🌳 Recursive comment tree — configurable depth and limit
  • 💬 Sentiment analysis — PT-BR + EN support (positivo/neutro/negativo)
  • 🧹 content_clean — HTML-stripped text ready for ML/AI training
  • Lightweight — pure HTTP + JSON, no browser required
  • Validated output — every item checked before delivery
  • 🌐 Apify Proxy — built-in proxy support for reliability

📥 Input

FieldTypeDefaultDescription
subredditsstring[]["brasil"]List of subreddits to scrape
searchQuerystring""Global search query (overrides subreddits)
sortenum"hot"Sort: hot, new, top, rising, controversial
timeenum"week"Time filter: hour, day, week, month, year, all
maxPostsinteger10Maximum posts to collect
includeCommentsbooleantrueFetch comment trees
commentsDepthinteger3Max depth for comment tree recursion
commentsLimitinteger10Max top-level comments per post

Example Input

{
"subreddits": ["brasil", "technology"],
"sort": "hot",
"time": "week",
"maxPosts": 5,
"includeComments": true,
"commentsDepth": 2,
"commentsLimit": 5
}

📤 Output

Each post produces one object:

FieldTypeDescription
post_idstringReddit post ID
subredditstringSubreddit name
titlestringPost title
selftextstringPost body text
authorstringAuthor username
scoreintegerNet upvotes
upvote_ratiofloatRatio of upvotes (0.0–1.0)
num_commentsintegerTotal comment count
urlstringPost URL
permalinkstringReddit permalink
created_utcintegerUnix timestamp
flairstring|nullPost flair text
is_videobooleanWhether the post is a video
content_cleanstringML-ready text (no HTML)
comments_treearrayRecursive comment tree

Comment Tree Structure

{
"id": "m6p2abc",
"author": "user123",
"body": "Great post!",
"score": 42,
"created_utc": 1707753600,
"sentiment": "positivo",
"depth": 1,
"replies": [
{
"id": "m6p3def",
"author": "user456",
"body": "Agreed!",
"score": 15,
"sentiment": "positivo",
"depth": 2,
"replies": []
}
]
}

📋 Use Cases

  • AI/ML Training Data — Clean text with content_clean field, ready for NLP
  • Market Research — Monitor discussions about brands, products, or industries
  • Sentiment Analysis — Track community sentiment over time
  • Competitor Intelligence — Monitor what people say about competitors
  • Content Ideas — Find popular topics and discussions in your niche
  • Academic Research — Collect structured data from Reddit communities
  • Community Monitoring — Track subreddit health and engagement

❓ FAQ

Q: Do I need a Reddit API key? A: No! This actor works without any API credentials.

Q: What proxy should I use? A: Apify Proxy with residential proxies is recommended for best results.

Q: Can I search across all of Reddit? A: Yes! Use the searchQuery field to search globally instead of specific subreddits.

Q: How deep can the comment tree go? A: Up to any depth you configure with commentsDepth. Default is 3 levels.

Q: Does it support Portuguese content? A: Yes! Sentiment analysis supports both PT-BR and English keywords.

📝 Changelog

v1.5 (Current)

  • ✅ Improved reliability and proxy handling
  • ✅ Enhanced sentiment analysis (PT-BR + EN)
  • ✅ Better comment tree extraction

v1.0

  • Initial release

Reddit Scraper

🇺🇸 English | 🇧🇷 Português

Raspe posts, árvore de comentários e sentimento de qualquer subreddit ou busca global no Reddit. Obtenha scores, upvote ratios, flair e árvore completa de comentários. Sem necessidade de API key.

✨ Funcionalidades

  • 🔍 Raspagem de subreddits — posts hot, new, top, rising, controversial
  • 🌐 Busca global — pesquise em todo o Reddit
  • 🌳 Árvore de comentários recursiva — profundidade e limite configuráveis
  • 💬 Análise de sentimento — suporte PT-BR + EN (positivo/neutro/negativo)
  • 🧹 content_clean — texto limpo pronto para ML/IA
  • Leve — HTTP puro + JSON, sem navegador
  • Output validado — cada item verificado antes da entrega
  • 🌐 Apify Proxy — suporte a proxy integrado para confiabilidade

📥 Entrada

CampoTipoPadrãoDescrição
subredditsstring[]["brasil"]Lista de subreddits para raspar
searchQuerystring""Busca global (substitui subreddits)
sortenum"hot"Ordenação: hot, new, top, rising, controversial
timeenum"week"Filtro de tempo: hour, day, week, month, year, all
maxPostsinteger10Máximo de posts a coletar
includeCommentsbooleantrueBuscar árvores de comentários
commentsDepthinteger3Profundidade máxima dos comentários
commentsLimitinteger10Máx comentários de nível superior por post

Exemplo de Entrada

{
"subreddits": ["brasil", "technology"],
"sort": "hot",
"time": "week",
"maxPosts": 5,
"includeComments": true,
"commentsDepth": 2,
"commentsLimit": 5
}

📤 Saída

Cada post produz um objeto:

CampoTipoDescrição
post_idstringID do post
subredditstringNome do subreddit
titlestringTítulo do post
selftextstringTexto do corpo
authorstringNome do autor
scoreintegerVotos líquidos
upvote_ratiofloatProporção de upvotes (0.0–1.0)
num_commentsintegerTotal de comentários
urlstringURL do post
permalinkstringPermalink do Reddit
created_utcintegerTimestamp Unix
flairstring|nullFlair do post
is_videobooleanSe o post é um vídeo
content_cleanstringTexto limpo para ML
comments_treearrayÁrvore recursiva de comentários

📋 Casos de Uso

  • Dados para IA/ML — Texto limpo com content_clean, pronto para NLP
  • Pesquisa de mercado — Monitore discussões sobre marcas e produtos
  • Análise de sentimento — Acompanhe o sentimento da comunidade ao longo do tempo
  • Inteligência competitiva — Monitore o que falam sobre concorrentes
  • Ideias de conteúdo — Encontre tópicos populares no seu nicho
  • Pesquisa acadêmica — Colete dados estruturados de comunidades do Reddit
  • Monitoramento de comunidade — Acompanhe engajamento de subreddits

❓ Perguntas Frequentes

P: Preciso de API key do Reddit? R: Não! Este actor funciona sem nenhuma credencial de API.

P: Qual proxy devo usar? R: Apify Proxy com proxies residenciais é recomendado.

P: Posso buscar em todo o Reddit? R: Sim! Use o campo searchQuery para busca global.

P: Até que profundidade vai a árvore de comentários? R: Até qualquer profundidade configurada em commentsDepth. Padrão é 3 níveis.

P: Suporta conteúdo em português? R: Sim! A análise de sentimento suporta palavras-chave PT-BR e inglês.

🔗 Actors Relacionados