Brazilian News Aggregator avatar

Brazilian News Aggregator

Pricing

from $0.90 / 1,000 articles

Go to Apify Store
Brazilian News Aggregator

Brazilian News Aggregator

Aggregate and extract full-text news articles from 40+ major and regional Brazilian news sources. Get structured article data including title, full text, authors, publish date, and more. Select individual sources via input toggles.

Pricing

from $0.90 / 1,000 articles

Rating

0.0

(0)

Developer

Zen Studio

Zen Studio

Maintained by Community

Actor stats

0

Bookmarked

2

Total users

1

Monthly active users

2 days ago

Last modified

Share

Colete e extraia artigos completos de 41 fontes de notícias brasileiras cobrindo veículos nacionais, mídia de negócios, jornalismo político e jurídico, tecnologia e jornais regionais de 12 estados. Obtenha dados estruturados incluindo título, texto completo, autores, data de publicação e mais — atualizados a cada execução.

Sem necessidade de login. Sem chaves de API para gerenciar. Basta configurar seus filtros e começar a coletar artigos.

Por que notícias brasileiras?

O Brasil possui uma das maiores e mais dinâmicas paisagens midiáticas da América Latina, com centenas de veículos nacionais e regionais publicando milhares de artigos diariamente em português. Este actor oferece um feed único e unificado cobrindo as fontes de notícias mais importantes do Brasil, possibilitando:

  • Monitoramento de mídia: Acompanhe a cobertura jornalística da imprensa brasileira em tempo real
  • Análise de sentimento: Alimente textos estruturados de artigos em pipelines de NLP
  • Inteligência de mercado: Monitore desenvolvimentos econômicos, empresariais e políticos na maior economia da América Latina
  • Pesquisa acadêmica: Colete corpora de notícias em português em larga escala
  • Agregação de conteúdo: Construa feeds de notícias ou dashboards sobre a cobertura brasileira

Início Rápido

Padrão: Obter 100 Artigos Recentes

{
"limit": 100
}

Buscar por um Tema

{
"search_query": "inteligência artificial",
"limit": 100
}

Artigos de um Período

{
"start_date": "2026-02-01",
"end_date": "2026-02-15",
"limit": 500
}

Combinado: Busca em um Período

{
"search_query": "taxa de juros",
"start_date": "2026-02-01",
"limit": 200
}

Selecionar Fontes Específicas

{
"limit": 100,
"folha_de_spaulo": true,
"o_globo": true,
"valor_economico": true,
"extra": false,
"canal_tech": false
}

Ilimitado (Todos os Artigos Disponíveis)

{
"limit": 0
}

Parâmetros de Entrada

ParâmetroTipoObrigatórioPadrãoDescrição
search_querystringNão-Filtrar artigos por palavra-chave. Apenas artigos cujo título, conteúdo ou URL contenham esta palavra serão retornados.
start_datedateNão-Incluir apenas artigos publicados a partir desta data (AAAA-MM-DD).
end_datedateNão-Incluir apenas artigos publicados até esta data (AAAA-MM-DD).
limitintegerNão100Número máximo de artigos a retornar. Defina como 0 para ilimitado. Máx: 10.000.

Detalhes da Filtragem

  • Busca por palavra-chave compara com o título e texto completo do artigo (sem distinção de maiúsculas/minúsculas). Durante a descoberta, também pré-filtra nos metadados do título quando disponível. Artigos que não podem ser descartados (metadados ausentes) são mantidos para análise completa.
  • Filtros de data se aplicam ao campo date_publish do artigo. Artigos sem data de publicação são incluídos (não podem ser descartados).
  • Os filtros são aplicados em dois estágios: primeiro como pré-filtro nos metadados de descoberta (rápido, evita downloads desnecessários), depois como pós-filtro no conteúdo completo extraído (minucioso, verifica título + texto).
  • Ao usar search_query, o actor pode processar mais artigos em segundo plano do que a contagem final de resultados, já que os artigos são filtrados após a extração.

Seleção de Fontes

Cada fonte de notícias pode ser ativada ou desativada individualmente por um toggle. Todas as fontes estão ativadas por padrão. Defina uma fonte como false para excluí-la da execução.

Consulte a seção Fontes de Notícias Suportadas abaixo para a lista completa de chaves de fonte disponíveis.

Fontes de Notícias Suportadas

O actor monitora 41 veículos de notícias em todo o Brasil, cobrindo política, economia, direito, esportes, cultura, tecnologia e muito mais.

Nacionais

FonteDomínioDescrição
Folha de S.Paulofolha.uol.com.brJornal de maior circulação qualificada do Brasil.
O Globooglobo.globo.comGrande jornal nacional, parte do Grupo Globo.
G1g1.globo.comMaior portal de notícias do Brasil, operado pelo Grupo Globo.
R7r7.comGrande portal de notícias do Grupo Record.
Valor Econômicovalor.globo.comPrincipal jornal de negócios e finanças do Brasil.
Correio Braziliensecorreiobraziliense.com.brGrande jornal de Brasília com foco em política nacional.
Carta Capitalcartacapital.com.brRevista e site de notícias de centro-esquerda.
Metrópolesmetropoles.comSite de notícias de rápido crescimento, sediado em Brasília.
Poder360poder360.com.brVeículo nativo digital de jornalismo político.
CNN Brasilcnnbrasil.com.brEdição brasileira da CNN cobrindo notícias nacionais e internacionais.
BBC Brasilbbc.com/portugueseServiço de notícias em português brasileiro da BBC.
Nexo Jornalnexojornal.com.brJornalismo digital explicativo e baseado em dados.
Brasil de Fatobrasildefato.com.brJornalismo popular de esquerda cobrindo movimentos sociais.
Agência Brasilagenciabrasil.ebc.com.brAgência oficial de notícias do governo brasileiro (EBC).
Vejaveja.abril.com.brMaior revista semanal de notícias do Brasil.
Congresso em Fococongressoemfoco.uol.com.brVeículo especializado na cobertura do Congresso Nacional.
The Intercept Brasiltheintercept.com/brasilJornalismo investigativo focado em política e liberdades civis.

Negócios

FonteDomínioDescrição
InfoMoneyinfomoney.com.brPrincipal portal de notícias financeiras e investimentos.
Exameexame.comGrande revista de negócios cobrindo economia, tecnologia e carreira.
Época Negóciosepocanegocios.globo.comRevista de negócios do Grupo Globo.

Política e Direito

FonteDomínioDescrição
Jotajota.infoEspecializado em direito, Judiciário (STF/STJ) e políticas jurídicas.
ConJurconjur.com.brGrande site de notícias jurídicas cobrindo tribunais e legislação.
O Antagonistaoantagonista.com.brVeículo político de centro-direita.
Agência Públicaapublica.orgAgência independente sem fins lucrativos de jornalismo investigativo.

Internacional

FonteDomínioDescrição
DW Brasildw.comServiço em português brasileiro da Deutsche Welle.
RFI Brasilrfi.fr/brServiço em português brasileiro da Radio France Internationale.

Tecnologia

FonteDomínioDescrição
Olhar Digitalolhardigital.com.brGrande site brasileiro de notícias de tecnologia.
Canaltechcanaltech.com.brPrincipal portal brasileiro de notícias de tecnologia.

Revistas

FonteDomínioDescrição
Revista Piauípiaui.folha.uol.com.brPremiada revista de jornalismo literário e reportagens longas.

Rio de Janeiro

FonteDomínioDescrição
Extraextra.globo.comTabloide popular do Rio de Janeiro, parte do Grupo Globo.

Minas Gerais

FonteDomínioDescrição
Estado de Minasem.com.brMaior jornal de Minas Gerais, sediado em Belo Horizonte.

Rio Grande do Sul

FonteDomínioDescrição
Sul21sul21.com.brJornalismo digital independente de Porto Alegre.

Paraná

FonteDomínioDescrição
Tribuna do Paranátribunapr.com.brGrande jornal de Curitiba cobrindo notícias do estado.

Santa Catarina

FonteDomínioDescrição
ND Maisndmais.com.brPortal de notícias de Florianópolis cobrindo o estado.

Pará

FonteDomínioDescrição
DOL - Diário Onlinedol.com.brGrande portal de notícias de Belém cobrindo a região amazônica.

Goiás

FonteDomínioDescrição
Jornal Opçãojornalopcao.com.brGrande jornal de Goiânia cobrindo política estadual.

Maranhão

FonteDomínioDescrição
O Imparcialoimparcial.com.brJornal tradicional de São Luís.

Rio Grande do Norte

FonteDomínioDescrição
Tribuna do Nortetribunadonorte.com.brGrande jornal de Natal cobrindo notícias do estado.

Distrito Federal

FonteDomínioDescrição
Jornal de Brasíliajornaldebrasilia.com.brJornal digital cobrindo Brasília e o Distrito Federal.

Espírito Santo

FonteDomínioDescrição
Folha Vitóriafolhavitoria.com.brPortal de notícias de Vitória cobrindo o estado.

Amazonas

FonteDomínioDescrição
Amazonas Atualamazonasatual.com.brVeículo de notícias cobrindo o estado do Amazonas e Manaus.

Exemplo de Saída

Cada artigo é retornado como um objeto estruturado com texto completo e metadados:

{
"url": "https://www1.folha.uol.com.br/poder/exemplo-12345678.shtml",
"article_title": "Título de exemplo do artigo",
"authors": ["Nome do Autor"],
"date_publish": "2026-02-15T10:30:00",
"article_description": "Breve resumo do conteúdo do artigo.",
"text": "Texto completo do artigo extraído da página...",
"language": "pt",
"image_url": "https://f.i.uol.com.br/image.jpg",
"source_domain": "www1.folha.uol.com.br",
"error": null
}

Campos de Saída

CampoTipoDescrição
urlstringURL completa do artigo
article_titlestringTítulo do artigo
authorsarrayLista de nomes dos autores
date_publishstringData de publicação (ISO 8601)
article_descriptionstringResumo / meta descrição do artigo
textstringTexto completo do artigo
languagestringCódigo do idioma (ex.: pt)
image_urlstringURL da imagem principal do artigo
source_domainstringDomínio da fonte de notícias
errorstringMensagem de erro, ou null se bem-sucedido

Artigos com Falha

Artigos que não podem ser extraídos (paywall, timeout, etc.) são retornados com um erro:

{
"url": "https://example.com/article",
"error": "Failed to download article"
}

Preços: Pague Conforme o Uso

Este actor utiliza o modelo de cobrança por evento da Apify.

EventoCustoDescrição
Início do actor$0,0002Cobrado uma vez por execução
Artigo$0,99 / 1.000 artigosCobrado por artigo extraído com sucesso

Detalhes importantes de cobrança:

  • Apenas artigos bem-sucedidos são cobrados: Extrações com falha são gratuitas
  • Sem compromisso mínimo: Pague apenas pelo que usar
  • Controles de orçamento: Defina limites de gastos na sua conta Apify
  • Descontos disponíveis: Membros Gold, Silver e Bronze da Apify recebem descontos.

Integração via API

Chamada via API da Apify

curl -X POST "https://api.apify.com/v2/acts/zen-studio~br-news-collector/runs?token=YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{"limit": 100, "search_query": "taxa de juros", "start_date": "2026-02-01"}'

Python

from apify_client import ApifyClient
client = ApifyClient("YOUR_API_TOKEN")
run = client.actor("zen-studio/br-news-collector").call(
run_input={
"limit": 100,
"search_query": "taxa de juros",
"start_date": "2026-02-01",
}
)
for item in client.dataset(run["defaultDatasetId"]).iterate_items():
if item.get("error"):
continue
print(f"[{item['source_domain']}] {item['article_title']}")
print(f" {item['url']}")
print(f" Publicado: {item['date_publish']}")
print()

JavaScript / Node.js

import { ApifyClient } from 'apify-client';
const client = new ApifyClient({ token: 'YOUR_API_TOKEN' });
const run = await client.actor('zen-studio/br-news-collector').call({
limit: 100,
search_query: 'taxa de juros',
start_date: '2026-02-01',
});
const { items } = await client.dataset(run.defaultDatasetId).listItems();
items
.filter(item => !item.error)
.forEach(item => {
console.log(`[${item.source_domain}] ${item.article_title}`);
console.log(` ${item.url}`);
});

Casos de Uso

  • Dashboards de monitoramento de notícias: Agregue manchetes da imprensa brasileira em um feed único para jornalistas, analistas ou equipes de RP
  • NLP e análise de sentimento: Extraia artigos completos em escala para treinar modelos de linguagem ou executar classificadores de sentimento em conteúdo em português
  • Inteligência competitiva: Acompanhe a cobertura da imprensa sobre empresas, marcas ou setores na mídia brasileira
  • Pesquisa acadêmica: Construa corpora de notícias em português para linguística, ciência política ou estudos de mídia
  • Risco e compliance: Monitore desenvolvimentos políticos e econômicos que possam impactar operações empresariais no Brasil

Uso Avançado

Monitoramento Programado

Configure execuções recorrentes para construir um arquivo contínuo de notícias:

  1. Vá para a aba Schedules do actor
  2. Crie um novo agendamento (ex.: a cada 6 horas)
  3. Configure sua entrada com o limite desejado
  4. Os resultados se acumulam em datasets para análise histórica

Integração com Google Sheets

Exporte resultados diretamente para o Google Sheets:

  1. Execute o actor
  2. Vá para o dataset
  3. Clique em Export > Google Sheets

Detalhes Técnicos

Como Funciona

  1. Descoberta: O actor consulta as fontes de notícias para encontrar URLs de artigos
  2. Pré-filtragem: Artigos são filtrados antecipadamente com base nos metadados de descoberta (data, palavra-chave no título) para evitar downloads desnecessários
  3. Deduplicação: URLs duplicadas entre fontes são removidas, e artigos são intercalados em round-robin entre fontes para distribuição justa
  4. Extração: Cada artigo é baixado e analisado em lotes para extrair conteúdo estruturado (título, texto, autores, data, etc.)
  5. Pós-filtragem: Artigos extraídos são filtrados novamente no conteúdo completo (data + busca por palavra-chave no título e texto)
  6. Saída: Os resultados são enviados para o seu dataset na Apify

Desempenho

  • Processamento em lotes: Execuções grandes são automaticamente divididas em partes para confiabilidade
  • Tolerância a falhas: Se uma fonte ou lote falhar, as demais continuam sendo processadas
  • Memória: 256-512 MB por execução

Tratamento de Erros

Tipo de ErroComportamento
Fonte indisponívelIgnorada, outras fontes continuam
Falha no download do artigoRetornado com mensagem de erro
Rate limit (429)Retry automático com backoff exponencial
Erro do servidor (5xx)Retry automático (3 tentativas)

Exportação de Dados

Os resultados podem ser exportados em múltiplos formatos:

  • JSON - Dados estruturados completos
  • CSV - Achatado para planilhas
  • Excel - Download direto em .xlsx
  • XML - Para integração com sistemas legados
# JSON
curl "https://api.apify.com/v2/datasets/DATASET_ID/items?format=json&token=YOUR_TOKEN"
# CSV
curl "https://api.apify.com/v2/datasets/DATASET_ID/items?format=csv&token=YOUR_TOKEN"

Perguntas Frequentes

Quantos artigos cada execução retorna?

Depende do que as fontes publicaram recentemente. Uma execução típica com limit: 0 retorna de algumas centenas a alguns milhares de artigos de todas as fontes.

Com que frequência a lista de fontes é atualizada?

As fontes são curadas e atualizadas periodicamente. Se quiser sugerir uma fonte, abra uma issue no repositório do actor.

O actor armazena artigos históricos?

Não. Cada execução descobre artigos atualmente disponíveis nos feeds das fontes. Para construir um arquivo histórico, configure execuções programadas.

Em que idioma estão os artigos?

A maioria dos artigos está em português. BBC Brasil, DW Brasil e RFI Brasil fornecem cobertura internacional em português. O idioma do artigo é indicado no campo language.

Posso filtrar por palavra-chave ou data?

Sim. Use search_query para filtrar artigos por palavra-chave (busca no título e texto completo). Use start_date e end_date para restringir artigos a um período. Esses filtros podem ser combinados.

Posso filtrar por fonte?

Sim. Cada fonte tem um toggle na entrada (ex.: folha_de_spaulo, o_globo, valor_economico). Defina qualquer fonte como false para excluí-la. Todas as fontes estão ativadas por padrão. Você também pode filtrar o dataset de saída por source_domain após a execução.

O que acontece se uma fonte de notícias ficar offline?

O actor continua processando todas as outras fontes. Fontes com falha são registradas nos logs, mas não interrompem a execução.

Por que o actor processa mais artigos do que meu limite ao usar busca?

Quando search_query é definido, o actor precisa baixar e extrair artigos para verificar o conteúdo completo contra sua palavra-chave. O limit controla quantos artigos correspondentes você recebe, mas mais artigos podem ser processados nos bastidores.

Este actor extrai artigos de notícias publicamente disponíveis em páginas web públicas. Ele não contorna paywalls, autenticação ou restrições de acesso. Use os dados em conformidade com as leis aplicáveis e os termos de serviço dos respectivos veículos de comunicação.


Precisa de ajuda? Abra uma issue no repositório do actor ou entre em contato pelo suporte no Apify Console.