Brazilian News Aggregator
Pricing
from $0.90 / 1,000 articles
Brazilian News Aggregator
Aggregate and extract full-text news articles from 40+ major and regional Brazilian news sources. Get structured article data including title, full text, authors, publish date, and more. Select individual sources via input toggles.
Pricing
from $0.90 / 1,000 articles
Rating
0.0
(0)
Developer

Zen Studio
Actor stats
0
Bookmarked
2
Total users
1
Monthly active users
2 days ago
Last modified
Categories
Share
Colete e extraia artigos completos de 41 fontes de notícias brasileiras cobrindo veículos nacionais, mídia de negócios, jornalismo político e jurídico, tecnologia e jornais regionais de 12 estados. Obtenha dados estruturados incluindo título, texto completo, autores, data de publicação e mais — atualizados a cada execução.
Sem necessidade de login. Sem chaves de API para gerenciar. Basta configurar seus filtros e começar a coletar artigos.
Por que notícias brasileiras?
O Brasil possui uma das maiores e mais dinâmicas paisagens midiáticas da América Latina, com centenas de veículos nacionais e regionais publicando milhares de artigos diariamente em português. Este actor oferece um feed único e unificado cobrindo as fontes de notícias mais importantes do Brasil, possibilitando:
- Monitoramento de mídia: Acompanhe a cobertura jornalística da imprensa brasileira em tempo real
- Análise de sentimento: Alimente textos estruturados de artigos em pipelines de NLP
- Inteligência de mercado: Monitore desenvolvimentos econômicos, empresariais e políticos na maior economia da América Latina
- Pesquisa acadêmica: Colete corpora de notícias em português em larga escala
- Agregação de conteúdo: Construa feeds de notícias ou dashboards sobre a cobertura brasileira
Início Rápido
Padrão: Obter 100 Artigos Recentes
{"limit": 100}
Buscar por um Tema
{"search_query": "inteligência artificial","limit": 100}
Artigos de um Período
{"start_date": "2026-02-01","end_date": "2026-02-15","limit": 500}
Combinado: Busca em um Período
{"search_query": "taxa de juros","start_date": "2026-02-01","limit": 200}
Selecionar Fontes Específicas
{"limit": 100,"folha_de_spaulo": true,"o_globo": true,"valor_economico": true,"extra": false,"canal_tech": false}
Ilimitado (Todos os Artigos Disponíveis)
{"limit": 0}
Parâmetros de Entrada
| Parâmetro | Tipo | Obrigatório | Padrão | Descrição |
|---|---|---|---|---|
search_query | string | Não | - | Filtrar artigos por palavra-chave. Apenas artigos cujo título, conteúdo ou URL contenham esta palavra serão retornados. |
start_date | date | Não | - | Incluir apenas artigos publicados a partir desta data (AAAA-MM-DD). |
end_date | date | Não | - | Incluir apenas artigos publicados até esta data (AAAA-MM-DD). |
limit | integer | Não | 100 | Número máximo de artigos a retornar. Defina como 0 para ilimitado. Máx: 10.000. |
Detalhes da Filtragem
- Busca por palavra-chave compara com o título e texto completo do artigo (sem distinção de maiúsculas/minúsculas). Durante a descoberta, também pré-filtra nos metadados do título quando disponível. Artigos que não podem ser descartados (metadados ausentes) são mantidos para análise completa.
- Filtros de data se aplicam ao campo
date_publishdo artigo. Artigos sem data de publicação são incluídos (não podem ser descartados). - Os filtros são aplicados em dois estágios: primeiro como pré-filtro nos metadados de descoberta (rápido, evita downloads desnecessários), depois como pós-filtro no conteúdo completo extraído (minucioso, verifica título + texto).
- Ao usar
search_query, o actor pode processar mais artigos em segundo plano do que a contagem final de resultados, já que os artigos são filtrados após a extração.
Seleção de Fontes
Cada fonte de notícias pode ser ativada ou desativada individualmente por um toggle. Todas as fontes estão ativadas por padrão. Defina uma fonte como false para excluí-la da execução.
Consulte a seção Fontes de Notícias Suportadas abaixo para a lista completa de chaves de fonte disponíveis.
Fontes de Notícias Suportadas
O actor monitora 41 veículos de notícias em todo o Brasil, cobrindo política, economia, direito, esportes, cultura, tecnologia e muito mais.
Nacionais
| Fonte | Domínio | Descrição |
|---|---|---|
| Folha de S.Paulo | folha.uol.com.br | Jornal de maior circulação qualificada do Brasil. |
| O Globo | oglobo.globo.com | Grande jornal nacional, parte do Grupo Globo. |
| G1 | g1.globo.com | Maior portal de notícias do Brasil, operado pelo Grupo Globo. |
| R7 | r7.com | Grande portal de notícias do Grupo Record. |
| Valor Econômico | valor.globo.com | Principal jornal de negócios e finanças do Brasil. |
| Correio Braziliense | correiobraziliense.com.br | Grande jornal de Brasília com foco em política nacional. |
| Carta Capital | cartacapital.com.br | Revista e site de notícias de centro-esquerda. |
| Metrópoles | metropoles.com | Site de notícias de rápido crescimento, sediado em Brasília. |
| Poder360 | poder360.com.br | Veículo nativo digital de jornalismo político. |
| CNN Brasil | cnnbrasil.com.br | Edição brasileira da CNN cobrindo notícias nacionais e internacionais. |
| BBC Brasil | bbc.com/portuguese | Serviço de notícias em português brasileiro da BBC. |
| Nexo Jornal | nexojornal.com.br | Jornalismo digital explicativo e baseado em dados. |
| Brasil de Fato | brasildefato.com.br | Jornalismo popular de esquerda cobrindo movimentos sociais. |
| Agência Brasil | agenciabrasil.ebc.com.br | Agência oficial de notícias do governo brasileiro (EBC). |
| Veja | veja.abril.com.br | Maior revista semanal de notícias do Brasil. |
| Congresso em Foco | congressoemfoco.uol.com.br | Veículo especializado na cobertura do Congresso Nacional. |
| The Intercept Brasil | theintercept.com/brasil | Jornalismo investigativo focado em política e liberdades civis. |
Negócios
| Fonte | Domínio | Descrição |
|---|---|---|
| InfoMoney | infomoney.com.br | Principal portal de notícias financeiras e investimentos. |
| Exame | exame.com | Grande revista de negócios cobrindo economia, tecnologia e carreira. |
| Época Negócios | epocanegocios.globo.com | Revista de negócios do Grupo Globo. |
Política e Direito
| Fonte | Domínio | Descrição |
|---|---|---|
| Jota | jota.info | Especializado em direito, Judiciário (STF/STJ) e políticas jurídicas. |
| ConJur | conjur.com.br | Grande site de notícias jurídicas cobrindo tribunais e legislação. |
| O Antagonista | oantagonista.com.br | Veículo político de centro-direita. |
| Agência Pública | apublica.org | Agência independente sem fins lucrativos de jornalismo investigativo. |
Internacional
| Fonte | Domínio | Descrição |
|---|---|---|
| DW Brasil | dw.com | Serviço em português brasileiro da Deutsche Welle. |
| RFI Brasil | rfi.fr/br | Serviço em português brasileiro da Radio France Internationale. |
Tecnologia
| Fonte | Domínio | Descrição |
|---|---|---|
| Olhar Digital | olhardigital.com.br | Grande site brasileiro de notícias de tecnologia. |
| Canaltech | canaltech.com.br | Principal portal brasileiro de notícias de tecnologia. |
Revistas
| Fonte | Domínio | Descrição |
|---|---|---|
| Revista Piauí | piaui.folha.uol.com.br | Premiada revista de jornalismo literário e reportagens longas. |
Rio de Janeiro
| Fonte | Domínio | Descrição |
|---|---|---|
| Extra | extra.globo.com | Tabloide popular do Rio de Janeiro, parte do Grupo Globo. |
Minas Gerais
| Fonte | Domínio | Descrição |
|---|---|---|
| Estado de Minas | em.com.br | Maior jornal de Minas Gerais, sediado em Belo Horizonte. |
Rio Grande do Sul
| Fonte | Domínio | Descrição |
|---|---|---|
| Sul21 | sul21.com.br | Jornalismo digital independente de Porto Alegre. |
Paraná
| Fonte | Domínio | Descrição |
|---|---|---|
| Tribuna do Paraná | tribunapr.com.br | Grande jornal de Curitiba cobrindo notícias do estado. |
Santa Catarina
| Fonte | Domínio | Descrição |
|---|---|---|
| ND Mais | ndmais.com.br | Portal de notícias de Florianópolis cobrindo o estado. |
Pará
| Fonte | Domínio | Descrição |
|---|---|---|
| DOL - Diário Online | dol.com.br | Grande portal de notícias de Belém cobrindo a região amazônica. |
Goiás
| Fonte | Domínio | Descrição |
|---|---|---|
| Jornal Opção | jornalopcao.com.br | Grande jornal de Goiânia cobrindo política estadual. |
Maranhão
| Fonte | Domínio | Descrição |
|---|---|---|
| O Imparcial | oimparcial.com.br | Jornal tradicional de São Luís. |
Rio Grande do Norte
| Fonte | Domínio | Descrição |
|---|---|---|
| Tribuna do Norte | tribunadonorte.com.br | Grande jornal de Natal cobrindo notícias do estado. |
Distrito Federal
| Fonte | Domínio | Descrição |
|---|---|---|
| Jornal de Brasília | jornaldebrasilia.com.br | Jornal digital cobrindo Brasília e o Distrito Federal. |
Espírito Santo
| Fonte | Domínio | Descrição |
|---|---|---|
| Folha Vitória | folhavitoria.com.br | Portal de notícias de Vitória cobrindo o estado. |
Amazonas
| Fonte | Domínio | Descrição |
|---|---|---|
| Amazonas Atual | amazonasatual.com.br | Veículo de notícias cobrindo o estado do Amazonas e Manaus. |
Exemplo de Saída
Cada artigo é retornado como um objeto estruturado com texto completo e metadados:
{"url": "https://www1.folha.uol.com.br/poder/exemplo-12345678.shtml","article_title": "Título de exemplo do artigo","authors": ["Nome do Autor"],"date_publish": "2026-02-15T10:30:00","article_description": "Breve resumo do conteúdo do artigo.","text": "Texto completo do artigo extraído da página...","language": "pt","image_url": "https://f.i.uol.com.br/image.jpg","source_domain": "www1.folha.uol.com.br","error": null}
Campos de Saída
| Campo | Tipo | Descrição |
|---|---|---|
url | string | URL completa do artigo |
article_title | string | Título do artigo |
authors | array | Lista de nomes dos autores |
date_publish | string | Data de publicação (ISO 8601) |
article_description | string | Resumo / meta descrição do artigo |
text | string | Texto completo do artigo |
language | string | Código do idioma (ex.: pt) |
image_url | string | URL da imagem principal do artigo |
source_domain | string | Domínio da fonte de notícias |
error | string | Mensagem de erro, ou null se bem-sucedido |
Artigos com Falha
Artigos que não podem ser extraídos (paywall, timeout, etc.) são retornados com um erro:
{"url": "https://example.com/article","error": "Failed to download article"}
Preços: Pague Conforme o Uso
Este actor utiliza o modelo de cobrança por evento da Apify.
| Evento | Custo | Descrição |
|---|---|---|
| Início do actor | $0,0002 | Cobrado uma vez por execução |
| Artigo | $0,99 / 1.000 artigos | Cobrado por artigo extraído com sucesso |
Detalhes importantes de cobrança:
- Apenas artigos bem-sucedidos são cobrados: Extrações com falha são gratuitas
- Sem compromisso mínimo: Pague apenas pelo que usar
- Controles de orçamento: Defina limites de gastos na sua conta Apify
- Descontos disponíveis: Membros Gold, Silver e Bronze da Apify recebem descontos.
Integração via API
Chamada via API da Apify
curl -X POST "https://api.apify.com/v2/acts/zen-studio~br-news-collector/runs?token=YOUR_API_TOKEN" \-H "Content-Type: application/json" \-d '{"limit": 100, "search_query": "taxa de juros", "start_date": "2026-02-01"}'
Python
from apify_client import ApifyClientclient = ApifyClient("YOUR_API_TOKEN")run = client.actor("zen-studio/br-news-collector").call(run_input={"limit": 100,"search_query": "taxa de juros","start_date": "2026-02-01",})for item in client.dataset(run["defaultDatasetId"]).iterate_items():if item.get("error"):continueprint(f"[{item['source_domain']}] {item['article_title']}")print(f" {item['url']}")print(f" Publicado: {item['date_publish']}")print()
JavaScript / Node.js
import { ApifyClient } from 'apify-client';const client = new ApifyClient({ token: 'YOUR_API_TOKEN' });const run = await client.actor('zen-studio/br-news-collector').call({limit: 100,search_query: 'taxa de juros',start_date: '2026-02-01',});const { items } = await client.dataset(run.defaultDatasetId).listItems();items.filter(item => !item.error).forEach(item => {console.log(`[${item.source_domain}] ${item.article_title}`);console.log(` ${item.url}`);});
Casos de Uso
- Dashboards de monitoramento de notícias: Agregue manchetes da imprensa brasileira em um feed único para jornalistas, analistas ou equipes de RP
- NLP e análise de sentimento: Extraia artigos completos em escala para treinar modelos de linguagem ou executar classificadores de sentimento em conteúdo em português
- Inteligência competitiva: Acompanhe a cobertura da imprensa sobre empresas, marcas ou setores na mídia brasileira
- Pesquisa acadêmica: Construa corpora de notícias em português para linguística, ciência política ou estudos de mídia
- Risco e compliance: Monitore desenvolvimentos políticos e econômicos que possam impactar operações empresariais no Brasil
Uso Avançado
Monitoramento Programado
Configure execuções recorrentes para construir um arquivo contínuo de notícias:
- Vá para a aba Schedules do actor
- Crie um novo agendamento (ex.: a cada 6 horas)
- Configure sua entrada com o limite desejado
- Os resultados se acumulam em datasets para análise histórica
Integração com Google Sheets
Exporte resultados diretamente para o Google Sheets:
- Execute o actor
- Vá para o dataset
- Clique em Export > Google Sheets
Detalhes Técnicos
Como Funciona
- Descoberta: O actor consulta as fontes de notícias para encontrar URLs de artigos
- Pré-filtragem: Artigos são filtrados antecipadamente com base nos metadados de descoberta (data, palavra-chave no título) para evitar downloads desnecessários
- Deduplicação: URLs duplicadas entre fontes são removidas, e artigos são intercalados em round-robin entre fontes para distribuição justa
- Extração: Cada artigo é baixado e analisado em lotes para extrair conteúdo estruturado (título, texto, autores, data, etc.)
- Pós-filtragem: Artigos extraídos são filtrados novamente no conteúdo completo (data + busca por palavra-chave no título e texto)
- Saída: Os resultados são enviados para o seu dataset na Apify
Desempenho
- Processamento em lotes: Execuções grandes são automaticamente divididas em partes para confiabilidade
- Tolerância a falhas: Se uma fonte ou lote falhar, as demais continuam sendo processadas
- Memória: 256-512 MB por execução
Tratamento de Erros
| Tipo de Erro | Comportamento |
|---|---|
| Fonte indisponível | Ignorada, outras fontes continuam |
| Falha no download do artigo | Retornado com mensagem de erro |
| Rate limit (429) | Retry automático com backoff exponencial |
| Erro do servidor (5xx) | Retry automático (3 tentativas) |
Exportação de Dados
Os resultados podem ser exportados em múltiplos formatos:
- JSON - Dados estruturados completos
- CSV - Achatado para planilhas
- Excel - Download direto em .xlsx
- XML - Para integração com sistemas legados
# JSONcurl "https://api.apify.com/v2/datasets/DATASET_ID/items?format=json&token=YOUR_TOKEN"# CSVcurl "https://api.apify.com/v2/datasets/DATASET_ID/items?format=csv&token=YOUR_TOKEN"
Perguntas Frequentes
Quantos artigos cada execução retorna?
Depende do que as fontes publicaram recentemente. Uma execução típica com limit: 0 retorna de algumas centenas a alguns milhares de artigos de todas as fontes.
Com que frequência a lista de fontes é atualizada?
As fontes são curadas e atualizadas periodicamente. Se quiser sugerir uma fonte, abra uma issue no repositório do actor.
O actor armazena artigos históricos?
Não. Cada execução descobre artigos atualmente disponíveis nos feeds das fontes. Para construir um arquivo histórico, configure execuções programadas.
Em que idioma estão os artigos?
A maioria dos artigos está em português. BBC Brasil, DW Brasil e RFI Brasil fornecem cobertura internacional em português. O idioma do artigo é indicado no campo language.
Posso filtrar por palavra-chave ou data?
Sim. Use search_query para filtrar artigos por palavra-chave (busca no título e texto completo). Use start_date e end_date para restringir artigos a um período. Esses filtros podem ser combinados.
Posso filtrar por fonte?
Sim. Cada fonte tem um toggle na entrada (ex.: folha_de_spaulo, o_globo, valor_economico). Defina qualquer fonte como false para excluí-la. Todas as fontes estão ativadas por padrão. Você também pode filtrar o dataset de saída por source_domain após a execução.
O que acontece se uma fonte de notícias ficar offline?
O actor continua processando todas as outras fontes. Fontes com falha são registradas nos logs, mas não interrompem a execução.
Por que o actor processa mais artigos do que meu limite ao usar busca?
Quando search_query é definido, o actor precisa baixar e extrair artigos para verificar o conteúdo completo contra sua palavra-chave. O limit controla quantos artigos correspondentes você recebe, mas mais artigos podem ser processados nos bastidores.
Aviso Legal
Este actor extrai artigos de notícias publicamente disponíveis em páginas web públicas. Ele não contorna paywalls, autenticação ou restrições de acesso. Use os dados em conformidade com as leis aplicáveis e os termos de serviço dos respectivos veículos de comunicação.
Precisa de ajuda? Abra uma issue no repositório do actor ou entre em contato pelo suporte no Apify Console.