Meta Threads 爬蟲 - 貼文、個人檔案與海巡 avatar

Meta Threads 爬蟲 - 貼文、個人檔案與海巡

Pricing

from $4.00 / 1,000 results

Go to Apify Store
Meta Threads 爬蟲 - 貼文、個人檔案與海巡

Meta Threads 爬蟲 - 貼文、個人檔案與海巡

從 Threads 擷取貼文與完整互動數據(按讚、留言、轉發、引用、分享、觀看),以及作者公開資料(追蹤者、驗證狀態、簡介)。依用戶、標籤或關鍵字搜尋,可加日期範圍。適用於 Threads 海巡、社群媒體監控、網紅開發和競品分析。無需登入。

Pricing

from $4.00 / 1,000 results

Rating

3.9

(2)

Developer

Rush

Rush

Maintained by Community

Actor stats

14

Bookmarked

275

Total users

22

Monthly active users

11 days ago

Last modified

Share

Meta Threads 爬蟲 - 貼文、個人資料與搜尋

這個 Actor 可從 Threads 擷取公開貼文資料,包含:

  • 貼文內容與時間
  • 互動數據(按讚、留言、轉發、引用、分享、觀看)
  • 作者公開資料(名稱、簡介、追蹤者數、驗證狀態、Fediverse 旗標等)
  • 新增:贊助合作識別、引用/轉發關係、回覆脈絡、無障礙圖片文字、媒體尺寸、高解析度頭像

支援三種模式:

  • user:用戶貼文
  • keyword:標籤頁結果
  • search:關鍵字搜尋(含排序)

無需登入,可匯出 JSON / CSV / Excel。

你可以拿到什麼資料

作者資料

  • username, display_name
  • bio, profile_url, profile_pic_url, profile_pic_hd_url(高解析度頭像)
  • followers_count, is_verified, fediverse_enabled(是否啟用 ActivityPub)
  • profile_tagspodcast_namepodcast_urlpodcast_platform
  • emails, phones, bio_links, external_links(由公開資料擷取)

貼文資料

  • post_url, post_code, text_content
  • created_at, created_at_timestamp, created_at_display
  • like_count, reply_count, repost_count, quote_count
  • share_count, view_count
  • has_media, media_type, media_url, media_urls
  • media_width, media_height(媒體原始尺寸)
  • hashtags, mentions, urls
  • is_pinned, is_edited
  • is_paid_partnership(是否為贊助合作 / 付費合作)
  • accessibility_caption(圖片替代文字 / 無障礙說明)
  • scraped_at

對話脈絡(每篇貼文)

  • is_reply, reply_to_username, reply_control(回覆貼文相關)
  • is_quote_post, quoted_post_url(引用其他貼文)
  • is_repost, reposted_post_url(轉發其他貼文)
  • search_keyword
  • search_filter
  • keyword_match

為什麼選這個 Actor?

核心能力(多數買家最關心的)

你需要本 actor
6 個完整互動數據(按讚、留言、轉發、引用、分享、觀看)
依用戶 / 標籤 / 關鍵字搜尋
日期範圍研究(start_date / end_date
一次最多批次 20 個用戶或 20 個關鍵字
不需登入 / 不需 sessionid

進階分析(深度功能)

功能用途
贊助合作 / 付費合作旗標分離自然內容與業配內容
引用 / 轉發來源網址跨貼文繪製對話圖譜
回覆脈絡(對象用戶 + 互動權限)重建對話樹結構
圖片無障礙說明內容歸檔與 a11y 分析
高解析度頭像高階品牌研究
Fediverse / ActivityPub 旗標跨平台觸及分析

模式快速選擇

  • 想抓某個帳號的歷史貼文 → mode: "user"
  • 想追蹤某 hashtag 的最新貼文 → mode: "keyword"
  • 想做 Threads 海巡(定時監控關鍵字、找潛在客戶 / 品牌提及)→ mode: "search" + search_filter: "recent"
  • 想看某話題的高互動精選 → mode: "search" + search_filter: "top"
  • 想抓某段日期內的貼文 → mode: "search" + start_date / end_date

輸入參數

參數類型說明
modestringuserkeywordsearch
usernamesarray用戶清單(user 模式使用,最多 20)
keywordsarray關鍵字或標籤清單(keyword / search 使用,最多 20)
search_filterstring排序方式:top(熱門)或 recent(最新);適用於 keywordsearch
start_datestring開始日期(僅 search,支援 YYYY-MM-DD7 days
end_datestring結束日期(僅 search
max_postsinteger每個目標的貼文數(10–500,預設 200)

日期篩選只支援 search 模式;若用在 userkeyword,執行會直接停止並提示。

Threads 海巡 — 定時關鍵字監控

如果你要做關鍵字定時監控(例如 lead-gen、品牌提及追蹤、競品動態觀察),用 mode: "search" 配合 search_filter: "recent"

{
"mode": "search",
"keywords": ["YOUR_KEYWORD_1", "YOUR_KEYWORD_2"],
"search_filter": "recent",
"max_posts": 30
}

執行方式

  1. 設定 Apify Schedule — 用 Apify Schedules 設 cron 表達式(例如每 3 小時 0 */3 * * *)讓 actor 自動定時執行。
  2. 每次執行把最新貼文寫入 Apify Dataset — 每筆貼文都附帶唯一識別碼與發布時間戳,方便下游處理。
  3. 下游處理(你的部分)
    • 用每篇貼文的唯一識別碼對照你的資料庫去除已處理過的內容
    • 視需要用發布時間戳篩選你關心的時間窗口
    • 新貼文觸發你的自動化(AI 擬回覆、Slack / Email 通知等)
    • 寫回你的資料庫 / Google Sheet

可以用 Apify Webhook 把每次執行結果推到 Make / Zapier / n8n / 你自家的 endpoint 串接後續流程。

提醒

  • 每次執行會回傳當下最新一批符合關鍵字的貼文。如果關鍵字非常熱門(每分鐘都有新貼文),單次執行可能無法涵蓋你完整的輪詢區間——這時建議縮短輪詢週期(例如改成每 30 分鐘跑一次)。
  • 我們不做跨 run 去重——讓你完全控制資料保留策略,跟你自家 DB 的 schema 對齊。

使用範例

1) 用戶貼文

{
"mode": "user",
"usernames": ["zuck"],
"max_posts": 200
}

2) 標籤模式

{
"mode": "keyword",
"keywords": ["AI", "tech", "#startup"],
"max_posts": 200
}

3) 關鍵字搜尋(熱門)

{
"mode": "search",
"keywords": ["AI automation"],
"search_filter": "top",
"max_posts": 100
}

4) 關鍵字搜尋(含日期)

{
"mode": "search",
"keywords": ["台海動態"],
"search_filter": "recent",
"start_date": "2026-01-01",
"end_date": "2026-02-28",
"max_posts": 200
}

5) 多用戶批次(KOL / 競品分析)

{
"mode": "user",
"usernames": ["competitor_a", "competitor_b", "competitor_c"],
"max_posts": 300
}

一次拉多位帳號的完整貼文歷史與互動數據,方便橫向比較。

範例輸出(單筆貼文)

{
"post_url": "https://www.threads.com/@zuck/post/DTa3-B1EbTp",
"post_code": "DTa3-B1EbTp",
"text_content": "we're establishing a new top-level initiative...",
"created_at": "2026-01-12T18:00:30+00:00",
"created_at_display": "2026-01-12 18:00 UTC",
"created_at_timestamp": 1768240830,
"like_count": 2684,
"reply_count": 810,
"repost_count": 129,
"quote_count": 42,
"share_count": 221,
"view_count": 416512,
"has_media": false,
"media_type": "text",
"media_url": "",
"media_urls": [],
"media_width": null,
"media_height": null,
"hashtags": [],
"mentions": [],
"urls": [],
"is_pinned": false,
"is_edited": false,
"is_paid_partnership": false,
"accessibility_caption": "",
"is_reply": false,
"reply_to_username": "",
"reply_control": "everyone",
"is_quote_post": false,
"quoted_post_url": "",
"is_repost": false,
"reposted_post_url": "",
"scraped_at": "2026-04-25T10:00:00+00:00",
"username": "zuck",
"display_name": "Mark Zuckerberg",
"profile_url": "https://www.threads.com/@zuck",
"is_verified": true,
"followers_count": 5450146,
"bio": "Mostly superintelligence and MMA takes",
"profile_pic_url": "https://...",
"profile_pic_hd_url": "https://...",
"fediverse_enabled": true,
"external_links": ["https://zuck.com"],
"emails": [],
"phones": [],
"bio_links": [],
"profile_tags": ["AI", "Tech"],
"podcast_name": "",
"podcast_url": "",
"podcast_platform": ""
}

範例 2:含贊助合作 + 引用 + 回覆的貼文

展示「對話脈絡」與「贊助識別」欄位同時有值的場景:

{
"post_url": "https://www.threads.com/@nike/post/EXMPL_REPLY01",
"post_code": "EXMPL_REPLY01",
"text_content": "超喜歡這次合作款,明天就來穿!",
"created_at": "2026-04-22T14:30:00+00:00",
"like_count": 412,
"reply_count": 23,
"repost_count": 9,
"view_count": 18750,
"is_paid_partnership": true,
"accessibility_caption": "紅色運動鞋放在木質桌面上",
"media_width": 1200,
"media_height": 1600,
"is_reply": true,
"reply_to_username": "athleteX",
"reply_control": "followers_only",
"is_quote_post": true,
"quoted_post_url": "https://www.threads.com/@brandY/post/QUOTED_ORIG",
"is_repost": false,
"reposted_post_url": "",
"username": "nike",
"display_name": "Nike",
"is_verified": true,
"followers_count": 1250000,
"fediverse_enabled": true
}

重要說明

  • max_posts 是上限,不是保證值。
  • share_countview_count 可能為 null(公開資料當下未提供或貼文過新)。
  • keyword_match 是「是否直接包含關鍵字」的輔助欄位,方便你在下游自行過濾。
  • 標籤模式與搜尋模式的作者資料屬於 best-effort 補齊,不保證每筆都完整。

FAQ

Q: 支援含 . 的用戶名嗎?

A: 支援。格式上可接受像 user.name 這類用戶名。

Q: 為什麼搜尋結果看起來不夠精準?

A: 搜尋結果可能包含廣義相關或不相關內容,不一定是精準字面匹配。可使用 keyword_match 欄位做二次篩選。

Q: 為什麼我設定 200,但拿到更少?

A: 平台公開介面可取得的內容本來就有上限與波動,實際結果會依查詢條件與當下可見資料而變化。

Q: 為什麼有時候 biofollowers_count 是空值?

A: 這些欄位來自公開作者資料補齊流程;若當下取不到公開資料,欄位可能為空或 0。

A: 若作者主動在公開簡介中標示電子郵件、電話或網址,系統會一併輸出。電話部分支援台灣本地格式(09xx 手機與 02-08 區碼市話)。請在使用前確認你的用途符合當地法規與隱私規範;若不需要可在下游忽略這些欄位。

Q: 在 Apify 怎麼看完整欄位?

A: 在 Dataset 頁面由 Preview 切換到 All fields,即可查看完整欄位與空值。

Q: 支援批次抓取多個用戶或關鍵字嗎?

A: 支援。一次最多 20 個用戶或 20 個關鍵字,會依序處理並合併到同一個 dataset。

Q: max_posts 為什麼最少要 10?

A: 為了維持服務品質與穩定性,最低設定為 10。低於 10 的請求會在輸入驗證階段被擋下,不會啟動執行(也不會計費)。

Q: 怎麼分辨贊助合作 / 業配貼文?

A: 每筆貼文都有 is_paid_partnership 欄位,Threads 標記為付費合作或品牌合作的貼文會顯示 true。可用此欄位過濾自然內容與業配內容。

Q: 可以看到引用貼文與被轉發的原貼文嗎?

A: 可以。is_quote_post + quoted_post_url 標示引用,is_repost + reposted_post_url 標示轉發。可以拿這個 URL 再跑一次 actor 抓引用源頭。

Q: 怎麼分辨主貼文與回覆?

A: is_replytrue 表示這是一則回覆;reply_to_username 顯示回覆對象;reply_control 顯示誰可以回覆(everyone / followers_only / mentioned_only)。

Q: 圖片有 alt 文字(無障礙說明)嗎?媒體尺寸?

A: 若作者提供圖片描述,會出現在 accessibility_caption。媒體原始解析度由 media_width / media_height(像素)提供。

Q: 高解析度頭像?Fediverse?

A: profile_pic_hd_url 提供作者高解析度頭像(如有)。fediverse_enabled 顯示作者是否啟用 Threads 的 Fediverse / ActivityPub 共享功能。

Alternative: Threads API

Important: 本工具以「不登入」方式擷取公開資料,因此可見範圍受公開介面限制。

如果你需要更可控、可授權的資料存取(例如自家應用整合),可評估官方 Threads API:

  • 由 Meta 官方文件與平台規範管理
  • 適合需要長期維護的正式整合情境

免責聲明

This Actor is provided for educational and research purposes only. You are responsible for using it ethically and in compliance with applicable laws and platform terms.

Keywords: Threads scraper, Threads API, Meta Threads, social media scraper, Instagram Threads, Threads posts, Threads hashtag search, Threads keyword search, Threads data extraction, social media monitoring, Threads automation, influencer discovery, follower count scraper, Threads engagement metrics, Threads search, OpenClaw, Claude Code, Gemini CLI, Antigravity, Codex, ChatGPT, Apify Skills