
Threads 爬蟲 (貼文、關鍵字搜尋、個人檔案)
Pricing
$10.00 / 1,000 results

Threads 爬蟲 (貼文、關鍵字搜尋、個人檔案)
輕鬆擷取 Threads 資料,免登入。抓取 貼文、關鍵字搜尋、個人檔案。 輸出 CSV / JSON,可接 Make.com、n8n,直接送至 Google Sheets、CRM、Slack、Email。 適用社群監測、KOL 搜尋、競品分析、自動化行銷。
0.0 (0)
Pricing
$10.00 / 1,000 results
1
4
4
Last modified
12 hours ago
Threads 貼文爬蟲 - 從 Meta 的 Threads 擷取貼文與個人檔案
🚀 Threads 爬蟲,可從 Threads.net(Meta 的 Twitter 替代品)擷取貼文、使用者個人檔案和搜尋結果。非常適合社群媒體監控、影響者發掘和競爭對手分析。
⚠️ 實驗性 Actor:這是一個實驗性工具。網站結構可能會偶爾改變,這可能會影響資料擷取。請在大規模使用前先用小批次測試。如果遇到任何問題,請透過 Issues 區域回報。謝謝!
⚠️ 重要說明:資料爬取限制
Threads 資料爬取存在以下固有限制:
- 資料量限制:Threads 平台會限制可獲取的資料量,實際結果數量會因帳號活躍度、內容類型等因素而異
- 動態載入:Threads 使用無限捲動載入內容,但會在一定數量後停止載入更多內容
- 長文截斷:較長的貼文內容在動態消息中可能會被截斷,需要額外處理才能獲得完整內容
- 速率限制:過於頻繁的請求可能觸發平台的防護機制
- 內容可用性:私人帳號、已刪除內容或地區限制內容無法獲取
🚀 最佳實踐建議
- 小批次測試:開始時使用較小的 limit 進行測試,逐步增加以找出最佳設定
- 合理預期:了解實際結果可能少於請求的數量
- 錯誤處理:準備好處理部分失敗或不完整的結果
- 間隔執行:避免過於頻繁的爬取,建議執行間隔至少 5-10 分鐘
- 資料驗證:始終驗證爬取的資料完整性和準確性
- 備用方案:對於關鍵資料,考慮多次爬取或使用不同參數
🌟 主要功能
- ✅ 兩種爬取模式:使用者貼文(含完整個人檔案資料)與關鍵字搜尋
- ✅ 三種搜尋篩選器:熱門(熱門話題)、最新(最新內容)、個人檔案(使用者發掘)
- ✅ 完整個人檔案資料:簡介、粉絲數量、驗證狀態
- ✅ 豐富的貼文內容:文字、提及、主題標籤、媒體網址
- ✅ 無需登入:僅公開資料
- ✅ 匯出格式:JSON、CSV、Excel
- ✅ 快速可靠:效能優化
📊 可以獲得哪些資料?
使用者個人檔案資訊
- 使用者名稱和顯示名稱
- 簡介/描述(完整文字)
- 個人檔案圖片網址
- 粉絲數量(準確數字)
- 驗證狀態
- 個人檔案網址
貼文內容
- 文字內容(長貼文可能會被截斷*)
- 貼文建立時間
- 貼文網址和唯一代碼
- 媒體附件(圖片/影片)
- 使用的主題標籤
- 使用者提及(@username.xxx 格式)
- 外部連結
💡 專業提示:使用 Apify 中的「所有欄位」檢視來查看所有擷取的資料欄位。對於被截斷的長貼文,您可以使用貼文網址配合 HTTP 請求工具來獲取完整內容。
🎯 使用案例
- 社群媒體監控:追蹤品牌提及和對話
- 影響者發掘:透過粉絲指標尋找內容創作者
- 競爭對手研究:監控競爭對手的活動和參與度
- 內容分析:分析熱門話題和主題標籤
- 潛在客戶開發:發現您利基市場中的個人檔案
- 市場研究:了解受眾情感
🚀 如何使用
輸入設定
Actor 接受以下輸入參數:
參數 | 類型 | 描述 | 範例 |
---|---|---|---|
mode | String | 爬取模式:user 或 keyword | "user" |
username | String | 目標使用者名稱(使用者模式) | "nike" |
keyword | String | 搜尋關鍵字(關鍵字模式) | "AI automation" |
searchFilter | String | 搜尋篩選器類型(僅關鍵字模式) | "recent" |
limit | Number | 最大爬取貼文數(1-100) | 30 |
headless | Boolean | 在無頭模式下執行瀏覽器 | true |
模式 1:爬取使用者貼文(含個人檔案資料)
從特定使用者擷取貼文和完整個人檔案資訊:
{"mode": "user","username": "zuck","limit": 50}
這會返回:
- 使用者的簡介和粉絲數量
- 所有最近的貼文(含提及和主題標籤)
- 個人檔案驗證狀態
- 媒體附件
模式 2:透過關鍵字搜尋貼文
搜尋包含特定關鍵字的貼文或個人檔案:
熱門/熱門貼文(預設)
{"mode": "keyword","keyword": "artificial intelligence","searchFilter": "default","limit": 30}
最新貼文
{"mode": "keyword","keyword": "#AI","searchFilter": "recent","limit": 30}
發掘使用者個人檔案
{"mode": "keyword","keyword": "tech entrepreneur","searchFilter": "profiles","limit": 20}
📤 輸出格式
檢視您的資料
- 資料集檢視:點擊「預覽」查看擷取的貼文
- 所有欄位:切換到「所有欄位」檢視以查看完整資料,包括:
- 完整使用者個人檔案資訊
- 完整提及陣列
- 媒體元資料
- 其他擷取的欄位
資料集輸出範例
每個貼文都儲存為單獨的記錄:
{"username": "user123","display_name": "John Doe","bio": "科技愛好者 | AI 研究員 | 建構未來","is_verified": true,"followers_count": 5043,"profile_pic_url": "https://...","profile_url": "https://www.threads.com/@user123","post_code": "C123456","text_content": "這是我關於 AI 的貼文...","created_at": "2024-01-15T10:30:00+00:00","has_media": true,"media_items": [{"media_type": "image","media_url": "https://..."}],"hashtags": ["AI", "Technology"],"mentions": [{"username": "friend.name","display_text": "@friend.name"}],"post_url": "https://www.threads.com/@user123/post/C123456"}
處理長貼文
⚠️ 關於長內容的注意事項:包含大量文字的貼文可能會在爬蟲輸出中被截斷。要獲取完整內容:
- 使用擷取的
post_url
- 發送 HTTP 請求以取得完整頁面
- 從回應中解析完整內容
使用貼文網址的範例:
https://www.threads.com/@username/post/C123456
🔧 進階功能
搜尋技巧
- 使用
#
進行主題標籤搜尋(例如:#AI
) - 完全支援帶有點的使用者名稱(例如:
@user.name
) - 多語言支援(英文、中文、日文、西班牙文等)
- 用空格組合關鍵字以獲得更廣泛的結果
資料品質功能
- 準確的粉絲數量解析(處理 K、M、萬 等符號)
- 乾淨的文字擷取(移除時間戳記和 UI 元素)
- 完整的提及擷取(保留完整使用者名稱格式)
- 簡介文字清理(移除粉絲數量的雜訊)
💡 使用案例範例
1. 透過指標發掘影響者
{"mode": "keyword","keyword": "fitness coach","searchFilter": "profiles","limit": 30}
獲取帶有粉絲數量的個人檔案,以識別微型和大型影響者。
2. 競爭對手分析
{"mode": "user","username": "competitor_brand","limit": 50}
擷取完整的個人檔案資料,包括簡介和所有最近的貼文。
3. 主題標籤監控
{"mode": "keyword","keyword": "#YourBrand","searchFilter": "recent","limit": 50}
追蹤即時提及和對話。
4. 內容研究
{"mode": "keyword","keyword": "AI tools","searchFilter": "default","limit": 30}
在您的利基市場中尋找熱門內容。
🔄 整合範例
使用 Apify API
from apify_client import ApifyClientclient = ApifyClient('YOUR_API_TOKEN')actor = client.actor('YOUR_USERNAME/threads-posts-scraper')# 執行 actorrun = actor.call(run_input={"mode": "user","username": "meta","limit": 30})# 獲取包含所有欄位的結果for item in client.dataset(run['defaultDatasetId']).iterate_items():print(f"@{item['username']} ({item['followers_count']} 粉絲)")print(f"簡介:{item['bio']}")print(f"貼文:{item['text_content'][:100]}...")print("---")
Webhook 整合
設定 webhooks 以在爬取完成時收到通知:
{"mode": "keyword","keyword": "your brand","limit": 50,"webhooks": [{"url": "https://your-server.com/webhook","eventTypes": ["ACTOR.RUN.SUCCEEDED"]}]}
📈 效能與限制
貼文限制:
- 使用者貼文:僅能獲取最近的貼文,數量因帳號而異
- 關鍵字搜尋:受 Threads 搜尋結果限制
- 個人檔案搜尋:受搜尋結果限制
注意:Threads 動態載入內容,可能會限制透過捲動可獲得的資料量。實際結果可能少於請求的限制。
❓ 常見問題
問:為什麼我看到長貼文的文字被截斷? 答:Threads 在動態消息中顯示截斷的內容。使用貼文網址透過 HTTP 請求取得完整內容。
問:如何查看所有可用的資料欄位? 答:在 Apify 控制台中,從「預覽」切換到「所有欄位」檢視以查看完整擷取的資料。
問:我可以獲得電子郵件地址嗎? 答:不行,Threads 個人檔案上不會公開顯示電子郵件地址。
問:為什麼粉絲數量很重要? 答:粉絲數量有助於識別影響者、驗證帳戶真實性,以及衡量社群監控的觸及範圍。
問:它可以處理包含點的使用者名稱嗎? 答:可以!完全支援像 @user.name 這樣的使用者名稱。
問:尋找影響者的最佳方法是什麼?
答:使用關鍵字模式配合 searchFilter: "profiles"
來發掘使用者,並包含粉絲數量。
問:為什麼我得到的結果少於我的限制? 答:Threads 限制透過其介面可獲得的內容量。實際可獲取的貼文數量會因多種因素而異,包括帳號活躍度、內容類型等。
💡 分享您的最佳實踐
如果您發現了有效的爬取技巧或遇到問題,歡迎透過以下方式回饋:
- 在 Actor 的評論區留言
- 透過 Issues 回報問題
- 給予評分和回饋
🆘 支援
遇到問題或有疑問?
- 查看 Apify 文件
- 在資料集中檢視所有欄位以獲得完整資料
- 透過 Apify 平台聯絡支援
📚 免責聲明
此工具僅供教育和研究目的使用。請負責任地使用,並遵守 Threads 的服務條款。
關鍵字:Threads 爬蟲、Threads API、Meta Threads、社群媒體爬蟲、Instagram Threads、Threads 貼文、Threads 資料擷取、社群媒體監控、Threads 自動化、影響者發掘、粉絲數量爬蟲
祝爬取愉快!🎉
On this page
Share Actor: