Threads 爬蟲 (貼文、關鍵字搜尋、個人檔案) avatar
Threads 爬蟲 (貼文、關鍵字搜尋、個人檔案)

Pricing

$10.00 / 1,000 results

Go to Apify Store
Threads 爬蟲 (貼文、關鍵字搜尋、個人檔案)

Threads 爬蟲 (貼文、關鍵字搜尋、個人檔案)

Developed by

Futurize Rush

Futurize Rush

Maintained by Community

輕鬆擷取 Threads 資料,免登入。抓取 貼文、關鍵字搜尋、個人檔案。 輸出 CSV / JSON,可接 Make.com、n8n,直接送至 Google Sheets、CRM、Slack、Email。 適用社群監測、KOL 搜尋、競品分析、自動化行銷。

0.0 (0)

Pricing

$10.00 / 1,000 results

6

54

19

Last modified

10 days ago

Meta Threads 爬蟲 - 貼文、搜尋與個人檔案

🚀 擷取完整的 Threads 資料,包括貼文、個人檔案、互動指標(按讚、留言、轉發、分享)以及個人簡介中的聯絡資訊。可依關鍵字、主題標籤或用戶名稱搜尋。非常適合用於社群媒體監控、網紅推廣和競爭對手分析。無需登入。可匯出為 JSON/CSV/Excel 格式。

⚠️ 實驗性 Actor:這是一個實驗性工具。網站結構可能會偶爾變更,這可能會影響資料擷取。請在大規模使用前先進行小批次測試。如果遇到任何問題,請透過 Issues 區段回報。謝謝!

⚠️ 重要:資料爬取限制

Threads 資料爬取具有以下固有限制:

  • 資料量限制:Threads 平台限制了可存取的資料量。實際結果會根據帳號活動、內容類型和其他因素而異
  • 動態載入:Threads 使用無限捲動載入內容,但在一定量後會停止載入
  • 文字截斷:較長的貼文內容可能在摘要中被截斷,需要額外處理才能取得完整文字
  • 速率限制:過於頻繁的請求可能會觸發平台保護機制
  • 內容可用性:無法存取私人帳號、已刪除的內容或地區限制的內容

🚀 最佳實踐

  1. 小批次測試:從較小的限制開始進行初始測試,逐步增加以找到最佳設定
  2. 實際期望:了解實際結果可能少於請求的數量
  3. 錯誤處理:準備好處理部分失敗或不完整的結果
  4. 執行間隔:避免過於頻繁的爬取;建議至少間隔 5-10 分鐘
  5. 資料驗證:始終驗證爬取的資料是否完整和準確
  6. 備用計劃:對於關鍵資料,考慮多次爬取嘗試或使用不同參數

🌟 主要功能

  • 兩種爬取模式:用戶貼文(包含完整個人檔案資料)和關鍵字搜尋
  • 三種搜尋篩選:熱門(趨勢)、最新(最近)、個人檔案(用戶發現)
  • 完整個人檔案資料:個人簡介、追蹤者數量、驗證狀態
  • 聯絡資訊:自動從個人簡介擷取電子郵件、電話號碼和連結
  • 互動指標:每則貼文的按讚、留言、轉發和分享數
  • 豐富的貼文內容:文字、提及、主題標籤、媒體 URL(自動翻譯提示會被移除)
  • 無需登入:僅限公開資料
  • 匯出格式:JSON、CSV、Excel
  • 快速可靠:針對效能進行最佳化

ℹ️ 一致的輸出:爬蟲始終使用 en-US 語言環境和 UTC 時區啟動 Chrome,以便 Threads 不會在擷取的內容中注入本地化的 UI 文字(例如「翻譯」提示)。

📊 可以取得哪些資料?

用戶個人檔案資訊

  • 用戶名稱和顯示名稱
  • 個人簡介/描述(完整文字)
  • 個人檔案圖片 URL
  • 追蹤者數量(準確數字)
  • 驗證狀態
  • 個人檔案 URL
  • 聯絡資訊:從個人簡介擷取的電子郵件、電話號碼和網站連結
  • 外部個人檔案連結

貼文內容

  • 文字內容(較長的貼文可能會被截斷*)
  • 貼文建立時間
  • 貼文 URL 和唯一代碼
  • 互動指標:按讚、留言、轉發和分享
  • 媒體附件(圖片/影片)
  • 使用的主題標籤
  • 用戶提及(@username.xxx 格式)
  • 外部連結

💡 專業提示:在 Apify 中使用「所有欄位」檢視以查看所有擷取的資料欄位。對於被截斷的長貼文,您可以使用貼文 URL 透過 HTTP 請求工具取得完整內容。

🎯 使用案例

  • 社群媒體監控:追蹤品牌提及和對話
  • 網紅發現:透過追蹤者指標尋找內容創作者
  • 競爭對手研究:監控競爭對手的活動和互動
  • 內容分析:分析趨勢主題和主題標籤
  • 潛在客戶開發:發現您領域中的個人檔案
  • 市場研究:了解受眾情緒

🚀 如何使用

⚠️ 重要:正確的輸入格式

請使用如下所示的確切欄位名稱以避免錯誤:

❌ 常見錯誤:

  • 不要使用 action → 請使用 mode
  • 不要使用 query → 請使用 keyword
  • 不要使用 usernames 陣列 → 請使用單一 username 字串
  • 不要在用戶名稱中包含 @ 符號
  • 不要使用 limit → 請使用 max_posts
  • 不要使用 searchFilter → 請使用 search_filter

✅ 正確的輸入範例:

爬取用戶貼文:

{
"mode": "user",
"username": "zuck",
"max_posts": 30
}

依關鍵字搜尋:

{
"mode": "keyword",
"keyword": "artificial intelligence",
"search_filter": "recent",
"max_posts": 20
}

輸入配置

Actor 接受以下輸入參數:

參數類型描述範例
mode字串爬取模式:userkeyword"user"
username字串目標用戶名稱(用於用戶模式,不含 @)"nike"
keyword字串搜尋關鍵字(用於關鍵字模式)"AI automation"
search_filter字串搜尋篩選:defaultrecentprofiles(僅限關鍵字模式)"recent"
max_posts數字要爬取的最大貼文數(20-100)30

模式 1:爬取用戶貼文(包含個人檔案資料)

從特定用戶擷取貼文和完整的個人檔案資訊:

{
"mode": "user",
"username": "zuck",
"max_posts": 50
}

這將返回:

  • 用戶的個人簡介和追蹤者數量
  • 從個人簡介擷取的聯絡資訊(電子郵件、電話、連結)
  • 所有最近的貼文及互動指標(按讚、留言、轉發、分享)
  • 個人檔案驗證狀態
  • 媒體附件
  • 提及和主題標籤

模式 2:依關鍵字搜尋貼文

搜尋包含特定關鍵字的貼文或個人檔案:

熱門/趨勢貼文(預設)

{
"mode": "keyword",
"keyword": "artificial intelligence",
"search_filter": "default",
"max_posts": 30
}

最新貼文

{
"mode": "keyword",
"keyword": "#AI",
"search_filter": "recent",
"max_posts": 30
}

發現用戶個人檔案

{
"mode": "keyword",
"keyword": "tech entrepreneur",
"search_filter": "profiles",
"max_posts": 20
}

📤 輸出格式

查看您的資料

  1. 資料集檢視:點擊「預覽」以查看擷取的貼文
  2. 所有欄位:切換到「所有欄位」檢視以查看完整資料,包括:
    • 完整的用戶個人檔案資訊
    • 完整的提及陣列
    • 媒體元數據
    • 其他擷取的欄位

資料集輸出範例

每則貼文都儲存為單獨的記錄:

{
"username": "user123",
"display_name": "John Doe",
"post_url": "https://www.threads.com/@user123/post/C123456",
"post_code": "C123456",
"text_content": "This is my post about AI...",
"created_at": "2024-01-15T10:30:00+00:00",
"like_count": 152,
"comment_count": 23,
"repost_count": 8,
"share_count": 5,
"has_media": true,
"media_items": [
{
"media_type": "image",
"media_url": "https://..."
}
],
"hashtags": ["AI", "Technology"],
"mentions": [
{
"username": "techfriend",
"profile_url": "https://www.threads.com/@techfriend"
},
{
"username": "ai.researcher",
"profile_url": "https://www.threads.com/@ai.researcher"
}
],
"urls": ["https://example.com/blog-post"],
"is_verified": true,
"followers_count": 5043,
"bio": "Tech enthusiast | AI researcher | Building the future 📧 contact@example.com",
"profile_pic_url": "https://...",
"profile_url": "https://www.threads.com/@user123",
"external_links": ["https://johndoe.com"],
"emails": ["contact@example.com"],
"phones": [],
"bio_links": ["https://johndoe.com"]
}

處理長貼文

⚠️ 關於長內容的注意事項:包含大量文字的貼文可能在爬蟲輸出中被截斷。要取得完整內容:

  1. 使用擷取的 post_url
  2. 發出 HTTP 請求以取得完整頁面
  3. 從回應中解析完整內容

使用貼文 URL 的範例:

https://www.threads.com/@username/post/C123456

🔧 進階功能

搜尋提示

  • 使用 # 進行主題標籤搜尋(例如 #AI
  • 完全支援帶點的用戶名稱(例如 @user.name
  • 多語言支援(英語、中文、日語、西班牙語等)
  • 使用空格組合關鍵字以獲得更廣泛的結果

資料品質功能

  • 準確的追蹤者數量解析(處理 K、M、萬 標記法)
  • 互動指標擷取(按讚、留言、轉發、分享)
  • 聯絡資訊擷取從個人簡介文字(電子郵件、電話、網站連結)
  • 乾淨的文字擷取(移除時間戳、UI 元素和翻譯提示)
  • 完整的提及擷取(保留完整的用戶名稱格式)
  • 個人簡介文字清理(移除追蹤者數量痕跡和 UI 文字)

💡 使用案例範例

1. 網紅發現與聯絡資訊

{
"mode": "keyword",
"keyword": "fitness coach",
"search_filter": "profiles",
"max_posts": 30
}

取得包含追蹤者數量、聯絡資訊(電子郵件、電話、連結)和個人簡介資料的個人檔案,以識別並聯繫網紅。

2. 競爭對手分析與互動指標

{
"mode": "user",
"username": "competitor_brand",
"max_posts": 50
}

擷取完整的個人檔案資料、所有最近的貼文及互動指標(按讚、留言、轉發、分享),以分析競爭對手的表現。

3. 主題標籤監控

{
"mode": "keyword",
"keyword": "#YourBrand",
"search_filter": "recent",
"max_posts": 50
}

即時追蹤提及和對話及互動資料。

4. 內容研究

{
"mode": "keyword",
"keyword": "AI tools",
"search_filter": "default",
"max_posts": 30
}

在您的領域中找到趨勢內容及互動指標,以了解哪些內容表現良好。

📈 效能與限制

貼文限制

  • 用戶貼文:僅可存取最近的貼文,數量因帳號而異
  • 關鍵字搜尋:受 Threads 搜尋結果限制
  • 個人檔案搜尋:受搜尋結果限制

注意:Threads 動態載入內容,可能會限制透過捲動取得的資料量。實際結果可能少於請求的限制。

❓ 常見問題

問:可以取得哪些互動指標? 答:爬蟲為每則貼文擷取按讚、留言、轉發和分享數,以幫助您分析內容表現。

問:聯絡資訊擷取如何運作? 答:爬蟲使用模式匹配從用戶個人簡介文字中自動擷取電子郵件、電話號碼和網站連結。這有助於網紅推廣和潛在客戶開發。

問:為什麼我看到長貼文的截斷文字? 答:Threads 在摘要中顯示截斷的內容。使用貼文 URL 透過 HTTP 請求取得完整內容。

問:如何查看所有可用的資料欄位? 答:在 Apify 控制台中,從「預覽」切換到「所有欄位」檢視,以查看完整擷取的資料,包括電子郵件、電話、bio_links 和互動指標。

問:為什麼追蹤者數量和互動指標很重要? 答:這些指標有助於識別網紅、驗證帳號真實性、衡量影響力,以及分析社群媒體監控的內容表現。

問:是否支援包含點的用戶名稱? 答:是的!完全支援像 @user.name 這樣的用戶名稱。

問:找到有聯絡資訊的網紅的最佳方法是什麼? 答:使用關鍵字模式搭配 search_filter: "profiles" 來發現用戶。您將獲得追蹤者數量、個人簡介資料以及在其個人簡介中找到的任何聯絡資訊。

問:為什麼我取得的結果少於我的 max_posts 限制? 答:Threads 限制了透過其介面可取得的內容量。實際可用的貼文數量會根據多種因素而異,包括帳號活動、內容類型等。

💡 分享您的最佳實踐

如果您發現了有效的爬取技術或遇到問題,請分享您的回饋:

  • 在 Actor 的評論區留言
  • 透過 Issues 標籤回報問題
  • 評分並提供回饋

🆘 支援

有問題或疑問?

  • 查看 Apify 文件
  • 在資料集中查看所有欄位以取得完整資料
  • 透過 Apify 平台聯繫支援

📌 替代方案:Threads API

重要提示:此爬蟲在不登入的情況下運作,這意味著可存取的資料量受 Threads 公開介面的限制。

如果您需要爬取自己帳號的資料,請考慮改用官方 Threads API

  • ✅ 更可靠和穩定
  • ✅ 更高的速率限制
  • ✅ 存取完整的貼文歷史
  • ✅ 不會被封鎖的風險
  • ✅ Meta 的官方支援

Threads API 是存取您自己帳號資料或需要大規模、生產級資料擷取的建議方法。

📚 免責聲明

此工具僅供教育和研究目的。請負責任地使用,並遵守 Threads 的服務條款。


關鍵字:Threads 爬蟲、Threads API、Meta Threads、社群媒體爬蟲、Instagram Threads、Threads 貼文、Threads 資料擷取、社群媒體監控、Threads 自動化、網紅發現、追蹤者數量爬蟲

爬取愉快!🎉