Threads 爬蟲 (貼文、關鍵字搜尋、個人檔案) avatar
Threads 爬蟲 (貼文、關鍵字搜尋、個人檔案)

Pricing

$10.00 / 1,000 results

Go to Store
Threads 爬蟲 (貼文、關鍵字搜尋、個人檔案)

Threads 爬蟲 (貼文、關鍵字搜尋、個人檔案)

Developed by

Futurize Rush

Futurize Rush

Maintained by Community

輕鬆擷取 Threads 資料,免登入。抓取 貼文、關鍵字搜尋、個人檔案。 輸出 CSV / JSON,可接 Make.com、n8n,直接送至 Google Sheets、CRM、Slack、Email。 適用社群監測、KOL 搜尋、競品分析、自動化行銷。

0.0 (0)

Pricing

$10.00 / 1,000 results

1

4

4

Last modified

12 hours ago

Threads 貼文爬蟲 - 從 Meta 的 Threads 擷取貼文與個人檔案

🚀 Threads 爬蟲,可從 Threads.net(Meta 的 Twitter 替代品)擷取貼文、使用者個人檔案和搜尋結果。非常適合社群媒體監控、影響者發掘和競爭對手分析。

⚠️ 實驗性 Actor:這是一個實驗性工具。網站結構可能會偶爾改變,這可能會影響資料擷取。請在大規模使用前先用小批次測試。如果遇到任何問題,請透過 Issues 區域回報。謝謝!

⚠️ 重要說明:資料爬取限制

Threads 資料爬取存在以下固有限制:

  • 資料量限制:Threads 平台會限制可獲取的資料量,實際結果數量會因帳號活躍度、內容類型等因素而異
  • 動態載入:Threads 使用無限捲動載入內容,但會在一定數量後停止載入更多內容
  • 長文截斷:較長的貼文內容在動態消息中可能會被截斷,需要額外處理才能獲得完整內容
  • 速率限制:過於頻繁的請求可能觸發平台的防護機制
  • 內容可用性:私人帳號、已刪除內容或地區限制內容無法獲取

🚀 最佳實踐建議

  1. 小批次測試:開始時使用較小的 limit 進行測試,逐步增加以找出最佳設定
  2. 合理預期:了解實際結果可能少於請求的數量
  3. 錯誤處理:準備好處理部分失敗或不完整的結果
  4. 間隔執行:避免過於頻繁的爬取,建議執行間隔至少 5-10 分鐘
  5. 資料驗證:始終驗證爬取的資料完整性和準確性
  6. 備用方案:對於關鍵資料,考慮多次爬取或使用不同參數

🌟 主要功能

  • 兩種爬取模式:使用者貼文(含完整個人檔案資料)與關鍵字搜尋
  • 三種搜尋篩選器:熱門(熱門話題)、最新(最新內容)、個人檔案(使用者發掘)
  • 完整個人檔案資料:簡介、粉絲數量、驗證狀態
  • 豐富的貼文內容:文字、提及、主題標籤、媒體網址
  • 無需登入:僅公開資料
  • 匯出格式:JSON、CSV、Excel
  • 快速可靠:效能優化

📊 可以獲得哪些資料?

使用者個人檔案資訊

  • 使用者名稱和顯示名稱
  • 簡介/描述(完整文字)
  • 個人檔案圖片網址
  • 粉絲數量(準確數字)
  • 驗證狀態
  • 個人檔案網址

貼文內容

  • 文字內容(長貼文可能會被截斷*)
  • 貼文建立時間
  • 貼文網址和唯一代碼
  • 媒體附件(圖片/影片)
  • 使用的主題標籤
  • 使用者提及(@username.xxx 格式)
  • 外部連結

💡 專業提示:使用 Apify 中的「所有欄位」檢視來查看所有擷取的資料欄位。對於被截斷的長貼文,您可以使用貼文網址配合 HTTP 請求工具來獲取完整內容。

🎯 使用案例

  • 社群媒體監控:追蹤品牌提及和對話
  • 影響者發掘:透過粉絲指標尋找內容創作者
  • 競爭對手研究:監控競爭對手的活動和參與度
  • 內容分析:分析熱門話題和主題標籤
  • 潛在客戶開發:發現您利基市場中的個人檔案
  • 市場研究:了解受眾情感

🚀 如何使用

輸入設定

Actor 接受以下輸入參數:

參數類型描述範例
modeString爬取模式:userkeyword"user"
usernameString目標使用者名稱(使用者模式)"nike"
keywordString搜尋關鍵字(關鍵字模式)"AI automation"
searchFilterString搜尋篩選器類型(僅關鍵字模式)"recent"
limitNumber最大爬取貼文數(1-100)30
headlessBoolean在無頭模式下執行瀏覽器true

模式 1:爬取使用者貼文(含個人檔案資料)

從特定使用者擷取貼文和完整個人檔案資訊:

{
"mode": "user",
"username": "zuck",
"limit": 50
}

這會返回:

  • 使用者的簡介和粉絲數量
  • 所有最近的貼文(含提及和主題標籤)
  • 個人檔案驗證狀態
  • 媒體附件

模式 2:透過關鍵字搜尋貼文

搜尋包含特定關鍵字的貼文或個人檔案:

熱門/熱門貼文(預設)

{
"mode": "keyword",
"keyword": "artificial intelligence",
"searchFilter": "default",
"limit": 30
}

最新貼文

{
"mode": "keyword",
"keyword": "#AI",
"searchFilter": "recent",
"limit": 30
}

發掘使用者個人檔案

{
"mode": "keyword",
"keyword": "tech entrepreneur",
"searchFilter": "profiles",
"limit": 20
}

📤 輸出格式

檢視您的資料

  1. 資料集檢視:點擊「預覽」查看擷取的貼文
  2. 所有欄位:切換到「所有欄位」檢視以查看完整資料,包括:
    • 完整使用者個人檔案資訊
    • 完整提及陣列
    • 媒體元資料
    • 其他擷取的欄位

資料集輸出範例

每個貼文都儲存為單獨的記錄:

{
"username": "user123",
"display_name": "John Doe",
"bio": "科技愛好者 | AI 研究員 | 建構未來",
"is_verified": true,
"followers_count": 5043,
"profile_pic_url": "https://...",
"profile_url": "https://www.threads.com/@user123",
"post_code": "C123456",
"text_content": "這是我關於 AI 的貼文...",
"created_at": "2024-01-15T10:30:00+00:00",
"has_media": true,
"media_items": [
{
"media_type": "image",
"media_url": "https://..."
}
],
"hashtags": ["AI", "Technology"],
"mentions": [
{
"username": "friend.name",
"display_text": "@friend.name"
}
],
"post_url": "https://www.threads.com/@user123/post/C123456"
}

處理長貼文

⚠️ 關於長內容的注意事項:包含大量文字的貼文可能會在爬蟲輸出中被截斷。要獲取完整內容:

  1. 使用擷取的 post_url
  2. 發送 HTTP 請求以取得完整頁面
  3. 從回應中解析完整內容

使用貼文網址的範例:

https://www.threads.com/@username/post/C123456

🔧 進階功能

搜尋技巧

  • 使用 # 進行主題標籤搜尋(例如:#AI
  • 完全支援帶有點的使用者名稱(例如:@user.name
  • 多語言支援(英文、中文、日文、西班牙文等)
  • 用空格組合關鍵字以獲得更廣泛的結果

資料品質功能

  • 準確的粉絲數量解析(處理 K、M、萬 等符號)
  • 乾淨的文字擷取(移除時間戳記和 UI 元素)
  • 完整的提及擷取(保留完整使用者名稱格式)
  • 簡介文字清理(移除粉絲數量的雜訊)

💡 使用案例範例

1. 透過指標發掘影響者

{
"mode": "keyword",
"keyword": "fitness coach",
"searchFilter": "profiles",
"limit": 30
}

獲取帶有粉絲數量的個人檔案,以識別微型和大型影響者。

2. 競爭對手分析

{
"mode": "user",
"username": "competitor_brand",
"limit": 50
}

擷取完整的個人檔案資料,包括簡介和所有最近的貼文。

3. 主題標籤監控

{
"mode": "keyword",
"keyword": "#YourBrand",
"searchFilter": "recent",
"limit": 50
}

追蹤即時提及和對話。

4. 內容研究

{
"mode": "keyword",
"keyword": "AI tools",
"searchFilter": "default",
"limit": 30
}

在您的利基市場中尋找熱門內容。

🔄 整合範例

使用 Apify API

from apify_client import ApifyClient
client = ApifyClient('YOUR_API_TOKEN')
actor = client.actor('YOUR_USERNAME/threads-posts-scraper')
# 執行 actor
run = actor.call(run_input={
"mode": "user",
"username": "meta",
"limit": 30
})
# 獲取包含所有欄位的結果
for item in client.dataset(run['defaultDatasetId']).iterate_items():
print(f"@{item['username']} ({item['followers_count']} 粉絲)")
print(f"簡介:{item['bio']}")
print(f"貼文:{item['text_content'][:100]}...")
print("---")

Webhook 整合

設定 webhooks 以在爬取完成時收到通知:

{
"mode": "keyword",
"keyword": "your brand",
"limit": 50,
"webhooks": [{
"url": "https://your-server.com/webhook",
"eventTypes": ["ACTOR.RUN.SUCCEEDED"]
}]
}

📈 效能與限制

貼文限制

  • 使用者貼文:僅能獲取最近的貼文,數量因帳號而異
  • 關鍵字搜尋:受 Threads 搜尋結果限制
  • 個人檔案搜尋:受搜尋結果限制

注意:Threads 動態載入內容,可能會限制透過捲動可獲得的資料量。實際結果可能少於請求的限制。

❓ 常見問題

問:為什麼我看到長貼文的文字被截斷? 答:Threads 在動態消息中顯示截斷的內容。使用貼文網址透過 HTTP 請求取得完整內容。

問:如何查看所有可用的資料欄位? 答:在 Apify 控制台中,從「預覽」切換到「所有欄位」檢視以查看完整擷取的資料。

問:我可以獲得電子郵件地址嗎? 答:不行,Threads 個人檔案上不會公開顯示電子郵件地址。

問:為什麼粉絲數量很重要? 答:粉絲數量有助於識別影響者、驗證帳戶真實性,以及衡量社群監控的觸及範圍。

問:它可以處理包含點的使用者名稱嗎? 答:可以!完全支援像 @user.name 這樣的使用者名稱。

問:尋找影響者的最佳方法是什麼? 答:使用關鍵字模式配合 searchFilter: "profiles" 來發掘使用者,並包含粉絲數量。

問:為什麼我得到的結果少於我的限制? 答:Threads 限制透過其介面可獲得的內容量。實際可獲取的貼文數量會因多種因素而異,包括帳號活躍度、內容類型等。

💡 分享您的最佳實踐

如果您發現了有效的爬取技巧或遇到問題,歡迎透過以下方式回饋:

  • 在 Actor 的評論區留言
  • 透過 Issues 回報問題
  • 給予評分和回饋

🆘 支援

遇到問題或有疑問?

  • 查看 Apify 文件
  • 在資料集中檢視所有欄位以獲得完整資料
  • 透過 Apify 平台聯絡支援

📚 免責聲明

此工具僅供教育和研究目的使用。請負責任地使用,並遵守 Threads 的服務條款。


關鍵字:Threads 爬蟲、Threads API、Meta Threads、社群媒體爬蟲、Instagram Threads、Threads 貼文、Threads 資料擷取、社群媒體監控、Threads 自動化、影響者發掘、粉絲數量爬蟲

祝爬取愉快!🎉