Instagram 貼文爬蟲 avatar

Instagram 貼文爬蟲

Pricing

$5.00 / 1,000 results

Go to Apify Store
Instagram 貼文爬蟲

Instagram 貼文爬蟲

擷取公開 Instagram 帳號的貼文、Reels 與輪播內容,提供媒體下載連結、互動數據、文字說明等完整資料。

Pricing

$5.00 / 1,000 results

Rating

5.0

(2)

Developer

Futurize Rush

Futurize Rush

Maintained by Community

Actor stats

2

Bookmarked

14

Total users

1

Monthly active users

6 days ago

Last modified

Share

Instagram 貼文爬蟲 — 提取貼文摘要與媒體下載連結

擷取公開 Instagram 帳號的貼文、Reels 與輪播內容,取得媒體下載連結、互動數據、貼文內容、主題標籤、提及等完整資料。支援一次處理最多 10 個帳號,無需登入。

這個爬蟲能做什麼?

Instagram 貼文爬蟲可從公開的 Instagram 帳號與個別貼文網址中擷取結構化資料。它能蒐集圖片、影片、Reels 以及完整輪播貼文(所有滑動項目,不只封面圖),同時提供互動數據、貼文內容與詳細資訊。

此爬蟲使用 Instagram 的輕量級 API 端點,執行快速、成本低廉且穩定。它會自動偵測置頂貼文、從貼文內容中解析主題標籤與提及,並支援日期篩選與提前終止分頁,節省運算資源。

可以擷取哪些資料?

  • 貼文、Reels 與輪播 — 所有內容類型,提供圖片與影片的直接下載連結
  • 完整貼文內容 — 不截斷的完整文字,自動擷取主題標籤與 @提及
  • 互動數據 — 按讚數、留言數、影片觀看次數與影片時長
  • 置頂貼文偵測 — 自動識別被釘選在帳號頂部的貼文
  • 標記使用者與共同作者 — 媒體中被標記的人與協作貼文的共同作者
  • Reel 音樂資訊 — 曲名與演出者
  • 日期篩選 — 只擷取特定日期之後的貼文,自動提前停止載入
  • 彈性輸入 — 同一次執行中可混合使用者名稱、帳號網址與個別貼文網址

如何使用

  1. 點擊 Try for free 在 Apify Console 中開啟此爬蟲。
  2. 在輸入中加入 Instagram 使用者名稱、帳號網址或貼文網址。
  3. 設定每個帳號要擷取的貼文數量(預設 50,最少 10)。
  4. 可選擇設定日期篩選或排除置頂貼文。
  5. 點擊 Start,等待資料出現在 Dataset 頁籤。

輸入設定

設定必填預設值說明
usernames-Instagram 使用者名稱、帳號網址或貼文/Reel 網址。每次最多 10 個項目。
maxPosts50每個帳號的貼文數量上限(最少 10)。不適用於個別貼文網址。
postsNewerThan-只擷取近期貼文。可輸入日期(2026-01-15)或相對時間(7 days2 weeks1 month)。
excludePinnedPostsfalse略過帳號頂部的置頂貼文,只擷取一般時間軸上的貼文。

支援的輸入格式

可在輸入列表中自由混合以下格式:

  • 使用者名稱natgeo
  • 帳號網址https://www.instagram.com/natgeo/
  • 貼文網址https://www.instagram.com/p/ABC123/
  • Reel 網址https://www.instagram.com/reel/ABC123/

輸入範例

{
"usernames": [
"natgeo",
"https://www.instagram.com/nasa/",
"https://www.instagram.com/p/XYZ789abc/"
],
"maxPosts": 25,
"postsNewerThan": "1 month",
"excludePinnedPosts": true
}

輸出說明

每篇貼文包含以下欄位:

內容與媒體

欄位說明
貼文網址Instagram 貼文或 Reel 的原始連結
媒體下載連結圖片/影片的直接下載連結,輪播貼文則為項目列表
媒體類型image(圖片)、video(影片)或 carousel(輪播)
貼文內容完整的貼文內容,含主題標籤與提及
主題標籤從貼文內容中擷取的主題標籤(如 ["sunset", "travel"]
提及從貼文內容中擷取的 @提及(如 ["natgeo"]

互動數據

欄位說明
按讚數按讚次數
留言數留言次數
留言已關閉此貼文是否已關閉留言
影片觀看次數影片觀看次數(僅限 Reels 與影片)
影片時長影片時長,單位秒(僅限 Reels 與影片)

詳細資訊

欄位說明
使用者名稱Instagram 使用者名稱
作者貼文作者的使用者名稱
短碼Instagram 貼文識別碼(貼文網址中的唯一代碼)
擁有者ID貼文擁有者的 Instagram 使用者 ID
發布時間貼文發布時間(ISO 8601 格式)
擷取時間資料擷取時間(ISO 8601 格式)
索引貼文位置編號(1, 2, 3...)
是否置頂此貼文是否被釘選在帳號頂部
地點標記的地點名稱(如有)
尺寸媒體尺寸(寬度與高度,單位像素)
是否為影片是否為影片
縮圖網址縮圖/預覽圖片網址
影片網址影片檔案的直接連結(影片與 Reels)
是否有聲音影片是否包含聲音
標記的使用者在媒體中被標記的使用者,如 ["willsmith"](與貼文內容中的 @提及不同)
音樂Reel 的音樂曲名與演出者,如 "Original audio - natgeo"
共同作者協作貼文的共同作者使用者名稱
標題貼文內容預覽(前 200 字)
描述貼文的簡短描述

範例輸出

{
"使用者名稱": "natgeo",
"貼文網址": "https://www.instagram.com/reel/ABC123xyz/",
"媒體下載連結": "https://scontent.cdninstagram.com/.../video.mp4",
"媒體類型": "video",
"貼文內容": "Check out this amazing sunset timelapse from our trip last weekend! The colors were unreal. Shot on location in Bali. #sunset #timelapse #travel #bali #nature #photography @natgeo",
"主題標籤": ["sunset", "timelapse", "travel", "bali", "nature", "photography"],
"提及": ["natgeo"],
"標題": "Check out this amazing sunset timelapse from our trip last weekend...",
"描述": "Check out this amazing sunset timelapse from our trip last weekend...",
"作者": "natgeo",
"短碼": "ABC123xyz",
"按讚數": 5230,
"留言數": 187,
"留言已關閉": false,
"發布時間": "2026-02-18T14:30:00.000Z",
"擷取時間": "2026-02-22T10:15:42.000Z",
"索引": 1,
"是否置頂": false,
"尺寸": {
"寬度": 640,
"高度": 1137
},
"是否為影片": true,
"縮圖網址": "https://scontent.cdninstagram.com/.../thumbnail.jpg",
"影片網址": "https://scontent.cdninstagram.com/.../video.mp4",
"影片觀看次數": 84500,
"影片時長": 143.1,
"是否有聲音": true,
"擁有者ID": "12345678901",
"地點": "Bali, Indonesia",
"標記的使用者": [],
"音樂": "Original audio - natgeo",
"共同作者": []
}

輪播貼文

輪播貼文的 媒體下載連結 包含所有滑動項目:

{
"媒體類型": "carousel",
"媒體下載連結": [
{
"類型": "image",
"網址": "https://scontent.cdninstagram.com/.../image1.jpg",
"寬度": 1080,
"高度": 1350
},
{
"類型": "video",
"網址": "https://scontent.cdninstagram.com/.../video.mp4",
"寬度": 1080,
"高度": 1920
}
]
}

效能

此爬蟲使用輕量級 API 請求而非完整瀏覽器,執行速度快且資源效率高。在 Apify 平台上的一般執行時間(256 MB 記憶體):

情境貼文數一般時間
單一帳號10約 12 秒
單一帳號50約 35 秒
多個帳號(3 x 50)150約 2 分鐘

執行時間包含容器啟動時間(約 5-7 秒),並取決於 Instagram 的回應速度。使用日期篩選可透過提前停止分頁顯著縮短執行時間。

置頂貼文偵測

Instagram 允許使用者將最多 3 篇貼文釘選在帳號頂部。這些貼文會出現在一般時間軸之前,即使它們可能是很久以前發布的。

此爬蟲會自動偵測置頂貼文,並在輸出中標記 是否置頂: true。你也可以透過 excludePinnedPosts 設定完全排除它們,這對需要按時間順序精確分析的場景特別有用。

日期篩選

使用 postsNewerThan 只擷取近期貼文。可指定:

  • 具體日期2026-01-15
  • 相對時間7 days2 weeks1 month1 year

當爬蟲到達比你指定日期更早的貼文時,會自動停止載入後續頁面,節省時間與運算資源。這對監控高頻發文帳號的近期內容特別有效。

使用建議

  • 從小規模開始 — 先用一個帳號加 10 篇貼文測試,確認輸出符合需求後再擴大規模。
  • 善用日期篩選 — 對於高頻發文帳號,設定 postsNewerThan 可避免載入數千篇舊貼文。
  • 混合輸入格式 — 同一次執行中可同時使用使用者名稱、帳號網址與個別貼文網址。
  • 輪播完整擷取 — 此爬蟲會擷取輪播貼文的所有滑動項目,不只是封面圖。檢查 媒體下載連結 陣列可取得完整內容。
  • 下載連結有時效 — 媒體下載連結為暫時性連結,建議在擷取後數小時內下載或處理。

整合

你可以透過 Apify 平台的整合功能 將 Instagram 貼文爬蟲與幾乎任何雲端服務或網頁應用連接。支援 Make、Zapier、Slack、Airbyte、GitHub、Google Sheets、Google Drive 等。

你也可以透過 Apify API 以程式方式存取資料集。可匯出的格式包括 JSON、CSV、Excel、XML、HTML 和 RSS。

使用情境

  • 社群媒體經營者 — 追蹤品牌帳號的內容表現與發文節奏
  • 研究人員 — 蒐集公開社群媒體資料,用於學術研究或市場分析
  • 內容創作者 — 監控互動趨勢、找出最佳表現內容、研究競爭對手策略
  • 開發人員 — 將 Instagram 資料匯入儀表板、分析工具或自訂應用程式
  • 分析師 — 搭配日期篩選與排除置頂功能,進行精確的時間軸分析

常見問題

可以擷取私人帳號的資料嗎? 不行。只能存取公開帳號。私人帳號會記錄錯誤並自動略過。

為什麼有些欄位顯示 null? 影片觀看次數影片時長影片網址音樂地點 等欄位取決於內容類型以及發文者是否有標記相關資訊。圖片貼文的影片相關欄位自然為 null

為什麼某個帳號回傳的貼文數比預期少? Instagram 可能暫時限制可用的資料。如果分頁中斷,爬蟲會保留已擷取的所有貼文,而非讓整個帳號的擷取失敗。

可以擷取留言或追蹤者嗎? 此爬蟲專注於貼文資料。如需其他 Instagram 資料,請在 Apify Store 搜尋相關爬蟲。

注意事項

  • 僅適用於公開帳號(無法存取私人帳號)
  • 下載連結為暫時性連結,可能在數小時後過期
  • 在高流量時段,Instagram 可能限制部分帳號的可用資料
  • 置頂貼文偵測使用 Instagram 原生 API 資料
  • 爬蟲內建請求間隔控制,以遵守速率限制