Instagram 貼文爬蟲
Pricing
$5.00 / 1,000 results
Pricing
$5.00 / 1,000 results
Rating
5.0
(2)
Developer

Futurize Rush
Actor stats
2
Bookmarked
14
Total users
1
Monthly active users
6 days ago
Last modified
Categories
Share
Instagram 貼文爬蟲 — 提取貼文摘要與媒體下載連結
擷取公開 Instagram 帳號的貼文、Reels 與輪播內容,取得媒體下載連結、互動數據、貼文內容、主題標籤、提及等完整資料。支援一次處理最多 10 個帳號,無需登入。
這個爬蟲能做什麼?
Instagram 貼文爬蟲可從公開的 Instagram 帳號與個別貼文網址中擷取結構化資料。它能蒐集圖片、影片、Reels 以及完整輪播貼文(所有滑動項目,不只封面圖),同時提供互動數據、貼文內容與詳細資訊。
此爬蟲使用 Instagram 的輕量級 API 端點,執行快速、成本低廉且穩定。它會自動偵測置頂貼文、從貼文內容中解析主題標籤與提及,並支援日期篩選與提前終止分頁,節省運算資源。
可以擷取哪些資料?
- 貼文、Reels 與輪播 — 所有內容類型,提供圖片與影片的直接下載連結
- 完整貼文內容 — 不截斷的完整文字,自動擷取主題標籤與 @提及
- 互動數據 — 按讚數、留言數、影片觀看次數與影片時長
- 置頂貼文偵測 — 自動識別被釘選在帳號頂部的貼文
- 標記使用者與共同作者 — 媒體中被標記的人與協作貼文的共同作者
- Reel 音樂資訊 — 曲名與演出者
- 日期篩選 — 只擷取特定日期之後的貼文,自動提前停止載入
- 彈性輸入 — 同一次執行中可混合使用者名稱、帳號網址與個別貼文網址
如何使用
- 點擊 Try for free 在 Apify Console 中開啟此爬蟲。
- 在輸入中加入 Instagram 使用者名稱、帳號網址或貼文網址。
- 設定每個帳號要擷取的貼文數量(預設 50,最少 10)。
- 可選擇設定日期篩選或排除置頂貼文。
- 點擊 Start,等待資料出現在 Dataset 頁籤。
輸入設定
| 設定 | 必填 | 預設值 | 說明 |
|---|---|---|---|
usernames | 是 | - | Instagram 使用者名稱、帳號網址或貼文/Reel 網址。每次最多 10 個項目。 |
maxPosts | 否 | 50 | 每個帳號的貼文數量上限(最少 10)。不適用於個別貼文網址。 |
postsNewerThan | 否 | - | 只擷取近期貼文。可輸入日期(2026-01-15)或相對時間(7 days、2 weeks、1 month)。 |
excludePinnedPosts | 否 | false | 略過帳號頂部的置頂貼文,只擷取一般時間軸上的貼文。 |
支援的輸入格式
可在輸入列表中自由混合以下格式:
- 使用者名稱:
natgeo - 帳號網址:
https://www.instagram.com/natgeo/ - 貼文網址:
https://www.instagram.com/p/ABC123/ - Reel 網址:
https://www.instagram.com/reel/ABC123/
輸入範例
{"usernames": ["natgeo","https://www.instagram.com/nasa/","https://www.instagram.com/p/XYZ789abc/"],"maxPosts": 25,"postsNewerThan": "1 month","excludePinnedPosts": true}
輸出說明
每篇貼文包含以下欄位:
內容與媒體
| 欄位 | 說明 |
|---|---|
貼文網址 | Instagram 貼文或 Reel 的原始連結 |
媒體下載連結 | 圖片/影片的直接下載連結,輪播貼文則為項目列表 |
媒體類型 | image(圖片)、video(影片)或 carousel(輪播) |
貼文內容 | 完整的貼文內容,含主題標籤與提及 |
主題標籤 | 從貼文內容中擷取的主題標籤(如 ["sunset", "travel"]) |
提及 | 從貼文內容中擷取的 @提及(如 ["natgeo"]) |
互動數據
| 欄位 | 說明 |
|---|---|
按讚數 | 按讚次數 |
留言數 | 留言次數 |
留言已關閉 | 此貼文是否已關閉留言 |
影片觀看次數 | 影片觀看次數(僅限 Reels 與影片) |
影片時長 | 影片時長,單位秒(僅限 Reels 與影片) |
詳細資訊
| 欄位 | 說明 |
|---|---|
使用者名稱 | Instagram 使用者名稱 |
作者 | 貼文作者的使用者名稱 |
短碼 | Instagram 貼文識別碼(貼文網址中的唯一代碼) |
擁有者ID | 貼文擁有者的 Instagram 使用者 ID |
發布時間 | 貼文發布時間(ISO 8601 格式) |
擷取時間 | 資料擷取時間(ISO 8601 格式) |
索引 | 貼文位置編號(1, 2, 3...) |
是否置頂 | 此貼文是否被釘選在帳號頂部 |
地點 | 標記的地點名稱(如有) |
尺寸 | 媒體尺寸(寬度與高度,單位像素) |
是否為影片 | 是否為影片 |
縮圖網址 | 縮圖/預覽圖片網址 |
影片網址 | 影片檔案的直接連結(影片與 Reels) |
是否有聲音 | 影片是否包含聲音 |
標記的使用者 | 在媒體中被標記的使用者,如 ["willsmith"](與貼文內容中的 @提及不同) |
音樂 | Reel 的音樂曲名與演出者,如 "Original audio - natgeo" |
共同作者 | 協作貼文的共同作者使用者名稱 |
標題 | 貼文內容預覽(前 200 字) |
描述 | 貼文的簡短描述 |
範例輸出
{"使用者名稱": "natgeo","貼文網址": "https://www.instagram.com/reel/ABC123xyz/","媒體下載連結": "https://scontent.cdninstagram.com/.../video.mp4","媒體類型": "video","貼文內容": "Check out this amazing sunset timelapse from our trip last weekend! The colors were unreal. Shot on location in Bali. #sunset #timelapse #travel #bali #nature #photography @natgeo","主題標籤": ["sunset", "timelapse", "travel", "bali", "nature", "photography"],"提及": ["natgeo"],"標題": "Check out this amazing sunset timelapse from our trip last weekend...","描述": "Check out this amazing sunset timelapse from our trip last weekend...","作者": "natgeo","短碼": "ABC123xyz","按讚數": 5230,"留言數": 187,"留言已關閉": false,"發布時間": "2026-02-18T14:30:00.000Z","擷取時間": "2026-02-22T10:15:42.000Z","索引": 1,"是否置頂": false,"尺寸": {"寬度": 640,"高度": 1137},"是否為影片": true,"縮圖網址": "https://scontent.cdninstagram.com/.../thumbnail.jpg","影片網址": "https://scontent.cdninstagram.com/.../video.mp4","影片觀看次數": 84500,"影片時長": 143.1,"是否有聲音": true,"擁有者ID": "12345678901","地點": "Bali, Indonesia","標記的使用者": [],"音樂": "Original audio - natgeo","共同作者": []}
輪播貼文
輪播貼文的 媒體下載連結 包含所有滑動項目:
{"媒體類型": "carousel","媒體下載連結": [{"類型": "image","網址": "https://scontent.cdninstagram.com/.../image1.jpg","寬度": 1080,"高度": 1350},{"類型": "video","網址": "https://scontent.cdninstagram.com/.../video.mp4","寬度": 1080,"高度": 1920}]}
效能
此爬蟲使用輕量級 API 請求而非完整瀏覽器,執行速度快且資源效率高。在 Apify 平台上的一般執行時間(256 MB 記憶體):
| 情境 | 貼文數 | 一般時間 |
|---|---|---|
| 單一帳號 | 10 | 約 12 秒 |
| 單一帳號 | 50 | 約 35 秒 |
| 多個帳號(3 x 50) | 150 | 約 2 分鐘 |
執行時間包含容器啟動時間(約 5-7 秒),並取決於 Instagram 的回應速度。使用日期篩選可透過提前停止分頁顯著縮短執行時間。
置頂貼文偵測
Instagram 允許使用者將最多 3 篇貼文釘選在帳號頂部。這些貼文會出現在一般時間軸之前,即使它們可能是很久以前發布的。
此爬蟲會自動偵測置頂貼文,並在輸出中標記 是否置頂: true。你也可以透過 excludePinnedPosts 設定完全排除它們,這對需要按時間順序精確分析的場景特別有用。
日期篩選
使用 postsNewerThan 只擷取近期貼文。可指定:
- 具體日期:
2026-01-15 - 相對時間:
7 days、2 weeks、1 month、1 year
當爬蟲到達比你指定日期更早的貼文時,會自動停止載入後續頁面,節省時間與運算資源。這對監控高頻發文帳號的近期內容特別有效。
使用建議
- 從小規模開始 — 先用一個帳號加 10 篇貼文測試,確認輸出符合需求後再擴大規模。
- 善用日期篩選 — 對於高頻發文帳號,設定
postsNewerThan可避免載入數千篇舊貼文。 - 混合輸入格式 — 同一次執行中可同時使用使用者名稱、帳號網址與個別貼文網址。
- 輪播完整擷取 — 此爬蟲會擷取輪播貼文的所有滑動項目,不只是封面圖。檢查
媒體下載連結陣列可取得完整內容。 - 下載連結有時效 — 媒體下載連結為暫時性連結,建議在擷取後數小時內下載或處理。
整合
你可以透過 Apify 平台的整合功能 將 Instagram 貼文爬蟲與幾乎任何雲端服務或網頁應用連接。支援 Make、Zapier、Slack、Airbyte、GitHub、Google Sheets、Google Drive 等。
你也可以透過 Apify API 以程式方式存取資料集。可匯出的格式包括 JSON、CSV、Excel、XML、HTML 和 RSS。
使用情境
- 社群媒體經營者 — 追蹤品牌帳號的內容表現與發文節奏
- 研究人員 — 蒐集公開社群媒體資料,用於學術研究或市場分析
- 內容創作者 — 監控互動趨勢、找出最佳表現內容、研究競爭對手策略
- 開發人員 — 將 Instagram 資料匯入儀表板、分析工具或自訂應用程式
- 分析師 — 搭配日期篩選與排除置頂功能,進行精確的時間軸分析
常見問題
可以擷取私人帳號的資料嗎? 不行。只能存取公開帳號。私人帳號會記錄錯誤並自動略過。
為什麼有些欄位顯示 null?
影片觀看次數、影片時長、影片網址、音樂、地點 等欄位取決於內容類型以及發文者是否有標記相關資訊。圖片貼文的影片相關欄位自然為 null。
為什麼某個帳號回傳的貼文數比預期少? Instagram 可能暫時限制可用的資料。如果分頁中斷,爬蟲會保留已擷取的所有貼文,而非讓整個帳號的擷取失敗。
可以擷取留言或追蹤者嗎? 此爬蟲專注於貼文資料。如需其他 Instagram 資料,請在 Apify Store 搜尋相關爬蟲。
注意事項
- 僅適用於公開帳號(無法存取私人帳號)
- 下載連結為暫時性連結,可能在數小時後過期
- 在高流量時段,Instagram 可能限制部分帳號的可用資料
- 置頂貼文偵測使用 Instagram 原生 API 資料
- 爬蟲內建請求間隔控制,以遵守速率限制