GitHub User & Repository Info Scraper avatar

GitHub User & Repository Info Scraper

Pricing

Pay per usage

Go to Apify Store
GitHub User & Repository Info Scraper

GitHub User & Repository Info Scraper

Récupère le profil public, les dépôts, les organisations et (optionnellement) les dépôts starrés pour un ou plusieurs utilisateurs GitHub, via l'API officielle GitHub.

Pricing

Pay per usage

Rating

0.0

(0)

Developer

Valisoa Mirija

Valisoa Mirija

Maintained by Community

Actor stats

0

Bookmarked

2

Total users

1

Monthly active users

3 days ago

Last modified

Share

Cet actor récupère, pour une liste d'utilisateurs ou d'organisations GitHub, leur profil public complet, leurs dépôts, leurs organisations d'appartenance et (optionnellement) leurs dépôts starrés. Les données proviennent directement de l'API officielle GitHub (pas de scraping HTML), ce qui garantit des résultats fiables et conformes aux conditions d'utilisation de GitHub.

Input

ChampTypeDescription
usernamesarray (requis)Liste de logins GitHub (utilisateurs ou organisations) à interroger
githubTokenstring (secret)Token d'accès personnel GitHub. Sans token : 60 requêtes/heure. Avec token : 5000 requêtes/heure
includeRepositoriesbooleanRécupère la liste des dépôts publics de chaque utilisateur (défaut : true)
includeOrganizationsbooleanRécupère les organisations auxquelles chaque utilisateur appartient (défaut : true)
includeStarredReposbooleanRécupère la liste des dépôts mis en favori (starred) par chaque utilisateur (défaut : false)
maxItemsPerEndpointintegerNombre maximum d'éléments à récupérer par endpoint paginé (dépôts, organisations, starred) pour chaque utilisateur (défaut : 100, max : 1000)

Comment créer un token GitHub

Settings → Developer settings → Personal access tokens → Generate new token (fine-grained ou classic). Aucun scope particulier n'est nécessaire pour des données publiques ; un token sans scope suffit à débloquer la limite de 5000 requêtes/heure au lieu de 60.

Output

Chaque utilisateur produit un item dans le dataset par défaut. Structure complète :

{
"profile": {
"login": "torvalds",
"id": 1024025,
"node_id": "MDQ6VXNlcjEwMjQwMjU=",
"avatar_url": "https://avatars.githubusercontent.com/u/1024025?v=4",
"html_url": "https://github.com/torvalds",
"type": "User",
"site_admin": false,
"name": "Linus Torvalds",
"company": "Linux Foundation",
"blog": "",
"location": "Portland, OR",
"email": null,
"hireable": null,
"bio": null,
"twitter_username": null,
"public_repos": 12,
"public_gists": 1,
"followers": 307935,
"following": 0,
"created_at": "2011-09-03T15:26:22Z",
"updated_at": "2026-06-17T17:35:14Z"
},
"repositories": [
{
"id": 2325298,
"name": "linux",
"full_name": "torvalds/linux",
"private": false,
"html_url": "https://github.com/torvalds/linux",
"description": "Linux kernel source tree",
"fork": false,
"created_at": "2011-09-04T22:48:12Z",
"updated_at": "2026-06-18T14:28:15Z",
"pushed_at": "2026-06-17T19:39:08Z",
"homepage": "",
"size": 6195147,
"stargazers_count": 236849,
"watchers_count": 236849,
"language": "C",
"forks_count": 62758,
"archived": false,
"disabled": false,
"open_issues_count": 3,
"license": { "key": "other", "name": "Other" },
"topics": [],
"visibility": "public",
"default_branch": "master"
}
],
"organizations": [
{
"login": "nom-organisation",
"id": 123456,
"avatar_url": "https://avatars.githubusercontent.com/u/123456?v=4",
"description": "Description de l'organisation"
}
],
"starredRepositories": []
}

Champs du profil

ChampDescription
loginNom d'utilisateur GitHub
id / node_idIdentifiants uniques GitHub (utile pour déduplication)
avatar_urlURL de la photo de profil
html_urlURL publique du profil
typeUser ou Organization
nameNom complet affiché sur le profil
companyEntreprise renseignée par l'utilisateur
blogSite web ou blog personnel
locationLocalisation déclarée
emailEmail public (souvent null sauf si rendu public volontairement)
hireableL'utilisateur se déclare-t-il disponible à l'emploi ?
bioBiographie du profil
twitter_usernameNom d'utilisateur Twitter/X lié
public_reposNombre total de dépôts publics
public_gistsNombre de gists publics
followers / followingRéseau social GitHub
created_atDate de création du compte
updated_atDate de dernière mise à jour du profil

Champs des dépôts

ChampDescription
name / full_nameNom court et nom complet (login/repo)
descriptionDescription du dépôt
forktrue si c'est un fork d'un autre dépôt
html_urlURL publique du dépôt
homepageSite web associé au projet
languageLangage principal détecté par GitHub
stargazers_countNombre d'étoiles
forks_countNombre de forks
open_issues_countNombre d'issues ouvertes
topicsTags associés au dépôt
licenseLicence du projet
archivedDépôt archivé (read-only)
created_at / pushed_atDate de création et de dernier push
visibilitypublic ou private (toujours public ici)
default_branchBranche par défaut (main ou master)

Cas d'usage

  • Audit de présence GitHub pour une organisation ou une liste de développeurs.
  • Veille concurrentielle sur des projets open source.
  • Constitution d'une base de données de profils développeurs pour le sourcing.
  • Alimentation d'un pipeline de traitement (n8n, Make, scripts Python) pour enrichissement ultérieur.

Limites

  • Données publiques uniquement. L'API GitHub ne donne pas accès aux informations privées sans autorisation OAuth dédiée.
  • L'email est fréquemment null : la plupart des utilisateurs ne le rendent pas public sur leur profil.
  • Soumis aux limites de taux de l'API GitHub : 60 requêtes/heure sans token, 5000 avec un token personnel.
  • Le champ starredRepositories peut contenir un grand nombre d'items et consommer beaucoup de quota : il est désactivé par défaut.