L’Annuaire des Entreprises Business Details Scraper avatar
L’Annuaire des Entreprises Business Details Scraper

Pricing

$20.00/month + usage

Go to Store
L’Annuaire des Entreprises Business Details Scraper

L’Annuaire des Entreprises Business Details Scraper

Developed by

ecomscrape

ecomscrape

Maintained by Community

Automate French business data extraction from the official government directory annuaire-entreprises.data.gouv.fr. Get comprehensive company information including SIREN, SIRET, legal status, financial details, and management data for market research, compliance, and business intelligence purposes.

0.0 (0)

Pricing

$20.00/month + usage

0

2

2

Last modified

3 days ago

Contact

If you encounter any issues or need to exchange information, please feel free to contact us through the following link: My profile

Guide (English version)

What does Annuaire-entreprises Bussiness Details Scraper do?

Introduction

The French business landscape contains over 10 million registered companies, associations, and public services, making manual data collection virtually impossible for researchers, analysts, and businesses. Annuaire-entreprises.data.gouv.fr serves as the official search engine for public information held by the French government on French companies, created by the Interministerial Directorate for Digital Affairs (DINUM) and the General Directorate for Enterprises (DGE).

Our Annuaire-entreprises scraper addresses the critical challenge of accessing this wealth of business intelligence efficiently. Whether you're conducting market research, verifying business partners, ensuring compliance, or building comprehensive databases, this tool transforms hours of manual searching into automated, accurate data extraction. The platform provides access to legal and financial information including legal form, closure dates, and other essential business details that are crucial for informed decision-making.

Comprehensive Scraper Overview

The Annuaire-entreprises scraper is a sophisticated data extraction tool designed specifically for the French government's official business directory. Unlike generic web scrapers, this specialized solution understands the unique structure and navigation patterns of the annuaire-entreprises platform, ensuring reliable and comprehensive data collection.

This tool stands out through its intelligent handling of the platform's complex business profiles, which can include multiple establishments, historical data changes, and intricate legal structures. The scraper efficiently navigates through company pages, document sections, and establishment listings to compile complete business profiles.

The primary users of this scraper include market research firms, business intelligence analysts, compliance officers, financial institutions, legal professionals, and entrepreneurs conducting due diligence. Sales teams also leverage this tool for lead generation and prospect qualification, while academic researchers use it for economic studies and business trend analysis.

The scraper's robust architecture handles the platform's anti-bot measures through advanced proxy rotation and request management, ensuring consistent access while respecting the platform's usage policies. Its scalable design accommodates both small-scale individual queries and large-scale enterprise data collection projects.

Input and Output Specifications

Example url 1: https://annuaire-entreprises.data.gouv.fr/documents/477796957

Example url 2: https://annuaire-entreprises.data.gouv.fr/entreprise/luis-529474579

Example url 3: https://annuaire-entreprises.data.gouv.fr/entreprise/alexandra-lacosse-alex-repasse-538072125

Example Screenshot of bussiness information page:

Input Format

The scraper accepts a JSON configuration that provides flexibility and control over the data extraction process:

{
"max_retries_per_url": 2, // Maximum waiting time when accessing the links you provided.
"proxy": { // Add a proxy to ensure that during the data collection process, you are not detected as a bot.
"useApifyProxy": true,
"apifyProxyGroups": [
"RESIDENTIAL"
],
"apifyProxyCountry": "SG" // You should choose an Country that coincides with the Country you want to collect data from
},
"urls": [ // Links to bussiness list by query pages.
"https://annuaire-entreprises.data.gouv.fr/documents/477796957",
"https://annuaire-entreprises.data.gouv.fr/entreprise/luis-529474579",
"https://annuaire-entreprises.data.gouv.fr/entreprise/alexandra-lacosse-alex-repasse-538072125"
]
}

Input Parameters Explained:

  • max_retries_per_url: Controls resilience by setting retry attempts for failed requests, ensuring data collection reliability
  • proxy configuration: Essential for avoiding bot detection during large-scale scraping operations, with country-specific proxy selection for optimal performance
  • urls array: Contains direct links to specific business profiles or category pages on Annuaire-entreprises

Output Format

You get the output from the Annuaire-entreprises Bussiness Details Scraper stored in a tab. The following is an example of the Information Fields collected after running the Actor.

[ // List of bussiness information
{
"url": "https://annuaire-entreprises.data.gouv.fr/entreprise/pari-477796957",
"name": "PARI",
"description": "<p>La société<!-- --> <!-- -->PARI<!-- --> <!-- -->a été créée le<!-- --> <strong>1 juillet 2004</strong>, il y a <!-- -->21 ans<!-- -->.<!-- --> <!-- -->Sa forme juridique est<!-- --> <strong>Société civile immobilière</strong>.<!-- --> <!-- -->Son domaine d’activité est :<!-- --> <!-- -->location de logements<!-- -->.<!-- --> Elle ne possédait pas de salariés.</p>",
"siren": "477796957",
"old_siren": "477796957",
"siege": {
"siren": "477796957",
"siret": "47779695700017",
"old_siret": "",
"etat_administratif": "en activité",
"statut_diffusion": "diffusible",
"est_siege": true,
"ancien_siege": false,
"enseigne": "",
"denomination": null,
"nic": "00017",
"date_creation": "2004-07-01",
"date_derniere_mise_a_jour": "",
"date_mise_a_jour_insee": "",
"date_debut_activite": "2008-01-01",
"date_fermeture": "",
"adresse": "117 BOULEVARD DE STRASBOURG 76600 LE HAVRE",
"adresse_postale": "117 BOULEVARD DE STRASBOURG 76600 LE HAVRE",
"code_postal": "76600",
"commune": "LE HAVRE",
"activite_principale": "68.20A",
"libelle_activite_principale": "Location de logements (68.20A",
"tranche_effectif": "N",
"annee_tranche_effectif": null,
"latitude": "49.492943",
"longitude": "0.115584",
"complements": {
"est_entrepreneur_individuel": false,
"id_finess": [],
"id_bio": [],
"id_organisme_formation": [],
"id_rge": [],
"id_uai": []
},
"liste_idcc": []
},
"tva": {
"tva_number": "58477796957",
"may_have_multiple_t_v_a_number": {
"all_time": false,
"currently_active": false
}
},
"anciens_sieges_sirets": [],
"statut_diffusion": "diffusible",
"etat_administratif": "en activité",
"nom_complet": "PARI",
"chemin": "pari-477796957",
"nature_juridique": "6540",
"libelle_nature_juridique": "Société civile immobilière",
"etablissements": {
"all": [
{
"siren": "477796957",
"siret": "47779695700017",
"old_siret": "",
"etat_administratif": "en activité",
"statut_diffusion": "diffusible",
"est_siege": true,
"ancien_siege": false,
"enseigne": "",
"denomination": null,
"nic": "00017",
"date_creation": "2004-07-01",
"date_derniere_mise_a_jour": "",
"date_mise_a_jour_insee": "",
"date_debut_activite": "2008-01-01",
"date_fermeture": "",
"adresse": "117 BOULEVARD DE STRASBOURG 76600 LE HAVRE",
"adresse_postale": "117 BOULEVARD DE STRASBOURG 76600 LE HAVRE",
"code_postal": "76600",
"commune": "LE HAVRE",
"activite_principale": "68.20A",
"libelle_activite_principale": "Location de logements (68.20A",
"tranche_effectif": "N",
"annee_tranche_effectif": null,
"latitude": "49.492943",
"longitude": "0.115584",
"complements": {
"est_entrepreneur_individuel": false,
"id_finess": [],
"id_bio": [],
"id_organisme_formation": [],
"id_rge": [],
"id_uai": []
},
"liste_idcc": []
}
],
"open": [
"$9:1:props:children:1:0:props:children:props:children:3:props:children:props:children:props:children:5:props:children:1:props:children:props:children:props:children:props:uniteLegale:etablissements:all:0"
],
"unknown": [],
"closed": [],
"nombre_etablissements_ouverts": 1,
"nombre_etablissements": 1,
"use_pagination": false,
"current_etablissement_page": 1
},
"activite_principale": "68.20A",
"libelle_activite_principale": "Location de logements",
"date_creation": "2004-07-01",
"date_fermeture": "",
"date_derniere_mise_a_jour": "2025-07-30T05:57:52",
"date_mise_a_jour_insee": "2024-03-22T14:26:06",
"date_mise_a_jour_inpi": "2024-05-19T16:49:33",
"date_mise_a_jour_ig": null,
"date_debut_activite": "",
"tranche_effectif": null,
"annee_categorie_entreprise": null,
"categorie_entreprise": null,
"annee_tranche_effectif": null,
"complements": {
"est_bio": false,
"est_ess": false,
"est_service_public": false,
"est_l100_3": false,
"est_entrepreneur_individuel": false,
"est_entrepreneur_spectacle": false,
"statut_entrepreneur_spectacle": null,
"est_finess": false,
"egapro_renseignee": false,
"est_rge": false,
"est_organisme_formation": false,
"est_societe_mission": false,
"est_qualiopi": false,
"est_association": false,
"est_uai": false,
"est_achats_responsables": false,
"est_entreprise_inclusive": false,
"type_entreprise_inclusive": null,
"est_patrimoine_vivant": false,
"est_alim_confiance": false,
"bilan_ges_renseigne": false
},
"association": {
"id_association": null,
"data": null
},
"colter": {
"code_colter": null
},
"liste_idcc": [],
"immatriculation": {
"date_debut_activite": "2004-07-01",
"date_radiation": "",
"date_immatriculation": "2004-07-13",
"duree": 99,
"date_fin": "13/07/2103",
"nature_entreprise": [
"Commerciale"
],
"date_cloture": "3112",
"is_personne_morale": true,
"capital": "10 000,00 € (fixe"
},
"matching_etablissements": [],
"nombre_etablissements": 1,
"nombre_etablissements_ouverts": 1,
"dirigeants": [
{
"sexe": null,
"nom": "LERAT",
"prenom": "Alice",
"prenoms": "Alice",
"role": "AUTRE",
"nationalite": "Française",
"date_naissance_partial": "1980-05"
},
{
"sexe": null,
"nom": "LERAT",
"prenom": "Pierre",
"prenoms": "Pierre",
"role": "AUTRE",
"nationalite": "Française",
"date_naissance_partial": "1984-09"
},
{
"sexe": null,
"nom": "LERAT",
"prenom": "Rene",
"prenoms": "Rene, Marc, Marie",
"role": "GERANT",
"nationalite": "Française",
"date_naissance_partial": "1950-08"
},
{
"sexe": null,
"nom": "LERAT (ODINET",
"prenom": "Isabelle",
"prenoms": "Isabelle, Anne, Nicole",
"role": "GERANT",
"nationalite": "Française",
"date_naissance_partial": "1955-09"
},
{
"siren": "401549613",
"denomination": "GENERALE DE SERVICES MARITIMES",
"role": "AUTRE"
}
]
}, // ... Many other bussiness details
]

The scraper extracts an extensive range of business information, creating a comprehensive business intelligence dataset. Each extracted record contains multiple data points that provide a complete picture of the business entity.

Core Identification Fields:

  • ID: Unique internal identifier for the extraction record
  • SIREN: The 9-digit unique identifier for French legal entities (Système d'Identification du Répertoire des ENtreprises)
  • Old SIREN: Historical SIREN numbers if the entity has undergone restructuring
  • SIRET: The 14-digit identifier combining SIREN with establishment number
  • TVA: VAT identification number for tax purposes

Legal and Administrative Information:

  • Statut Diffusion: Indicates whether the entity's information can be publicly shared
  • État Administratif: Current administrative status (active, closed, suspended)
  • Nature Juridique & Libellé Nature Juridique: Legal form code and description (SARL, SA, SAS, etc.)
  • Date de Création: Official creation/registration date
  • Date de Fermeture: Closure date if applicable
  • Immatriculation: Registration details with commercial courts

Business Activity Details:

  • Activité Principale & Libellé Activité Principale: Primary business activity code (NAF/APE) and description
  • Date Début Activité: Activity start date
  • Tranche Effectif: Employee count range categories
  • Catégorie Entreprise: Enterprise size classification (micro, small, medium, large)

Operational Information:

  • Établissements: List of all business establishments
  • Nombre Établissements: Total number of establishments
  • Nombre Établissements Ouverts: Number of currently active establishments
  • Siege: Headquarters information
  • Anciens Sièges SIRETs: Historical headquarters SIRET numbers

Management and Governance:

  • Dirigeants: Leadership and management information including names, roles, and appointment dates
  • Association: Association-specific information if applicable
  • Colter: Territorial collectivity information for public entities

Data Quality and Updates:

  • Date Dernière Mise à Jour: Last general update timestamp
  • Date Mise à Jour INSEE: Last update from INSEE (National Institute of Statistics)
  • Date Mise à Jour INPI: Last update from INPI (National Institute of Industrial Property)
  • Date Mise à Jour IG: Last update from other government sources

Additional Metadata:

  • Complement: Supplementary information and notes
  • Liste IDCC: Applicable collective bargaining agreement codes
  • Matching Établissements: Establishment matching information for data consistency

Step-by-Step Usage Guide

Step 1: URL Preparation Begin by identifying the specific companies or documents you need to extract. URLs should be copied directly from the annuaire-entreprises website to ensure proper formatting. For bulk extraction, compile URLs in a spreadsheet first, then format them into the JSON input structure.

Step 2: Configuration Setup Configure the scraper parameters based on your extraction requirements. For large-scale operations, increase the retry count and implement residential proxies. For quick tests, minimal configuration suffices. Always set the proxy country to France for optimal access.

Step 3: Execution and Monitoring Launch the scraper and monitor the extraction progress. The tool provides real-time feedback on successful extractions, failed attempts, and retry operations. Large datasets may require several hours for complete extraction.

Step 4: Data Validation Review the extracted data for completeness and accuracy. Pay special attention to date fields, numeric values, and text encoding for French characters. Cross-reference a sample of results with the original website to ensure data integrity.

Best Practices:

  • Implement delays between requests to avoid overwhelming the server
  • Use residential proxies for better success rates
  • Regularly update your URL lists as business information changes
  • Maintain backup copies of extracted data
  • Respect the platform's terms of service and usage guidelines

Common Issues and Solutions:

  • Rate limiting: Implement longer delays and reduce concurrent requests
  • Proxy blocks: Rotate proxy pools and use different geographic locations
  • Data format inconsistencies: Implement post-processing validation and cleanup routines
  • Missing fields: Some businesses may not have complete information; handle null values appropriately

Business Benefits and Applications

The Annuaire-entreprises scraper delivers significant time savings, transforming manual data collection that could take weeks into automated processes completed in hours. This efficiency gain allows businesses to focus on analysis and decision-making rather than data gathering.

Market Research Applications: Companies use the extracted data to identify market opportunities, analyze competitor landscapes, and track industry trends. The comprehensive business information enables detailed market segmentation and targeting strategies.

Compliance and Due Diligence: Financial institutions and legal firms leverage the tool for KYC (Know Your Customer) processes, vendor verification, and compliance monitoring. The official government source ensures data reliability for regulatory requirements.

Sales and Lead Generation: Sales teams utilize the business intelligence for prospecting, lead qualification, and territory planning. The detailed company information enables personalized outreach and improved conversion rates.

Economic Research: Academic institutions and government agencies use the aggregated data for economic analysis, policy development, and statistical research. The comprehensive dataset supports evidence-based decision-making at macro and micro economic levels.

Conclusion

The Annuaire-entreprises scraper represents a powerful solution for accessing France's official business intelligence repository efficiently and accurately. By automating the extraction of comprehensive company data, this tool empowers businesses, researchers, and analysts to make informed decisions based on reliable, up-to-date information.

Whether you're conducting market research, ensuring compliance, or building business intelligence systems, this scraper provides the foundation for data-driven success in the French business landscape. Start leveraging the power of automated business intelligence extraction today.

Guide (Version en français)

Que fait le Annuaire-entreprises Bussiness Details Scraper ?

Introduction

Le paysage entrepreneurial français regroupe plus de 10 millions d'entreprises, associations et services publics, rendant la collecte manuelle de données pratiquement impossible pour les chercheurs, analystes et entreprises. Annuaire-entreprises.data.gouv.fr sert de moteur de recherche officiel pour les informations publiques détenues par le gouvernement français sur les entreprises françaises, créé par la Direction interministérielle du numérique (DINUM) et la Direction Générale des Entreprises (DGE).

Notre scraper Annuaire-entreprises répond à l’enjeu crucial d’accéder efficacement à cette richesse d’informations économiques. Que vous réalisiez une étude de marché, vérifiiez des partenaires commerciaux, assuriez la conformité ou constituiez des bases de données complètes, cet outil transforme plusieurs heures de recherches manuelles en une extraction de données automatisée, précise. La plateforme offre l’accès à des renseignements légaux et financiers, tels que la forme juridique, les dates de clôture, et d’autres détails essentiels pour une prise de décision éclairée.

Aperçu complet du scraper

Le scraper Annuaire-entreprises est un outil sophistiqué d’extraction de données, conçu spécifiquement pour le répertoire officiel du gouvernement français. Contrairement à des scrapers génériques, cette solution spécialisée comprend la structure unique et les schémas de navigation de la plateforme, garantissant une collecte fiable et exhaustive.

Cet outil se distingue par sa capacité à gérer intelligemment les profils d’entreprises complexes, pouvant inclure plusieurs établissements, des historiques de modifications ou des structures juridiques sophistiquées. Le scraper navigue efficacement à travers les pages d’entreprises, les sections de documents et les listings d’établissements afin de compiler des profils complets.

Les utilisateurs principaux incluent des sociétés de recherche de marché, des analystes en business intelligence, des responsables conformité, des institutions financières, des avocats, et des entrepreneurs qui effectuent des diligences. Les équipes commerciales exploitent également cet outil pour la génération de prospects et la qualification. Les chercheurs académiques l’utilisent pour des études économiques et des analyses de tendances.

L’architecture robuste du scraper gère les mécanismes anti-bot à l’aide d’un système avancé de rotation de proxies et de gestion des requêtes, garantissant un accès continu tout en respectant les règles d’utilisation de la plateforme. Son design évolutif permet aussi bien des requêtes ponctuelles que de larges opérations de collecte de données à l’échelle de l’entreprise.

Spécifications d'entrée et de sortie

Exemple URL 1 : https://annuaire-entreprises.data.gouv.fr/entreprise/pari-477796957

Exemple URL 2 : https://annuaire-entreprises.data.gouv.fr/entreprise/luis-529474579

Exemple URL 3 : https://annuaire-entreprises.data.gouv.fr/entreprise/alexandra-lacosse-alex-repasse-538072125

Exemple de capture d’écran de la page d’informations sur l’entreprise :

Format d'entrée

Le scraper accepte une configuration JSON permettant une flexibilité et un contrôle précis du processus d’extraction :

{
"max_retries_per_url": 2, // Nombre maximal de tentatives pour accéder à chaque lien échoué
"proxy": { // Paramètres proxy pour éviter la détection et garantir un accès continu
"useApifyProxy": true,
"apifyProxyGroups": [
"RESIDENTIAL"
],
"apifyProxyCountry": "SG" // Choisissez un pays conforme à la localisation des données souhaitées
},
"urls": [ // Liste des liens vers des documents ou profils d’entreprises.
"https://annuaire-entreprises.data.gouv.fr/entreprise/pari-477796957",
"https://annuaire-entreprises.data.gouv.fr/entreprise/luis-529474579",
"https://annuaire-entreprises.data.gouv.fr/entreprise/alexandra-lacosse-alex-repasse-538072125"
]
}

Paramètres d'entrée expliqués :

  • max_retries_per_url : Gère la résilience en fixant le nombre de tentatives en cas d’échec d’accès à une URL, garantissant la fiabilité de la collecte
  • configuration du proxy : Indispensable pour éviter la détection de bot lors d’opérations massives de scraping, avec sélection de proxy par pays pour des performances optimales
  • urls : Tableau contenant des liens directs vers des profils d’entreprises ou pages de catégorie sur Annuaire-entreprises

Format de sortie

Vous recevrez la sortie du Annuaire-entreprises Bussiness Details Scraper stockée sous forme tabulaire. Voici un exemple des champs d’informations collectées après l’exécution de l’Actor.

[ // List of bussiness information
{
"url": "https://annuaire-entreprises.data.gouv.fr/entreprise/pari-477796957",
"name": "PARI",
"description": "<p>La société<!-- --> <!-- -->PARI<!-- --> <!-- -->a été créée le<!-- --> <strong>1 juillet 2004</strong>, il y a <!-- -->21 ans<!-- -->.<!-- --> <!-- -->Sa forme juridique est<!-- --> <strong>Société civile immobilière</strong>.<!-- --> <!-- -->Son domaine d’activité est :<!-- --> <!-- -->location de logements<!-- -->.<!-- --> Elle ne possédait pas de salariés.</p>",
"siren": "477796957",
"old_siren": "477796957",
"siege": {
"siren": "477796957",
"siret": "47779695700017",
"old_siret": "",
"etat_administratif": "en activité",
"statut_diffusion": "diffusible",
"est_siege": true,
"ancien_siege": false,
"enseigne": "",
"denomination": null,
"nic": "00017",
"date_creation": "2004-07-01",
"date_derniere_mise_a_jour": "",
"date_mise_a_jour_insee": "",
"date_debut_activite": "2008-01-01",
"date_fermeture": "",
"adresse": "117 BOULEVARD DE STRASBOURG 76600 LE HAVRE",
"adresse_postale": "117 BOULEVARD DE STRASBOURG 76600 LE HAVRE",
"code_postal": "76600",
"commune": "LE HAVRE",
"activite_principale": "68.20A",
"libelle_activite_principale": "Location de logements (68.20A",
"tranche_effectif": "N",
"annee_tranche_effectif": null,
"latitude": "49.492943",
"longitude": "0.115584",
"complements": {
"est_entrepreneur_individuel": false,
"id_finess": [],
"id_bio": [],
"id_organisme_formation": [],
"id_rge": [],
"id_uai": []
},
"liste_idcc": []
},
"tva": {
"tva_number": "58477796957",
"may_have_multiple_t_v_a_number": {
"all_time": false,
"currently_active": false
}
},
"anciens_sieges_sirets": [],
"statut_diffusion": "diffusible",
"etat_administratif": "en activité",
"nom_complet": "PARI",
"chemin": "pari-477796957",
"nature_juridique": "6540",
"libelle_nature_juridique": "Société civile immobilière",
"etablissements": {
"all": [
{
"siren": "477796957",
"siret": "47779695700017",
"old_siret": "",
"etat_administratif": "en activité",
"statut_diffusion": "diffusible",
"est_siege": true,
"ancien_siege": false,
"enseigne": "",
"denomination": null,
"nic": "00017",
"date_creation": "2004-07-01",
"date_derniere_mise_a_jour": "",
"date_mise_a_jour_insee": "",
"date_debut_activite": "2008-01-01",
"date_fermeture": "",
"adresse": "117 BOULEVARD DE STRASBOURG 76600 LE HAVRE",
"adresse_postale": "117 BOULEVARD DE STRASBOURG 76600 LE HAVRE",
"code_postal": "76600",
"commune": "LE HAVRE",
"activite_principale": "68.20A",
"libelle_activite_principale": "Location de logements (68.20A",
"tranche_effectif": "N",
"annee_tranche_effectif": null,
"latitude": "49.492943",
"longitude": "0.115584",
"complements": {
"est_entrepreneur_individuel": false,
"id_finess": [],
"id_bio": [],
"id_organisme_formation": [],
"id_rge": [],
"id_uai": []
},
"liste_idcc": []
}
],
"open": [
"$9:1:props:children:1:0:props:children:props:children:3:props:children:props:children:props:children:5:props:children:1:props:children:props:children:props:children:props:uniteLegale:etablissements:all:0"
],
"unknown": [],
"closed": [],
"nombre_etablissements_ouverts": 1,
"nombre_etablissements": 1,
"use_pagination": false,
"current_etablissement_page": 1
},
"activite_principale": "68.20A",
"libelle_activite_principale": "Location de logements",
"date_creation": "2004-07-01",
"date_fermeture": "",
"date_derniere_mise_a_jour": "2025-07-30T05:57:52",
"date_mise_a_jour_insee": "2024-03-22T14:26:06",
"date_mise_a_jour_inpi": "2024-05-19T16:49:33",
"date_mise_a_jour_ig": null,
"date_debut_activite": "",
"tranche_effectif": null,
"annee_categorie_entreprise": null,
"categorie_entreprise": null,
"annee_tranche_effectif": null,
"complements": {
"est_bio": false,
"est_ess": false,
"est_service_public": false,
"est_l100_3": false,
"est_entrepreneur_individuel": false,
"est_entrepreneur_spectacle": false,
"statut_entrepreneur_spectacle": null,
"est_finess": false,
"egapro_renseignee": false,
"est_rge": false,
"est_organisme_formation": false,
"est_societe_mission": false,
"est_qualiopi": false,
"est_association": false,
"est_uai": false,
"est_achats_responsables": false,
"est_entreprise_inclusive": false,
"type_entreprise_inclusive": null,
"est_patrimoine_vivant": false,
"est_alim_confiance": false,
"bilan_ges_renseigne": false
},
"association": {
"id_association": null,
"data": null
},
"colter": {
"code_colter": null
},
"liste_idcc": [],
"immatriculation": {
"date_debut_activite": "2004-07-01",
"date_radiation": "",
"date_immatriculation": "2004-07-13",
"duree": 99,
"date_fin": "13/07/2103",
"nature_entreprise": [
"Commerciale"
],
"date_cloture": "3112",
"is_personne_morale": true,
"capital": "10 000,00 € (fixe"
},
"matching_etablissements": [],
"nombre_etablissements": 1,
"nombre_etablissements_ouverts": 1,
"dirigeants": [
{
"sexe": null,
"nom": "LERAT",
"prenom": "Alice",
"prenoms": "Alice",
"role": "AUTRE",
"nationalite": "Française",
"date_naissance_partial": "1980-05"
},
{
"sexe": null,
"nom": "LERAT",
"prenom": "Pierre",
"prenoms": "Pierre",
"role": "AUTRE",
"nationalite": "Française",
"date_naissance_partial": "1984-09"
},
{
"sexe": null,
"nom": "LERAT",
"prenom": "Rene",
"prenoms": "Rene, Marc, Marie",
"role": "GERANT",
"nationalite": "Française",
"date_naissance_partial": "1950-08"
},
{
"sexe": null,
"nom": "LERAT (ODINET",
"prenom": "Isabelle",
"prenoms": "Isabelle, Anne, Nicole",
"role": "GERANT",
"nationalite": "Française",
"date_naissance_partial": "1955-09"
},
{
"siren": "401549613",
"denomination": "GENERALE DE SERVICES MARITIMES",
"role": "AUTRE"
}
]
}, // ... Many other bussiness details
]

Le scraper extrait une gamme étendue d'informations commerciales, créant un jeu de données complet sur l'intelligence économique. Chaque enregistrement extrait contient plusieurs points de données permettant d'obtenir une vision globale de l'entité commerciale.

Champs d'identification principaux :

  • ID : Identifiant interne unique pour chaque enregistrement
  • SIREN : Numéro SIREN à 9 chiffres, identifiant unique des entreprises françaises
  • Ancien SIREN : Numéros SIREN historiques en cas de restructuration
  • SIRET : Numéro SIRET à 14 chiffres combinant SIREN et numéro d’établissement
  • TVA : Numéro d’identification TVA pour la fiscalité

Informations légales et administratives :

  • Statut Diffusion : Indique si l'information peut être diffusée publiquement
  • État Administratif : Statut actuel (actif, fermé, suspendu)
  • Nature Juridique & Libellé Nature Juridique : Code et description de la forme juridique (SARL, SA, SAS, etc.)
  • Date de Création : Date d’immatriculation officielle
  • Date de Fermeture : Date de clôture si applicable
  • Immatriculation : Détails d’immatriculation au registre du commerce

Détails de l’activité :

  • Activité Principale & Libellé Activité Principale : Code NAFA/APE et description de l’activité principale
  • Date Début Activité : Date de début d’activité
  • Tranche Effectif : Catégorie de taille selon le nombre d’employés
  • Catégorie Entreprise : Classification de la taille (micro, petite, moyenne, grande)

Informations opérationnelles :

  • Établissements : Liste complète des établissements
  • Nombre Établissements : Total des établissements
  • Nombre Établissements Ouverts : Nombre d’établissements actifs
  • Siege : Information sur le siège social
  • Anciens Sièges SIRETs : Historique des SIRET de sièges précédents

Management et gouvernance :

  • Dirigeants : Informations sur la direction : noms, rôles, dates d’entrée
  • Association : Données spécifiques si l’entité est une association
  • Colter : Collectivités territoriales associées pour les entités publiques

Qualité et mise à jour des données :

  • Date Dernière Mise à Jour : Date de la dernière mise à jour générale
  • Date Mise à Jour INSEE : Dernière mise à jour par l’INSEE
  • Date Mise à Jour INPI : Dernière mise à jour par l’INPI
  • Date Mise à Jour IG : Dernière mise à jour par d’autres sources gouvernementales

Métadonnées supplémentaires :

  • Complement : Informations complémentaires et notes
  • Liste IDCC : Codes des accords collectifs applicables
  • Matching Établissements : Informations de correspondance pour assurer la cohérence

Guide étape par étape d’utilisation

Étape 1 : Préparer les URLs Sélectionnez les profils d’entreprises ou documents précis à extraire. Copiez les URLs directement depuis le site annuaire-entreprises et compilez-les dans un fichier ou une liste pour le JSON en entrée.

Étape 2 : Paramétrer la configuration Définissez les paramètres de votre JSON selon vos besoins : augmenter le nombre de retries pour garantir la récupération, utiliser des proxies résidentielles pour éviter le blocage, et configurer la langue ou le pays pour optimiser l’accès.

Étape 3 : Lancer l’extraction Démarrez le scraper avec la configuration JSON. Le processus sera systématique : il naviguera dans chaque page, extraira les données et respectera la limite de requêtes pour éviter toute surcharge ou refus de service.

Étape 4 : Exploiter et valider les données Vérifiez la complétude et la précision de votre jeu de données. Effectuez des contrôles aléatoires pour confirmer la qualité. L’export peut être directement utilisé dans des bases CRM, des plateformes d’analyse ou de reporting.

Bonnes pratiques :

  • Insérer des délais entre chaque requête pour respecter les serveurs
  • Utiliser des proxies résidentielles réparties géographiquement
  • Mettre à jour régulièrement la liste des URLs à scraper
  • Conserver des copies sauvegardées des données extraites
  • Respecter les conditions d’utilisation et la législation locale

Problèmes courants et solutions :

  • Limitations de débit : réduire la fréquence ou augmenter les délais d’attente
  • Blocages proxy : renouveler les proxies ou changer de géolocalisation
  • Données manquantes ou incohérentes : filtrer ou nettoyer en post-traitement
  • Difficultés d’accès : vérifier la configuration des proxies et des headers HTTP

Bénéfices et cas d’usage

Ce scraper fournit une extraction complète et automatisée du référentiel officiel français des entreprises, en réduisant drastiquement le temps de collecte. Au lieu de semaines de recherches manuelles, vous disposez en quelques heures d’un dataset robuste pour analyser le marché français.

Applications et usages :

  • Étude de marché : identification des acteurs clés, segmentation et ciblage
  • Conformité réglementaire et due diligence : vérification d’identité, suivi réglementaire
  • Génération de leads : constitution de bases prospects pour commerciale
  • Analyse économique : suivi des dynamiques sectorielles, cartographie d’activités
  • Recherche académique : statistiques, indicateurs macroéconomiques, politiques publiques

Les données extraites servent à nourrir les stratégies d’expansion, de partenariat ou d’investissement, tout en garantissant un socle d’informations officiel et fiable.

Conclusion

Le Annuaire-entreprises scraper offre une solution puissante pour accéder, de manière automatisée, à l’un des plus vastes référentiels d’entreprises françaises. La collecte de données légales, financières et administratives devient rapide, précise et prête à exploiter pour soutenir vos décisions stratégiques et opérationnelles. Commencez dès aujourd'hui à automatiser votre veille économique et à renforcer votre position sur le marché français.

Your feedback

We are always working to improve Actors' performance. So, if you have any technical feedback about Annuaire-entreprises Bussiness Details Scraper or simply found a bug, please create an issue on the Actor's Issues tab in Apify Console.