# BD_Benchmark
BD_Benchmark est un projet destiné au développement de bases de données de référence, fournissant un ensemble d'outils Python pour aider les utilisateurs à générer des bases de données de référence de différentes tailles. Ces outils permettent aux utilisateurs d'obtenir des données valides à partir de la base de données DBLP et de les personnaliser et étendre.
## Objectif du projet
L'objectif de BD_Benchmark est de fournir du code Python aux utilisateurs pour les aider à créer et manipuler des bases de données de référence. Les utilisateurs peuvent générer des bases de données de différentes tailles selon leurs besoins et les utiliser dans divers contextes d'application. Le projet prend également en charge la connexion à l'endpoint DBLP pour effectuer des requêtes sur les données.
## Fonctionnalités
1. **Conversion de jeux de données** : Sélection de jeux de données du réseau académique DBLP, contenant plus de 310 000 nœuds d'identité personnelle. Utilisation de code Python pour convertir ces nœuds en format de fichier CSV.
2. **Filtrage des ID valides** : Connexion à l'endpoint DBLP pour interroger les données, filtrer les ID valides actuellement dans DBLP et les écrire dans un nouveau fichier CSV.
3. **Création de fichiers de données complets** : Lecture des ID de personnes dans les fichiers CSV pour créer un fichier de données complet du réseau DBLP, incluant des informations sur les auteurs, éditeurs, articles, revues, collections de conférences, conférences, éditeurs, etc., et générer des fichiers JSON de nœuds et de liens.
4. **Génération et organisation de fichiers de données** : Génération du nombre requis de fichiers en fonction des paramètres de données dans les fichiers JSON, organisés dans des dossiers par "année-mois-jour". Les utilisateurs peuvent définir le ratio et le contenu de changement pour chaque fichier. Le programme commence à partir d'une date de début et s'arrête après avoir généré le nombre requis de dossiers.
## Installation
Pour installer le projet BD_Benchmark, exécutez la commande suivante :
```sh
pip install bd_dev_benchmark
## Update log
`1.0.0` first release
Raw data
{
"_id": null,
"home_page": "https://github.com/Bonjoureloi/BD-Benchmark-Base-en-sparql",
"name": "BD-Dev-Benchmark",
"maintainer": null,
"docs_url": null,
"requires_python": ">=3.6",
"maintainer_email": null,
"keywords": "python, DBLP, Benchmark, Base de donnees",
"author": "Huangjing LEI and Yuan YAN",
"author_email": "huangjingleifr@gmail.com, yuan36803@gmail.com",
"download_url": "https://files.pythonhosted.org/packages/5d/5b/d90c9f0f33617c578979b0e12b626c09365b1dfbf2bf9f692a1e88632c0d/BD_Dev_Benchmark-1.0.0.tar.gz",
"platform": null,
"description": "# BD_Benchmark\n\nBD_Benchmark est un projet destin\u00e9 au d\u00e9veloppement de bases de donn\u00e9es de r\u00e9f\u00e9rence, fournissant un ensemble d'outils Python pour aider les utilisateurs \u00e0 g\u00e9n\u00e9rer des bases de donn\u00e9es de r\u00e9f\u00e9rence de diff\u00e9rentes tailles. Ces outils permettent aux utilisateurs d'obtenir des donn\u00e9es valides \u00e0 partir de la base de donn\u00e9es DBLP et de les personnaliser et \u00e9tendre.\n\n## Objectif du projet\n\nL'objectif de BD_Benchmark est de fournir du code Python aux utilisateurs pour les aider \u00e0 cr\u00e9er et manipuler des bases de donn\u00e9es de r\u00e9f\u00e9rence. Les utilisateurs peuvent g\u00e9n\u00e9rer des bases de donn\u00e9es de diff\u00e9rentes tailles selon leurs besoins et les utiliser dans divers contextes d'application. Le projet prend \u00e9galement en charge la connexion \u00e0 l'endpoint DBLP pour effectuer des requ\u00eates sur les donn\u00e9es.\n\n## Fonctionnalit\u00e9s\n\n1. **Conversion de jeux de donn\u00e9es**\u00a0: S\u00e9lection de jeux de donn\u00e9es du r\u00e9seau acad\u00e9mique DBLP, contenant plus de 310\u00a0000 n\u0153uds d'identit\u00e9 personnelle. Utilisation de code Python pour convertir ces n\u0153uds en format de fichier CSV.\n\n2. **Filtrage des ID valides**\u00a0: Connexion \u00e0 l'endpoint DBLP pour interroger les donn\u00e9es, filtrer les ID valides actuellement dans DBLP et les \u00e9crire dans un nouveau fichier CSV.\n\n3. **Cr\u00e9ation de fichiers de donn\u00e9es complets**\u00a0: Lecture des ID de personnes dans les fichiers CSV pour cr\u00e9er un fichier de donn\u00e9es complet du r\u00e9seau DBLP, incluant des informations sur les auteurs, \u00e9diteurs, articles, revues, collections de conf\u00e9rences, conf\u00e9rences, \u00e9diteurs, etc., et g\u00e9n\u00e9rer des fichiers JSON de n\u0153uds et de liens.\n\n4. **G\u00e9n\u00e9ration et organisation de fichiers de donn\u00e9es**\u00a0: G\u00e9n\u00e9ration du nombre requis de fichiers en fonction des param\u00e8tres de donn\u00e9es dans les fichiers JSON, organis\u00e9s dans des dossiers par \"ann\u00e9e-mois-jour\". Les utilisateurs peuvent d\u00e9finir le ratio et le contenu de changement pour chaque fichier. Le programme commence \u00e0 partir d'une date de d\u00e9but et s'arr\u00eate apr\u00e8s avoir g\u00e9n\u00e9r\u00e9 le nombre requis de dossiers.\n\n## Installation\n\nPour installer le projet BD_Benchmark, ex\u00e9cutez la commande suivante\u00a0:\n\n```sh\npip install bd_dev_benchmark\n\n## Update log\n`1.0.0` first release\n",
"bugtrack_url": null,
"license": null,
"summary": "A package for converting DBLP data into JSON format with varying capacities for benchmarking software performance.",
"version": "1.0.0",
"project_urls": {
"Homepage": "https://github.com/Bonjoureloi/BD-Benchmark-Base-en-sparql"
},
"split_keywords": [
"python",
" dblp",
" benchmark",
" base de donnees"
],
"urls": [
{
"comment_text": "",
"digests": {
"blake2b_256": "74c93c9b448cf89eaa102d0a86acd722d5dea37288bdd46b51a3b9b04eee22f6",
"md5": "36d37b7622de9a81f745c353f27e9934",
"sha256": "b48bfdb1da42717a789d2156631a34220ddb51197826a0031525d1526a0d7c18"
},
"downloads": -1,
"filename": "BD_Dev_Benchmark-1.0.0-py3-none-any.whl",
"has_sig": false,
"md5_digest": "36d37b7622de9a81f745c353f27e9934",
"packagetype": "bdist_wheel",
"python_version": "py3",
"requires_python": ">=3.6",
"size": 2280,
"upload_time": "2024-11-02T14:02:34",
"upload_time_iso_8601": "2024-11-02T14:02:34.148802Z",
"url": "https://files.pythonhosted.org/packages/74/c9/3c9b448cf89eaa102d0a86acd722d5dea37288bdd46b51a3b9b04eee22f6/BD_Dev_Benchmark-1.0.0-py3-none-any.whl",
"yanked": false,
"yanked_reason": null
},
{
"comment_text": "",
"digests": {
"blake2b_256": "5d5bd90c9f0f33617c578979b0e12b626c09365b1dfbf2bf9f692a1e88632c0d",
"md5": "b622169aafdd5f6c2f3d5d7dee85bf6d",
"sha256": "e73061c271dc8710d1a0ce11722ac74b0a334ae40f68357b30774c5b056e4eb1"
},
"downloads": -1,
"filename": "BD_Dev_Benchmark-1.0.0.tar.gz",
"has_sig": false,
"md5_digest": "b622169aafdd5f6c2f3d5d7dee85bf6d",
"packagetype": "sdist",
"python_version": "source",
"requires_python": ">=3.6",
"size": 2313,
"upload_time": "2024-11-02T14:02:35",
"upload_time_iso_8601": "2024-11-02T14:02:35.901355Z",
"url": "https://files.pythonhosted.org/packages/5d/5b/d90c9f0f33617c578979b0e12b626c09365b1dfbf2bf9f692a1e88632c0d/BD_Dev_Benchmark-1.0.0.tar.gz",
"yanked": false,
"yanked_reason": null
}
],
"upload_time": "2024-11-02 14:02:35",
"github": true,
"gitlab": false,
"bitbucket": false,
"codeberg": false,
"github_user": "Bonjoureloi",
"github_project": "BD-Benchmark-Base-en-sparql",
"github_not_found": true,
"lcname": "bd-dev-benchmark"
}