# msmthx
Pacote para manipulação, limpeza e visualização de dados na sua versão (0.1.0)
# msmthx
**ms_toolkit** é uma biblioteca Python leve e modular projetada para facilitar tarefas comuns no tratamento, limpeza, visualização e análise de dados. Este pacote oferece funções para carregar arquivos CSV, limpar dados, visualizar correlações e calcular estatísticas como média, mediana e moda, tudo em módulos bem organizados.
## Instalação
Para instalar a biblioteca, basta clonar este repositório ou usar o `pip` diretamente:
git clone https://github.com/usuario/ms_toolkit.git
##
# Ou, se você preferir, instale com pip (assumindo que o pacote foi publicado no PyPI):
- pip install msmthx
## Funcionalidades
1. Carregamento de Dados
O módulo msdt fornece funções para carregar e manipular dados de arquivos CSV.
# Funções:
- ld(): Carrega um arquivo CSV para um DataFrame.
from msmthx import ld
df = ld('arquivo.csv', sep=';')
##
# 2. Limpeza de Dados
- O módulo **msclg** oferece funções para tratar dados ausentes, duplicados e formatar as colunas.
## Funções:
dmv(): Remove valores ausentes de um DataFrame.
dr(): Remove valores duplicados de um DataFrame.
scn(): Padroniza os nomes das colunas (minúsculas e sem espaços).
from msmthx import dmv, dr, scn
df_cleaned = dmv(df)
df_no_duplicates = dr(df_cleaned)
df_standardized = scn(df_no_duplicates)
##
# 3. Visualização de Dados
O módulo msvzt oferece uma função para gerar mapas de calor das correlações entre colunas de um DataFrame.
Função:
pltch(): Plota um mapa de calor da correlação entre as colunas numéricas do DataFrame.
from msmthx import pltch
pltch(df)
##
# 4. Operações Estatísticas
O módulo msmt oferece funções para calcular a média, mediana e moda de listas ou arrays.
Funções:
msn(): Calcula a média.
mdn(): Calcula a mediana.
modc(): Calcula a moda.
##
from msmthx import msn, mdn, modc
data = [1, 2, 2, 3, 4, 5]
media = msn(data)
mediana = mdn(data)
moda = modc(data)
print(f"Média: {media}")
print(f"Mediana: {mediana}")
print(f"Moda: {moda}")
##
# Testes
Para garantir que tudo esteja funcionando corretamente, você pode executar testes diretamente em seu Jupyter Notebook ou no Python:
from msmthx import ld, dmv, pltch, msn, mdn, modc
# Teste de carregamento de CSV
df = ld('dados.csv', sep=';')
# Teste de limpeza de dados
df_cleaned = dmv(df)
df_no_duplicates = dr(df_cleaned)
# Teste de visualização de correlação
pltch(df)
# Teste de operações estatísticas
data = [1, 2, 2, 3, 4, 5, 5]
media = msn(data)
mediana = mdn(data)
moda = modc(data)
print(f"Média: {media}")
print(f"Mediana: {mediana}")
print(f"Moda: {moda}")
##
## Contribuição
Contribuições são bem-vindas! Se você deseja contribuir para este projeto, siga os passos abaixo:
Faça um fork deste repositório.
Crie uma nova branch (git checkout -b minha-feature).
Faça suas alterações e adicione os arquivos (git add .).
Faça o commit das suas alterações (git commit -m 'Adicionando uma nova feature').
Envie para o repositório remoto (git push origin minha-feature).
Abra um Pull Request.
Licença
Este projeto está licenciado sob a Licença MIT .
Raw data
{
"_id": null,
"home_page": "https://github.com/mamadusama/ms_toolkit",
"name": "msmthx",
"maintainer": null,
"docs_url": null,
"requires_python": ">=3.6",
"maintainer_email": null,
"keywords": null,
"author": "Mamadu Sama",
"author_email": "mamadusama19@gmail.com",
"download_url": "https://files.pythonhosted.org/packages/0a/65/73cd3ac6a1550e5fc6c3894e81a45ebd964bc1f8a48699065481bd43cf1e/msmthx-0.1.0.tar.gz",
"platform": null,
"description": "# msmthx\r\nPacote para manipula\u00e7\u00e3o, limpeza e visualiza\u00e7\u00e3o de dados na sua vers\u00e3o (0.1.0)\r\n\r\n\r\n\r\n\r\n\r\n# msmthx\r\n\r\n**ms_toolkit** \u00e9 uma biblioteca Python leve e modular projetada para facilitar tarefas comuns no tratamento, limpeza, visualiza\u00e7\u00e3o e an\u00e1lise de dados. Este pacote oferece fun\u00e7\u00f5es para carregar arquivos CSV, limpar dados, visualizar correla\u00e7\u00f5es e calcular estat\u00edsticas como m\u00e9dia, mediana e moda, tudo em m\u00f3dulos bem organizados.\r\n\r\n## Instala\u00e7\u00e3o\r\n\r\nPara instalar a biblioteca, basta clonar este reposit\u00f3rio ou usar o `pip` diretamente:\r\n\r\ngit clone https://github.com/usuario/ms_toolkit.git\r\n##\r\n\r\n# Ou, se voc\u00ea preferir, instale com pip (assumindo que o pacote foi publicado no PyPI):\r\n- pip install msmthx\r\n\r\n## Funcionalidades\r\n1. Carregamento de Dados\r\nO m\u00f3dulo msdt fornece fun\u00e7\u00f5es para carregar e manipular dados de arquivos CSV.\r\n\r\n# Fun\u00e7\u00f5es:\r\n- ld(): Carrega um arquivo CSV para um DataFrame.\r\n\r\n from msmthx import ld\r\n\r\n df = ld('arquivo.csv', sep=';')\r\n\r\n##\r\n\r\n# 2. Limpeza de Dados\r\n- O m\u00f3dulo **msclg** oferece fun\u00e7\u00f5es para tratar dados ausentes, duplicados e formatar as colunas.\r\n\r\n## Fun\u00e7\u00f5es:\r\ndmv(): Remove valores ausentes de um DataFrame.\r\ndr(): Remove valores duplicados de um DataFrame.\r\nscn(): Padroniza os nomes das colunas (min\u00fasculas e sem espa\u00e7os).\r\n\r\nfrom msmthx import dmv, dr, scn\r\n\r\ndf_cleaned = dmv(df)\r\ndf_no_duplicates = dr(df_cleaned)\r\ndf_standardized = scn(df_no_duplicates)\r\n\r\n##\r\n\r\n\r\n# 3. Visualiza\u00e7\u00e3o de Dados\r\nO m\u00f3dulo msvzt oferece uma fun\u00e7\u00e3o para gerar mapas de calor das correla\u00e7\u00f5es entre colunas de um DataFrame.\r\n\r\nFun\u00e7\u00e3o:\r\npltch(): Plota um mapa de calor da correla\u00e7\u00e3o entre as colunas num\u00e9ricas do DataFrame.\r\nfrom msmthx import pltch\r\n\r\npltch(df)\r\n\r\n\r\n##\r\n\r\n# 4. Opera\u00e7\u00f5es Estat\u00edsticas\r\nO m\u00f3dulo msmt oferece fun\u00e7\u00f5es para calcular a m\u00e9dia, mediana e moda de listas ou arrays.\r\n\r\nFun\u00e7\u00f5es:\r\nmsn(): Calcula a m\u00e9dia.\r\nmdn(): Calcula a mediana.\r\nmodc(): Calcula a moda.\r\n\r\n##\r\n\r\nfrom msmthx import msn, mdn, modc\r\n\r\ndata = [1, 2, 2, 3, 4, 5]\r\n\r\nmedia = msn(data)\r\nmediana = mdn(data)\r\nmoda = modc(data)\r\n\r\nprint(f\"M\u00e9dia: {media}\")\r\nprint(f\"Mediana: {mediana}\")\r\nprint(f\"Moda: {moda}\")\r\n\r\n##\r\n\r\n# Testes\r\nPara garantir que tudo esteja funcionando corretamente, voc\u00ea pode executar testes diretamente em seu Jupyter Notebook ou no Python:\r\n\r\nfrom msmthx import ld, dmv, pltch, msn, mdn, modc\r\n\r\n# Teste de carregamento de CSV\r\ndf = ld('dados.csv', sep=';')\r\n\r\n# Teste de limpeza de dados\r\ndf_cleaned = dmv(df)\r\ndf_no_duplicates = dr(df_cleaned)\r\n\r\n# Teste de visualiza\u00e7\u00e3o de correla\u00e7\u00e3o\r\npltch(df)\r\n\r\n# Teste de opera\u00e7\u00f5es estat\u00edsticas\r\ndata = [1, 2, 2, 3, 4, 5, 5]\r\nmedia = msn(data)\r\nmediana = mdn(data)\r\nmoda = modc(data)\r\n\r\nprint(f\"M\u00e9dia: {media}\")\r\nprint(f\"Mediana: {mediana}\")\r\nprint(f\"Moda: {moda}\")\r\n\r\n##\r\n\r\n## Contribui\u00e7\u00e3o\r\nContribui\u00e7\u00f5es s\u00e3o bem-vindas! Se voc\u00ea deseja contribuir para este projeto, siga os passos abaixo:\r\n\r\nFa\u00e7a um fork deste reposit\u00f3rio.\r\nCrie uma nova branch (git checkout -b minha-feature).\r\nFa\u00e7a suas altera\u00e7\u00f5es e adicione os arquivos (git add .).\r\nFa\u00e7a o commit das suas altera\u00e7\u00f5es (git commit -m 'Adicionando uma nova feature').\r\nEnvie para o reposit\u00f3rio remoto (git push origin minha-feature).\r\nAbra um Pull Request.\r\nLicen\u00e7a\r\nEste projeto est\u00e1 licenciado sob a Licen\u00e7a MIT .\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n",
"bugtrack_url": null,
"license": null,
"summary": "Pacote para manipula\u00e7\u00e3o, limpeza e visualiza\u00e7\u00e3o de dados.",
"version": "0.1.0",
"project_urls": {
"Homepage": "https://github.com/mamadusama/ms_toolkit"
},
"split_keywords": [],
"urls": [
{
"comment_text": "",
"digests": {
"blake2b_256": "087949be539d11f69a92f97bf484346a7260e7904e20d571d0bdb37aff63b840",
"md5": "fc96d9d4460e0e4d34441a5df74b2767",
"sha256": "42f346a0866b553c6bc63c9922d837d93f02b1c469155abaab9f16c32ee58578"
},
"downloads": -1,
"filename": "msmthx-0.1.0-py3-none-any.whl",
"has_sig": false,
"md5_digest": "fc96d9d4460e0e4d34441a5df74b2767",
"packagetype": "bdist_wheel",
"python_version": "py3",
"requires_python": ">=3.6",
"size": 3340,
"upload_time": "2024-11-25T03:25:19",
"upload_time_iso_8601": "2024-11-25T03:25:19.488122Z",
"url": "https://files.pythonhosted.org/packages/08/79/49be539d11f69a92f97bf484346a7260e7904e20d571d0bdb37aff63b840/msmthx-0.1.0-py3-none-any.whl",
"yanked": false,
"yanked_reason": null
},
{
"comment_text": "",
"digests": {
"blake2b_256": "0a6573cd3ac6a1550e5fc6c3894e81a45ebd964bc1f8a48699065481bd43cf1e",
"md5": "4566476c64fdd26283579e5e18d351b2",
"sha256": "02ac306262fba2cac25bd6aa795e87c8a8a14eda0c71307723f2b86afe7e7b4e"
},
"downloads": -1,
"filename": "msmthx-0.1.0.tar.gz",
"has_sig": false,
"md5_digest": "4566476c64fdd26283579e5e18d351b2",
"packagetype": "sdist",
"python_version": "source",
"requires_python": ">=3.6",
"size": 3530,
"upload_time": "2024-11-25T03:25:21",
"upload_time_iso_8601": "2024-11-25T03:25:21.300498Z",
"url": "https://files.pythonhosted.org/packages/0a/65/73cd3ac6a1550e5fc6c3894e81a45ebd964bc1f8a48699065481bd43cf1e/msmthx-0.1.0.tar.gz",
"yanked": false,
"yanked_reason": null
}
],
"upload_time": "2024-11-25 03:25:21",
"github": true,
"gitlab": false,
"bitbucket": false,
"codeberg": false,
"github_user": "mamadusama",
"github_project": "ms_toolkit",
"travis_ci": false,
"coveralls": false,
"github_actions": false,
"lcname": "msmthx"
}