# tamil-nlp-package
It is a repository for Tamil NLP packages as pip installable
## steps for installation and dependencies
Install and update using pip:
```bash
pip install tamil_nlp_package_test
```
## Tamil Sentence Tokenizer Example
```python
from tamil_nlp_package_test import sent_tokenizer as tt
input_text = "ஒவ்வொருவருக்கும் கல்வி கற்பதற்கான உரிமையுண்டு. குறைந்தது ெதாடக்க அடிப்படைக் கட்டங்களிலாவது கல்வி இலவசமானதாயிருத்தல் வேண்டும். தொடக்கக் கல்வி கட்டாயப்படுத்தல் வேண்டும். தொழில் நுட்பக் கல்வியும் உயர் தொழிற் கல்வியும் பொதுவாகப் பெறப்படத்தக்கனவாயிருத்தல் வேண்டும். உயர் கல்வியானது யாவருக்கும் திறமையடிப்படையின் மீது சமமான முறையில் கிடைக்கக் கூடியதாக்கப்படுதலும் வேண்டும். கல்வியானது மனிதனின் ஆளுமையை முழுதாக விருத்தி ெசய்யுமுகமாகவும் மனிதவுரிமைகளுக்கும் அடிப்படைச் சுதந்திரங்களுக்குமான மரியாதையை வலுப்படு்த்துமுகமாகவும் ஆற்றப்படுத்தப்படல் வேண்டும். அது சகல நாடுகளுக்கிடையேயும், இன அல்லத மதக் குழுவினருக்கிைடயேயும் மன ஒத்திசைவு, பொறுதியுணர்வு, தோழமை, ஆகியவற்றை மேம்படுத்துதல் வேண்டுமென்பதுடன், சமாதானத்தைப் பேணுவதற்காக ஐக்கிய நாடுகள் சபையின் முயற்சிகளை மேற்கொண்டு செல்லுவதற்குதவவும் வேண்டும்."
output = tt.tokenize(input_text)
print(output)
```
### Output
```text
ஒவ்வொருவருக்கும் கல்வி கற்பதற்கான உரிமையுண்டு.
குறைந்தது ெதாடக்க அடிப்படைக் கட்டங்களிலாவது கல்வி இலவசமானதாயிருத்தல் வேண்டும்.
தொடக்கக் கல்வி கட்டாயப்படுத்தல் வேண்டும்.
தொழில் நுட்பக் கல்வியும் உயர் தொழிற் கல்வியும் பொதுவாகப் பெறப்படத்தக்கனவாயிருத்தல் வேண்டும்.
```
## Tamil Word Tokenizer Example
### input file - sample.txt
```text
ஒவ்வொருவருக்கும் கல்வி கற்பதற்கான உரிமையுண்டு.
குறைந்தது ெதாடக்க அடிப்படைக் கட்டங்களிலாவது கல்வி இலவசமானதாயிருத்தல் வேண்டும்.
தொடக்கக் கல்வி கட்டாயப்படுத்தல் வேண்டும்.
தொழில் நுட்பக் கல்வியும் உயர் தொழிற் கல்வியும் பொதுவாகப் பெறப்படத்தக்கனவாயிருத்தல் வேண்டும்.
```
```python
from tamil_nlp_package_test import word_tokenizer as wt
lang = 'tam' # tam - Tamil, Hindi - hin ...
input_file_name = 'sample.txt' # input filename as string.
output_file_name = 'output' # output filename as string.
output = wt.tokenize(lang, input_file_name, output_file_name)
# It'll return a result in a text file as output_file_name.
```
### output file - output.txt
```text
# Sent_id = 1
# text = தொடக்கக் கல்வி கட்டாயப்படுத்தல் வேண்டும்.
# transliteration =  toṭakkak kalwi kaṭṭāyappaṭuttal wēṇṭum.
# url = ஒவ்வொருவருக்கும் கல்வி கற்பதற்கான உரிமையுண்டு.	குறைந்தது ெதாடக்க அடிப்படைக் கட்டங்களிலாவது கல்வி இலவசமானதாயிருத்தல் வேண்டும்.
# wtok =தொடக்கக் கல்வி கட்டாயப்படுத்தல் வேண்டும் .
1 தொடக்கக் unk
2 கல்வி unk
3 கட்டாயப்படுத்தல் unk
4 வேண்டும் unk
# Sent_id = 2
# text = தொழில் நுட்பக் கல்வியும் உயர் தொழிற் கல்வியும் பொதுவாகப் பெறப்படத்தக்கனவாயிருத்தல் வேண்டும்.
# transliteration =  toẓil nuṭpak kalwiyum uyar toẓiṟ kalwiyum potuwākap peṟappaṭattakkaṉawāyiruttal wēṇṭum.
# url = ஒவ்வொருவருக்கும் கல்வி கற்பதற்கான உரிமையுண்டு.	குறைந்தது ெதாடக்க அடிப்படைக் கட்டங்களிலாவது கல்வி இலவசமானதாயிருத்தல் வேண்டும்.
# wtok =தொழில் நுட்பக் கல்வியும் உயர் தொழிற் கல்வியும் பொதுவாகப் பெறப்படத்தக்கனவாயிருத்தல் வேண்டும் .
1 தொழில் unk
2 நுட்பக் unk
3 கல்வியும் unk
4 உயர் unk
5 தொழிற் unk
6 கல்வியும் unk
7 பொதுவாகப் unk
8 பெறப்படத்தக்கனவாயிருத்தல் unk
9 வேண்டும் unk
```
            
         
        Raw data
        
            {
    "_id": null,
    "home_page": "",
    "name": "tamil-nlp-package-test",
    "maintainer": "",
    "docs_url": null,
    "requires_python": ">=3.6,<4.0",
    "maintainer_email": "",
    "keywords": "",
    "author": "Author",
    "author_email": "",
    "download_url": "https://files.pythonhosted.org/packages/28/31/565e4bc8acd3b48c20dceee5d83ec3ccfc129c9db92589deb873db73c837/tamil_nlp_package_test-1.4.tar.gz",
    "platform": null,
    "description": "# tamil-nlp-package\nIt is a repository for Tamil NLP packages as pip installable\n\n## steps for installation and dependencies\nInstall and update using pip:\n```bash\npip install tamil_nlp_package_test\n```\n\n## Tamil Sentence Tokenizer Example\n\n```python\nfrom tamil_nlp_package_test import sent_tokenizer as tt\n\ninput_text = \"\u0b92\u0bb5\u0bcd\u0bb5\u0bca\u0bb0\u0bc1\u0bb5\u0bb0\u0bc1\u0b95\u0bcd\u0b95\u0bc1\u0bae\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b95\u0bb1\u0bcd\u0baa\u0ba4\u0bb1\u0bcd\u0b95\u0bbe\u0ba9 \u0b89\u0bb0\u0bbf\u0bae\u0bc8\u0baf\u0bc1\u0ba3\u0bcd\u0b9f\u0bc1. \u0b95\u0bc1\u0bb1\u0bc8\u0ba8\u0bcd\u0ba4\u0ba4\u0bc1 \u0bc6\u0ba4\u0bbe\u0b9f\u0b95\u0bcd\u0b95 \u0b85\u0b9f\u0bbf\u0baa\u0bcd\u0baa\u0b9f\u0bc8\u0b95\u0bcd \u0b95\u0b9f\u0bcd\u0b9f\u0b99\u0bcd\u0b95\u0bb3\u0bbf\u0bb2\u0bbe\u0bb5\u0ba4\u0bc1 \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b87\u0bb2\u0bb5\u0b9a\u0bae\u0bbe\u0ba9\u0ba4\u0bbe\u0baf\u0bbf\u0bb0\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd. \u0ba4\u0bca\u0b9f\u0b95\u0bcd\u0b95\u0b95\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b95\u0b9f\u0bcd\u0b9f\u0bbe\u0baf\u0baa\u0bcd\u0baa\u0b9f\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd. \u0ba4\u0bca\u0bb4\u0bbf\u0bb2\u0bcd \u0ba8\u0bc1\u0b9f\u0bcd\u0baa\u0b95\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf\u0baf\u0bc1\u0bae\u0bcd \u0b89\u0baf\u0bb0\u0bcd \u0ba4\u0bca\u0bb4\u0bbf\u0bb1\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf\u0baf\u0bc1\u0bae\u0bcd \u0baa\u0bca\u0ba4\u0bc1\u0bb5\u0bbe\u0b95\u0baa\u0bcd \u0baa\u0bc6\u0bb1\u0baa\u0bcd\u0baa\u0b9f\u0ba4\u0bcd\u0ba4\u0b95\u0bcd\u0b95\u0ba9\u0bb5\u0bbe\u0baf\u0bbf\u0bb0\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd. \u0b89\u0baf\u0bb0\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf\u0baf\u0bbe\u0ba9\u0ba4\u0bc1 \u0baf\u0bbe\u0bb5\u0bb0\u0bc1\u0b95\u0bcd\u0b95\u0bc1\u0bae\u0bcd \u0ba4\u0bbf\u0bb1\u0bae\u0bc8\u0baf\u0b9f\u0bbf\u0baa\u0bcd\u0baa\u0b9f\u0bc8\u0baf\u0bbf\u0ba9\u0bcd \u0bae\u0bc0\u0ba4\u0bc1 \u0b9a\u0bae\u0bae\u0bbe\u0ba9 \u0bae\u0bc1\u0bb1\u0bc8\u0baf\u0bbf\u0bb2\u0bcd \u0b95\u0bbf\u0b9f\u0bc8\u0b95\u0bcd\u0b95\u0b95\u0bcd \u0b95\u0bc2\u0b9f\u0bbf\u0baf\u0ba4\u0bbe\u0b95\u0bcd\u0b95\u0baa\u0bcd\u0baa\u0b9f\u0bc1\u0ba4\u0bb2\u0bc1\u0bae\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd. \u0b95\u0bb2\u0bcd\u0bb5\u0bbf\u0baf\u0bbe\u0ba9\u0ba4\u0bc1 \u0bae\u0ba9\u0bbf\u0ba4\u0ba9\u0bbf\u0ba9\u0bcd \u0b86\u0bb3\u0bc1\u0bae\u0bc8\u0baf\u0bc8 \u0bae\u0bc1\u0bb4\u0bc1\u0ba4\u0bbe\u0b95 \u0bb5\u0bbf\u0bb0\u0bc1\u0ba4\u0bcd\u0ba4\u0bbf \u0bc6\u0b9a\u0baf\u0bcd\u0baf\u0bc1\u0bae\u0bc1\u0b95\u0bae\u0bbe\u0b95\u0bb5\u0bc1\u0bae\u0bcd \u0bae\u0ba9\u0bbf\u0ba4\u0bb5\u0bc1\u0bb0\u0bbf\u0bae\u0bc8\u0b95\u0bb3\u0bc1\u0b95\u0bcd\u0b95\u0bc1\u0bae\u0bcd \u0b85\u0b9f\u0bbf\u0baa\u0bcd\u0baa\u0b9f\u0bc8\u0b9a\u0bcd \u0b9a\u0bc1\u0ba4\u0ba8\u0bcd\u0ba4\u0bbf\u0bb0\u0b99\u0bcd\u0b95\u0bb3\u0bc1\u0b95\u0bcd\u0b95\u0bc1\u0bae\u0bbe\u0ba9 \u0bae\u0bb0\u0bbf\u0baf\u0bbe\u0ba4\u0bc8\u0baf\u0bc8 \u0bb5\u0bb2\u0bc1\u0baa\u0bcd\u0baa\u0b9f\u0bc1\u0bcd\u0ba4\u0bcd\u0ba4\u0bc1\u0bae\u0bc1\u0b95\u0bae\u0bbe\u0b95\u0bb5\u0bc1\u0bae\u0bcd \u0b86\u0bb1\u0bcd\u0bb1\u0baa\u0bcd\u0baa\u0b9f\u0bc1\u0ba4\u0bcd\u0ba4\u0baa\u0bcd\u0baa\u0b9f\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd. \u0b85\u0ba4\u0bc1 \u0b9a\u0b95\u0bb2 \u0ba8\u0bbe\u0b9f\u0bc1\u0b95\u0bb3\u0bc1\u0b95\u0bcd\u0b95\u0bbf\u0b9f\u0bc8\u0baf\u0bc7\u0baf\u0bc1\u0bae\u0bcd, \u0b87\u0ba9 \u0b85\u0bb2\u0bcd\u0bb2\u0ba4 \u0bae\u0ba4\u0b95\u0bcd \u0b95\u0bc1\u0bb4\u0bc1\u0bb5\u0bbf\u0ba9\u0bb0\u0bc1\u0b95\u0bcd\u0b95\u0bbf\u0bc8\u0b9f\u0baf\u0bc7\u0baf\u0bc1\u0bae\u0bcd \u0bae\u0ba9 \u0b92\u0ba4\u0bcd\u0ba4\u0bbf\u0b9a\u0bc8\u0bb5\u0bc1, \u0baa\u0bca\u0bb1\u0bc1\u0ba4\u0bbf\u0baf\u0bc1\u0ba3\u0bb0\u0bcd\u0bb5\u0bc1, \u0ba4\u0bcb\u0bb4\u0bae\u0bc8, \u0b86\u0b95\u0bbf\u0baf\u0bb5\u0bb1\u0bcd\u0bb1\u0bc8 \u0bae\u0bc7\u0bae\u0bcd\u0baa\u0b9f\u0bc1\u0ba4\u0bcd\u0ba4\u0bc1\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bc6\u0ba9\u0bcd\u0baa\u0ba4\u0bc1\u0b9f\u0ba9\u0bcd, \u0b9a\u0bae\u0bbe\u0ba4\u0bbe\u0ba9\u0ba4\u0bcd\u0ba4\u0bc8\u0baa\u0bcd \u0baa\u0bc7\u0ba3\u0bc1\u0bb5\u0ba4\u0bb1\u0bcd\u0b95\u0bbe\u0b95 \u0b90\u0b95\u0bcd\u0b95\u0bbf\u0baf \u0ba8\u0bbe\u0b9f\u0bc1\u0b95\u0bb3\u0bcd \u0b9a\u0baa\u0bc8\u0baf\u0bbf\u0ba9\u0bcd \u0bae\u0bc1\u0baf\u0bb1\u0bcd\u0b9a\u0bbf\u0b95\u0bb3\u0bc8 \u0bae\u0bc7\u0bb1\u0bcd\u0b95\u0bca\u0ba3\u0bcd\u0b9f\u0bc1 \u0b9a\u0bc6\u0bb2\u0bcd\u0bb2\u0bc1\u0bb5\u0ba4\u0bb1\u0bcd\u0b95\u0bc1\u0ba4\u0bb5\u0bb5\u0bc1\u0bae\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd.\"\noutput = tt.tokenize(input_text)\nprint(output)\n```\n\n### Output\n```text\n\u0b92\u0bb5\u0bcd\u0bb5\u0bca\u0bb0\u0bc1\u0bb5\u0bb0\u0bc1\u0b95\u0bcd\u0b95\u0bc1\u0bae\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b95\u0bb1\u0bcd\u0baa\u0ba4\u0bb1\u0bcd\u0b95\u0bbe\u0ba9 \u0b89\u0bb0\u0bbf\u0bae\u0bc8\u0baf\u0bc1\u0ba3\u0bcd\u0b9f\u0bc1.\n\u0b95\u0bc1\u0bb1\u0bc8\u0ba8\u0bcd\u0ba4\u0ba4\u0bc1 \u0bc6\u0ba4\u0bbe\u0b9f\u0b95\u0bcd\u0b95 \u0b85\u0b9f\u0bbf\u0baa\u0bcd\u0baa\u0b9f\u0bc8\u0b95\u0bcd \u0b95\u0b9f\u0bcd\u0b9f\u0b99\u0bcd\u0b95\u0bb3\u0bbf\u0bb2\u0bbe\u0bb5\u0ba4\u0bc1 \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b87\u0bb2\u0bb5\u0b9a\u0bae\u0bbe\u0ba9\u0ba4\u0bbe\u0baf\u0bbf\u0bb0\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd.\n\u0ba4\u0bca\u0b9f\u0b95\u0bcd\u0b95\u0b95\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b95\u0b9f\u0bcd\u0b9f\u0bbe\u0baf\u0baa\u0bcd\u0baa\u0b9f\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd.\n\u0ba4\u0bca\u0bb4\u0bbf\u0bb2\u0bcd \u0ba8\u0bc1\u0b9f\u0bcd\u0baa\u0b95\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf\u0baf\u0bc1\u0bae\u0bcd \u0b89\u0baf\u0bb0\u0bcd \u0ba4\u0bca\u0bb4\u0bbf\u0bb1\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf\u0baf\u0bc1\u0bae\u0bcd \u0baa\u0bca\u0ba4\u0bc1\u0bb5\u0bbe\u0b95\u0baa\u0bcd \u0baa\u0bc6\u0bb1\u0baa\u0bcd\u0baa\u0b9f\u0ba4\u0bcd\u0ba4\u0b95\u0bcd\u0b95\u0ba9\u0bb5\u0bbe\u0baf\u0bbf\u0bb0\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd.\n```\n\n## Tamil Word Tokenizer Example\n### input file - sample.txt\n```text\n\u0b92\u0bb5\u0bcd\u0bb5\u0bca\u0bb0\u0bc1\u0bb5\u0bb0\u0bc1\u0b95\u0bcd\u0b95\u0bc1\u0bae\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b95\u0bb1\u0bcd\u0baa\u0ba4\u0bb1\u0bcd\u0b95\u0bbe\u0ba9 \u0b89\u0bb0\u0bbf\u0bae\u0bc8\u0baf\u0bc1\u0ba3\u0bcd\u0b9f\u0bc1.\n\u0b95\u0bc1\u0bb1\u0bc8\u0ba8\u0bcd\u0ba4\u0ba4\u0bc1 \u0bc6\u0ba4\u0bbe\u0b9f\u0b95\u0bcd\u0b95 \u0b85\u0b9f\u0bbf\u0baa\u0bcd\u0baa\u0b9f\u0bc8\u0b95\u0bcd \u0b95\u0b9f\u0bcd\u0b9f\u0b99\u0bcd\u0b95\u0bb3\u0bbf\u0bb2\u0bbe\u0bb5\u0ba4\u0bc1 \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b87\u0bb2\u0bb5\u0b9a\u0bae\u0bbe\u0ba9\u0ba4\u0bbe\u0baf\u0bbf\u0bb0\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd.\n\u0ba4\u0bca\u0b9f\u0b95\u0bcd\u0b95\u0b95\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b95\u0b9f\u0bcd\u0b9f\u0bbe\u0baf\u0baa\u0bcd\u0baa\u0b9f\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd.\n\u0ba4\u0bca\u0bb4\u0bbf\u0bb2\u0bcd \u0ba8\u0bc1\u0b9f\u0bcd\u0baa\u0b95\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf\u0baf\u0bc1\u0bae\u0bcd \u0b89\u0baf\u0bb0\u0bcd \u0ba4\u0bca\u0bb4\u0bbf\u0bb1\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf\u0baf\u0bc1\u0bae\u0bcd \u0baa\u0bca\u0ba4\u0bc1\u0bb5\u0bbe\u0b95\u0baa\u0bcd \u0baa\u0bc6\u0bb1\u0baa\u0bcd\u0baa\u0b9f\u0ba4\u0bcd\u0ba4\u0b95\u0bcd\u0b95\u0ba9\u0bb5\u0bbe\u0baf\u0bbf\u0bb0\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd.\n```\n\n```python\nfrom tamil_nlp_package_test import word_tokenizer as wt\n\nlang = 'tam' # tam - Tamil, Hindi - hin ...\ninput_file_name = 'sample.txt' # input filename as string.\noutput_file_name = 'output' # output filename as string.\noutput = wt.tokenize(lang, input_file_name, output_file_name)\n\n# It'll return a result in a text file as output_file_name.\n```\n\n### output file - output.txt\n```text\n# Sent_id = 1\n# text = \u0ba4\u0bca\u0b9f\u0b95\u0bcd\u0b95\u0b95\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b95\u0b9f\u0bcd\u0b9f\u0bbe\u0baf\u0baa\u0bcd\u0baa\u0b9f\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd.\n# transliteration =  to\u1e6dakkak kalwi ka\u1e6d\u1e6d\u0101yappa\u1e6duttal w\u0113\u1e47\u1e6dum.\n# url = \u0b92\u0bb5\u0bcd\u0bb5\u0bca\u0bb0\u0bc1\u0bb5\u0bb0\u0bc1\u0b95\u0bcd\u0b95\u0bc1\u0bae\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b95\u0bb1\u0bcd\u0baa\u0ba4\u0bb1\u0bcd\u0b95\u0bbe\u0ba9 \u0b89\u0bb0\u0bbf\u0bae\u0bc8\u0baf\u0bc1\u0ba3\u0bcd\u0b9f\u0bc1.\t\u0b95\u0bc1\u0bb1\u0bc8\u0ba8\u0bcd\u0ba4\u0ba4\u0bc1 \u0bc6\u0ba4\u0bbe\u0b9f\u0b95\u0bcd\u0b95 \u0b85\u0b9f\u0bbf\u0baa\u0bcd\u0baa\u0b9f\u0bc8\u0b95\u0bcd \u0b95\u0b9f\u0bcd\u0b9f\u0b99\u0bcd\u0b95\u0bb3\u0bbf\u0bb2\u0bbe\u0bb5\u0ba4\u0bc1 \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b87\u0bb2\u0bb5\u0b9a\u0bae\u0bbe\u0ba9\u0ba4\u0bbe\u0baf\u0bbf\u0bb0\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd.\n# wtok =\u0ba4\u0bca\u0b9f\u0b95\u0bcd\u0b95\u0b95\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b95\u0b9f\u0bcd\u0b9f\u0bbe\u0baf\u0baa\u0bcd\u0baa\u0b9f\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd .\n1 \u0ba4\u0bca\u0b9f\u0b95\u0bcd\u0b95\u0b95\u0bcd unk\n2 \u0b95\u0bb2\u0bcd\u0bb5\u0bbf unk\n3 \u0b95\u0b9f\u0bcd\u0b9f\u0bbe\u0baf\u0baa\u0bcd\u0baa\u0b9f\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd unk\n4 \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd unk\n\n# Sent_id = 2\n# text = \u0ba4\u0bca\u0bb4\u0bbf\u0bb2\u0bcd \u0ba8\u0bc1\u0b9f\u0bcd\u0baa\u0b95\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf\u0baf\u0bc1\u0bae\u0bcd \u0b89\u0baf\u0bb0\u0bcd \u0ba4\u0bca\u0bb4\u0bbf\u0bb1\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf\u0baf\u0bc1\u0bae\u0bcd \u0baa\u0bca\u0ba4\u0bc1\u0bb5\u0bbe\u0b95\u0baa\u0bcd \u0baa\u0bc6\u0bb1\u0baa\u0bcd\u0baa\u0b9f\u0ba4\u0bcd\u0ba4\u0b95\u0bcd\u0b95\u0ba9\u0bb5\u0bbe\u0baf\u0bbf\u0bb0\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd.\n# transliteration =  to\u1e93il nu\u1e6dpak kalwiyum uyar to\u1e93i\u1e5f kalwiyum potuw\u0101kap pe\u1e5fappa\u1e6dattakka\u1e49aw\u0101yiruttal w\u0113\u1e47\u1e6dum.\n# url = \u0b92\u0bb5\u0bcd\u0bb5\u0bca\u0bb0\u0bc1\u0bb5\u0bb0\u0bc1\u0b95\u0bcd\u0b95\u0bc1\u0bae\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b95\u0bb1\u0bcd\u0baa\u0ba4\u0bb1\u0bcd\u0b95\u0bbe\u0ba9 \u0b89\u0bb0\u0bbf\u0bae\u0bc8\u0baf\u0bc1\u0ba3\u0bcd\u0b9f\u0bc1.\t\u0b95\u0bc1\u0bb1\u0bc8\u0ba8\u0bcd\u0ba4\u0ba4\u0bc1 \u0bc6\u0ba4\u0bbe\u0b9f\u0b95\u0bcd\u0b95 \u0b85\u0b9f\u0bbf\u0baa\u0bcd\u0baa\u0b9f\u0bc8\u0b95\u0bcd \u0b95\u0b9f\u0bcd\u0b9f\u0b99\u0bcd\u0b95\u0bb3\u0bbf\u0bb2\u0bbe\u0bb5\u0ba4\u0bc1 \u0b95\u0bb2\u0bcd\u0bb5\u0bbf \u0b87\u0bb2\u0bb5\u0b9a\u0bae\u0bbe\u0ba9\u0ba4\u0bbe\u0baf\u0bbf\u0bb0\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd.\n# wtok =\u0ba4\u0bca\u0bb4\u0bbf\u0bb2\u0bcd \u0ba8\u0bc1\u0b9f\u0bcd\u0baa\u0b95\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf\u0baf\u0bc1\u0bae\u0bcd \u0b89\u0baf\u0bb0\u0bcd \u0ba4\u0bca\u0bb4\u0bbf\u0bb1\u0bcd \u0b95\u0bb2\u0bcd\u0bb5\u0bbf\u0baf\u0bc1\u0bae\u0bcd \u0baa\u0bca\u0ba4\u0bc1\u0bb5\u0bbe\u0b95\u0baa\u0bcd \u0baa\u0bc6\u0bb1\u0baa\u0bcd\u0baa\u0b9f\u0ba4\u0bcd\u0ba4\u0b95\u0bcd\u0b95\u0ba9\u0bb5\u0bbe\u0baf\u0bbf\u0bb0\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd .\n1 \u0ba4\u0bca\u0bb4\u0bbf\u0bb2\u0bcd unk\n2 \u0ba8\u0bc1\u0b9f\u0bcd\u0baa\u0b95\u0bcd unk\n3 \u0b95\u0bb2\u0bcd\u0bb5\u0bbf\u0baf\u0bc1\u0bae\u0bcd unk\n4 \u0b89\u0baf\u0bb0\u0bcd unk\n5 \u0ba4\u0bca\u0bb4\u0bbf\u0bb1\u0bcd unk\n6 \u0b95\u0bb2\u0bcd\u0bb5\u0bbf\u0baf\u0bc1\u0bae\u0bcd unk\n7 \u0baa\u0bca\u0ba4\u0bc1\u0bb5\u0bbe\u0b95\u0baa\u0bcd unk\n8 \u0baa\u0bc6\u0bb1\u0baa\u0bcd\u0baa\u0b9f\u0ba4\u0bcd\u0ba4\u0b95\u0bcd\u0b95\u0ba9\u0bb5\u0bbe\u0baf\u0bbf\u0bb0\u0bc1\u0ba4\u0bcd\u0ba4\u0bb2\u0bcd unk\n9 \u0bb5\u0bc7\u0ba3\u0bcd\u0b9f\u0bc1\u0bae\u0bcd unk\n```\n\n",
    "bugtrack_url": null,
    "license": "GNU GENERAL PUBLIC LICENSE",
    "summary": "Description",
    "version": "1.4",
    "project_urls": null,
    "split_keywords": [],
    "urls": [
        {
            "comment_text": "",
            "digests": {
                "blake2b_256": "529a97dfa7795aaeef525db24a6cd1e739b64c0d0c7cb294f77e3c50c8d8b7f6",
                "md5": "3cad95c4c2e1aa2d17c599925369890e",
                "sha256": "cf18c7170498c2f7a96cd1c5aa43f99c7720060340b9038536718ff13edcd0c1"
            },
            "downloads": -1,
            "filename": "tamil_nlp_package_test-1.4-py3-none-any.whl",
            "has_sig": false,
            "md5_digest": "3cad95c4c2e1aa2d17c599925369890e",
            "packagetype": "bdist_wheel",
            "python_version": "py3",
            "requires_python": ">=3.6,<4.0",
            "size": 52169,
            "upload_time": "2024-01-31T10:54:44",
            "upload_time_iso_8601": "2024-01-31T10:54:44.363347Z",
            "url": "https://files.pythonhosted.org/packages/52/9a/97dfa7795aaeef525db24a6cd1e739b64c0d0c7cb294f77e3c50c8d8b7f6/tamil_nlp_package_test-1.4-py3-none-any.whl",
            "yanked": false,
            "yanked_reason": null
        },
        {
            "comment_text": "",
            "digests": {
                "blake2b_256": "2831565e4bc8acd3b48c20dceee5d83ec3ccfc129c9db92589deb873db73c837",
                "md5": "82fe719c5ac5864c41b2f8955893f286",
                "sha256": "46d9770a83e2bd27766a29250e4ec9051255dc31677d361690176b05290a9226"
            },
            "downloads": -1,
            "filename": "tamil_nlp_package_test-1.4.tar.gz",
            "has_sig": false,
            "md5_digest": "82fe719c5ac5864c41b2f8955893f286",
            "packagetype": "sdist",
            "python_version": "source",
            "requires_python": ">=3.6,<4.0",
            "size": 41529,
            "upload_time": "2024-01-31T10:54:46",
            "upload_time_iso_8601": "2024-01-31T10:54:46.544661Z",
            "url": "https://files.pythonhosted.org/packages/28/31/565e4bc8acd3b48c20dceee5d83ec3ccfc129c9db92589deb873db73c837/tamil_nlp_package_test-1.4.tar.gz",
            "yanked": false,
            "yanked_reason": null
        }
    ],
    "upload_time": "2024-01-31 10:54:46",
    "github": false,
    "gitlab": false,
    "bitbucket": false,
    "codeberg": false,
    "lcname": "tamil-nlp-package-test"
}