简易中文简繁转换
==================================
**zhconv** 提供基于 MediaWiki 词汇表的最大正向匹配简繁转换。Python 2, 3 通用。支持以下地区词转换:
* ``zh-cn`` 大陆简体
* ``zh-tw`` 台灣正體
* ``zh-hk`` 香港繁體
* ``zh-sg`` 马新简体(无词汇表,需要手工指定)
* ``zh-hans`` 简体
* ``zh-hant`` 繁體
示例
----
.. code-block:: pycon
>>> print(convert(u'我幹什麼不干你事。', 'zh-cn'))
我干什么不干你事。
>>> print(convert(u'人体内存在很多微生物', 'zh-tw'))
人體內存在很多微生物
完整支持 MediaWiki 人工转换语法:
.. code-block:: pycon
>>> print(convert_for_mw(u'在现代,机械计算-{}-机的应用已经完全被电子计算-{}-机所取代', 'zh-hk'))
在現代,機械計算機的應用已經完全被電子計算機所取代
>>> print(convert_for_mw(u'-{zh-hant:資訊工程;zh-hans:计算机工程学;}-是电子工程的一个分支,主要研究计算机软硬件和二者间的彼此联系。', 'zh-tw'))
資訊工程是電子工程的一個分支,主要研究計算機軟硬體和二者間的彼此聯繫。
>>> print(convert_for_mw(u'張國榮曾在英國-{zh:利兹;zh-hans:利兹;zh-hk:列斯;zh-tw:里茲}-大学學習。', 'zh-sg'))
张国荣曾在英国利兹大学学习。
>>> print(convert_for_mw('毫米(毫公分),符號mm,是長度單位和降雨量單位,-{zh-hans:台湾作-{公釐}-或-{公厘}-;zh-hant:港澳和大陸稱為-{毫米}-(台灣亦有使用,但較常使用名稱為毫公分);zh-mo:台灣作-{公釐}-或-{公厘}-;zh-hk:台灣作-{公釐}-或-{公厘}-;}-。', 'zh-cn'))
毫米(毫公分),符号mm,是长度单位和降雨量单位,台湾作公釐或公厘。
和其他 `高级字词转换语法 <https://zh.wikipedia.org/wiki/Help:%E9%AB%98%E7%BA%A7%E5%AD%97%E8%AF%8D%E8%BD%AC%E6%8D%A2%E8%AF%AD%E6%B3%95>`_。
命令行工具
----------
::
python -mzhconv [-w] {zh-cn|zh-tw|zh-hk|zh-sg|zh-hans|zh-hant|zh} < input > output
Raw data
{
"_id": null,
"home_page": "https://github.com/gumblex/zhconv",
"name": "zhconv",
"maintainer": "",
"docs_url": "https://pythonhosted.org/zhconv/",
"requires_python": "",
"maintainer_email": "",
"keywords": "chinese conversion",
"author": "Dingyuan Wang",
"author_email": "abcdoyle888@gmail.com",
"download_url": "https://files.pythonhosted.org/packages/25/47/c8ae2d5d4025e253211ff3d8c163f457db1da94976cb582337a5ab76cb87/zhconv-1.4.3.tar.gz",
"platform": "any",
"description": "\n\u7b80\u6613\u4e2d\u6587\u7b80\u7e41\u8f6c\u6362\n==================================\n\n**zhconv** \u63d0\u4f9b\u57fa\u4e8e MediaWiki \u8bcd\u6c47\u8868\u7684\u6700\u5927\u6b63\u5411\u5339\u914d\u7b80\u7e41\u8f6c\u6362\u3002Python 2, 3 \u901a\u7528\u3002\u652f\u6301\u4ee5\u4e0b\u5730\u533a\u8bcd\u8f6c\u6362\uff1a\n\n* ``zh-cn`` \u5927\u9646\u7b80\u4f53\n* ``zh-tw`` \u53f0\u7063\u6b63\u9ad4\n* ``zh-hk`` \u9999\u6e2f\u7e41\u9ad4\n* ``zh-sg`` \u9a6c\u65b0\u7b80\u4f53\uff08\u65e0\u8bcd\u6c47\u8868\uff0c\u9700\u8981\u624b\u5de5\u6307\u5b9a\uff09\n* ``zh-hans`` \u7b80\u4f53\n* ``zh-hant`` \u7e41\u9ad4\n\n\u793a\u4f8b\n----\n\n.. code-block:: pycon\n\n >>> print(convert(u'\u6211\u5e79\u4ec0\u9ebc\u4e0d\u5e72\u4f60\u4e8b\u3002', 'zh-cn'))\n \u6211\u5e72\u4ec0\u4e48\u4e0d\u5e72\u4f60\u4e8b\u3002\n >>> print(convert(u'\u4eba\u4f53\u5185\u5b58\u5728\u5f88\u591a\u5fae\u751f\u7269', 'zh-tw'))\n \u4eba\u9ad4\u5167\u5b58\u5728\u5f88\u591a\u5fae\u751f\u7269\n\n\u5b8c\u6574\u652f\u6301 MediaWiki \u4eba\u5de5\u8f6c\u6362\u8bed\u6cd5\uff1a\n\n.. code-block:: pycon\n\n >>> print(convert_for_mw(u'\u5728\u73b0\u4ee3\uff0c\u673a\u68b0\u8ba1\u7b97-{}-\u673a\u7684\u5e94\u7528\u5df2\u7ecf\u5b8c\u5168\u88ab\u7535\u5b50\u8ba1\u7b97-{}-\u673a\u6240\u53d6\u4ee3', 'zh-hk'))\n \u5728\u73fe\u4ee3\uff0c\u6a5f\u68b0\u8a08\u7b97\u6a5f\u7684\u61c9\u7528\u5df2\u7d93\u5b8c\u5168\u88ab\u96fb\u5b50\u8a08\u7b97\u6a5f\u6240\u53d6\u4ee3\n >>> print(convert_for_mw(u'-{zh-hant:\u8cc7\u8a0a\u5de5\u7a0b;zh-hans:\u8ba1\u7b97\u673a\u5de5\u7a0b\u5b66;}-\u662f\u7535\u5b50\u5de5\u7a0b\u7684\u4e00\u4e2a\u5206\u652f\uff0c\u4e3b\u8981\u7814\u7a76\u8ba1\u7b97\u673a\u8f6f\u786c\u4ef6\u548c\u4e8c\u8005\u95f4\u7684\u5f7c\u6b64\u8054\u7cfb\u3002', 'zh-tw'))\n \u8cc7\u8a0a\u5de5\u7a0b\u662f\u96fb\u5b50\u5de5\u7a0b\u7684\u4e00\u500b\u5206\u652f\uff0c\u4e3b\u8981\u7814\u7a76\u8a08\u7b97\u6a5f\u8edf\u786c\u9ad4\u548c\u4e8c\u8005\u9593\u7684\u5f7c\u6b64\u806f\u7e6b\u3002\n >>> print(convert_for_mw(u'\u5f35\u570b\u69ae\u66fe\u5728\u82f1\u570b-{zh:\u5229\u5179;zh-hans:\u5229\u5179;zh-hk:\u5217\u65af;zh-tw:\u91cc\u8332}-\u5927\u5b66\u5b78\u7fd2\u3002', 'zh-sg'))\n \u5f20\u56fd\u8363\u66fe\u5728\u82f1\u56fd\u5229\u5179\u5927\u5b66\u5b66\u4e60\u3002\n >>> print(convert_for_mw('\u6beb\u7c73(\u6beb\u516c\u5206)\uff0c\u7b26\u865fmm\uff0c\u662f\u9577\u5ea6\u55ae\u4f4d\u548c\u964d\u96e8\u91cf\u55ae\u4f4d\uff0c-{zh-hans:\u53f0\u6e7e\u4f5c-{\u516c\u91d0}-\u6216-{\u516c\u5398}-;zh-hant:\u6e2f\u6fb3\u548c\u5927\u9678\u7a31\u70ba-{\u6beb\u7c73}-\uff08\u53f0\u7063\u4ea6\u6709\u4f7f\u7528\uff0c\u4f46\u8f03\u5e38\u4f7f\u7528\u540d\u7a31\u70ba\u6beb\u516c\u5206\uff09;zh-mo:\u53f0\u7063\u4f5c-{\u516c\u91d0}-\u6216-{\u516c\u5398}-;zh-hk:\u53f0\u7063\u4f5c-{\u516c\u91d0}-\u6216-{\u516c\u5398}-;}-\u3002', 'zh-cn'))\n \u6beb\u7c73(\u6beb\u516c\u5206)\uff0c\u7b26\u53f7mm\uff0c\u662f\u957f\u5ea6\u5355\u4f4d\u548c\u964d\u96e8\u91cf\u5355\u4f4d\uff0c\u53f0\u6e7e\u4f5c\u516c\u91d0\u6216\u516c\u5398\u3002\n\n\u548c\u5176\u4ed6 `\u9ad8\u7ea7\u5b57\u8bcd\u8f6c\u6362\u8bed\u6cd5 <https://zh.wikipedia.org/wiki/Help:%E9%AB%98%E7%BA%A7%E5%AD%97%E8%AF%8D%E8%BD%AC%E6%8D%A2%E8%AF%AD%E6%B3%95>`_\u3002\n\n\u547d\u4ee4\u884c\u5de5\u5177\n----------\n\n::\n\n python -mzhconv [-w] {zh-cn|zh-tw|zh-hk|zh-sg|zh-hans|zh-hant|zh} < input > output\n\n\n",
"bugtrack_url": null,
"license": "GPLv2+",
"summary": "A simple implementation of Simplified-Traditional Chinese conversion.",
"version": "1.4.3",
"split_keywords": [
"chinese",
"conversion"
],
"urls": [
{
"comment_text": "",
"digests": {
"md5": "ad2636e382bdbf5982c3b0ce623b2419",
"sha256": "ad42d9057ca0605f8e41d62b67ca797f879f58193ee6840562c51459b2698c45"
},
"downloads": -1,
"filename": "zhconv-1.4.3.tar.gz",
"has_sig": true,
"md5_digest": "ad2636e382bdbf5982c3b0ce623b2419",
"packagetype": "sdist",
"python_version": "source",
"requires_python": null,
"size": 211571,
"upload_time": "2021-10-31T05:59:44",
"upload_time_iso_8601": "2021-10-31T05:59:44.096957Z",
"url": "https://files.pythonhosted.org/packages/25/47/c8ae2d5d4025e253211ff3d8c163f457db1da94976cb582337a5ab76cb87/zhconv-1.4.3.tar.gz",
"yanked": false,
"yanked_reason": null
}
],
"upload_time": "2021-10-31 05:59:44",
"github": true,
"gitlab": false,
"bitbucket": false,
"github_user": "gumblex",
"github_project": "zhconv",
"travis_ci": false,
"coveralls": false,
"github_actions": false,
"lcname": "zhconv"
}