unidump


Nameunidump JSON
Version 1.1.4 PyPI version JSON
download
home_pagehttps://github.com/Codepoints/unidump
Summaryhexdump for your Unicode data
upload_time2024-09-03 19:27:24
maintainerNone
docs_urlNone
authorManuel Strehl
requires_pythonNone
licenseMIT
keywords unicode hexdump debugging codepoint utility
VCS
bugtrack_url
requirements No requirements were recorded.
Travis-CI No Travis.
coveralls test coverage No coveralls.
              Ein Unicode-Codepunkt-Dump.

  Denke es dir als hexdump(1) für Unicode. Der Befehl analysiert die Eingabe und
  gibt dann drei Spalten aus: die direkte Byte-Position des ersten Codepunkts in
  dieser Zeile, Codepunkte in ihrer Hex-Schreibweise und schließlich die rohen
  Eingabezeichen, wobei Kontrollzeichen und Leerzeichen durch einen Punkt
  ersetzt wurden.

  Ungültige Byte-Sequenzen werden mit einem „X“ dargestellt und mit dem Hex-Wert
  in Fragezeichen eingeschlossen, z. B., „?F5?“.

  Du kannst Daten von stdin einleiten, mehrere Dateien auf einmal auswählen oder
  sogar alle diese Eingabemethoden durcheinander verwenden.

Beispiele:

  * Basic usage with stdin::

      echo -n 'ABCDEFGHIJKLMNOP' | unidump -n 4
            0    0041 0042 0043 0044    ABCD
            4    0045 0046 0047 0048    EFGH
            8    0049 004A 004B 004C    IJKL
           12    004D 004E 004F 0050    MNOP

  * Dump the code points translated from another encoding::

      unidump -c latin-1 some-legacy-file

  * Dump many files at the same time::

      unidump foo-*.txt

  * Control characters and whitespace are safely rendered::

      echo -n -e '\x01' | unidump -n 1
           0    0001    .

  * Finally learn what your favorite Emoji is composed of::

      ( echo -n -e '\xf0\x9f\xa7\x9d\xf0\x9f\x8f\xbd\xe2' ; \
        echo -n -e '\x80\x8d\xe2\x99\x82\xef\xb8\x8f' ; ) | \
      unidump -n 5
           0    1F9DD 1F3FD 200D 2642 FE0F    .🏽.♂️

  See <https://emojipedia.org/man-elf-medium-skin-tone/> for images. The “elf”
  emoji (the first character) is replaced with a dot here, because the current
  version of Python’s unicodedata doesn’t know of this character yet.

  * Use it like strings(1)::

      unidump -e '{data}' some-file.bin

  Das ersetzt jedes unbekannte Byte aus der Eingabedatei mit „X“ und jedes
  Kontroll- und Leerzeichen mit „.“.

  * Only print the code points of the input::

      unidump -e '{repr}'$'\n' -n 1 some-file.txt

  Das Ergebnis ist eine Folge von Codepunkten in Hex-Notation, jeder auf einer
  eigenen Zeile, ohne Byte-Zähler oder Darstellung der tatsächlichen Daten. Du
  kannst das verwenden, um die Gesamtzahl an Zeichen (nicht rohe Bytes) in einer
  Datei zu bestimmen, indem du es durch `wc -l` pipest.

Das ist version 1.1.4 von unidump mit Unicode-13.0.0-Daten.



            

Raw data

            {
    "_id": null,
    "home_page": "https://github.com/Codepoints/unidump",
    "name": "unidump",
    "maintainer": null,
    "docs_url": null,
    "requires_python": null,
    "maintainer_email": null,
    "keywords": "unicode hexdump debugging codepoint utility",
    "author": "Manuel Strehl",
    "author_email": "boldewyn@gmail.com",
    "download_url": "https://files.pythonhosted.org/packages/58/c1/e5ad58903d895c62206f7a625ee3c1ccd4fe6f70a5b0dd87ed6557e3093b/unidump-1.1.4.tar.gz",
    "platform": null,
    "description": "  Ein Unicode-Codepunkt-Dump.\n\n  Denke es dir als hexdump(1) f\u00fcr Unicode. Der Befehl analysiert die Eingabe und\n  gibt dann drei Spalten aus: die direkte Byte-Position des ersten Codepunkts in\n  dieser Zeile, Codepunkte in ihrer Hex-Schreibweise und schlie\u00dflich die rohen\n  Eingabezeichen, wobei Kontrollzeichen und Leerzeichen durch einen Punkt\n  ersetzt wurden.\n\n  Ung\u00fcltige Byte-Sequenzen werden mit einem \u201eX\u201c dargestellt und mit dem Hex-Wert\n  in Fragezeichen eingeschlossen, z.\u2009B., \u201e?F5?\u201c.\n\n  Du kannst Daten von stdin einleiten, mehrere Dateien auf einmal ausw\u00e4hlen oder\n  sogar alle diese Eingabemethoden durcheinander verwenden.\n\nBeispiele:\n\n  * Basic usage with stdin::\n\n      echo -n 'ABCDEFGHIJKLMNOP' | unidump -n 4\n            0    0041 0042 0043 0044    ABCD\n            4    0045 0046 0047 0048    EFGH\n            8    0049 004A 004B 004C    IJKL\n           12    004D 004E 004F 0050    MNOP\n\n  * Dump the code points translated from another encoding::\n\n      unidump -c latin-1 some-legacy-file\n\n  * Dump many files at the same time::\n\n      unidump foo-*.txt\n\n  * Control characters and whitespace are safely rendered::\n\n      echo -n -e '\\x01' | unidump -n 1\n           0    0001    .\n\n  * Finally learn what your favorite Emoji is composed of::\n\n      ( echo -n -e '\\xf0\\x9f\\xa7\\x9d\\xf0\\x9f\\x8f\\xbd\\xe2' ; \\\n        echo -n -e '\\x80\\x8d\\xe2\\x99\\x82\\xef\\xb8\\x8f' ; ) | \\\n      unidump -n 5\n           0    1F9DD 1F3FD 200D 2642 FE0F    .\ud83c\udffd.\u2642\ufe0f\n\n  See <https://emojipedia.org/man-elf-medium-skin-tone/> for images. The \u201celf\u201d\n  emoji (the first character) is replaced with a dot here, because the current\n  version of Python\u2019s unicodedata doesn\u2019t know of this character yet.\n\n  * Use it like strings(1)::\n\n      unidump -e '{data}' some-file.bin\n\n  Das ersetzt jedes unbekannte Byte aus der Eingabedatei mit \u201eX\u201c und jedes\n  Kontroll- und Leerzeichen mit \u201e.\u201c.\n\n  * Only print the code points of the input::\n\n      unidump -e '{repr}'$'\\n' -n 1 some-file.txt\n\n  Das Ergebnis ist eine Folge von Codepunkten in Hex-Notation, jeder auf einer\n  eigenen Zeile, ohne Byte-Z\u00e4hler oder Darstellung der tats\u00e4chlichen Daten. Du\n  kannst das verwenden, um die Gesamtzahl an Zeichen (nicht rohe Bytes) in einer\n  Datei zu bestimmen, indem du es durch `wc -l` pipest.\n\nDas ist version 1.1.4 von unidump mit Unicode-13.0.0-Daten.\n\n\n",
    "bugtrack_url": null,
    "license": "MIT",
    "summary": "hexdump for your Unicode data",
    "version": "1.1.4",
    "project_urls": {
        "Homepage": "https://github.com/Codepoints/unidump"
    },
    "split_keywords": [
        "unicode",
        "hexdump",
        "debugging",
        "codepoint",
        "utility"
    ],
    "urls": [
        {
            "comment_text": "",
            "digests": {
                "blake2b_256": "c6a37fdce5d74be37ba232ac0371a77aadc0ebe9e0602914560d38c9fd7b842b",
                "md5": "76079ec8b3ca31416751157574e26fde",
                "sha256": "24293269f06cd627255034e0d755526b6d43443eeb104c3c773e50e6b9d8c2cb"
            },
            "downloads": -1,
            "filename": "unidump-1.1.4-py3-none-any.whl",
            "has_sig": false,
            "md5_digest": "76079ec8b3ca31416751157574e26fde",
            "packagetype": "bdist_wheel",
            "python_version": "py3",
            "requires_python": null,
            "size": 11722,
            "upload_time": "2024-09-03T19:27:22",
            "upload_time_iso_8601": "2024-09-03T19:27:22.862199Z",
            "url": "https://files.pythonhosted.org/packages/c6/a3/7fdce5d74be37ba232ac0371a77aadc0ebe9e0602914560d38c9fd7b842b/unidump-1.1.4-py3-none-any.whl",
            "yanked": false,
            "yanked_reason": null
        },
        {
            "comment_text": "",
            "digests": {
                "blake2b_256": "58c1e5ad58903d895c62206f7a625ee3c1ccd4fe6f70a5b0dd87ed6557e3093b",
                "md5": "7630e8eddfb2cdf837ed975427452ebd",
                "sha256": "be39ba0beff5b50cab11f5ce5de9c03c3a4f5437755f2d93e9a176f5c30586b3"
            },
            "downloads": -1,
            "filename": "unidump-1.1.4.tar.gz",
            "has_sig": false,
            "md5_digest": "7630e8eddfb2cdf837ed975427452ebd",
            "packagetype": "sdist",
            "python_version": "source",
            "requires_python": null,
            "size": 10336,
            "upload_time": "2024-09-03T19:27:24",
            "upload_time_iso_8601": "2024-09-03T19:27:24.823598Z",
            "url": "https://files.pythonhosted.org/packages/58/c1/e5ad58903d895c62206f7a625ee3c1ccd4fe6f70a5b0dd87ed6557e3093b/unidump-1.1.4.tar.gz",
            "yanked": false,
            "yanked_reason": null
        }
    ],
    "upload_time": "2024-09-03 19:27:24",
    "github": true,
    "gitlab": false,
    "bitbucket": false,
    "codeberg": false,
    "github_user": "Codepoints",
    "github_project": "unidump",
    "travis_ci": false,
    "coveralls": false,
    "github_actions": false,
    "requirements": [],
    "lcname": "unidump"
}
        
Elapsed time: 0.32719s