Ein Unicode-Codepunkt-Dump.
Denke es dir als hexdump(1) für Unicode. Der Befehl analysiert die Eingabe und
gibt dann drei Spalten aus: die direkte Byte-Position des ersten Codepunkts in
dieser Zeile, Codepunkte in ihrer Hex-Schreibweise und schließlich die rohen
Eingabezeichen, wobei Kontrollzeichen und Leerzeichen durch einen Punkt
ersetzt wurden.
Ungültige Byte-Sequenzen werden mit einem „X“ dargestellt und mit dem Hex-Wert
in Fragezeichen eingeschlossen, z. B., „?F5?“.
Du kannst Daten von stdin einleiten, mehrere Dateien auf einmal auswählen oder
sogar alle diese Eingabemethoden durcheinander verwenden.
Beispiele:
* Basic usage with stdin::
echo -n 'ABCDEFGHIJKLMNOP' | unidump -n 4
0 0041 0042 0043 0044 ABCD
4 0045 0046 0047 0048 EFGH
8 0049 004A 004B 004C IJKL
12 004D 004E 004F 0050 MNOP
* Dump the code points translated from another encoding::
unidump -c latin-1 some-legacy-file
* Dump many files at the same time::
unidump foo-*.txt
* Control characters and whitespace are safely rendered::
echo -n -e '\x01' | unidump -n 1
0 0001 .
* Finally learn what your favorite Emoji is composed of::
( echo -n -e '\xf0\x9f\xa7\x9d\xf0\x9f\x8f\xbd\xe2' ; \
echo -n -e '\x80\x8d\xe2\x99\x82\xef\xb8\x8f' ; ) | \
unidump -n 5
0 1F9DD 1F3FD 200D 2642 FE0F .🏽.♂️
See <https://emojipedia.org/man-elf-medium-skin-tone/> for images. The “elf”
emoji (the first character) is replaced with a dot here, because the current
version of Python’s unicodedata doesn’t know of this character yet.
* Use it like strings(1)::
unidump -e '{data}' some-file.bin
Das ersetzt jedes unbekannte Byte aus der Eingabedatei mit „X“ und jedes
Kontroll- und Leerzeichen mit „.“.
* Only print the code points of the input::
unidump -e '{repr}'$'\n' -n 1 some-file.txt
Das Ergebnis ist eine Folge von Codepunkten in Hex-Notation, jeder auf einer
eigenen Zeile, ohne Byte-Zähler oder Darstellung der tatsächlichen Daten. Du
kannst das verwenden, um die Gesamtzahl an Zeichen (nicht rohe Bytes) in einer
Datei zu bestimmen, indem du es durch `wc -l` pipest.
Das ist version 1.1.4 von unidump mit Unicode-13.0.0-Daten.
Raw data
{
"_id": null,
"home_page": "https://github.com/Codepoints/unidump",
"name": "unidump",
"maintainer": null,
"docs_url": null,
"requires_python": null,
"maintainer_email": null,
"keywords": "unicode hexdump debugging codepoint utility",
"author": "Manuel Strehl",
"author_email": "boldewyn@gmail.com",
"download_url": "https://files.pythonhosted.org/packages/58/c1/e5ad58903d895c62206f7a625ee3c1ccd4fe6f70a5b0dd87ed6557e3093b/unidump-1.1.4.tar.gz",
"platform": null,
"description": " Ein Unicode-Codepunkt-Dump.\n\n Denke es dir als hexdump(1) f\u00fcr Unicode. Der Befehl analysiert die Eingabe und\n gibt dann drei Spalten aus: die direkte Byte-Position des ersten Codepunkts in\n dieser Zeile, Codepunkte in ihrer Hex-Schreibweise und schlie\u00dflich die rohen\n Eingabezeichen, wobei Kontrollzeichen und Leerzeichen durch einen Punkt\n ersetzt wurden.\n\n Ung\u00fcltige Byte-Sequenzen werden mit einem \u201eX\u201c dargestellt und mit dem Hex-Wert\n in Fragezeichen eingeschlossen, z.\u2009B., \u201e?F5?\u201c.\n\n Du kannst Daten von stdin einleiten, mehrere Dateien auf einmal ausw\u00e4hlen oder\n sogar alle diese Eingabemethoden durcheinander verwenden.\n\nBeispiele:\n\n * Basic usage with stdin::\n\n echo -n 'ABCDEFGHIJKLMNOP' | unidump -n 4\n 0 0041 0042 0043 0044 ABCD\n 4 0045 0046 0047 0048 EFGH\n 8 0049 004A 004B 004C IJKL\n 12 004D 004E 004F 0050 MNOP\n\n * Dump the code points translated from another encoding::\n\n unidump -c latin-1 some-legacy-file\n\n * Dump many files at the same time::\n\n unidump foo-*.txt\n\n * Control characters and whitespace are safely rendered::\n\n echo -n -e '\\x01' | unidump -n 1\n 0 0001 .\n\n * Finally learn what your favorite Emoji is composed of::\n\n ( echo -n -e '\\xf0\\x9f\\xa7\\x9d\\xf0\\x9f\\x8f\\xbd\\xe2' ; \\\n echo -n -e '\\x80\\x8d\\xe2\\x99\\x82\\xef\\xb8\\x8f' ; ) | \\\n unidump -n 5\n 0 1F9DD 1F3FD 200D 2642 FE0F .\ud83c\udffd.\u2642\ufe0f\n\n See <https://emojipedia.org/man-elf-medium-skin-tone/> for images. The \u201celf\u201d\n emoji (the first character) is replaced with a dot here, because the current\n version of Python\u2019s unicodedata doesn\u2019t know of this character yet.\n\n * Use it like strings(1)::\n\n unidump -e '{data}' some-file.bin\n\n Das ersetzt jedes unbekannte Byte aus der Eingabedatei mit \u201eX\u201c und jedes\n Kontroll- und Leerzeichen mit \u201e.\u201c.\n\n * Only print the code points of the input::\n\n unidump -e '{repr}'$'\\n' -n 1 some-file.txt\n\n Das Ergebnis ist eine Folge von Codepunkten in Hex-Notation, jeder auf einer\n eigenen Zeile, ohne Byte-Z\u00e4hler oder Darstellung der tats\u00e4chlichen Daten. Du\n kannst das verwenden, um die Gesamtzahl an Zeichen (nicht rohe Bytes) in einer\n Datei zu bestimmen, indem du es durch `wc -l` pipest.\n\nDas ist version 1.1.4 von unidump mit Unicode-13.0.0-Daten.\n\n\n",
"bugtrack_url": null,
"license": "MIT",
"summary": "hexdump for your Unicode data",
"version": "1.1.4",
"project_urls": {
"Homepage": "https://github.com/Codepoints/unidump"
},
"split_keywords": [
"unicode",
"hexdump",
"debugging",
"codepoint",
"utility"
],
"urls": [
{
"comment_text": "",
"digests": {
"blake2b_256": "c6a37fdce5d74be37ba232ac0371a77aadc0ebe9e0602914560d38c9fd7b842b",
"md5": "76079ec8b3ca31416751157574e26fde",
"sha256": "24293269f06cd627255034e0d755526b6d43443eeb104c3c773e50e6b9d8c2cb"
},
"downloads": -1,
"filename": "unidump-1.1.4-py3-none-any.whl",
"has_sig": false,
"md5_digest": "76079ec8b3ca31416751157574e26fde",
"packagetype": "bdist_wheel",
"python_version": "py3",
"requires_python": null,
"size": 11722,
"upload_time": "2024-09-03T19:27:22",
"upload_time_iso_8601": "2024-09-03T19:27:22.862199Z",
"url": "https://files.pythonhosted.org/packages/c6/a3/7fdce5d74be37ba232ac0371a77aadc0ebe9e0602914560d38c9fd7b842b/unidump-1.1.4-py3-none-any.whl",
"yanked": false,
"yanked_reason": null
},
{
"comment_text": "",
"digests": {
"blake2b_256": "58c1e5ad58903d895c62206f7a625ee3c1ccd4fe6f70a5b0dd87ed6557e3093b",
"md5": "7630e8eddfb2cdf837ed975427452ebd",
"sha256": "be39ba0beff5b50cab11f5ce5de9c03c3a4f5437755f2d93e9a176f5c30586b3"
},
"downloads": -1,
"filename": "unidump-1.1.4.tar.gz",
"has_sig": false,
"md5_digest": "7630e8eddfb2cdf837ed975427452ebd",
"packagetype": "sdist",
"python_version": "source",
"requires_python": null,
"size": 10336,
"upload_time": "2024-09-03T19:27:24",
"upload_time_iso_8601": "2024-09-03T19:27:24.823598Z",
"url": "https://files.pythonhosted.org/packages/58/c1/e5ad58903d895c62206f7a625ee3c1ccd4fe6f70a5b0dd87ed6557e3093b/unidump-1.1.4.tar.gz",
"yanked": false,
"yanked_reason": null
}
],
"upload_time": "2024-09-03 19:27:24",
"github": true,
"gitlab": false,
"bitbucket": false,
"codeberg": false,
"github_user": "Codepoints",
"github_project": "unidump",
"travis_ci": false,
"coveralls": false,
"github_actions": false,
"requirements": [],
"lcname": "unidump"
}