unicode

Jaka jest różnica między UTF8 general ci a utf8 unicode ci?

Pomiędzy utf8_general_ci a utf8_unicode_ci, czy są jakieś różnice w wydajności?

Twitter image encoding challenge [zamknięty]

Obecnie pytanie to nie pasuje do naszego formatu pytań i odpowiedzi. Oczekujemy, że odpowiedzi będą poparte faktami, referenc ... ormatu PPM. Jest to format tekstowy, który jest bardzo łatwy w obsłudze i możesz użyć ImageMagick do konwersji do i z niego.

UnicodeEncodeError: kodek 'ascii' nie może zakodować znaku u '\xa0 ' w pozycji 20: ordinal not in range (128)

Mam problemy z obsługą znaków unicode z tekstu pobranego z różnych stron internetowych (na różnych stronach). Używam Beautifu ... zymkolwiek innym niż Angielski. Czy ktoś ma jakieś pomysły, jak to rozwiązać, abym mógł konsekwentnie rozwiązać ten problem?

Dlaczego wykonywanie kodu Java w komentarzach z pewnymi znakami Unicode jest dozwolone?

Poniższy kod daje wynik " Hello World!"(naprawdę nie, spróbuj). public static void main(String... args) { // The comment ... ramisty może sobie wyobrazić, dlaczego jest to dozwolone w komentarzach? Dlaczego jest to dozwolone przez Javę Specyfikacja?

Jak działa Zalgo text?

Widziałem dziwnie sformatowany tekst o nazwie Zalgo jak poniżej pisany na różnych forach. To trochę denerwujące patrzeć na to ... te pojedyncze postacie mają dziwne właściwości? Co tu się dzieje? Hơw dŏs Z ą ąĺgo te ҉ xț worǩ?̙͉̥̬͙̟̮͕ͤ̌͗ͩ̕͡

Jaka jest różnica między UTF-8 a Unicode

Słyszałem sprzeczne opinie od ludzi-według Wikipedii, patrz tutaj . To to samo, prawda? Czy ktoś może to wyjaśnić?

Co robi znak "b"przed literalnym łańcuchem?

Wygląda na to, że prawidłowa składnia jest następująca: my_string = b'The string' Chciałbym wiedzieć: co oznacza ten b ... dokumencie nie ma wzmianki o znaku b. Również, tak z ciekawości, czy jest więcej symboli niż b i u, które robią inne rzeczy?

Jaka jest różnica między ASCII a Unicode?

Jaka jest dokładna różnica między Unicode a ASCII? ASCII ma w sumie 128 znaków (256 w rozszerzonym zestawie). Czy jest jakaś Specyfikacja rozmiaru dla znaków Unicode?

Jaki jest najlepszy sposób na usunięcie akcentów (normalizację) w łańcuchu Unicode Pythona?

Mam ciąg Unicode w Pythonie i chciałbym usunąć wszystkie akcenty (znaki diakrytyczne). Znalazłem w sieci elegancki sposób na ... em 3? Ważna uwaga: chciałbym uniknąć kodu z wyraźnym mapowaniem ze znaków akcentowanych do ich nieakcentowanego odpowiednika.

Zapisywanie tekstów utf-8 za pomocą json.zrzuty jako UTF8, nie jako sekwencja ucieczki \u

Przykładowy kod: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print(json_string) ... zrzutów JSON (i wolałbym nie używać XML). Czy istnieje sposób serializacji obiektów do łańcuchów JSON UTF-8 (zamiast \uXXXX)?

UTF-8, UTF-16 i UTF-32

Jakie są różnice między UTF-8, UTF-16 i UTF-32? Rozumiem, że wszystkie będą przechowywać Unicode i że każdy z nich używa innej liczby bajtów do reprezentowania znaku. Czy jest jakaś przewaga w wyborze jednego nad drugim?

Różnice w formacie Unicode, UTF, ASCII, ANSI

Jaka jest różnica między Unicode, UTF8, UTF7, UTF16, UTF32, ASCII, i ANSI kodowanie? W jaki sposób są one pomocne dla programistów?

Co dokładnie robią flagi łańcuchowe " u " i " r " i czym są surowe literały łańcuchowe?

Zadając to pytanie , zdałem sobie sprawę, że nie wiem zbyt wiele o surowych strunach. Jak na kogoś, kto twierdzi, że jest tre ... łańcucha? A tak przy okazji, jeśli Twój system i Kod edytora tekstu są ustawione na UTF-8, to czy u'' rzeczywiście coś robi?

Konwertuj ciąg znaków Unicode na ciąg znaków w Pythonie (zawierający dodatkowe symbole)

Jak przekonwertować ciąg znaków Unicode (zawierający dodatkowe znaki jak£ $, itp.) w ciąg Pythona?

Jaki jest najlepszy sposób na usunięcie akcentów w łańcuchu Unicode Pythona?

Mam ciąg Unicode w Pythonie i chciałbym usunąć wszystkie akcenty (znaki diakrytyczne). Znalazłem w sieci elegancki sposób na ... e 3? Ważna uwaga: chciałbym uniknąć kodu z wyraźnym mapowaniem ze znaków akcentowanych do ich nieakcentowanego odpowiednika.

Jak używać znaków unicode w wierszu poleceń systemu Windows?

Mamy projekt w Team Foundation Server (TFS), który ma w sobie nie-Angielski znak (š). Próbując napisać kilka rzeczy związanyc ... JavaScript (który z natury jest Unicode) - ale bez powodzenia. Jak uruchomić program i przekazać mu wiersz poleceń Unicode ?

Jak przekonwertować ciąg znaków na małe litery w Pythonie

Czy istnieje sposób na konwersję łańcucha z wielkich liter,a nawet części wielkich liter na małe? Np. kilometry --> kilometry.

UnicodeDecodeError: kodek 'charmap' nie może dekodować bajtu X w pozycji Y: mapy znaków do

Próbuję nakłonić program Pythona 3 do wykonywania pewnych manipulacji z plikiem tekstowym wypełnionym informacjami. Jednak po ... UnicodeDecodeError: 'charmap' codec can't decode byte 0x90 in position 2907500: character maps to `<undefined>`

Jak mogę grep dla wszystkich znaków spoza ASCII?

Mam kilka bardzo dużych plików XML i próbuję znaleźć linie, które zawierają znaki inne niż ASCII. Próbowałem: grep -e "[\x{ ... go? Też próbowałem: egrep "[\x{00FF}-\x{FFFF}]" file.xml (z pojedynczymi i podwójnymi cudzysłowami otaczającymi wzór).