unicode

Niewidzialne postacie-ASCII

Czy są jakieś niewidzialne postacie? Sprawdziłem Google dla niewidzialnych znaków i skończyło się z wieloma odpowiedziami, ... ch? Hakowanie czy coś? Kiedy przeszukałem Internet, odkryłem, że 200D jest ASCII wartość ze znakiem invisible . To prawda?

Biblioteka Light C Unicode [zamknięta]

zamknięte. to pytanie nie spełnia wytycznych dotyczących przepełnienia stosu . Obecnie nie przyjmuje odpowiedzi. ... Czy ktoś znalazł jakieś niezależne od platformy, małe biblioteki kodowe do obsługi ciągów unicode (nie trzeba tego robić).

urllib2 odczyt do Unicode

Muszę przechowywać zawartość strony, która może być w dowolnym języku. I muszę być w stanie przeszukiwać zawartość Dla ciągu ... y zrobię urlopen, a następnie odczytam, aby użyć zestawu znaków z nagłówków, aby dekodować zawartość i zakodować ją do UTF-8.

Jak poprawić TypeError: Unicode-obiekty muszą być zakodowane przed hashowaniem?

Mam taki błąd: Traceback (most recent call last): File "python_md5_cracker.py", line 27, in <module> m.update(lin ... input() sys.exit() print("The hash given does not correspond to any supplied word in the wordlist.") input() sys.exit()

Konkretne wyrażenia regularne Javascript dla znaków akcentowanych (znaki diakrytyczne)

Spojrzałem na Stack Overflow (zastępowanie znaków.. eh, Jak JavaScript nie jest zgodny ze standardem Unicode dotyczącym RegEx ... prawdziwe pytanie(s): które z tych trzech podejść jest najbardziej odpowiednie do tego zadania? A może są lepsze rozwiązania?

Co to jest "para zastępcza" w Javie?

Czytałem dokumentację StringBuffer, w szczególności metodę reverse(). Dokumentacja ta wspomina coś o parach zastępczych . Czym w tym kontekście jest para zastępcza? A czym są niskie i Wysokie surogaci?

Jak znaleźć Długość łańcucha w R?

Jak znaleźć Długość łańcucha (liczbę znaków w łańcuchu) bez dzielenia go w R? Wiem, jak znaleźć długość listy, ale nie ciągu. ... ków (runy, symbole) w łańcuchu Unicode? Podobne Pytanie: Jak znaleźć "rzeczywistą" liczbę znaków w ciągu Unicode w R

Użycie 'use utf8;' daje mi 'szeroki znak w druku'

Jeśli uruchamiam następujący program Perl: perl -e 'use utf8; print "鸡\n";' Dostaję to Ostrzeżenie: Wide character in p ... ogę to naprawić? Używam Perla 5.16.2. Mam ten sam problem, jeśli jest to w pliku, zamiast być jednym linerem w linii poleceń.

Różnica między bajtem a znakiem w typach danych kolumn

W Oracle, jaka jest różnica między: CREATE TABLE CLIENT ( NAME VARCHAR2(11 BYTE), ID_CLIENT NUMBER ) I CREATE TABLE CLIENT ( NAME VARCHAR2(11 CHAR), -- or even VARCHAR2(11) ID_CLIENT NUMBER )

Usuwanie znaków diakrytycznych (ń ň i ñ ņ ņ) z znaków Unicode

Patrzę na algorytm, który może mapować znaki ze znakami diakrytycznymi (tilde, circumflex, caret, umlaut, caron ) i ich "pros ... w, a björn_borg jest wpisany, będę również zachować Bjorn_Borg, więc mogę go znaleźć, jeśli ktoś wejdzie Bjorn, a nie Björn.

Jak przekonwertować ciąg znaków do utf-8 w Pythonie

Mam przeglądarkę, która wysyła znaki utf-8 do mojego serwera Pythona, ale kiedy pobieram je z ciągu zapytania, kodowanie zwra ... ? Uwaga: ciąg przekazywany z sieci jest już zakodowany w UTF-8, chcę tylko, aby Python traktował go jako UTF-8, a nie ASCII.

WChars, kodowanie, standardy i przenośność

Poniższe pytania mogą nie kwalifikować się jako pytanie typu SO; jeśli jest to poza granicami, proszę, powiedz mi, żebym sobi ... ego pojęcia " ile znaków" zawierać nazwę danego pliku, ponieważ nie ma pojęcia "znak" w pierwszej kolejności. Caveat emptor.

UnicodeDecodeError: kodek' ascii ' nie może dekodować bajtu 0xef w pozycji 1

Mam kilka problemów próbując zakodować łańcuch do UTF-8. Próbowałem wielu rzeczy, w tym używając string.encode('utf-8') i uni ... ne 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode characters in position 1-5: ordinal not in range(128)

Dane SQLite, python, unicode i inne niż utf

Zacząłem od próby przechowywania łańcuchów w SQLite za pomocą Pythona i dostałem wiadomość: Sqlite3.ProgrammingError: mu ... print x = 'ó' encodingDemo(x) Wielkie dzięki za Odpowiedzi poniżej, a szczególnie @ John Machin za tak dokładną odpowiedź.

Różnica między porządkiem bajtów Big Endian i little Endian

Jaka jest różnica między Big Endian a Little endian Byte order ? Oba wydają się być związane z Unicode i UTF16. Gdzie dokładnie tego używamy?

Jak sprawić, by Django slugify działało poprawnie z ciągami Unicode?

Co mogę zrobić, aby filtr slugify nie usuwał znaków alfanumerycznych innych niż ASCII? (Używam Django 1.0.2) Cnprog.com ma ... t_absolute_url(self): return '%s%s' % (reverse('question', args=[self.id]), self.title) Czy usuwają adresy URL czy nie?

Jak ustawić sys.kodowanie stdout w Pythonie 3?

Ustawienie domyślnego kodowania wyjściowego w Pythonie 2 jest dobrze znanym idiomem: sys.stdout = codecs.getwriter("utf-8") ... bytes, A błąd występuje, gdy codecs próbuje zapisać zakodowane bajty do oryginalnego sys.stdout. Jak to zrobić w Pythonie 3?

Jak porównać znaki Unicode, które "wyglądają podobnie"?

Wpadam w zaskakujący problem. Załadowałem plik tekstowy do mojej aplikacji i mam pewną logikę, która porównuje wartość µ. ... stacie, które są takie. Czy Jest jakiś sposób w C#, aby porównać znaki, które wyglądają tak samo, ale są rzeczywiście różne?

Jak sortować ciągi unicode Alfabetycznie w Pythonie?

Python sortuje według wartości bajtów domyślnie, co oznacza, że é pojawia się po z i innych równie zabawnych rzeczach. Jaki j ... posób żeby to zrobić? Po prostu zrobić mapowanie z litery do wartości całkowitej i mapować łańcuch do listy całkowitej z tym?

Kodowanie Unicode dla liter ciągów w C++11

W związku z związanym pytaniem , chciałbym zapytać o nowe typy znaków i ciągów literalnych w C++11. Wydaje się, że mamy tera ... est trochę otwarte pytanie, ale chciałbym uzyskać jak najpełniejszy obraz nowego kodowania UTF i urządzeń typu w nowym C++11.