unicode

Najlepszy sposób na konwersję Unicode URL do ASCII (UTF-8 percent-escaped) w Pythonie?

Zastanawiam się, jaki jest najlepszy sposób-lub czy istnieje prosty sposób z biblioteką standardową-aby przekonwertować adres ... xn--hgi.ws/%E3%89%8C' Czy to prawda? Jakieś lepsze propozycje? Czy istnieje do tego prosta funkcja biblioteki standardowej?

Jak zastąpić akcentowane znaki łacińskie w Ruby?

Mam model ActiveRecord, Foo, który ma pole name. Chciałbym, aby użytkownicy mogli wyszukiwać po nazwie, ale chciałbym, aby w ... o 1.9, nie mogę umieścić tych liter Unicode w moim kodzie. Rzeczywiste wyrażenia regularne będzie wyglądać o wiele brzydiej.

Programowa redukcja akcentu w JavaScript (aka normalizacja tekstu lub unaccenting)

Muszę porównać 2 ciągi jako równe takie jak te: Lubeck = = Lübeck W JavaScript. Dlaczego? Cóż, mam pole autouzupełni ... (choć w okrutnym skręcie, jego edycje wściekły to odpowiedź wiki społeczności, więc nie jestem pewien, czy dostanie bounty!)

Czy poprawnie obsługuję UTF-8 w moich aplikacjach PHP?

Chciałbym się upewnić, że wszystko, co wiem o UTF-8 jest poprawne. Próbuję używać UTF-8 od jakiegoś czasu, ale ciągle natykam ... rn true; } Jeśli ktoś jest zainteresowany znalazłem świetną przykładową stronę do wykorzystania podczas testowania UTf-8.

Używanie Objective C / Cocoa do unescape znaków unicode, czyli u1234

Niektóre strony, z których pobieram dane, zwracają ciągi UTF-8, z unikniętymi znakami UTF-8, czyli: \u5404\u500b\u90fd Czy jest wbudowana funkcja cocoa, która może w tym pomóc, czy będę musiał napisać własny algorytm dekodowania.

Czy TCHAR jest nadal aktualny?

Jestem nowy w programowaniu Windows i po przeczytaniu książki Petzold zastanawiam się: Czy nadal dobrą praktyką jest używan ... wać łańcuchów wchar_t i L"" w nowym kodzie? Będę kierować tylko Windows 2000 i do góry, a mój kod będzie i18n od początku.

Różnica między MBCS i UTF-8 W Windows

Czytam o zestawie charater i kodowaniu w Windows. Zauważyłem, że w kompilatorze Visual Studio (dla C++) są dwie flagi kompila ... code może być kodowane różnymi kodowaniami, takimi jak UTF-8 i UTF-16. Czy ktoś może rzucić więcej światła na to zamieszanie?

Jak wyświetlić znaki UTF-8 w phpMyAdmin?

Mam poprawnie ustawioną bazę danych na UTF-8 i mam do czynienia z bazą danych zawierającą japońskie znaki. Jeśli zaznaczę *. ... Framework do wstawiania danych do bazy danych. Zamierzam otworzyć nagrodę za to pytanie, ponieważ naprawdę chcę to rozgryźć.

Ciąg Pythona do unicode [duplikat]

Możliwy duplikat:Jak traktować ciąg znaków ASCII jako unicode i odblokować znaki ucieczki w Pythonie?Jak konwertować sekwe ... print b Hello… >>> print unicode(a) Hello\u2026 >>> Tak wyraźnie unicode(a) nie jest odpowiedz. Więc co?

Jak sprawdzić, czy Python jest kompilowany z UCS-2 lub UCS-4?

Dokładnie to, co mówi tytuł. $ ./configure --help | grep -i ucs --enable-unicode[=ucs[24]] Przeszukując oficjalną dokume ... ane jako UCS-2 lub UCS-4. Nie jest jasne, jakie wartości odpowiadają UCS-2 i UCS-4. The kod ma działać na Pythonie 2.6+.

Jak mogę iterować poprzez Punkty kodowe unicode ciągu znaków Java?

Więc wiem o String#codePointAt(int), ale jest indeksowany przez offset char, a nie przez offset codepoint. Myślę o wypróbo ... ywane jako dwie char wartości lub jedna To bardzo kosztowny sposób na iterację znaków.]} Ktoś musiał wymyślić coś lepszego.

Java regex dla wsparcia Unicode?

Aby dopasować od A do Z, użyjemy regex: [A-Za-z] Jak zezwolić regex na dopasowanie znaków utf8 wprowadzonych przez użytkownika? Na przykład chińskie słowa jak 环保部

Konwertuj CString na const char*

Jak przekonwertować z CString na const char* w mojej aplikacji Unicode MFC?

Is there a Unicode glyph that looks like a «key» icon? [closed]

Unicode has a million icon-like glyphs, but they're not always easy to search by, since I don't always know what they loo ... at looks like a "key"? Or is there a symbol that's used in database circles to mean "primary key", which is in Unicode?

Czy znaki Unicode i Ascii są takie same?

Czym dokładnie są kody znaków unicode? Czym się różnią od znaków ascii?

Python: Using.format () na unikodowym łańcuchu znaków

Używam Pythona 2.6.5. Mój kod wymaga użycia znaku "więcej lub równo". Zaczyna się: >>> s = u'\u2265' >>> ... ition 0: ordinal not in range(128)` Dlaczego dostaję ten błąd? Czy jest na to dobry sposób? Muszę użyć funkcji .format().

Regex: co to jest InCombiningDiacriticalMarks?

Poniższy kod jest bardzo dobrze znany do konwersji znaków akcentowanych na zwykły tekst: Normalizer.normalize(text, Normali ... eć część" regex " zamiennika 1) Co to jest "InCombiningDiacriticalMarks"? 2) Gdzie jest dokumentacja? (i podobne?) Dzięki.

Pobierz wartość unicode znaku

Czy Jest jakiś sposób w Javie, abym mógł uzyskać odpowiednik Unicode dowolnego znaku? np. Załóżmy metodę getUnicode(char c). Wywołanie getUnicode('÷') powinno zwrócić \u00f7.

Python Unicode równe porównanie nie powiodło się

To pytanie jest związane z szukaniem znaków Unicode w Pythonie Czytam plik tekstowy unicode używając kodeków python code ... uments to Unicode - interpreting them as being unequal Czy istnieje jakiś specjalny sposób porównywania łańcuchów unicode ?

Jak odczytać UTF-8 z operatorem diamond (< > )?

Chcę odczytać wejście UTF-8 w Perlu, bez względu na to, czy pochodzi ze standardowego wejścia, czy z pliku, używając operator ... kwencję: a\xCA\xA7b. Metoda z cat poprawnie wyprowadza: a \xCA\xA7 b Ale inna metoda daje mi to: a \xC3\x8A \xC2\xA7 b