unicode

Dlaczego nie mogę używać \u000D i \u000a jako CR i LF w Javie?

Dlaczego nie mogę używać \u000d i \u000a jako CR i LF w Javie? To daje błąd podczas kompilacji kodu: String x = "\u000A hello";//Error - Illegal escape character in string literal.

Odczyt danych pliku Unicode za pomocą znaków BOM w Pythonie

Czytam serię plików kodu źródłowego używając Pythona i uruchamiam błąd BOM unicode. Oto Mój kod: bytes = min(32, os.path.ge ... ę, że próbuje dekodować BOM używając domyślnego zestawu znaków i nie udaje się. Jak usunąć BOM z łańcucha, aby temu zapobiec?

Dlaczego znaki" control " są nielegalne w XML 1.0?

Istnieje wiele znaków, które nie są legalnie kodowane w XML 1.0, np. U+0007 ('bell') i U+001B ('escape'). Większość interesuj ... ię w innych kodowaniach formatach danych, kończę na "podwójnych ucieczkach" nowych dokumentach XML, które muszą to zakodować.

MySQL VARCHAR i UTF-8

W MySQL, jeśli utworzę nowe pole VARCHAR(32) w tabeli UTF-8 czy oznacza to, że mogę przechowywać 32 bajty danych w tym polu lub 32 znaki (multi-bajt)?

Czy istnieje powłoka poleceń systemu Windows, która wyświetla znaki Unicode?

Zakładając, że mam zainstalowane czcionki, które zawierają odpowiednie glify, czy istnieje powłoka poleceń dla Windows XP, kt ... o innych aplikacji z poprawnymi znakami. Cygwin (?/ align = "left" / znak i to przechodzi w kopiuj / wklej. Jakieś pomysły?

Znak nowej linii unicode (u000d) w języku Java

Zobaczmy poniższy fragment kodu w Javie. public class Main { public static void main(String[] args) { // new Cha ... linia jest niekomentowana, nie będzie działać w ogóle, powodując błąd w czasie kompilacji. Dlaczego wyświetla tutaj "cześć"?

Jak przekonwertować wartość unichar na NSString w Objective-C?

Mam międzynarodowy znak przechowywany w zmiennej unichar. Ten znak nie pochodzi z pliku ani adresu url. Sama zmienna przechow ... ncoding]; Ale to też nie działa. Najwyraźniej robię coś strasznego źle, ale nie wiem co. Czy ktoś może mi pomóc ? Dzięki!

Normalizacja Unicode

Czy istnieje standardowy sposób, w Pythonie, aby znormalizować ciąg znaków unicode, tak aby rozumiał on tylko najprostsze enc ... ęczne wymiany, itp., ale nie jest wydajny i jestem prawie pewien, że przegapiłbym połowę specjalne przypadki, i zrobić błędy.

Konwersja punycode ze znakiem myślnika na Unicode

Muszę przekonwertować punycode NIATO-OTABD na nñiñatoñ. Znalazłem konwerter tekstu w JavaScript pewnego dnia, ale konwersja punycode nie działa, jeśli jest myślnik w środku. Jakieś sugestie, aby naprawić problem "myślnik"?

Wyświetlanie symboli unicode w HTML

Chcę po prostu wyświetlić symbole tick ( ✔ ) i cross ( ✘ ) na stronie HTML, ale pokazuje się jako pudełko lub goop ✠" - ocz ... ąc to na tylko UTF-8 symbole są teraz poprawnie wyświetlane... ale firebug nadal wydaje się wskazywać ten sam typ zawartości.

Kodowanie FPDF utf-8 (HOW-TO)

Czy ktoś wie jak ustawić kodowanie w pakiecie FPDF na utf-8? A przynajmniej do ISO-8859-7 (Grecki), które obsługują Greckie znaki? W zasadzie chcę utworzyć plik pdf zawierający Greckie znaki. Wszelkie sugestie by pomogły. George

Jak zdobyć str.tłumaczyć do pracy z ciągami Unicode?

Mam następujący kod: import string def translate_non_alphanumerics(to_translate, translate_to='_'): not_letters_or_digi ... zrozumieć akapitu o "obiektach Unicode" w Python 2.6.2 docs dla str.metoda translate (). Jak to działa dla ciągów Unicode?

Pobierz listę wszystkich kodowań, do których może kodować Python

Piszę skrypt, który spróbuje kodować bajty do wielu różnych kodowań w Pythonie 2.6. Czy jest jakiś sposób, aby uzyskać listę ... (encodinglist(), 2): try: unicode_string = my_unicode_character.encode(encoding1).decode(encoding2) except: pass

ISO-8859-1 vs UTF-8?

Co należy stosować i kiedy ? Czy zawsze lepiej używać UTF-8? lub ISO-8859-1 nadal ma znaczenie w szczególnych warunkach? Czy ... ?xml version="1.0" encoding="UTF-8"?> Lub <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

Jak poprawnie dekodować parametry unicode przekazywane do serwletu

Przypuśćmy, że mam: <a href="http://www.yahoo.com/" target="_yahoo" title="Yahoo!&#8482;" onclick="return gatew ... rameter("external_title").getBytes(), "UTF-8"); i / lub coś innego, co spowoduje Yahoo!TM pojawiające się w wyjściu SERVLET?

Szybki sposób filtrowania nielegalnych znaków XML unicode w Pythonie?

Specyfikacja XML wymienia kilka znaków Unicode, które są nielegalne lub "zniechęcane". Biorąc pod uwagę ciąg znaków, jak mog ... clean = illegal_xml_re.sub('', dirty) (Python 2.5 nie wie o znakach Unicode powyżej 0xFFFF, więc nie trzeba ich filtrować.)

Jak odznaczyć urlencoded ciąg unicode w Pythonie?

Mam ciąg unicode jak "Tanım", który jest zakodowany jako" Tan%u0131m " jakoś. Jak mogę przekonwertować ten zakodowany ciąg z powrotem do oryginalnego unicode. Najwyraźniej urllib.unquote nie obsługuje unicode.

Jak pobrać Nie-ascii url z Python urlopen?

Muszę pobrać dane z adresu URL ze znakami Nie-ascii, ale urllib2.urlopen odmawia otwarcia zasobu i podnosi: UnicodeEncodeEr ... i za pomocą Pythona? Edit: Innymi słowy, można / jak urlopen otworzyć adres URL, taki jak: http://example.org/Ñöñ-ÅŞÇİİ/

Jak określić, czy łańcuch znaków zawiera nieprawidłowe zakodowane znaki

Scenariusz użycia Zaimplementowaliśmy usługę webservice, której nasi programiści używają (poprzez API php) do wyświetlania ... 59-1") ); } To drukuje: v=abc?def v=abcädef v=abcädef v=abcädef I robi a nie rzuca nielegalny dokument westchnienie

Właściwy sposób obsługi Unicode z C++ w 2018 roku?

Próbowałem przeszukiwać stackoverflow, aby znaleźć odpowiedź na to pytanie, ale pytania i odpowiedzi, które znalazłem, mają o ... Chciałbym wiedzieć, czy istnieje standardowy sposób obsługi tego na Linuksie, Windows i MacOS. Dziękuję za poświęcony czas.