unicode

Jak przekonwertować wstring na string?

Pytanie brzmi, jak przekonwertować wstring na string? Mam następny przykład: #include <string> #include <iostream ... tring = Hello std::stringstream = 0x860283c Dlatego stringstream nie może być użyty do konwersji wstring na sznurek.

Naprawianie uszkodzonego kodowania UTF8

Jestem w trakcie naprawiania złego kodowania UTF8. Obecnie używam PHP 5 i MySQL W mojej bazie danych mam kilka przypadków z ... funkcji, które pomogą mi odwzorować instancje î, ÃÂ, ü i innych podobnych do ich właściwych akcentowanych znaków UTF8.

Jak dobrze jest obsługiwany Unicode w C++11?

Czytałem i słyszałem, że C++11 obsługuje Unicode. Kilka pytań na ten temat: Jak dobrze biblioteka standardowa C++ obsługuje Unicode? czy std::string robi to, co powinno? Jak go używać? Gdzie są potencjalne problemy?

Jak sprawdzić, czy ciąg znaków jest unicode lub ascii?

Co muszę zrobić w Pythonie, aby dowiedzieć się, które kodowanie?

Wprowadzanie znaków Unicode w Latexie

Jak wprowadzić znaki Unicode w Latexie? Jakie pakiety muszę zainstalować i jaką sekwencję escape wpisać, aby określić znaki Unicode w pliku źródłowym ASCII?

Użycie awk do usunięcia znaku kolejności bajtów

Jak wyglądałby awk skrypt (prawdopodobnie jednowierszowy) do usuwania BOM ? Specyfikacja: wypisuje każdą linię po pierwszej (NR > 1) dla pierwszej linii: jeśli zaczyna się od #FE #FF lub #FF #FE, usuń te i wydrukuj resztę

Konwertuj Unicode na ASCII bez błędów w Pythonie

Mój kod po prostu zeskrobuje stronę internetową, a następnie konwertuje ją do Unicode. html = urllib.urlopen(link).read() ht ... dzieś błędnie uformowaną próbę Unicode. Czy mogę po prostu porzucić bajty kodu, które powodują problem, zamiast uzyskać błąd?

Do czego służy snowman param w Ruby on Rails 3 forms?

W Ruby on Rails 3 (obecnie używa Beta 4), widzę, że podczas używania helperów form_tag LUB form_for pojawia się ukryte pole o nazwie _snowman z wartością ☃ (Unicode \x9731). Więc po co to?

Dlaczego ten kod, napisany od tyłu, drukuje " Hello World!"

Oto jakiś kod, który znalazłem w Internecie: class M‮{public static void main(String[]a‭){System.out.print(new char[] {'H', ... goś powodu nie działa w notepad++, wraz z cmd. Nadal nie znalazłem na to rozwiązania, więc jeśli ktoś wie, komentarz poniżej.

Na czym polega znormalizowany UTF-8?

Projekt ICU (który również posiada bibliotekę PHP ) zawiera klasy potrzebne do normalizacji łańcuchów UTF-8, aby ułatwić p ... i. Na przykład, w jakich przypadkach chcę "równoważności kanonicznej" zamiast "równoważności kompatybilności", czy vis-versa?

Znaki Unicode w adresach URL

Czy w 2010 roku podałbyś adresy URL zawierające znaki UTF-8 w dużym portalu internetowym? Znaki Unicode są zabronione zgodni ... żna skopiować + wkleić z nienaruszonymi znakami specjalnymi, ale działają poprawnie po ponownym użyciu w starszych klientach?

Jak dekodować sekwencje escape Unicode, takie jak "\u00ed", do odpowiednich znaków zakodowanych w UTF-8?

Czy istnieje funkcja w PHP, która może dekodować sekwencje escape Unicode, takie jak "\u00ed " do " í" i wszystkie inne podobne zdarzenia? Znalazłem podobne pytanie tutaj ale nie wydaje się działać.

Java odpowiednik kodu JavaScript, który generuje identyczne wyjście?

Eksperymentowałem z różnymi bitami kodu Javy próbując wymyślić coś, co zakoduje ciąg znaków zawierający cudzysłowy, spacje i ... erował on takie same dane wyjściowe jak JavaScript encodeURIComponent? EDIT: używam Javy 1.4 przechodząc wkrótce do Javy 5.

Jak sprawdzić, czy ciąg znaków w Pythonie jest w ASCII?

Chcę sprawdzić, czy łańcuch jest w ASCII, czy nie. Jestem świadomy ord(), jednak kiedy próbuję ord('é'), mam TypeError: ord( ... wane przez sposób, w jaki zbudowałem Pythona (jak wyjaśniono w ord()'s dokumentacja ). Czy jest inny sposób na sprawdzenie?

Python-kodek 'ascii' nie potrafi dekodować bajtów

Jestem naprawdę zdezorientowana. Próbowałem kodować, ale błąd powiedział can't decode.... >>> "你好".encode("utf8") ... . Zastanawiam się tylko, dlaczego błąd jest "nie można dekodować", gdy kodowanie zostało wywołane. Co Python robi pod maską?

Czy Mogę sprawić, by git rozpoznał plik UTF-16 jako tekst?

Śledzę plik Virtual PC virtual machine (*.vmc) w git, a po dokonaniu zmiany git zidentyfikował plik jako binarny i nie chciał ... ć? Używam git pod Cygwin, z core.autocrlf ustawione na false. Mógłbym użyć mSysGit lub git pod Uniksem, jeśli to konieczne.

Python str versus unicode

Czy istnieje konwencja Pythona, kiedy należy zaimplementować __str__() versus __unicode__(). Widziałem, że klasy nadpisują _ ... ą konkretne zasady, kiedy lepiej jest wdrożyć jedną a drugą? Czy wdrożenie obu tych rozwiązań jest konieczne/dobre praktyki?

Różnica między UTF-8 a UTF-16?

Różnica między UTF-8 a UTF-16? Po co nam to? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();

(grep) Regex do dopasowania znaków innych niż ASCII?

Na Linuksie mam katalog z mnóstwem plików. Niektóre z nich mają znaki inne niż ASCII, ale wszystkie są poprawne UTF-8 . JEDEN ... larnego , Jak Perl, sed, AWK , itd. Jednak, czy istnieje wyrażenie regularne dla "każdy znak, który nie jest znakiem ASCII"?

Jak używać greckich symboli w ggplot2?

Moje kategorie muszą być nazwane greckimi literami. Używam ggplot2 i działa pięknie z danymi. Niestety nie potrafię wymyśli ... t na to jakiś sposób? UPDATE: Spojrzałem na link , jednak nie ma opisanej dobrej metody, aby osiągnąć to, co chcę zrobić.