utf-8

Elegancki sposób wyszukiwania plików UTF-8 za pomocą BOM?

Do celów debugowania, muszę rekurencyjnie przeszukać katalog w poszukiwaniu wszystkich plików, które zaczynają się od znaku B ... est jakieś krótsze lub bardziej eleganckie rozwiązanie? Czy są jakieś ciekawe edytory tekstu lub makra do tekstu redaktorzy?

Problemy z kodowaniem HTML - pojawia się znak "Â" zamiast " "

Mam starą aplikację, która zaczyna się źle zachowywać, z jakiegoś powodu nie jestem pewien. Generuje kilka HTML, który zosta ... eNonASCIIChars(ByVal html As String) As String Return Regex.Replace(html, "[^\u0000-\u007F]", " ") End Function

Jak mogę wypisać plik CSV UTF-8 w PHP, który Excel będzie poprawnie odczytał?

Mam bardzo prostą rzecz, która wypisuje pewne rzeczy w formacie CSV, ale to musi być UTF-8. Otwieram ten plik w TextEdit lub ... ała wykryć BOM. Ale Excel po prostu dołącza te trzy znaki do pierwszej komórki, gdy importuje, i nadal psuje znaki specjalne.

Zapis do pliku UTF-8 w Pythonie

Jestem naprawdę zmieszany z codecs.open function. Kiedy robię: file = codecs.open("temp", "w", "utf-8") file.write(codecs.B ... A jak wstawić bom? Jeśli druga metoda jest prawidłową metodą, jaki jest sens stosowania codecs.open(filename, "w", "utf-8")?

"Niepoprawna wartość ciągu" podczas próby wstawienia UTF-8 do MySQL przez JDBC?

Tak ustawione jest moje połączenie:Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&charact ... iepoprawna wartość łańcuchowa zawsze zaczyna się od \xF0). Zestawienie kolumny to utf8_general_ci. W czym może być problem?

Naprawianie uszkodzonego kodowania UTF8

Jestem w trakcie naprawiania złego kodowania UTF8. Obecnie używam PHP 5 i MySQL W mojej bazie danych mam kilka przypadków z ... funkcji, które pomogą mi odwzorować instancje î, ÃÂ, ü i innych podobnych do ich właściwych akcentowanych znaków UTF8.

Jak określić kodowanie plików w systemie OSX?

Próbuję wprowadzić kilka znaków UTF-8 do pliku LaTeX w TextMate (który mówi, że jego domyślne kodowanie to UTF-8), ale LaTeX ... v, ale to chyba nie jest w stanie mi powiedzieć, co to jest kodowanie -- przekonwertuje się tylko wtedy, gdy wykażę wyduś to.

Jak sprawdzić, czy ciąg znaków jest unicode lub ascii?

Co muszę zrobić w Pythonie, aby dowiedzieć się, które kodowanie?

Konwertuj Unicode na ASCII bez błędów w Pythonie

Mój kod po prostu zeskrobuje stronę internetową, a następnie konwertuje ją do Unicode. html = urllib.urlopen(link).read() ht ... dzieś błędnie uformowaną próbę Unicode. Czy mogę po prostu porzucić bajty kodu, które powodują problem, zamiast uzyskać błąd?

Jaka jest różnica między kodami utf8mb4 i utf8 w MySQL?

Jaka jest różnica między znakami utf8mb4 a utf8W MySQL? Już wiem o ASCII, UTF-8, kodowanie UTF-16 i UTF-32 ; ale jestem c ... ami kodowania zdefiniowanymi w MySQL Server . Czy są jakieś szczególne korzyści/propozycje stosowania utf8mb4 zamiast utf8?

W OS X Lion, LANG nie jest ustawiony na UTF-8, Jak to naprawić?

Próbuję skonfigurować postgress w OS X Lion i stwierdzam, że nie jest to poprawnie skonfigurowane środowisko LOCALE var. Oto ... k ustawić to na UTF-8. W ustawieniach terminala jest zaznacz UTF-8 i ustaw ustawienia regionalne w open, mimo to nie działa.

Znaki Unicode w adresach URL

Czy w 2010 roku podałbyś adresy URL zawierające znaki UTF-8 w dużym portalu internetowym? Znaki Unicode są zabronione zgodni ... żna skopiować + wkleić z nienaruszonymi znakami specjalnymi, ale działają poprawnie po ponownym użyciu w starszych klientach?

PHP DOMDocument loadHTML nie koduje poprawnie UTF-8

Próbuję przeanalizować kod HTML używając DOMDocument, ale kiedy to robię, nagle tracę kodowanie(przynajmniej tak mi się wydaj ... ƒ«ãƒ©ãƒ³ãƒ‰ç³»ã®å®¶åº­ã«ã€</p></div> <div lang="ja"><p>イリノイ州シカゴにて、アイルランド系の家庭に、</p></div>

Jak dekodować sekwencje escape Unicode, takie jak "\u00ed", do odpowiednich znaków zakodowanych w UTF-8?

Czy istnieje funkcja w PHP, która może dekodować sekwencje escape Unicode, takie jak "\u00ed " do " í" i wszystkie inne podobne zdarzenia? Znalazłem podobne pytanie tutaj ale nie wydaje się działać.

Java odpowiednik kodu JavaScript, który generuje identyczne wyjście?

Eksperymentowałem z różnymi bitami kodu Javy próbując wymyślić coś, co zakoduje ciąg znaków zawierający cudzysłowy, spacje i ... erował on takie same dane wyjściowe jak JavaScript encodeURIComponent? EDIT: używam Javy 1.4 przechodząc wkrótce do Javy 5.

Różnica między UTF-8 a UTF-16?

Różnica między UTF-8 a UTF-16? Po co nam to? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();

Jak używać greckich symboli w ggplot2?

Moje kategorie muszą być nazwane greckimi literami. Używam ggplot2 i działa pięknie z danymi. Niestety nie potrafię wymyśli ... t na to jakiś sposób? UPDATE: Spojrzałem na link , jednak nie ma opisanej dobrej metody, aby osiągnąć to, co chcę zrobić.

błąd UnicodeDecodeError: kodek 'utf-8' nie może dekodować bajtu 0xFF W POZYCJI 0: nieprawidłowy bajt startowy

Https://github.com/affinelayer/pix2pix-tensorflow/tree/master/tools Wystąpił błąd podczas kompilacji "process.py" na powyżs ... f-8' codec can't decode byte 0xff in position 0: invalid start byte Jaka jest przyczyna błędu? Wersja Pythona to 3.5.2.

Jak usunąć plik z początku?

Mam plik CSS, który wygląda dobrze, gdy otwieram go za pomocą gedit, ale kiedy jest odczytywany przez PHP( aby połączyć wszys ... ć za pomocą określonego kodowanie znaków). Próbowałem zapisać go z zakończeniami linii Windows i Linux, ale żaden nie pomógł.

PHP: Konwersja dowolnego ciągu znaków na UTF-8 bez znajomości oryginalnego zestawu znaków, lub przynajmniej spróbuj

Mam aplikację, która zajmuje się klientami z całego świata i oczywiście chcę, aby wszystko, co trafi do moich baz danych, był ... robam dane ze stron internetowych "(lub, rzeczywiście,"nie możesz"). Ale musi być coś, co przynajmniej ma dobry spróbować !