html-parsing

Jak Mogę dodać "aktualną passę" wpisów z Githuba do mojego bloga?

Mam osobistego bloga zbudowanego przy użyciu rails. Chcę dodać sekcję na mojej stronie, która wyświetla moją aktualną passę w ... a zrobienie tego? Edit: dla wyjaśnienia, oto czego chcę: Tylko liczba dni jest dla mnie wszystkim, co jest mi potrzebne.

Web Scraping With Haskell

Jaki jest aktualny stan bibliotek do skrobania stron internetowych z Haskell? Staram się zrobić więcej moich szybkich jednor ... ę ładny, w rzeczywistości przemierzanie stron nie wydaje się tak miłe, jak to jest w innych językach. Czy jest lepsza opcja?

Co to jest parsowanie?

Parsowanie jest czymś, na co natykam się często w rozwoju, ale jako junior jest to jedna z tych rzeczy, które zakładam, że w ... TML dla określonej funkcji, znalazłem kilka w Internecie. Ale co właściwie robi parser HTML? A co to znaczy parsować obiekt?

Jak działa parser (na przykład HTML)?

Dla argumentu przyjmijmy parser HTML. Czytałem, że to tokenizuje wszystko najpierw, a potem analizuje. Co oznacza tokeniz ... ybym miał przeczytać źródło czegoś takiego jak HTML Purifier , czy dałoby mi to dobre pojęcie o tym, jak HTML jest parsowany?

Jaka jest najlepsza praktyka parsowania zdalnej zawartości za pomocą jQuery?

Po wywołaniu jQuery ajax w celu pobrania całego dokumentu XHTML, jaki jest najlepszy sposób na wybranie określonych elementów ... rać te elementy? Jako przykład, jeśli możesz pokazać mi, jak wybrać tytuł strony zdalnej, byłoby to idealne! Dzięki, Pete.]}

Jak mogę użyć biblioteki Python HTMLParser do wyodrębnienia danych z określonego znacznika div?

Próbuję uzyskać wartość ze strony HTML za pomocą biblioteki HTMLParser Pythona. Wartość, którą chcę zdobyć, znajduje się w ty ... read() p.feed(html) p.close() Czy ktoś może wskazać mi właściwy kierunek? Chcę, żeby funkcjonalność klasy miała wartość 20.

interfejs podobny do jQuery dla PHP?

Byłem ciekaw, czy istnieje interfejs/Biblioteka w stylu jQuery dla PHP do obsługi plików HTML/XML - szczególnie przy użyciu s ... czego szukałem. Czy ktoś wie czy coś w tym stylu istnieje, czy jest to coś, co będę musiał zrobić od podstaw używając domxml?

Korzystanie z XPath zawiera HTML w Javie

Skrobam wartości ze stron HTML za pomocą XPath wewnątrz programu java, aby dostać się do określonego tagu i od czasu do czasu ... String.zawiera Krótkie pytanie: Czy Jest jakiś sposób na użycie XPath contains w HTML wewnątrz istniejącej biblioteki Java?

TagSoup vs. Jsoup vs. HTML Parser vs. HotSax vs [zamknięty]

Obfitość parserów HTML do wyboru (i trzymania się) jest oszałamiająca: Http://java-source.net/open-source/html-parsers J ... na Androidzie) Bazując na twoim doświadczeniu, który parser HTML poleciłbyś (dla spełnienie powyższych wymagań) i dlaczego?

Android ImageGetter obrazy nakładające się na tekst

Próbuję załadować blok HTML do widoku tekstowego, w tym obrazy, używając URLImageParser p = new URLImageParser(articleBody, ... rn drawable; } catch (Exception e) { return null; } } } } Jakieś pomysły? Wielkie dzięki.

Wyodrębnij dane ze strony internetowej za pomocą PHP

Próbuję stworzyć prostą aplikację dla znajomych. W zasadzie chcę być w stanie wyodrębnić dane "Cena" i "dostępność zapasów" ... na niektórych tutorialach, ale jestem zbyt n00b do tego), ale nie udało się to działa, jakieś dobre wskazówki lub przykłady?

Wstawianie i analizowanie HTML w widoku za pomocą AngularJS

Wiem, że gdy chcę wstawić HTML do widoku, używam 'ng-bind-html' lub 'ng-bind-html-unsafe'. To czego Nie wiem, to jak wstawić ... return _html; } } Próbowałem użyć powyższego, ale Angular wystarczy wydrukować {{s}} lub {{s.k}} tak jak jest.

HTML5: W3C vs WHATWG. Który daje najbardziej autorytatywny spec?

Jestem w połowie drogi parsera html i znalazłem HTML5 zdefiniowane jawnie Zasady parsowania źle uformowany html. (a ja wyw ... e oficjalnego statusu rekomendacji? Którą specyfikację html5 my, biedne diabły, powinniśmy naśladować, gdy mamy wątpliwości?

Parsowanie HTML w Pythonie [zamknięte]

Jaka jest najlepsza opcja do parsowania HTML, jeśli nie mogę użyć BeautifulSoup lub lxml? Mam jakiś kod, który używa SGMLlib, ... żeby to było trochę zniekształcone HTML, chociaż jestem prawie pewien, że większość danych wejściowych będzie całkiem czysta.

Tekst HTML ze znacznikami do sformatowanego tekstu w komórce Excela

Czy istnieje sposób, aby pobrać HTML i zaimportować go do Excela, aby został sformatowany jako tekst bogaty (najlepiej za pom ... or <i>italic</i></p></html> Do tego: To jest test. Czy ten tekst będzie pogrubiony lub kursywą

Czyszczenie HTML poprzez usunięcie dodatkowych / zbędnych znaczników formatowania

Używam CKEditor edytor wysiwyg dla strony internetowej, gdzie użytkownicy mogą używać edytora HTML do dodawania komentarzy. S ... blioteka/etc), aby oczyścić bałagan (tak bałagan jak oryginalny HTML) bbcode, który będzie / align = "left" / Thanks again

PowerShell-parsowanie HTML: pobieranie informacji ze strony internetowej

Aktualizacja, skrypt działa z PowerShell V3. 0, dzięki @ Doug Chcę użyć następującego skryptu PowerShell, aby uzyskać infor ... ultArray = @() foreach($element in $elements.Split("`n")){ if($element.Length -gt "2") {$resultArray += $element} }

Parsing HTML to fix microtypography & Gliph issues

Jestem zainteresowanymikrotypografią zagadnieniami w sieci. Chcę narzędzie do naprawy: Cytaty " ( ") cytat otwierając ... ipiec 2013: opracowałem JoliTypo z testów i wiedzy, którą zdobyłem w tym problemie. Żadna Lib nie robiła tego, co chciałem.

Jak parsować zniekształcony HTML w Pythonie, używając standardowych bibliotek

Jest tak wiele bibliotek html i xml wbudowanych w python, że trudno uwierzyć, że nie ma wsparcia dla rzeczywistego parsowania ... ree.ElementTree import fromstring DOM = fromstring("<html>%s</html>" % html.replace('&nbsp;', '&#160;'))

Problem z PARSEREM HTML w IE

Próbuję utworzyć okno dialogowe, które pojawi się tylko wtedy, gdy wybrana przeglądarka to IE (dowolna wersja), jednak pojawi ... nę " BrowserDetect.przeglądarka " oraz .wersja usuwa błąd, ale muszę je sprawdzić =/...wszelkie pomysły zostaną docenione =).