XPath wähle alle, aber nicht selbst :: stark und selbst :: stark / folgend-Geschwister :: Text ()

Also habe ich folgendes Beispiel html zu analysieren.

<div> <strong>Title:</strong> Sub Editor at NEWS ABC <strong>Name:</strong> John <strong>Where:</strong> Everywhere <strong>When:</strong> Anytime <strong>Everything can go down there..</strong> Lorem Ipsum blah blah blah.... </div> 

Ich möchte dieses ganze div extrahieren, außer ich will nicht Titel und wo und wann mit den folgenden Werten.

Ich habe bisher nach XPaths getestet.

A) Ohne nachfolgende Geschwister (1: funktioniert nicht 2: Werke)

 1. //div/node()[not(strong[contains(text(), "Title")])] 2. //div/node()[not(self::strong and contains(text(), "Title"))] 

A) Mit folgendem Geschwister (1: nicht arbeiten 2: nicht arbeiten)

 1. //div/node()[not(strong[contains(text(), "Title")]) and not(strong[contains(text(), "Title")]/following-sibling::text())] 2. //div/node()[not(self::strong and contains(text(), "Title") and following-sibling::text())] 

Wie kann ich das erreichen?

One Solution collect form web for “XPath wähle alle, aber nicht selbst :: stark und selbst :: stark / folgend-Geschwister :: Text ()”

Ich denke, das Folgende trifft auf das, was du zu tun versuchst – es schließt das starke Element mit dem Titel sowie dem Textknoten aus, der danach ist. Sie können es erweitern, um die anderen starken Elemente einzuschließen, die Sie ausschließen möchten:

 //div/node()[not(self::strong and contains(text(), "Title") or preceding-sibling::strong[1][contains(text(), "Title")])] 

Der starke Knoten wird von der:

 not(self::strong and contains(text(), "Title") 

Der folgende Text wird übersprungen von:

 preceding-sibling::strong[1][contains(text(), "Title")] 

Beachten Sie, dass der Textknoten seine nächstgelegenen vorherigen Geschwister (anstatt der folgenden Geschwister) überprüfen muss.

  • Sortieren von XML-Dateien
  • Finden Sie ein Element in einem XML-Baum mit ElementTree
  • Wie kann ich diesen XPath-Ausdruck in BeautifulSoup übersetzen?
  • Dynamische Suche durch XML-Attribute mit lxml und xpath in python
  • Warum gibt mein Scrapy-Code ein leeres Array zurück?
  • Wie man einem einfachen Zitat in xpath 1.0 in Selen für Python entgehen kann
  • Brauchen Sie Hilfe bei Verwendung von XPath in ElementTree
  • Extrahieren von Informationen aus einer Tabelle auf einer Website mit python, LXML & XPATH
  • Warum funktioniert xpath nicht bei der Verarbeitung eines XHTML-Dokuments mit lxml (in python)?
  • Das Scraping von Webinhalten mit xpath funktioniert nicht
  • Python XPath SyntaxError: ungültiges Prädikat
  • Python ist die beste Programmiersprache der Welt.