Python-xpath-Abfrage, die keinen Textwert zurückgibt

Ich versuche, Daten von der folgenden Seite mit dem lxml-Modul in Python zu kratzen: http://www.thehindu.com/todays-paper/with-afspa-india-has-failed-statute-amnesty/article7376286.ece . Ich möchte den Text im ersten Absatz bekommen, aber der folgende Code gibt den Nullwert zurück

from lxml import html import requests page = requests.get('http://www.thehindu.com/todays-paper/with-afspa-india-has-failed-statute-amnesty/article7376286.ece') tree = html.fromstring(page.text) data = tree.xpath('//*[@id="left-column"]/div[6]/p[1]/text()') print data 

Ich verstehe nicht, was ich hier falsch mache. Bitte schlagen Sie vor, wenn es bessere Möglichkeiten gibt, das zu tun, was ich versuche zu tun.

2 Solutions collect form web for “Python-xpath-Abfrage, die keinen Textwert zurückgibt”

Versuche //div[class='article-text']/p/text()

Sie können xpath wie folgt verwenden:

 div[@class='article-text']/p[1]/text() 
  • Extrahieren von Informationen aus einer Tabelle auf einer Website mit python, LXML & XPATH
  • Können wir xpath mit BeautifulSoup benutzen?
  • Extrahieren Sie Informationen von der Website mit Xpath, Python
  • Wie selektiere ich Elemente in einem iframe mit Xpath?
  • Benötige xpath-Locators für sichtbare Elemente
  • Wildcard-Namespaces in lxml
  • Kratzen neuer ESPN-Site mit xpath [Python]
  • Wortbrüche in Text-Extraktion, Lxml Xpath
  • Leere Liste mit scrapy und Xpath
  • Lxml xpath ignoriert nicht "& nbsp;"
  • Ist es ein xpath (lxml) Bug?
  • Python ist die beste Programmiersprache der Welt.