Tag: regex

Warum führt dieses Regex zu vier Items?

Ich möchte einen String durch , -> , => , oder die mit mehreren Räumen verpackt, was bedeutet, dass ich zwei Gegenstände bekommen kann, she und he , aus den folgenden Saiten, nachdem sie gespalten wurden: "she he", "she he", "she he ", "she he ", "she->he", "she ->he", "she=>he", "she=> he", " she-> he […]

Erfassen und Ändern von Strings in PDFs

Ich möchte in der Lage sein, ein Muster in einem PDF zu erkennen und irgendwie zu kennzeichnen. Zum Beispiel, in diesem PDF , gibt es die Zeichenfolge *2 . Ich möchte in der Lage sein, das PDF zu analysieren, alle Instanzen von *[integer] und etwas zu tun, um die Aufmerksamkeit auf die Spiele zu rufen […]

Python-Split-String auf Regex

Ich versuche, einen String mit einem regulären Ausdruck zu teilen. Friday 1Friday 11 JAN 11 Die Ausgabe, die ich erreichen möchte, ist ['Friday 1', 'Friday 11', ' JAN 11'] Mein Snippet macht noch nicht die gewünschten Ergebnisse: >>> import re >>> p = re.compile(r'(Sunday|Monday|Tuesday|Wednesday|Thursday|Friday|Saturday)\s*\d{1,2}') >>> filter(None, p.split('Friday 1Friday 11 JAN 11')) ['Friday', 'Friday', ' JAN […]

Python regelmäßiger Ausdruck für schöne Suppe

Ich benutze schöne Suppe, um bestimmte div-Tags herauszuziehen, und es scheint, dass ich keine einfache String-Matching verwenden kann. Die Seite hat einige Tags in Form von <div class="comment form new"…> Die ich ignorieren möchte, und auch einige Tags in Form von <div class="comment comment-xxxx…"> Wo die xs eine ganze Zahl von beliebiger Länge darstellen und […]

Python 3 regulären Ausdruck zu finden multiline Kommentar

Ich versuche, Kommentarblöcke im PHP-Quellcode mit regulären Ausdrücken in Python 3 zu finden. Die PHP-Kommentare sind in diesem Format: /** * This is a very short block comment */ Jetzt kam ich mit dem folgenden regulären Ausdruck: '/\*\*[.]+?\*/' Ich stelle fest, dass – in Kombination mit der DOTALL-Flagge – es tun sollte, aber nein. Es […]

Ersetzt nur einzelne Instanzen eines Charakters mit Python-Regexp

Ich versuche, einzelne $ Zeichen mit etwas anderem zu ersetzen und möchte mehrere $ Zeichen in einer Reihe ignorieren, und ich kann nicht ganz herausfinden, wie. Ich habe versucht, lookahead: s='$a $$b $$$c $d' re.sub('\$(?!\$)','z',s) Das gibt mir: 'za $zb $$zc zd' Wann was ich will 'za $$b $$$c zd' Was mache ich falsch?

Regex: Warum werden leere Strings (in einer Liste von Tupeln) in re.findall () aufgenommen?

Nach dem Muster Match hier sind die Spiele 213.239.250.131 und 014.10.26.06 . Doch wenn ich den generierten Python-Code ausführe und den Wert von re.findall(p, test_str) ich: [('', '', '213.239.250.131'), ('', '', '014.10.26.06')] Ich könnte um die Liste hacken und es tupel, um die Werte zu bekommen, die ich suche (die IP-Adressen), aber (i) sie vielleicht […]

Python Split String

Lass uns sagen, wir haben Zaptoit:685158:zaptoit@hotmail.com Wie geteilt du dich so, dass es nur noch übrig 685158:zaptoit@hotmail.com

Wiederholt eine Zeile zwischen zwei Begrenzern in einer Textdatei, Python

Ich habe eine Textdatei im folgenden Format: DELIMITER1 extract me extract me extract me DELIMITER2 Ich möchte jeden Block von extract me s zwischen DELIMITER1 und DELIMITER2 in der .txt Datei zu extrahieren Dies ist mein aktueller, nicht erfüllter Code: import re def GetTheSentences(file): fileContents = open(file) start_rx = re.compile('DELIMITER') end_rx = re.compile('DELIMITER2') line_iterator = […]

Re.findall nicht wieder volle Übereinstimmung?

Ich habe eine Datei, die eine Reihe von Strings wie "size = XXX;" enthält. Ich versuche das Python's Re-Modul zum ersten Mal und bin ein bisschen verwirrt durch das folgende Verhalten: Wenn ich eine Pipe für 'oder' in einem regulären Ausdruck verwende, sehe ich nur, dass das Stück des Spiels zurückgekehrt ist. Z.B: >>> myfile […]

Python ist die beste Programmiersprache der Welt.