Tag: regex

Sehr langsamer regelmäßiger Ausdruck suchen

Ich bin mir nicht sicher, ob ich völlig verstehe, was los ist mit der folgenden regelmäßigen Ausdrucksuche: >>> import re >>> template = re.compile("(\w+)+\.") >>> target = "a" * 30 >>> template.search(target) search() call nimmt Minuten zu vervollständigen, CPU-Auslastung geht auf 100%. Das Verhalten ist sowohl für 2.7.5 als auch 3.3.3 Python-Versionen reproduzierbar. Interessante Tatsache, […]

Python re.findall mit groupdicts

Ich wünsche mir, dass es eine Version von re.findall , die groupdict s statt nur group s zurückgegeben hat. Bin ich irgendeinen einfachen Weg, um das gleiche Ergebnis zu erreichen? (Kennt jemand von einem Grund, dass diese Funktion nicht existiert?)

Python regex, entfernen Sie alle Interpunktion außer Bindestrich für Unicode-String

Ich habe diesen Code für das Entfernen aller Interpunktion aus einer Regex-String: import regex as re re.sub(ur"\p{P}+", "", txt) Wie würde ich es ändern, um Bindestriche zu erlauben? Wenn Sie erklären könnten, wie Sie es getan haben, wäre das toll. Ich verstehe das hier, korrigiere mich, wenn ich mich irre, P mit irgendetwas, nachdem es […]

Ersetzen Sie URLs im Text mit Links zu URLs

Mit Python Ich möchte alle URLs in einem Textkörper mit Links zu diesen URLs ersetzen, wie das Gmail macht. Kann dies in einem direkten Ausdruck gemacht werden? Bearbeiten: durch Textkörper Ich meinte einfach nur Text – kein HTML

Python: wie zu bestimmen, ob eine Liste von Wörtern in einem String existiert

Angesichts einer Liste ["one", "two", "three"] , wie zu bestimmen, ob jedes Wort in einer bestimmten Zeichenfolge existiert? Die Wortliste ist ziemlich kurz (in meinem Fall weniger als 20 Wörter), aber die zu suchenden Saiten sind ziemlich groß (400.000 Saiten für jeden Lauf) Meine aktuelle Implementierung verwendet, um nach Spielen zu suchen, aber ich bin […]

Python + Regex: AttributeError: 'NoneType' Objekt hat kein Attribut 'Gruppen'

Ich habe einen String, den ich eine Untermenge von extrahieren möchte. Dies ist Teil eines größeren Python-Skripts. Dies ist die Saite: import re htmlString = '</dd><dt> Fine, thank you. </dt><dd> Molt bé, gràcies. (<i>mohl behh, GRAH-syuhs</i>)' Was will ich herausziehen " Molt bé, gràcies mohl behh, GRAH-syuhs ". Und dafür verwende ich den regulären Ausdruck mit […]

Python Regex ersetzt sofort Gruppen

Gibt es eine Möglichkeit, alle Gruppen direkt in Regex-Syntax zu ersetzen. Der normale Weg: re.match(r"(?:aaa)(_bbb)", string1).group(1) Dennoch möchte ich so etwas erreichen: re.match(r"(\d.*?)\s(\d.*?)", "(CALL_GROUP_1) (CALL_GROUP_2)") Also will ich einfach nur die neue Saite sofort aufbauen, wenn möglich, indem du die Gruppen anrufst, die die Regex gerade erwischt hat.

Regulärer Ausdruck für ganze Zahlen und ganze Zahlen?

Ich versuche, alle Ganzzahlen und ganze Zahlen (unter vielen anderen Dingen) aus einer Zeichenkette zu erkennen. Hier sind die regulären Ausdrücke, die ich derzeit verwende: Ganze Zahlen: r"[0-9]+" Integers: r"[+,-]?[0-9]+" Hier sind die Themen: Die ganze Zahl regex erkennt auch negative Zahlen, was ich nicht haben kann. Wie kann ich das lösen? Wenn ich einen […]

Übergeben einer Funktion an re.sub in Python

Ich habe Strings, die eine Nummer irgendwo in ihnen enthalten und ich versuche, diese Nummer durch ihre Wortnotation (dh 3 -> drei) zu ersetzen. Ich habe eine Funktion, die das tut. Das Problem ist jetzt, die Nummer innerhalb der Zeichenfolge zu finden, während der Rest der Zeichenfolge intakt bleibt. Dazu habe ich mich entschlossen, die […]

Gibt es einen Weg, um wirklich komplizierte reguläre Ausdrücke in Python zu pflücken?

Ich habe eine Python-Konsole Anwendung, die 300 + reguläre Ausdrücke enthält. Die Menge der regulären Ausdrücke ist für jede Freigabe festgelegt. Wenn die Benutzer die App ausführen, wird der gesamte Satz von regulären Ausdrücken überall von einmal (ein sehr kurzer Job) auf Tausende von Zeiten (ein langer Job) angewendet. Ich möchte die kürzeren Aufträge beschleunigen, […]

Python ist die beste Programmiersprache der Welt.