Tag: regex

Saubere Python Reguläre Ausdrücke

Gibt es einen saubereren Weg, um lange Regex-Muster in Python zu schreiben? Ich habe diesen Ansatz irgendwo gesehen, aber Regex in Python erlaubt keine Listen. patterns = [ re.compile(r'<!–([^->]|(-+[^->])|(-?>))*-{2,}>'), re.compile(r'\n+|\s{2}') ]

Pandas, die Regex verwenden, um Werte zu ersetzen

Ich habe einige Preisdaten in ein pandas dataframe gelesen, die Werte erscheinen als: $40,000* $40000 conditions attached Ich möchte es nur auf die numerischen Werte abstreifen. Ich weiß, ich kann durchschleifen und regex anwenden [0-9]+ Zu jedem Feld dann beitreten die resultierende Liste wieder zusammen, aber gibt es eine nicht loopy Weg? Vielen Dank

Python-Re-Modul wird 20-mal langsamer, wenn man auf mehr als 100 verschiedene Regex schleppt

Mein Problem ist das Analysieren von Protokolldateien und das Entfernen von Variablenteilen auf jeder Zeile, um sie zu gruppieren. Zum Beispiel: s = re.sub(r'(?i)User [_0-9A-z]+ is ', r"User .. is ", s) s = re.sub(r'(?i)Message rejected because : (.*?) \(.+\)', r'Message rejected because : \1 (…)', s) Ich habe etwa 120+ passende Regeln wie die […]

Aufteilen einer Zeichenfolge mit wiederholten Zeichen in eine Liste mit Regex

Ich bin nicht gut mit Regex erlebt, aber ich habe viel darüber gelesen. Angenommen, es gibt einen String s = '111234' Ich möchte eine Liste mit der Zeichenfolge, die in L = ['111', '2', '3', '4'] . Mein Ansatz war, eine Gruppe zu überprüfen, ob es eine Ziffer ist oder nicht und dann auf eine […]

Python regelmäßiger Ausdruck mit utf8 Problem

Ich habe eine Datei, die viele Zeilen von einfachen utf-8 Text enthält. Wie unten, durch die von, ist es Chinesisch. PROCESS:类型:关爱积分[NOTIFY] 交易号:2012022900000109 订单号:W12022910079166 交易金额:0.01元 交易状态:true 2012-2-29 10:13:08 Die Datei selbst wurde im utf-8 Format gespeichert. Dateiname ist xx.txt Hier ist mein python code, env ist python2.7 #coding: utf-8 import re pattern = re.compile(r'交易金额:(\d+)元') for line […]

Was bedeutet das "r" in pythons re.compile (r 'Musterflaggen')?

Ich lese durch http://docs.python.org/2/library/re.html . Dementsprechend bezieht sich das "r" in pythons re.compile ( r 'Musterflaggen') auf die Rohstring-Notation: Die Lösung besteht darin, Pythons Rohstring-Notation für reguläre Ausdrucksmuster zu verwenden. Backslashs werden nicht in besonderer Weise in einem String-Literal behandelt, das mit 'r' vorangestellt ist. Also ist r \ n "eine Zwei-Zeichen-Zeichenfolge mit '\' und […]

Duplikate mit Regex entfernen?

Nehmen wir an, ich möchte alle doppelten Zeichen (eines bestimmten Char) in einer Zeichenfolge mit regulären Ausdrücken entfernen. Das ist einfach – import re re.sub("a*", "a", "aaaa") # gives 'a' Was ist, wenn ich alle doppelten Zeichen (dh a, z) durch das jeweilige char ersetzen möchte? Wie mache ich das? import re re.sub('[az]*', <what_to_put_here>, 'aabb') […]

Extrahieren von Zeichen aus einer Zeichenfolge in Python

In Python möchte ich nur die Zeichen aus einer Zeichenfolge extrahieren. Überlegen Sie, ich habe die folgende Zeichenfolge, input = "{('players',): 24, ('year',): 28, ('money',): 19, ('ipod',): 36, ('case',): 23, ('mini',): 46}" Ich möchte das Ergebnis als, output = "players year money ipod case mini" Ich habe versucht, nur die Alphabete zu teilen, word1 = […]

Tool zum Umwandeln von Regex zwischen verschiedenen Sprachsyntaxen?

Gibt es ein Werkzeug, um eine Regex von einer populären Sprache Syntax zu einem anderen zu konvertieren? Zum Beispiel eine Python-Stil Regex zu einem Java-Stil Regex ?. Oder zumindest hat jemand eine Reihe von Regeln zusammengestellt, um diese Conversions zu machen? Und offensichtlich können manche Konstrukte nicht umwandeln.

In Python, wie man überprüft, ob ein String nur bestimmte Zeichen enthält?

In Python, wie man überprüft, ob ein String nur bestimmte Zeichen enthält? Ich muss einen String mit nur a..z, 0..9 und. (Periode) und kein anderer Charakter. Ich könnte über jedem Charakter iterieren und überprüfen Sie das Zeichen ist ein ..z oder 0..9, oder. Aber das wäre langsam. Ich bin jetzt nicht klar, wie man es […]

Python ist die beste Programmiersprache der Welt.