Entfernen Sie Sub String mit Python

Ich habe schon einige Informationen aus einem Forum extrahiert. Es ist die rohe Saite, die ich jetzt habe:

string = 'i think mabe 124 + <font color="black"><font face="Times New Roman">but I don\'t have a big experience it just how I see it in my eyes <font color="green"><font face="Arial">fun stuff' 

Die Sache, die ich nicht mag, ist die Sub-String "<font color="black"><font face="Times New Roman">" und "<font color="green"><font face="Arial">" . Ich möchte den anderen Teil des Strings außer diesem halten. So sollte das Ergebnis so sein

 resultString = "i think mabe 124 + but I don't have a big experience it just how I see it in my eyes fun stuff" 

Wie könnte ich das machen? Eigentlich habe ich schöne Suppe benutzt, um die Saite aus einem Forum zu extrahieren. Jetzt kann ich den regulären Ausdruck bevorzugen, um den Teil zu entfernen.

2 Solutions collect form web for “Entfernen Sie Sub String mit Python”

 import re re.sub('<.*?>', '', string) "i think mabe 124 + but I don't have a big experience it just how I see it in my eyes fun stuff" 

Die re.sub Funktion nimmt eine reguläre Ausprägung und ersetzt alle Streichhölzer im String mit dem zweiten Parameter. In diesem Fall suchen wir nach allen Tags ( '<.*?>' ) Und ersetzen sie mit nichts ( '' ).

Die re für nicht gierige suche verwendet.

Mehr über das re module

 >>> import re >>> st = " i think mabe 124 + <font color=\"black\"><font face=\"Times New Roman\">but I don't have a big experience it just how I see it in my eyes <font color=\"green\"><font face=\"Arial\">fun stuff" >>> re.sub("<.*?>","",st) " i think mabe 124 + but I don't have a big experience it just how I see it in my eyes fun stuff" >>> 
  • Wie finde ich heraus, ob ein Python-Objekt ein String ist?
  • Wie man den Parse-Baum zu glätten und in einem String für weitere String-Operationen python nltk zu speichern
  • Konvertieren eines Strings in ein Tupel in Python
  • Hinzufügen aller Buchstaben eines Strings um 1
  • Python-Interpreter-String-Pooling-Optimierung [duplizieren]
  • Finde die Position eines Teilstrings in einer Zeichenkette
  • Liste, die von der Kartenfunktion zurückgegeben wird, verschwindet nach einer Verwendung
  • Was ist der Unterschied zwischen einem String und einem Byte-String?
  • Verknüpfen von Elementen einer Liste
  • String Manipulation in Python Docstrings
  • Probleme mit Dezimalstellen und wissenschaftlicher Notation in Python 2.6.6
  • Python ist die beste Programmiersprache der Welt.