Überprüfen Sie auf gültige utf8 Zeichenfolge in Python

Ich lese Dateinamen aus dem Dateisystem und ich möchte sie als JSON-codiertes Array senden. Das Problem ist, dass Dateien auf Dateisystem in ungültiger Codierung gespeichert werden können, und ich muss diese Situation behandeln, um ungültige Dateinamen auszulassen, bevor sie an json.dump , andernfalls wird es fehlschlagen

Gibt es eine Möglichkeit zu überprüfen, dass meine Zeichenfolge (Dateiname) gültige utf-8 Zeichen enthält?

One Solution collect form web for “Überprüfen Sie auf gültige utf8 Zeichenfolge in Python”

Wie wäre es mit dem folgenden?

 valid_utf8 = True try: filename.decode('utf-8') except UnicodeDecodeError: valid_utf8 = False 

… basierend auf einer Antwort auf eine ähnliche Frage hier: Wie schreibe ich einen Check in python, um zu sehen, ob Datei gültig ist UTF-8?

  • Umwandlung von UTF-16 in UTF-8
  • Python Rückgängig Unicode Frage
  • Python-Insert UTF8-String in SQLite
  • Python 3 CSV-Datei, die UnicodeDecodeError: 'utf-8' Codec kann nicht decode Byte Fehler, wenn ich drucken
  • SQLAlchemy Text Zusammenpassende Daten im JSON-Feld mit UTF-8
  • UTF-8 Kodierung in Python
  • Importieren von Oracle mit der richtigen Codierung mit Python
  • Chinesisch Unicode Problem?
  • UnicodeDecodeError im PyCharm-Debugger
  • Warum Zeichen ID 160 wird nicht als Unicode in PDFMiner erkannt?
  • Konvertiere alle csv-Dateien von der Verschlüsselung von ansi zu utf8 mit python
  • Python ist die beste Programmiersprache der Welt.