Wie importiere ich unbeschriftete und fehlende Spalten in ein Pandas-Dataframe?

Ich habe einen tabulatorgetrennten Satz von Daten mit einigen Spalten nicht in der richtigen Reihenfolge und fehlt.

Einige Zeilen haben 12 Spalten, andere haben 13 oder 14 oder 15 Spalten.

Wenn ich mir die Daten anschaue, finde ich die folgenden Arten von Zeilen

.... Col_10: 25 Col_11: 23432 Col12: 639142 .... Col_10: 25 Col_12: 25134 Col13: 243344 .... Col_11: 75 Col_13: 79876 Col15: 634534 Col12: 5 Col14: 73453 .... Col_10: 25 Col_11: 32425 Col13: 989423 .... Col_10: 25 Col_11: 23424 Col12: 342421 Col13: 7 Col14: 13424 Col 15: 67 .... Col_10: 95 Col_11: 32121 Col15: 111231 

So wird jede Spalte von Col_10 bis Col_15 so markiert, dass column_name: value .

Ich möchte diese Daten in einem Pandas-Dataframe mit lesen

 import pandas as pd df = pd.read_table("fname.dat") 

Wo fname.dat das Format für die oben genannten Daten ist.

Wie machst Du das? Es scheint, dass ich Platz für 15 Spalten zuweisen muss, und dann die Daten so analysieren, dass, wenn es mit Col_10 beginnt, dieser Wert in die 10. Spalte gesetzt werden sollte, wenn Col_11 dann in der 11., etc.

Wie liest man solche Daten mit Pandas?

  • Lernparser in Python
  • Erstellen von Wörterbuch-Objekt aus String, das wie Wörterbücher aussieht
  • Effiziente Berechnung der Wortfrequenz in einem String
  • Malz-Parser gibt Behauptungsfehler bei der Verwendung mit nltk
  • Konvertieren Sie String in Wörterbuch mit Python
  • Bash-Skript, um eine einzelne Python-Funktion aus einer Datei auszuwählen
  • Wie bekomme ich eine Reihe von Grammatikregeln von Penn Treebank mit python & NLTK?
  • DateTime.TryParse () in Python?
  • Python / Pandas CSV Parsing
  • Parsing HTML mit Python 2.7 - HTMLParser, SGMLParser oder schöne Suppe?
  • Erlangung der Modelltopologie aus einem Simulink-Modell
  • Python ist die beste Programmiersprache der Welt.