Unbestimmtheit über die Interpolationsfunktion in Pandas

Ich arbeite mit der Interpolationsfunktion in pandas . Hier ist ein Spielzeugbeispiel, um einen illustrativen Fall zu machen:

 df=pd.DataFrame({'Data':np.random.normal(size=200), 'Data2':np.random.normal(size=200)}) df.iloc[1, 0] = np.nan print df print df.interpolate('nearest') 

Meine Frage: Funktioniert die interpolate über mehrere Spalten? Das heißt, verwendet es multivariate Analyse, um den Wert für ein fehlendes Feld zu bestimmen? Oder sieht man einfach einzelne Spalten an?

One Solution collect form web for “Unbestimmtheit über die Interpolationsfunktion in Pandas”

Die Docs verweisen auf die verschiedenen verfügbaren Methoden – die meisten verlassen sich einfach auf den index , möglicherweise über die univariate scipy.interp1d oder andere univariate scipy Methoden:

Methode: {'linear', 'zeit', 'index', 'null', 'slinear', 'quadratisch', 'kubisch', 'barycentric' , 'Spline' 'piecewise_polynomial', 'pchip'}

  • 'Linear': ignoriere den Index und behandle die Werte gleichmäßig beabstandet. Dies ist die einzige Methode, die auf MultiIndexes unterstützt wird.
  • Default 'time': Interpolation arbeitet auf täglichen und höheren Auflösungsdaten, um die vorgegebene Länge des Intervalls 'index', 'values' zu interpolieren: Verwenden Sie die tatsächlichen Zahlenwerte des Index
  • "Nett", "slinear", "quadratisch", "kubisch", "baryzentrisch", "polynom" wird an scipy.interpolate.interp1d übergeben. Sowohl 'Polynom' als auch 'Spline' verlangen, dass Sie auch eine Bestellung (int) angeben, zB df.interpolate (method = 'polynomial', order = 4). Diese verwenden die tatsächlichen Zahlenwerte des Indexes.
  • 'Krogh', 'piecewise_polynomial', 'spline' und 'pchip' sind alle Wrapper um die scipy Interpolationsmethoden ähnlicher Namen. Diese verwenden die tatsächlichen Zahlenwerte des Indexes.

Scipy-Dokumente und Diagramme, die hier die Ausgabe veranschaulichen

  • Effiziente Indizes von Histogrammbehältern in Python
  • Schätzung eines Bereichs eines Bildes, das durch einen Satz von Punkten erzeugt wird (Alpha-Formen ??)
  • Python MemoryError beim Anpassen mit Scikit-Learn
  • Erzeugen von diskreten Zufallsvariablen mit bestimmten Gewichten mit SciPy oder NumPy
  • Fehler beim Testen von SciPy
  • Python scipy Delaunay Plotten Punkt Wolke
  • Warum ist Zeilenindexierung von scipy csr Matrizen langsamer im Vergleich zu numpy Arrays
  • Ersatz für numpy broadcasting mit scipy.sparse.csc_matrix
  • Quadratisches Programm (QP) Solver, das nur von NumPy / SciPy abhängt?
  • Py2exe mit scipy.sparse.sparsetools.csr
  • Cx_freeze ImportError kein Modul namens scipy
  • Python ist die beste Programmiersprache der Welt.