Unbestimmtheit über die Interpolationsfunktion in Pandas

Ich arbeite mit der Interpolationsfunktion in pandas . Hier ist ein Spielzeugbeispiel, um einen illustrativen Fall zu machen:

 df=pd.DataFrame({'Data':np.random.normal(size=200), 'Data2':np.random.normal(size=200)}) df.iloc[1, 0] = np.nan print df print df.interpolate('nearest') 

Meine Frage: Funktioniert die interpolate über mehrere Spalten? Das heißt, verwendet es multivariate Analyse, um den Wert für ein fehlendes Feld zu bestimmen? Oder sieht man einfach einzelne Spalten an?

One Solution collect form web for “Unbestimmtheit über die Interpolationsfunktion in Pandas”

Die Docs verweisen auf die verschiedenen verfügbaren Methoden – die meisten verlassen sich einfach auf den index , möglicherweise über die univariate scipy.interp1d oder andere univariate scipy Methoden:

Methode: {'linear', 'zeit', 'index', 'null', 'slinear', 'quadratisch', 'kubisch', 'barycentric' , 'Spline' 'piecewise_polynomial', 'pchip'}

  • 'Linear': ignoriere den Index und behandle die Werte gleichmäßig beabstandet. Dies ist die einzige Methode, die auf MultiIndexes unterstützt wird.
  • Default 'time': Interpolation arbeitet auf täglichen und höheren Auflösungsdaten, um die vorgegebene Länge des Intervalls 'index', 'values' zu interpolieren: Verwenden Sie die tatsächlichen Zahlenwerte des Index
  • "Nett", "slinear", "quadratisch", "kubisch", "baryzentrisch", "polynom" wird an scipy.interpolate.interp1d übergeben. Sowohl 'Polynom' als auch 'Spline' verlangen, dass Sie auch eine Bestellung (int) angeben, zB df.interpolate (method = 'polynomial', order = 4). Diese verwenden die tatsächlichen Zahlenwerte des Indexes.
  • 'Krogh', 'piecewise_polynomial', 'spline' und 'pchip' sind alle Wrapper um die scipy Interpolationsmethoden ähnlicher Namen. Diese verwenden die tatsächlichen Zahlenwerte des Indexes.

Scipy-Dokumente und Diagramme, die hier die Ausgabe veranschaulichen

  • Python / Scipy 2D Interpolation (ungleichförmige Daten)
  • Lesen Sie .mat Dateien in Python
  • Berechnen Sie Pixel für Pixel-Mittel der Raster mit numpy
  • Problem mit 2D-Interpolation in SciPy, nicht rechteckigem Raster
  • Anpassung eines 3D-Arrays an Daten an eine 1D-Funktion mit numpy oder scipy
  • Python Multiple Lineare Regression mit OLS-Code mit spezifischen Daten?
  • Schnellere Möglichkeit, die Summe der quadrierten Differenz zwischen einem Bild (M, N) und einer Schablone (3, 3) für die Schablonenanpassung zu berechnen?
  • Wie man ein numpy Array auf polyphone Musik übersetzt
  • Schaffung neuer Distributionen in scipy
  • Python: Berechnen pariwise Distanzen verursacht Speicherfehler
  • Lösen eines Systems von Oden (mit wechselnden Konstanten!) Mit scipy.integrate.odeint?
  • Python ist die beste Programmiersprache der Welt.