Tag: dataframe

Wie man eine Funktion in jeder Zeile in DataFrame ausführt und das Ergebnis an einen neuen DataFrame anhängt

NB Mein Code läuft, wenn kopiert Ich schrieb ein einfaches Skript zum Backtest Kryptokurrenzen mit der poloniex API. Zuerst fordere ich die Daten aus der API an und schalte sie in ein Dataframe- data . Dann nehme ich die Daten, die ich will und neue df namens df Ein Funktionshandel muss dann auf jeder Zeile […]

Bewegt die Zeile zum Ende von DataFrame

Ich möchte eine gegebene Zeile aus einem DataFrame nehmen und vorangestellt oder an dieselbe DataFrame angehängt werden. Mein Code unten tut genau das, aber ich bin mir nicht sicher, ob ich es richtig mache oder wenn es einfacher, besser, schneller geht? testdf = df.copy() #get row target_row = testdf.ix[[2],:] #del row from df testdf.drop([testdf.index[2]], axis=0, […]

Vermeidung von Fehler von pd.to_datetime in Pandas

Ich habe ein riesiges Dataframe mehr als 100 Millionen Zeilen. Da habe ich ein Datum Spalten, haben leider falsch formatierte (gemischte) Datum Strings. Jetzt habe ich es in datetime umgewandelt von: df['TRX_DATE'] = pd.to_datetime(df['TRX_DATE'],coerce=True) # without any error # Now i want to calculate week day from that date columns df['day_type'] = [x.strftime('%A') for x […]

Zuordnen mehrerer Dataframe basierend auf den passenden Spalten

Ich habe 25 Datenrahmen, die ich zusammenführen muss und immer wieder auftretende Zeilen aus allen 25 Datenrahmen finden soll. Beispielsweise sieht mein Datenrahmen wie folgt aus, df1 chr start end name 1 12334 12334 AAA 1 2342 2342 SAP 2 3456 3456 SOS 3 4537 4537 ABR df2 chr start end name 1 12334 12334 […]

Eliminiere whitespaces in pd.read_csv

Sagen wir, ich habe eine csv-Datei mit Zeilen im folgenden Format. 89.96.146.2 # Einige String Related, To, 45.53,11.0 Ich möchte diese Zeilen in einem Pandas-Dataframe lesen und eine Suchfunktion basierend auf der IP-Adresse (89.96.146.2) durchführen. df = pd.read_csv('test.csv', sep='#\s+', header=None).set_index(0) Das hat einen weißen Platz mit IP ?. Ich kann nur die Suchfunktion ausführen, wenn […]

Umordnen einer nicht aufeinanderfolgenden Reihenfolge von Spalten in pandas dataframe

Ich habe einen Pandas-Datenrahmen (Ergebnis) df mit n (Variable) Spalten, die ich mit dem Zusammenführen von zwei anderen Datenrahmen erzeugt habe: result1 = df1.merge(df2, on='ID', how='left') Result1 dataframe wird erwartet, dass eine variable Anzahl von Spalten (dies ist Teil eines größeren Skripts). Ich möchte die Spalten so anordnen, dass die letzten 2 Spalten die zweite […]

Vergleichen Sie PandaS DataFrames und geben Sie Zeilen zurück, die vom ersten fehlen

Ich habe 2 dataFrames und möchte sie vergleichen und die Zeilen aus dem ersten (df1) zurückgeben, die nicht im zweiten (df2) sind. Ich fand einen Weg, um sie zu vergleichen und die Unterschiede zurückzugeben, aber kann nicht herausfinden, wie man nur fehlende von df1 zurückgibt. import pandas as pd from pandas import Series, DataFrame df1 […]

Pandas.DataFrame setzt alle String-Werte auf nan

Ich habe ein pandas.DataFrame , das pandas.DataFrame , pandas.DataFrame und int-Typen enthält. Gibt es eine Möglichkeit, alle Streicher zu setzen, die nicht umgewandelt werden können, um zu NaN zu schwimmen? Beispielsweise: ABCD 0 1 2 5 7 1 0 4 NaN 15 2 4 8 9 10 3 11 5 8 0 4 11 5 […]

Holen Sie sich sowohl die Top-n-Werte als auch die Namen der Spalten, in denen sie auftreten, innerhalb jeder Zeile in dataframe

Ich habe ein Dataframe wie in diesem: df = pd.DataFrame({'a':[1,2,1],'b':[4,6,0],'c':[0,4,8]}) +—+—+—+ | a | b | c | +—+—+—+ | 1 | 4 | 0 | +—+—+—+ | 2 | 6 | 4 | +—+—+—+ | 1 | 0 | 8 | +—+—+—+ Für jede Zeile brauche ich ( beide ) die 'n' (in diesem […]

Groupby Ausgaben der nicht erkennenden numerischen Spalte pandas python

Ich habe eine Excel-Daten, die ich gelesen habe von pd.read_excel : Block Concentration Name Replicate 1 Array Marker 1 Array Marker 1 100.0 Man5GlcNAc2 1 33.0 Man5GlcNAc2 1 10.0 Man5GlcNAc2 1 100.0 Man6GlcNAc2 1 33.0 Man6GlcNAc2 1 10.0 Man6GlcNAc2 1 100.0 Man7GlcNAc2 D1 1 33.0 Man7GlcNAc2 D1 1 10.0 Man7GlcNAc2 D1 1 100.0 Man7GlcNAc2 D3 […]

Python ist die beste Programmiersprache der Welt.