Tag: pandas

Ausgabe von mehreren Dateien basierend auf Spaltenwert Python Pandas

Ich habe einen Beispiel-Pandas-Datenrahmen: import pandas as pd df = {'ID': [73, 68,1,94,42,22, 28,70,47, 46,17, 19, 56, 33 ], 'CloneID': [1, 1, 1, 1, 1, 2, 2, 3, 3, 3, 4, 4, 4, 4 ], 'VGene': ['64D', '64D', '64D', 61, 61, 61, 311, 311, 311, 311, 311, 311, 311, 311]} df = pd.DataFrame(df) es sieht […]

Python-Pandas: flach mit Arrays in Spalte

Ich habe einen Pandas Data Frame mit einer Spalte mit Arrays. Ich möchte es "flach", indem ich die Werte der anderen Spalten für jedes Element der Arrays wiederhole. Es gelingt mir, es zu schaffen, indem ich eine temporäre Liste von Werten aufbaut, indem du über jede Zeile gehebe, aber es benutzt "reine Python" und ist […]

Python pandas – Eingabe von Werten in neue Spalte

Ich habe ein kleines Dataframe unterhalb von Ausgaben von 4 Personen. Es gibt eine leere Spalte namens 'Grade'. Ich würde gerne diejenigen bewerten, die mehr als $ 100 Klasse A ausgegeben haben, und Klasse B für die weniger als $ 100. Was ist die effizienteste Methode, die Spalte 'Grade' zu füllen, vorausgesetzt, es ist ein […]

TypeError: ("sort_values ​​() bekam mehrere Werte für das Argument 'axis' ',' trat bei Index SUMLEV 'auf)

Warum dieser Code cdf = census_df[census_df['SUMLEV'] == 50] cdf = cdf.apply(lambda x:x.sort_values('CENSUS2010POP', axis=0, ascending=False)).reset_index(drop=True) cdf = cdf.groupby('STNAME').head(3) cdf.head(20) Gibt den folgenden Fehler an TypeError: ("sort_values() got multiple values for argument 'axis'", 'occurred at index SUMLEV') Während dieser Code funktioniert gut cdf = census_df[census_df['SUMLEV'] == 50] cdf = cdf.groupby('STNAME') cdf = cdf.apply(lambda x:x.sort_values('CENSUS2010POP', axis=0, ascending=False)).reset_index(drop=True) cdf […]

Nur die erste Bedingung angewendet

Ich bin neu in Python. Ich möchte die folgende Filterung haben, aber nur die erste Bedingung wird angewendet und die anderen Bedingungen werden ignoriert. Könnten Sie mir sagen, wo bin ich falsch? Hier sind meine Daten: import pandas as pd census_df = pd.read_csv('census.csv') census_df.head() census_df val1=census_df['POPESTIMATE2015'] val2=census_df['POPESTIMATE2014'] def answer_one(): return census_df[val1>val2 & (census_df['REGION']==1 | (census_df['REGION']==2) […]

Stoppwörter aus Dataframe entfernen

dataframe['Text'] = dataframe['Text'].apply(lambda x : ' '.join([item for item in string.split(x.lower()) if item not in stopwords])) Ich lösche die Stoppwörter aus dem Dataframe. Logik funktioniert gut, aber wenn es irgendeine leere Reihe gibt, gibt es Fehler. Ich habe Dropna () verwendet, aber es wird die ganze Zeile fallen, da es Daten in einer anderen Spalte […]

Wie Gruppe nach Summe und durchschnittliche Spalte in Python?

Als Eingang habe ich eine CSV-Datei mit mal und ein paar Zahlen für jedes Mal. Time,F1,F2,F3 8:11,5,2,4 9:25,9,8,2 9:39,7,3,2 9:53,6,5,1 10:07,4,6,7 10:21,7,3,1 10:35,5,6,7 11:49,1,2,1 12:03,3,3,1 Ich möchte die Tabelle für jede Stunde gruppiert nach Spalte Avg und Summe: Time,SUM F1,SUM F2,SUM F3,AVG F1,AVG F2,AVG F3 8:00,5,2,4,5,2,4 9:00,22,16,5,7.3,5.3,1.6 10:00,16,15,15,5.3,5,5 11:00,1,2,1,1,2,1 12:00,3,3,1,3,3,1 Bisher schaute ich es mit […]

Pandas besserer Weg zum Sortieren, Gruppieren, Summieren

Neu in Pandas so frage mich, ob es eine mehr Pandithic (coining it!) Weg, um einige Daten zu sortieren, gruppieren Sie es, und dann Summe davon. Das Problem besteht darin, die 3 größten Werte in einer Reihe von Werten zu finden und dann nur sie zu summen. Census_cp ist ein dataframe mit Informationen über Grafschaften […]

Pandas – erhalten Werte aus Multindex-Spalten

Ich habe folgendes dataframe df: H,Nu,City,Code,Code2 0.965392,15,Madrid,es,es 0.920614,15,Madrid,it,es 0.726219,16,Madrid,tn,es 0.739119,17,Madrid,fr,es 0.789923,55,Dublin,mt,en 0.699239,57,Dublin,en,en 0.890462,68,Dublin,ar,en 0.746863,68,Dublin,pt,en 0.789923,55,Milano,it,it 0.699239,57,Milano,es,it 0.890462,68,Milano,ar,it 0.746863,68,Milano,pt,it Ich möchte eine neue Spalte HCode für jede City mit dem H Wert hinzufügen, der dem Code entspricht, der von der Code2 Zeichenfolge abgebildet wird, so dass das resultierende Dataframe als: H,Nu,City,Code,Code2,HCode 0.965392,15,Madrid,es,es,0.965392 0.920614,15,Madrid,it,es,0.965392 0.726219,16,Madrid,tn,es,0.965392 0.739119,17,Madrid,fr,es,0.965392 0.789923,55,Dublin,mt,en,0.699239 […]

Auswahl der richtigen Werte in Excel in Python

Gesamtübersicht: Ich schaffe einen Graphen eines großen Datensatzes, aber ich habe ein Beispieltextdokument erstellt, damit es einfacher ist, die Probleme zu überwinden. Die Daten stammen aus einem Excel-Dokument, das als CSV gespeichert wird. Problem: Ich bin in der Lage, die Daten zu kompilieren, die es grafisch macht (siehe unten) Jedoch wie ich die Daten ziehe, […]

Python ist die beste Programmiersprache der Welt.