Wie kann ich große Arrays zwischen numpy und R?

Ich benutze Python und numpy / scipy, um Regex zu tun und für eine Textverarbeitungsanwendung zu stampfen. Aber ich möchte auch einige der statistischen Pakete von R verwenden.

Was ist der beste Weg, um die Daten von Python zu R? (Und zurück?)

Auch muss ich das Array auf die Festplatte zu einem gewissen Punkt zu sichern, also bin ich offen für das Speichern von Python und Laden th R, wenn das die beste Lösung ist. Die Matrizen sind ziemlich groß (zB 100.000 x 10.000), also mit spärlichen Matrizen könnte auch schön sein.

Entschuldigung, wenn dies ein Repost ist. Ich habe nicht in der Lage, etwas zu finden, das alle diese Stücke zusammensetzt.

3 Solutions collect form web for “Wie kann ich große Arrays zwischen numpy und R?”

Benutze Rpy, http://rpy.sourceforge.net/ , um R von Python anzurufen.

Die Einschränkung ist, dass sowohl R- als auch Python-Versionen genau das sein müssen, für das die Rpy-Binärdatei gebaut wurde. Sie müssen also bei der Installation vorsichtig sein.

Ich kann mich nicht auf "große Daten" zwischen geteilt zwischen R und Python, aber ich habe eine viel einfachere Zeit mit pyRserve als RPy oder RPy2 gearbeitet haben.

Das heißt, ich bin neugierig auf die Textverarbeitung, die du tust? Python hat offensichtlich viel auf der Textverarbeitungsseite zu bieten, aber statistisch gibt es auch viel zu Pakete wie NLTK und das Pattern Paket von CLiPS . Bist du nur einfacher, Stats in R zu machen, oder gibt es in Python etwas Besonderes?

  • Statmodels in python-paket, wie genau duplizierte funktionen behandelt werden
  • R Äquivalent von Python "_"?
  • Konvertieren von Pythonobjekten für rpy2
  • Pandas und rpy2: Warum funktioniert ezANOVA über robjects.r aber nicht robjects.packages.importr?
  • Running R Skript aus Python
  • Der Unterschied in GLM ergibt sich zwischen iPython und R
  • Scheibe nach einem unregelmäßigen Muster
  • Warum einige Eigen-Vektor-Zeichen von C ++ Armadillo unterscheiden sich von Python und R
  • Berechnen Sie innerhalb der Kategorien: Äquivalent von R's ddply in Python?
  • Analysieren von halbstrukturierten Json-Daten (Python / R)
  • Wie kann man ein Dichte-Plot in Matplotlib erstellen?
  • Python ist die beste Programmiersprache der Welt.