Tag: Elastische suche

Wie bekomme ich "Daten verarbeitet" in Elastiksuche

Wenn du eine Abfrage in BigQuery machst, gibt es einen schönen Indikator, der dir sagt, wie viel Zeit die Abfrage nahm und wieviel Daten verarbeitet wurden, um das Ergebnis zu erhalten: Es ist einfach, die Zeit zu bekommen, die in einer ES-Abfrage vergangen ist, aber wie würde ich die Menge der von der Abfrage verarbeiteten […]

Elasticsearch "more_like_this" Abfrage spezifisch für Felder

Elasticsearchs "more_like_this" -Abfrage ermöglicht es Benutzern, ähnliche Dokumente zu finden, die auf einer Suchbeleg-ID basieren. Ich habe eine Abfrage, um Dokumente zu finden, die einem gesuchten Dokument auf bestimmten Feldern ähnlich sind (dh Titel, Marke, Kategoriename). es.search(index=INDEX_NAME, body = {'query': { "more_like_this" : { "fields" : ['title', 'brand', 'category_name'], "like" : [ { "_index" : […]

Effizient XML in Elasticsearch bringen

Zurzeit verwende ich scrapy, um eine große XML-Datei von einem FTP-Server in Elastiksuche zu analysieren. Es funktioniert aber scheint eine ziemlich schwergewichtige Lösung und es nutzt auch viel Speicher. Ich frage mich, ob es mir besser geht, ein Plugin für ES zu schreiben. Ich weiß, Logstash kann es tun, aber ich kann nicht Inline-Sprache Erkennung […]

Anhängen an ein vorhandenes Elastiksearch-Array-Feld mit Python

Ich habe folgendes ES-Objekt: { "_index": "index_name", "_type": "my_type", "_id": "12345678-abcd-9012-efgh-3456ijkl7890" "_source": { "apps": [ { "processName": "process_name_1", "name": "app_name_1", "VersionName": "version_1" }, { "processName": "process_name_2", "name": "app_name_2", "VersionName": "version_2" } ] } } Ich möchte ein weiteres Objekt dem "apps" Array hinzufügen, während die vorhandenen Daten so gehalten werden, dass es wie folgt aussieht: […]

Wie bekomme ich eine Liste aller Indizes in Python-Elastiksuche

Wie bekomme ich eine Liste der Namen eines Index in Python? Hier ist was ich bisher habe >>> es=e.es >>> es <Elasticsearch([{'host': '14555f777d8097.us-east-1.aws.found.io', 'port': 9200}])> >>> es.indices <elasticsearch.client.indices.IndicesClient object at 0x10de86790> # how to get a list of all indexes in this cluster?

Gruppe von und Filter max (Datum) zwischen zwei Daten in der elastischen Suche

Derzeit können wir gruppieren nach customer_id in der elastischen Suche. Im Folgenden ist die Dokumentenstruktur { "order_id":"6", "customer_id":"1", "customer_name":"shailendra", "mailing_addres":"shailendra@gmail.com", "actual_order_date":"2000-04-30", "is_veg":"0", "total_amount":"2499", "store_id":"276", "city_id":"12", "payment_mode":"cod", "is_elite":"0", "product":["1","2"], "coupon_id":"", "client_source":"1", "vendor_id":"", "vendor_name: "", "brand_id":"", "third_party_source":"" } Jetzt müssen wir die Gruppe filtern, um die Dokumente zu finden Letztes bestelltes Datum zwischen zwei Daten Erster Auftragsdatum […]

Wie mache ich ein gültiges Format JSON in Python?

Ich möchte JSON machen, um Fragen von der elastischen Suche zu bekommen. Ich benutze diesen Code, um die Abfrage zu erstellen: search_doc = {} search_doc.update({"sort": [{"re_max": {"order": "desc"}}]}) search_doc.update({"from": 0}) search_doc.update({"size": 100}) search_doc.update({"filter": {"and": [{"term": {"country_id": "10"}},{"range": {"pub_date": {"gte": "2014-06-07T00:00:00.0", "lte": "2014-06-07T23:59:59.0"}}}]}}) Wie du siehst, habe ich doppeltes Zitat in all meinen Streichern benutzt, aber […]

So erstellen Sie einen schreibgeschützten Client für ElasticSearch in Python?

Ich möchte Daten aus ES lesen, will aber nicht versehentlich Daten schreiben (keine Indizierungsoperationen). Dies ist nur eine Sicherheitsmaßnahme, so dass jemand anderes später die Abfragefunktionen ändern darf keine Daten einfügen.

MultiTermVectors in der Elasticsearch Java

Ich benutze die folgende Funktion, um den Begriff Vektor für einige Satz von IDs zu erhalten. public static void builtTermVectorRequest(Client client, String index, Map<String, String> postIDs) { TermVectorsRequest termVectorsRequest = new TermVectorsRequest(); termVectorsRequest.index(index).type("post"); for (Map.Entry<String, String> entry : postIDs.entrySet()) { String currentPostId = entry.getKey(); String currentParentID = entry.getValue(); termVectorsRequest .id(currentPostId) .parent(currentParentID) .termStatistics(true) .selectedFields("content"); } MultiTermVectorsRequestBuilder […]

Kein Handler für Typ [Text] deklariert auf Feld [Titel] (python elasticsearch

alle. Die Python-Elastiksearch-Version, die ich verwendete, ist import elasticsearch print elasticsearch.__version__ (5, 0, 1) Die Zuordnungen sind request_body = { 'mappings':{ 'post': { 'properties': { 'title': { 'type': 'text', } } } } } Der Fehler ist: {U'status ': 400, u'error': {u'caused_by ': {u'reason': u'No Handler für Typ [Text] deklariert auf Feld [title] ', u'type': […]

Python ist die beste Programmiersprache der Welt.