Tag: hash

Wie sicher und effizient speichern SSN in einer Datenbank?

Mein Hauptproblem ist, dass ich gern überprüfen möchte, ob jemand mit demselben SSN mehrere Konten bei uns hat. Derzeit sind alle persönlich identifizierbaren Informationen verschlüsselt und entschlüsselt eine nicht-triviale Zeit. Meine erste Idee war, eine ssn Spalte der Benutzerspalte in der Datenbank hinzuzufügen. Dann könnte ich einfach eine Abfrage machen, wo ich alle Benutzer mit […]

Finden Sie Duplikate für gemischte Werte in Wörterbüchern

Ich möchte gern Duplikate in einem Wörterbuch erkennen und gruppieren. Um dies zu tun, baue ich einen Pseudo-Hash (besser lesere Signatur ) meines Datensatzes wie folgt: from pickle import dumps taxonomy = {} binder = defaultdict(list) for key, value in ds.items(): signature = dumps(value) taxonomy[signature] = value binder[signature].append(key) Für einen konkreten Anwendungsfall siehe diese Frage […]

Wie Hash-Listen?

Listen sind nicht haltbar. Allerdings verwende ich LSH und ich suche nach einer Hash-Funktion , die einer Liste von positiven ganzen Zahlen (in [1, 29.000]) zu k Eimern entsprechen wird. Die Anzahl der Listen ist D, wobei D> k (ich glaube) und D = 40.000, wobei k noch nicht bekannt ist (offen für Vorschläge). Beispiel […]

Python Hash wird nicht in der csv-Datei ausgegeben

Ich habe Arbeit Code, der ein Verzeichnis von csv-Dateien und Hashes eine Spalte von jeder Zeile, dann aggregiert alle Dateien zusammen. Das Problem ist, dass die Ausgabe nur den ersten Hash-Wert anzeigt und den Hash nicht für jede Zeile wiedergibt. Hier ist der Code: import glob import hashlib files = glob.glob( '*.csv' ) output="combined.csv" with […]

Gibt es eine Hashfunktion, die folgende Eigenschaften hat

Ich möchte eine Hash-Funktion, die schnell, kollisionsresistent und kann eine einzigartige Ausgabe geben. Die primäre Voraussetzung ist – es sollte beharrlich sein, dh es ist Fortschritt (Hash Fortschritt) konnte in einer Datei gespeichert werden und dann später wieder aufgenommen werden. Sie können auch Ihre eigene Implementierung mit Python bereitstellen. Implementierungen in "anderen Sprachen" sind / […]

Matching MD5 Hashes aus einem anderen Skript

Ok, also versuche ich, ein Skript zu erstellen, das folgendes macht: Sucht ein Verzeichnis für bekannte Hashes. Hier ist mein erstes Drehbuch: Hash.py import hashlib from functools import partial #call another python script execfile("knownHashes.py") def md5sum(filename): with open(filename, mode='rb') as f: d = hashlib.md5() for buf in iter(partial(f.read, 128), b''): d.update(buf) return d.hexdigest() print "Hash […]

Segmentierungsfehler 11, Pythonhash mit Listen, Hashing 1 Million Objekte

Wenn ich versuche zu machen und Hash-Objekte aus einer Datei, mit einer Million Songs, bekomme ich einen seltsamen Segmentierung Fehler nach etwa 12000 erfolgreich Hashes. Jeder hat eine Ahnung, warum dies: Segmentation fault: 11 Passiert, wenn ich das Programm laufe? Ich habe diese Klassen für das Hashing der Objekte: class Node(): def __init__(self, key, value […]

Erzeugen und Überprüfen von Passwort-Hashes mit Flaschen-Bcrypt

So habe ich vor kurzem gelernt, wie man Passwörter in einer DB zu speichern, das ist durch das Hinzufügen eines Salzes, um die Klartext-Passwort, Hashing, und dann die Speicherung der Hash. Ich arbeite an einer wirklich kleinen Flasche App, um das alles auszuprobieren, aber ich habe ein Problem mit dem Passwort Hashing und Überprüfung Teile […]

Ist pythons Hash-Funktion über verschiedene Versionen identisch?

Ich verwende derzeit hash auf Tupel von Integern und Strings (und verschachtelte Tupel von Integern und Strings etc.), um die Einzigartigkeit einiger Objekte zu berechnen. Sperren, dass es vielleicht eine Hash-Kollisionen, ich frage mich – ist die hash Funktion auf diese Datentypen garantiert, um das gleiche Ergebnis für verschiedene Versionen von Python zurückgeben?

Python, erhalten base64-codierte MD5 Hash eines Bildobjekts

Ich muss einen base64-codierten MD5-Hash eines Objekts erhalten, wobei das Objekt ein Bild als Datei gespeichert ist, fname. Ich habe das versucht: def get_md5(fname): hash = hashlib.md5() with open(fname) as f: for chunk in iter(lambda: f.read(4096), ""): hash.update(chunk) return hash.hexdigest().encode('base64').strip() Allerdings denke ich nicht, dass das richtig ist, weil es einen String mit zu vielen […]

Python ist die beste Programmiersprache der Welt.