Wie in Excel-Daten anonymisieren und de-anonymisieren?

ThaMasterT

Themenstarter
Bekanntes Mitglied
ich habe folgende Herausforderung:
Ich möchte eine Datenbank, also mehrere Tabellen (ca. 20) mit sensiblen Daten weitergeben.
Auf Basis dieser Weitergabe werden Auswertungen erstellt, die ich dann prüfen möchte.

Die Idee ist gerade, dass die Tabellen in Excel exportiert werden, damit man sie überhaupt teilen kann (ein Zugriff direkt soll nicht gewährt werden).
Man könnte in einer Excel pro Datenbank-Tabelle ein Arbeitsblatt nehmen.
Die Tabellen wären z.B. in folgendem Format:

IDNameCategory
1abcaaa
2bcdbbb
3cdeccc


Kennt ihr eine Software (addon oder eigenständig), welches Excel-Dateien oder CSV oder ähnlich per Knopfdruck anonymisieren und später auch wiederherstellen kann?
Falls man beispielsweise einen Key angeben kann, den man zum umwandeln/anonymisieren der Daten nehmen kann, wäre das super.
Eine Umwandlung wäre nur bei den Nicht-numerische-Spalten notwendig (im obigen Beispiel Name + Category).
Also der bestehende Text dann in einen anderen Text.

Kennt jemand sowas?
Oder gibt es andere Ideen?

Herzlichen Dank! :)
 

dr_tommi

alter Oldie
Zuletzt bearbeitet:

dr_tommi

alter Oldie
Nachtrag:
Eine Idee wäre vielleicht noch dass du in den Tabellen nur einen Indexwert für die Namen weitergibst, den du dann mit deiner Datenbank problemlos dann wieder den jeweiligen Namen zuordnen kannst.
 

ThaMasterT

Themenstarter
Bekanntes Mitglied
Anonymisieren an sich wäre kein Problem, allerdings wenn du das wieder rückgängig gemacht haben willst wird das nicht ganz so einfach.
z.B. https://codedocu.de/Details_mobile?d=2976&z=1&t=Excel+:+Nummern+Anonymizieren+und+Pseudonymizieren
Die Frage ist ja was du mit den Daten anstellen willst und wie anonym es werden soll.

Eine andere Möglichkeit wäre die betreffenden Zellen mit den Daten verschlüsseln und bei Bedarf wieder zu entschlüsseln.
Anonymisieren und Pseudonymisieren geht schonmal in die richtige Richtung.
Auf Basis der Umwandlung sollen Auswertungen in Power BI erstellt werden.
Die Ergebnisse werden auf Plausibilität etc. Geprüft, eine Entschlüsselung sollte also möglich sein...
Wie anonym muss es sein? -> wie darf ich das beantworten...?

"Eine andere Möglichkeit wäre die betreffenden Zellen mit den Daten verschlüsseln und bei Bedarf wieder zu entschlüsseln."
--> wie meinst du das?
 

ThaMasterT

Themenstarter
Bekanntes Mitglied
Nachtrag:
Eine Idee wäre vielleicht noch dass du in den Tabellen nur einen Indexwert für die Namen weitergibst, den du dann mit deiner Datenbank problemlos dann wieder den jeweiligen Namen zuordnen kannst.
hatte ich auch dran gedacht. Allerdings müsste ich für jede Spalte in jeder Tabelle (ca. 20 Tabellen und ca. 20 Spalten je Tabelle) eine Regel entwerfen in beide Richtungen.
Selbst wenn ich nicht alle Spalten umwandeln muss, ist es doch ein organisatorischer Aufwand.
Wie kann man das so lösen, dass ich das mit möglichst geringem Aufwand einrichten und im Alltag immer wieder nutzen kann?
Es ist leider keine one-time Aktion, sondern kommt eben täglich vor.
 

Raymond

Der Wahnsinn hat einen Namen......
Wenn du keine maximale Verschlüsselung wie Enigma o. ä. benötigst kann auch die einfache caesar Verschlüsselung (und Entschlüsselung) ausreichen.


Dort findest du eine Beispieldatei mit der Texte ver- und entschlüsselt werden können. Das Makro muss dann an deine Tabellen angepasst werden, aber als Ansatz vielleicht nicht schlecht.

Grüße
Ray.
 

ThaMasterT

Themenstarter
Bekanntes Mitglied
Wenn du keine maximale Verschlüsselung wie Enigma o. ä. benötigst kann auch die einfache caesar Verschlüsselung (und Entschlüsselung) ausreichen.


Dort findest du eine Beispieldatei mit der Texte ver- und entschlüsselt werden können. Das Makro muss dann an deine Tabellen angepasst werden, aber als Ansatz vielleicht nicht schlecht.

Grüße
Ray.

max. Verschlüsselung muss nicht sein, Vigenere (zweites Bsp. Auf verlinkter Seite) würde schon reichen.

Ich versuche gerade das Makro zu verstehen, inkl. Der Frage wie viel Aufwand das ist, mit wenig Know How das an mehrere Tabellen anzupassen.
Bin kein Experte, was Makros angeht... 🥵

Den Ansatz an sich finde ich aber nicht verkehrt :)
 

chaospir8

★★★★★-Oldie
Wie wäre es mit einem entsprechenden VBA-Skript/-Makro?!
Wozu das Rad neu erfinden, meine Herren (nehme ich an).

Siehe z.B.


(erster Google-Treffer für excel macro to encrypt data)
 

ThaMasterT

Themenstarter
Bekanntes Mitglied
Wie wäre es mit einem entsprechenden VBA-Skript/-Makro?!
Wozu das Rad neu erfinden, meine Herren (nehme ich an).

Siehe z.B.


(erster Google-Treffer für excel macro to encrypt data)
danke sehr auch für diesen guten Beitrag.

Das sieht richtig gut aus. Mit PW und De-, bzw. En-crypt. Sowas hatte ich mir vorgestellt.

Zwei Punkte, die mir aufgefallen sind:
Die Sonderzeichen könnten früher oder später zu Problemen führen - weiß jemand, wie man das Makro entsprechend ändern kann - also ohne Sonderzeichen?
Weiterhin muss man die Range, also die Spalten und Zeilen, die man markiert, durchgängig selektieren. Also Spalte A und C gehen nicht, da man B auslässt. Das könnte in meinem Fall nervig werden aufgrund der Menge.

Asche über mein Haupt, dass die Anforderungen von mir unvollständig formulierten worden sind, welche eure Zeit und Geduld in Anspruch nehmen.
Entschuldigt bitte.

Falls es allerdings nichts anderes (i.S.v. Besser für meine Zwecke) geben sollte, ist diese Lösung schon sehr gut. Ich teste und suche weiterhin.
 

Raymond

Der Wahnsinn hat einen Namen......
Sortier doch einfach die Spalten um. Das sollte für die Auswertungen doch keine Rolle spielen......
 

ThaMasterT

Themenstarter
Bekanntes Mitglied
verständlich der Kommentar des Sortierens, wenn da nicht ein "aber" wäre... ;)

bei grob geschätzten 400 Spalten (20 Spalten pro 20 Tabellen) sortiere ich erstmal eine Weile.
danach sende ich es raus und würde 1-2 Tage später ggf. de-crypten, testen, en-crypten (inkl. der Sortierung).
Klingt halt ne einer ordentlich gefrickelten Lösung. Nicht ideal.
 

RichyZuHause

Alter mit Ego
Das Umsortieren der Spalten könntest Du mit PowerQuery machen.
Das geht dort manuell ohne Programmierung. Das Ergebnis in ein Excel-Sheet ausgeben lassen.
Dann verschlüsseln.
Rückwärts genauso.
Wenn sowieso PowerBI verwendet wird, dann wissen die BI-Leute sicher, dies mit PowerQuery zu erledigen (PowerBI verwendet PowerQuery).
 

ThaMasterT

Themenstarter
Bekanntes Mitglied
Power BI kann bei bestehenden Tabellen keine Umsortierung machen. Die Initialen Reihenfolge besteht leider. Eine übliche Möglichkeit ist, den m Code rauszukopieren und die Tabelle zu klonen. Allerdings müsste man dann Redundanzen nur dafür erstellen, nur um zu sortieren.

Es sei denn dieses lang gehegte Problemchen von Power BI ist gelöst und es gibt Updates.

Danke dennoch
 

RichyZuHause

Alter mit Ego
PowerQuery ist immer defensiv, was die Originale betrifft.
Die bleiben unverändert, alle Operationen erzeugen Kopien.
Die z. B. anders sortiert/angeordnet werden.
 

ThaMasterT

Themenstarter
Bekanntes Mitglied
Richtig, die Quelle wird nicht beschrieben.
Ich meine aber etwas anderes.

Wenn die Quelle eingelesen wird und durch Transformation in Power Query eine "neue" Tabelle erzeugt wird, dann kann die Reihenfolge der Spalten dieser Tabelle nach dem Übernehmen der Änderungen nicht mehr angepasst werden. Leider und bekanntes Problem.

Lass uns gerne weiteres bzgl. Power BI per PM besprechen, wenn es nichts ausmacht. Falls du andere Infos haben solltest, bin ich stark interessiert. :)
 

RichyZuHause

Alter mit Ego
@ThaMasterT, das Spaltenproblem kann man ohne PowerQuery lösen.
Wenn Dich das KuTool-Macro aus dem Posting#8 nach dem Address-Bereich fragt, kannst Du leicht mehrere, nicht zusammenhängede Bereiche auswählen.
Dazu einfach die Strg-Taste bei der Mehrfachauswahl gedrückt halten.
Wenn Du auch das nicht jedesmal machen willst, dann kann man das Macro etwas ändern.
Am Anfang (vor allen Funktionen) fügst Du Deine Vorbelegung ein:
Code:
Const SPALTEN_BEREICHE As String = "=$B$4:$B$17;$C$4:$C$17;$E$4:$E$17"
In der Prozedur EncryptionRange() änderst Du am Anfang so:
Code:
    ' Vorgabe für Krypto-Bereich.
    ' Original:
    ' xTxt = ActiveWindow.RangeSelection.Address
    ' Richys Änderung
    If ActiveWindow.RangeSelection.Count <= 1 Then
            xTxt = SPALTEN_BEREICHE
    Else
        xTxt = ActiveWindow.RangeSelection.Address
    End If 'ActiveWindow.RangeSelection.Count
    ' Ende Richys Änderung
Das macht dies: wenn Du vor dem Aufruf des Macros nicht schon einen Bereich ausgewählt hast, wird der voreingestellte verwendet.
In der Beispieldatei (Endung .txt entfernen) geht das prima mit nicht zusammenhängenden Spalten.

Nur Artikel, Warengruppe und Leitung werden verschlüsselt.
1649676776639.png



Das löst noch nicht das Umlaute-Problem.
Es werden im Code nur Zeichen bis ASCII 126 verwendet, das "ü" liegt z.B auf 252.
 

Anhänge

  • CCB_Crypt_2.xlsm.txt
    19,4 KB · Aufrufe: 17
  • 1649676332857.png
    1649676332857.png
    52,4 KB · Aufrufe: 19
Zuletzt bearbeitet:

ThaMasterT

Themenstarter
Bekanntes Mitglied
@ThaMasterT, das Spaltenproblem kann man ohne PowerQuery lösen.
Wenn Dich das KuTool-Macro aus dem Posting#8 nach dem Address-Bereich fragt, kannst Du leicht mehrere, nicht zusammenhängede Bereiche auswählen.
Dazu einfach die Strg-Taste bei der Mehrfachauswahl gedrückt halten.
Wenn Du auch das nicht jedesmal machen willst, dann kann man das Macro etwas ändern.
Am Anfang (vor allen Funktionen) fügst Du Deine Vorbelegung ein:
Code:
Const SPALTEN_BEREICHE As String = "=$B$4:$B$17;$C$4:$C$17;$E$4:$E$17"
In der Prozedur EncryptionRange() änderst Du am Anfang so:
Code:
    ' Vorgabe für Krypto-Bereich.
    ' Original:
    ' xTxt = ActiveWindow.RangeSelection.Address
    ' Richys Änderung
    If ActiveWindow.RangeSelection.Count <= 1 Then
            xTxt = SPALTEN_BEREICHE
    Else
        xTxt = ActiveWindow.RangeSelection.Address
    End If 'ActiveWindow.RangeSelection.Count
    ' Ende Richys Änderung
Das macht dies: wenn Du vor dem Aufruf des Macros nicht schon einen Bereich ausgewählt hast, wird der voreingestellte verwendet.
In der Beispieldatei (Endung .txt entfernen) geht das prima mit nicht zusammenhängenden Spalten.

Nur Artikel, Warengruppe und Leitung werden verschlüsselt.
Anhang anzeigen 22016


Das löst noch nicht das Umlaute-Problem.
Es werden im Code nur Zeichen bis ASCII 126 verwendet, das "ü" liegt z.B auf 252.
ich wunderte mich schon, dass "keiner mehr antwortete". Dabei ging bei mir nur die Benachrichtigung im Spam Ordner unter (merkwürdig, da urplötzlich).

Ganz lieben Dank noch für diese tolle Rückmeldung und Verzeihung für meine späte Antwort!

Die Auswahl der Spalten mit deiner Datei hat schonmal sehr gut geklappt.

Umlaute werden leider auch vorhanden sein, daher sterben die wsl. weg wie der Müller beim En- und Decrypten.

Die Sonderzeichen sind ja auch noch da in der Encrypten Version, welche stören.
Mal sehen, wie ich vorgehe. Ich probiere mich mal weiter.


Nochmals herzlichen Dank :)
 
Oben Unten