Über Sarus
Sarus ist die Datenschutz-Schicht für Analytics und KI, die zwischen Datenquellen und Analysten sitzt und dir ermöglicht, mit sensiblen Daten zu arbeiten, ohne sie offenzulegen. Sarus gewährleistet bei jeder Abfrage Datenschutz-Garantien mittels Differential Privacy, synthetischen Daten und datenschutzkonformem Abfrage-Rewriting und unterstützt Bereitstellungen vor Ort oder in der Public Cloud. Dieser Ansatz hilft Forschungs-, Analytics- und KI-Anwendungsfällen, den Wert von Daten sicher und rechtskonform nutzbar zu machen.
Kernfunktionen
- Konnektoren: verbinden Datenbanken, Data-Warehouses/Lakehouses und Cloud-Speicher direkt, ohne Daten zu verschieben.
- Datenschutzrichtlinien: definieren Ausgaben (synthetische Daten, Aggregationen, Outputs mit Differential Privacy) und auditieren alle Verarbeitungen.
- Audit-Logging: vollständige Abfrage-Auditierung für Compliance.
- Synthetische Daten: hochtreue, DP-geschützte Daten, die Verteilungen bewahren.
- Analytics & BI: SQL-API- und BI-Connector-Unterstützung für gängige Tools (Power BI, Tableau, Metabase).
- Machine Learning: Python-SDK, um Remote-Datenverarbeitung mit Datenschutz (DP) bei Bedarf auszuführen.
- Aktion bei Daten: Abfrageergebnisse an externe Endpunkte senden, ohne persönliche Informationen offenzulegen.
- Privatsphäre-erhaltende DP, Privacy-first-Query-Rewriting und Output-Level-Kontrollen, um Privatsphäre in komplexen Pipelines sicherzustellen.
Warum Sarus?
- Starke Privatsphäre-Garantien: Differential Privacy, synthetische Daten und Abfrage-Neuschreibung in Echtzeit, die Richtlinien durchsetzt.
- Daten verlassen nie die Kontrolle der Datenbesitzer: Analysten arbeiten mit entfernten Daten, ohne direkten Zugriff auf Rohdaten.
- Compliance-freundlich: detaillierte Audit-Logs und schlanke Datenschutz- und Compliance-Workflows.
- Datenwert über Silos hinweg: Erkenntnisse aus Daten systemübergreifend gewinnen, ohne Datenschutz zu gefährden.
- Unterstützt KI/ML-Workflows und den Einsatz von LLMs mit Datenschutzgarantien.
- Flexible Bereitstellung: vor Ort oder in deiner Public Cloud (Docker oder Kubernetes) mit breiten Quellkonnektoren.