Pribatutasunaren Adimen Artifiziala

Sherpa.ai Federated Learning eta Differential Privacy Framework: Babestu zure erabiltzaileen pribatutasuna, Adimen Artifizialaren botereari uko egin gabe

Sherpa.ai Federated Learning and Differential Privacy Framework Machine Learningentzako kode irekiko framework bat da, elkarlaneko ikaskuntza ahalbidetzen duena, datu pribatuak partekatu gabe. Ikaskuntza Federatuan eta Pribatutasun Diferentzialean ikerketa eta esperimentazio irekia errazteko garatu da. Ikaskuntza federatua Machine Learningeko paradigma bat da, datu deszentralizatuen ereduak ikastera bideratuta dagoena, hala nola erabiltzaileen telefono adimendunetan, ospitaleetan edo bankuetan dauden datuak, eta datuen pribatutasuna bermatzen duena. Hori lortzeko, eredua nodo bakoitzean trebatzen da (adibidez, telefono bakoitzean, ospitale bakoitzean edo banku bakoitzean), ereduaren parametro eguneratuak partekatzen dira (ez datuak) eta parametro hauek eredu hobea eraikitzeko modu seguruan gehitzen dira. Ikaskuntza Federatua Pribatutasun Diferentzialarekin konbina daiteke, pribatutasun-maila are handiagoa ziurtatzeko. Pribatutasun Diferentziala datuak gehitzeko eta, aldi berean, datu indibidualak pasatzea saihesteko erabiltzen den teknika estatistikoa da. Teknika honekin, tokiko parametroen komunikazioan parte hartzen duten agente maltzurrek ezin dute informazioa datuen iturriraino arakatu, eta horrek beste segurtasun-maila bat gehitzen du.

Teknologia hau disruptiboa izan liteke, datuen pribatutasuna mantentzea nahitaezkoa den egoeretan:

  • Datuek isilpeko informazioa dutenean: posta elektronikoa, gomendio pertsonalizatuak eta osasuna esaterako. Aplikazioek, datuen pribatutasunerako mekanismoak eman behar dituzte erabiltzaile multzo batengandik ikasteko, datu sentikorrak erabiltzailearen gailu bakoitzean dauden bitartean.
  • Datuak datu-siloetan daudenean: autoen osagaien fabrikatzaile batek, adibidez, bere datuak ezagutzera ematea beharbada ez du gustukoa izango. Baina besteen datuetatik ikasten duten ereduetatik onura aterako du, ekoizpena eta hornidura katearen kudeaketa hobetzeko.
  • Datuen pribatutasunarekin lotutako araudia dela eta: esaterako, bankuek eta telekomunikazio enpresek ezin dituzte banakako erregistroak partekatu, baina hainbat erakundetan banatutako datuetatik ikasten duten ereduez baliatuko lirateke.

Sherpa.aik ikaskuntza federatua demokratizatzea du ardatz, ikaskuntza federaturako berariaz diseinatutako metodologiak, sekuentziak eta ebaluazio-teknikak ematen baititu. Shepa.ai Federated Learning Framework-ak aukera ematen die garatzaileei ikaskuntza-agertokiak simulatzeko, frameworkak emandako eredu, algoritmo eta datuekin, eta baita euren datuekin ere.

import numpy as np
import tensorflow as tf
import shfl

from shfl.federated_government import FederatedGovernment

# Load data to use in simulation
database = shfl.data_base.Emnist()
train_data, train_labels, test_data, test_label = database.load_data()

# Deploy data over data nodes
iid_dist = shfl.data_distribution.IidDataDistribution(database)
federated_data, test_data, test_labels = iid_dist.get_federated_data(num_nodes=20,
                                                                     percent=10)

# Create function that builds a model
def model_builder():
    model = tf.keras.models.Sequential()
    model.add(tf.keras.layers.Flatten(input_shape=(28,28)))
    model.add(tf.keras.layers.Dense(64, activation='relu'))
    model.add(tf.keras.layers.Dropout(0.1))
    model.add(tf.keras.layers.Dense(10, activation='softmax'))

    model.compile(optimizer="rmsprop",
                  loss="categorical_crossentropy",
                  metrics=["accuracy"])

    return shfl.model.DeepLearningModel(model)

# Choose aggregattor
aggregator = shfl.federated_aggregator.FedAvgAggregator()
fed_government = FederatedGovernment(model_builder, federated_data, aggregator)

# Run a few rounds of federated learning
fed_government.run_rounds(3, test_data, test_label)

Erabilera-kasuak

Diagnostikoak eta tratamenduak hobetu itzazu, pazienteen datu seguruak eta pribatuak erabiliz

Osasun-sektoreko datu sentikorrek datuen babeserako erregulazio zorrotzak bete behar dituzte. Osasun-informaziotik ikasi eta pazienteen datuak modu seguruan partekatu ahal izateko, Ikaskuntza Federatua erabil daiteke, horrela erakunde medikoek datuen pribatutasuna ziurtatu ahal dute eta, aldi berean, ahalik eta prozesu, tresna diagnostiko eta zainketa aurreratuenak eskaini.

Funtsak seguru gorde itzazu bezeroen datuak partekatu gabe

Bankuek eta finantza-erakundeek dirua zuritzeko transakzioak identifikatzeko erabil dezateke Ikaskuntza Federatua, transakzioen datu pribatuak eredu trebeagoak eraikitzeko erabiliz. Sistema bera erabiltzen duten banku guztiek besteen transakzioen datuei onura aterako diete, baina euren datu gordinak ezta bezeroenak lehiakideei erakutsi barik.

Industria 4,0 ezar ezazu, datu sentikorrik eman gabe

Mundu osoko bezeroei operazio- eta mantentze-zerbitzuak ematen dizkieten enpresek Ikaskuntza Federatuari eta Pribatutasun Diferentzialari onura atera diezaiekete, eskura dauden ekipamendu-datu guztietatik ikasten baitute, bezeroen datu sentikorrak azaldu gabe. Lankidetza anonimoaren bidez, instalazioek, makinek eta edozein tamainatako fabrikek modu eraginkorragoan eta adimentsuagoan jardun dezakete, datu pribatuak babestuta dauden bitartean.

Ikerketan aurrera egin ezazu framework pribatua erabiliz

Unibertsitateek eta ikerketa-erakundeek Ikaskuntza Federatua erabil dezakete, beren ahaleginak modu anonimoan bateratzeko, ikerketan aurrera egiteko eta euren aurkikuntzak zabaltzeko, Framework Federatu bati esker haien datuak pribatuak mantentzen direlarik.

Zaintza automatizatuko ereduak entrenatu eta anonimatua ziurtatu

Machine Learningen zaintza automatizatuko sistemen ereduak entrenatzeko, hainbat establezimenduren ereduak eta haien segurtasun-ekipamendua eta informazioa erabil daitezke, zaintzaren irudiak ezta datuak eskuratu gabe. Teknologia hau erabiltzeak anonimatua eta pribatutasuna bermatzen ditu, eta bitartean segurtasun- eta babes-neurriak handitzeko modua eskaintzen du, Adimen Artifizialeko teknikak erabiliz.

Edge Computing erraztu eta ereduak datuen jatorrian entrenatu

Gaitasun konputazionalak dituzten gailuen garapen azkarrak, hala nola mugikorrak eta IoT gailuak, eredu konplexuetatik ikasteko eta datuak deszentralizatzeko aukera sortu du, Edge Computing delakoaren bidez. Ikaskuntza Federatuak Machine Learningen ereduak gailu ezberdinetan hobetzen laguntzen du, informazio globala nodoen artean partekatzen duelarik, baina datuak gailu bakoitzean pribatu jarraitzen direla.

FRANCISCO HERRERA, PH.D.

Erabiltzaileen pribatutasuna errespetatzen duen merkatuan dagoen framework-rik ahaltsuena da, Ikaskuntza Federatuko teknologia berrienean oinarritua.

FRANCISCO HERRERA, PH.D.

  • Matematikan Doktorea
  • Ingeniaritza eta Informatika arloetan oso aipatua den ikertzailea (Thomson Reuters)
  • Espainiako Informatika Sari Nazionala
  • Argitaratutako 331 aldizkari artikulu baino gehiago eta Google Scholar-en 85.240 aipamen baino gehiago.



Competitive Benchmarking

Federated Learning and
Differential Privacy Features

Federated Learning Framework
Use Federated Models with different datasets
Support other libraries
Sampling Enviroment: IID or Non-IID data distribution
Federated Aggregation Mechanisms
Federated Attack Simulation

Differential Privacy
Mechanisms: Exponential, Laplacian, Gaussian
Sensitivity Sampler
Subsampling methods to increase privacy
Adaptive Differential Privacy

Desired Properties
Documentation & Tutorials
High-level API
Ability to extend the framework with new properties
  • Complete
  • Partial
  • Not available
  • Not specified

Provisions

  1. Definition of Confidential Information. Understood as any information disclosed by Sherpa, either in writing or orally, in the forms of samples, models, software or any other type of technical data, trade secrets, manufacturing processes or other (know-how) of Sherpa, whether it had been disclosed prior to the date of this Agreement or thereafter, including, but not limited to, information regarding business plans, products or services, financial provisions, patents, trademark, utility models and any other intellectual or industrial property rights and/or requests for them (whether they are registered or not), computer passwords and/or their source code, inventions, processes, designs, whether they are graphic designs or not, engineering, advertising or finance, which are identified, in writing, as confidential or exclusive or that could be considered as such by an average person, taking into account the circumstances The following information, technical data or knowhow shall not be considered Confidential Information where the information: (i) was known to the User prior to receiving any of the Confidential Information from the other and this circumstance can be accredited; (ii) has become publicly known, unless that circumstance takes place as a consequence of an act or failure to act of the User; (iii) was received by the User from a third party who is not required secrecy; (iv) Sherpa has given written permission to disclose.
  2. Obligation of confidentiality. The User agrees not to disclose, or permit to be disclosed any Sherpa Confidential Information to third parties and undertakes to take appropriate measures to ensure the secrecy of any Sherpa Confidential Information with the purpose that the same do not goes into public knowledge, nor fall into possession of unauthorized third parties. The above mentioned measures must adequate to the maximum diligence in a manner similar to the way the User protect its own confidential information of similar content, which cannot be inferior to the diligence of a reasonable businessman.
  3. Term of the obligation of confidentiality. The obligations assumed by the User under this agreement shall remain in force while the visits and meetings with Sherpa takes places, and after the termination of such activities, until the Confidential Information goes into public knowledge, only if this had happened by cause other than breach of this agreement by the User.
  4. Non-compliance with obligations. The User understands that the monetary damages that could develop from a breach of this agreement may not be a sufficient remedy, and therefore expressly agree that any present or future breach of the obligations contained in this agreement and, notwithstanding any other rights or remedies that could correspond, would be enough to encourage before the competent jurisdiction to adopt the necessary precautionary measures to remedy and/or prevent such failure, without having to prove that damage has been caused.
  5. Return information exchanged. The User agrees to return to Sherpa all documents containing Confidential Information which may have been supplied and all copies thereof, and permanently erase or destroy all Confidential Information or any part thereof stored in electronic files. For this purpose, for documents it is understood any storage devise containing data or information.
  6. Ownership of rights. This agreement does not grant the User license or property rights under any intellectual property of Sherpa, nor is any right granted to the User over the Sherpa Confidential Information, except as provided herein.
  7. Non-transferability. This agreement is a personal agreement between Sherpa and the User; it may not be transferred, in whole or part, without prior written consent of the other party.
  8. Applicable law and jurisdiction. This agreement shall be governed by Spanish law and shall be interpreted in accordance with them. The Parties to this agreement expressly submit to the exclusive jurisdiction of the Courts of Bilbao, renouncing any other jurisdiction that may correspond to the resolution of any dispute arising in relation to the implementation of this agreement. By accepting this message, the user accepts all the clauses contained in this agreement.