WEBVTT

00:00:03.480 --> 00:00:06.560
Synthetische data is een
vervanger van echte data.

00:00:06.560 --> 00:00:10.000
Die niet meer te herleiden is
naar echte bestaande personen.

00:00:10.000 --> 00:00:12.520
Maar waar wel dezelfde informatie
uit gehaald kan worden.

00:00:12.520 --> 00:00:15.440
Twee voorbeelden van synthetische
data zijn bijvoorbeeld...

00:00:15.440 --> 00:00:18.840
Nou, als je hier het Haagse Bos, als je
daar onderzoek naar wilt doen...

00:00:18.840 --> 00:00:21.400
...dan wil je wel dat de omschrijving
ongeveer overeenkomt.

00:00:21.400 --> 00:00:25.200
Dus je wilt weten welke boomsoorten er
voorkomen, op welke plek ze staan, et cetera.

00:00:25.200 --> 00:00:27.040
Maar het hoeft niet precies overeen te komen.

00:00:27.040 --> 00:00:29.880
En een synthetische dataset zou dus
die omschrijving wel vatten...

00:00:29.880 --> 00:00:33.240
...maar zou niet een exacte
kopie zijn van het Haagse Bos.

00:00:33.240 --> 00:00:37.080
Als je het dan gaat hebben over
persoonsgegevens, dan zou je...

00:00:37.080 --> 00:00:40.840
...bijvoorbeeld een filmpje zoals deze,
als ik hier niet in zou willen zitten...

00:00:40.840 --> 00:00:43.920
...met mijn echte gezicht, dan zou je een
synthetische variant van mijn gezicht...

00:00:43.920 --> 00:00:44.600
...kunnen maken.

00:00:44.600 --> 00:00:47.600
Waardoor je weet dat er een data
scientist aan het woord is bijvoorbeeld.

00:00:47.600 --> 00:00:49.440
Maar je hoeft niet te weten wie dat is.

00:00:49.440 --> 00:00:53.840
De meerwaarde van synthetische data
is dat je als overheid wel open kunt zijn.

00:00:53.840 --> 00:00:55.320
Dus je kunt gegevens delen.

00:00:55.320 --> 00:00:57.640
Maar daarbij ook de privacy van
burgers waarborgt.

00:00:57.640 --> 00:01:01.120
Dus dat zijn twee hele belangrijke
doelen van de overheid.

00:01:01.120 --> 00:01:05.880
Een heel concreet voorbeeld van een
situatie waarin synthetische data is...

00:01:05.880 --> 00:01:10.320
...gebruikt, is bijvoorbeeld een mbo-instelling
die graag wilde weten wat voor opleiding...

00:01:10.320 --> 00:01:13.960
...de mbo-studenten kozen nadat ze
uitvielen zonder diploma.

00:01:13.960 --> 00:01:17.160
Dat zijn gegevens die je niet zomaar mag delen.

00:01:17.160 --> 00:01:19.080
Maar wel een synthetische variant daarvan.

00:01:19.080 --> 00:01:24.240
Waardoor deze instelling wel inzichten kon
verkrijgen uit synthetische data.

00:01:24.240 --> 00:01:27.200
En daar wel hun beleid op konden aanpassen.

00:01:27.200 --> 00:01:30.040
Het is belangrijk om synthetische data
te gebruiken, omdat we...

00:01:30.040 --> 00:01:31.800
...natuurlijk steeds meer doen met data.

00:01:31.800 --> 00:01:34.920
En is het daarbij belangrijk dat privacy
van burgers gewaarborgd wordt.

00:01:34.920 --> 00:01:36.920
Maar dat je als overheid ook opent kunt zijn.

00:01:36.920 --> 00:01:42.080
Het kan ook lastig zijn om informatie te
delen tussen overheidsinstanties.

00:01:42.080 --> 00:01:45.200
En syntetische data kan bijvoorbeeld
daar ook een oplossing voor zijn.

00:01:45.200 --> 00:01:47.880
Zodat processen soepeler kunnen verlopen.

00:01:55.880 --> 00:01:59.640
Het innovatiebudget heeft voor ons een
kickstart gegeven aan de community...

00:01:59.640 --> 00:02:01.520
...rondom synthetische data.

00:02:01.520 --> 00:02:05.240
Die echt in het teken staat van
kennis delen en kennis opdoen.

00:02:05.240 --> 00:02:08.440
Voor heel de publieke zaak in Nederland.

00:02:08.440 --> 00:02:12.360
Het kennisnetwerk zoekt elkaar op,
op verschillende manieren.

00:02:12.360 --> 00:02:16.560
Allereerst, hebben we een online platform,
waarop nieuws wordt gedeeld en...

00:02:16.560 --> 00:02:17.760
...informatie wordt gedeeld.

00:02:17.760 --> 00:02:21.600
Daarnaast organiseren we ook bijeenkomsten,
zodat we elkaar echt face-to-face kunnen zien.

00:02:21.600 --> 00:02:24.120
En de wat diepere gesprekken kunnen voeren.

00:02:24.120 --> 00:02:28.280
En als laatste hebben we ook nog
werkgroepen die in het teken staan...

00:02:28.280 --> 00:02:33.760
...van het door ontwikkelen en het kennis
delen en vergaren op specifieke thema’s...

00:02:33.760 --> 00:02:35.240
...binnen synthetische data.

00:02:35.240 --> 00:02:40.360
Om ook echt bij te kunnen dragen aan
die kennis en informatie die breder leeft.

00:02:40.360 --> 00:02:43.960
Andere organisaties kunnen het beste
aan de slag met synthetische data...

00:02:43.960 --> 00:02:46.160
...door eerst op te halen wat er al bekend is.

00:02:46.160 --> 00:02:47.680
En dat is ook juist wat we aanbieden.

00:02:47.680 --> 00:02:50.920
We hebben al heel veel kennis verzameld,
heel veel ervaring opgedaan.

00:02:50.920 --> 00:02:55.400
Dus begin gewoon eens door te kijken
naar de informatie die we hebben verzameld.

00:02:55.400 --> 00:02:59.400
Begin eens een gesprek met iemand die
al wat ervaring heeft in een specifieke...

00:02:59.400 --> 00:03:00.760
...toepassing die je voor ogen hebt.

00:03:00.760 --> 00:03:02.560
Dan kan het eigenlijk heel simpel zijn.

00:03:02.560 --> 00:03:05.560
Heel veel van de tooling, die we
gebruiken, is open-source.

00:03:05.560 --> 00:03:07.240
En dat willen we ook zo blijven doen.

00:03:07.240 --> 00:03:08.760
Iedereen kan er mee aan de gang.

00:03:08.760 --> 00:03:14.280
Maar ons advies is wel: neem gelijk de lessen
mee die al zijn opgedaan door anderen.

