BIO 08.03.01 ISO A.5.30

Chaos Engineering In Azure: Proactieve Veerkrachttests Voor Nederlandse Overheidsorganisaties

📅 2025-01-27

•

⏱️ 30 minuten lezen

•

🟢 Should-Have

💼 Management Samenvatting

Chaos engineering in Azure vertegenwoordigt een proactieve benadering van veerkrachttests waarbij organisaties op gecontroleerde wijze storingen injecteren in productie- of productie-achtige omgevingen om zwakke punten te identificeren voordat echte incidenten optreden. Voor Nederlandse overheidsorganisaties die kritieke digitale diensten leveren, biedt chaos engineering een systematische methode om te verifiëren dat architecturale keuzes, failover-mechanismen en herstelprocedures daadwerkelijk functioneren zoals ontworpen. In tegenstelling tot traditionele disaster recovery-tests die vaak in geïsoleerde omgevingen worden uitgevoerd, simuleert chaos engineering realistische scenario's zoals regionale uitval, netwerkpartities, databasefailures en resource-exhaustion, waardoor organisaties hun veerkracht kunnen meten en verbeteren voordat burgers en bestuurders de gevolgen van een echte storing ervaren.

Aanbeveling

IMPLEMENT

Risico zonder

High

Risk Score

8/10

Implementatie

120u (tech: 80u)

Van toepassing op:

✓ Azure

Nederlandse overheidsorganisaties die hun kritieke diensten in Azure hosten, staan voor de uitdaging om te waarborgen dat deze diensten beschikbaar blijven tijdens onverwachte storingen, cyberincidenten, infrastructuurproblemen of regionale calamiteiten. Traditionele benaderingen waarbij alleen theoretische risicoanalyses worden uitgevoerd of disaster recovery-tests in gecontroleerde laboratoriumomgevingen, bieden onvoldoende zekerheid dat systemen daadwerkelijk veerkrachtig zijn wanneer echte storingen optreden. Zonder proactieve chaos engineering-tests loopt een organisatie het risico dat verborgen afhankelijkheden, ongedocumenteerde failover-paden of onvoldoende geteste herstelprocedures pas aan het licht komen tijdens een echte crisis. Dit kan leiden tot langdurige uitval van essentiële diensten zoals burgerportalen, zaaksystemen, registraties of zorgketenintegraties, met als gevolg schending van wettelijke verplichtingen, verlies van vertrouwen bij burgers en bestuurlijke aansprakelijkheid. Een gestructureerde chaos engineering-strategie zorgt ervoor dat technische maatregelen zoals multi-region deployments, auto-scaling, load balancing en database-replicatie daadwerkelijk functioneren onder stress, en dat operationele teams weten hoe te reageren wanneer systemen onverwacht falen.

PowerShell Modules Vereist

Primary API: Azure Portal, Azure Resource Manager, Azure Chaos Studio
Connection: Connect-AzAccount
Required Modules: Az.Accounts, Az.Resources, Az.Chaos

Implementatie

Dit artikel beschrijft hoe organisaties chaos engineering kunnen implementeren binnen de Microsoft Azure-cloudomgeving als onderdeel van de Nederlandse Baseline voor Veilige Cloud. We behandelen fundamentele concepten zoals fault injection, chaos experiments, hypothesis-driven testing en de relatie tussen chaos engineering en compliance-kaders zoals de Baseline Informatiebeveiliging Overheid (BIO), de NIS2 richtlijn en ISO 27001. Het artikel beschrijft hoe Azure Chaos Studio kan worden gebruikt om gecontroleerde storingen te injecteren in Azure-resources zoals virtuele machines, databases, netwerken en storage-accounts, en hoe organisaties een volwassen chaos engineering-programma kunnen opzetten met duidelijke experiment-scopes, safety mechanisms, rollback-procedures en learnings-capture. Daarnaast behandelen we hoe chaos engineering-tests kunnen worden geïntegreerd in CI/CD-pipelines, hoe resultaten kunnen worden gedocumenteerd voor audit-doeleinden, en hoe chaos experiments kunnen worden gebruikt om compliance-vereisten rond business continuity en disaster recovery aan te tonen. Het artikel fungeert als praktische gids voor security architects, cloud engineers en resilience teams die de veerkracht van hun Azure-omgevingen willen verifiëren en verbeteren.

Rol en scope van chaos engineering in Azure

Chaos engineering in Azure moet worden gezien als een systematische discipline die proactieve veerkrachttests integreert in de reguliere operationele cyclus van cloudomgevingen. In tegenstelling tot reactieve benaderingen waarbij organisaties wachten tot een storing optreedt om te leren hoe systemen zich gedragen, stelt chaos engineering organisaties in staat om op gecontroleerde wijze storingen te simuleren en te observeren hoe systemen, teams en processen reageren. Deze proactieve benadering is bijzonder waardevol voor Nederlandse overheidsorganisaties die kritieke digitale diensten leveren, omdat het hen in staat stelt om zwakke punten te identificeren en te verhelpen voordat burgers en bestuurders de gevolgen van een echte storing ervaren. Chaos engineering moet daarom niet worden gezien als een eenmalige activiteit, maar als een doorlopend proces dat parallel loopt aan de ontwikkeling en operationele beheer van cloudomgevingen.

De primaire rol van chaos engineering in Azure is het verifiëren dat architecturale keuzes, failover-mechanismen en herstelprocedures daadwerkelijk functioneren zoals ontworpen wanneer systemen onder stress staan. Dit betekent dat chaos experiments niet alleen technische componenten testen, maar ook de interactie tussen componenten, de effectiviteit van monitoring en alerting, de snelheid waarmee operationele teams reageren op incidenten, en de mate waarin herstelprocedures zijn gedocumenteerd en getraind. Een goed ontworpen chaos engineering-programma maakt het mogelijk om te bewijzen dat passende maatregelen zijn genomen om veerkracht te waarborgen, dat failover-paden daadwerkelijk werken, en dat de organisatie in staat is om snel te reageren op onverwachte storingen. Voor auditors, toezichthouders en bestuurders biedt een gedocumenteerd chaos engineering-programma transparantie over hoe veerkracht is ingericht en hoe deze wordt getest en verbeterd.

De scope van chaos engineering in Azure binnen de Nederlandse Baseline voor Veilige Cloud omvat alle lagen van de cloudstack: van de fysieke en netwerkinfrastructuur tot applicaties en data, van identiteits- en toegangsbeheer tot monitoring en incident response. Het chaos engineering-landschap moet rekening houden met verschillende workload-typen – van Infrastructure as a Service (IaaS) virtuele machines tot Platform as a Service (PaaS) applicaties en Software as a Service (SaaS) integraties – en moet schaalbaar zijn van kleine pilots tot enterprise-omgevingen die duizenden gebruikers en honderden applicaties ondersteunen. Daarnaast moet de strategie flexibel genoeg zijn om te kunnen evolueren met nieuwe Azure-services en veranderende businessvereisten, terwijl de fundamentele chaos engineering-principes consistent blijven. Belangrijk is dat chaos experiments altijd worden uitgevoerd binnen duidelijke safety boundaries, met expliciete rollback-procedures en met volledige documentatie van hypotheses, resultaten en learnings.

Implementatieroadmap: van eerste experimenten naar volwassen chaos engineering

De implementatie van een volwassen chaos engineering-programma in Azure verloopt zelden in één grote stap, maar groeit geleidelijk van gecontroleerde experimenten naar een systematisch, geautomatiseerd programma. In de eerste fase wordt de fundamentele basis gelegd: een goed gestructureerde chaos engineering-strategie waarin per dienst wordt vastgesteld welke componenten kritiek zijn, welke failover-mechanismen zijn geïmplementeerd, en welke hypotheses moeten worden getest. Voor elk kritisch systeem worden expliciete chaos experiment-scenarios vastgesteld, bijvoorbeeld het testen van failover naar een secundaire regio wanneer de primaire regio uitvalt, of het testen van auto-scaling wanneer workloads plotseling toenemen. Deze scenarios vormen de harde testcriteria voor de Azure-architectuur en voorkomen discussies op het moment van een echt incident.

Vervolgens wordt per workload bepaald welke chaos experiments passend en haalbaar zijn. Voor niet-kritieke systemen kunnen eenvoudige fault injection-tests voldoende zijn, waarbij bijvoorbeeld een enkele virtuele machine wordt gestopt om te verifiëren dat load balancing correct functioneert. Voor bedrijfskritieke workloads is doorgaans een uitgebreidere chaos engineering-strategie nodig. Dit kan bestaan uit multi-region failover-tests met Azure Chaos Studio, netwerkpartition-tests om te verifiëren dat systemen correct omgaan met gescheiden netwerksegmenten, database-failover-tests om te verifiëren dat replicatie en failover correct functioneren, en resource-exhaustion-tests om te verifiëren dat auto-scaling en throttling correct werken. Belangrijk is dat de gekozen strategie niet alleen technisch mogelijk, maar ook financieel verantwoord en beheersbaar is, en dat alle experiments worden uitgevoerd binnen duidelijke safety boundaries met expliciete rollback-procedures.

In de volwassenheidsfase wordt de chaos engineering-strategie geoptimaliseerd en geautomatiseerd. Infrastructure as Code (IaC) met Azure Resource Manager templates, Bicep of Terraform zorgt voor reproduceerbare chaos experiment-configuraties. Geautomatiseerde chaos experiments worden regelmatig uitgevoerd als onderdeel van CI/CD-pipelines, waarbij resultaten automatisch worden gedocumenteerd en geanalyseerd. Advanced monitoring, behavioral analytics en machine learning-gebaseerde detectie helpen om potentiële zwakke punten vroegtijdig te identificeren voordat ze tot echte storingen leiden. Governance wordt volwassen met geautomatiseerde rapportages, dashboards voor bestuurders en geïntegreerde change management processen. Door deze fasering expliciet te maken in een roadmap – met duidelijke mijlpalen, beslismomenten en success criteria – ontstaat voorspelbaarheid voor bestuurders en wordt het eenvoudiger om investeringen, risico's en baten te verantwoorden.

Azure Chaos Studio: gecontroleerde fault injection in Azure-omgevingen

Azure Chaos Studio is de native Microsoft-service voor het uitvoeren van gecontroleerde chaos experiments in Azure-omgevingen. De service biedt een gestructureerde manier om storingen te injecteren in Azure-resources zoals virtuele machines, databases, netwerken en storage-accounts, zonder dat organisaties zelf complexe fault injection-mechanismen hoeven te bouwen. Azure Chaos Studio ondersteunt verschillende typen chaos experiments, waaronder VM-shutdown experiments om te testen hoe systemen omgaan met het onverwacht stoppen van virtuele machines, network latency experiments om te testen hoe systemen omgaan met vertraagde netwerkverbindingen, database failover experiments om te testen hoe systemen omgaan met database-storingen, en storage experiments om te testen hoe systemen omgaan met storage-uitval. Alle experiments worden uitgevoerd binnen expliciet gedefinieerde scopes en met automatische rollback-mechanismen, waardoor organisaties veilig kunnen experimenteren zonder het risico te lopen dat experimenten onbedoeld permanente schade veroorzaken.

Het gebruik van Azure Chaos Studio begint met het registreren van resources die deel moeten uitmaken van chaos experiments. Dit registratieproces geeft Azure Chaos Studio de benodigde machtigingen om storingen te injecteren in deze resources, terwijl organisaties volledige controle behouden over welke resources worden geregistreerd en welke experiments worden uitgevoerd. Vervolgens worden chaos experiments gedefinieerd als gestructureerde configuraties die beschrijven welke storingen moeten worden geïnjecteerd, in welke volgorde, en met welke parameters. Experiments kunnen worden georganiseerd in experiment suites die meerdere gerelateerde experiments combineren, bijvoorbeeld een suite die alle failover-scenarios voor een specifieke applicatie test. Experiments kunnen handmatig worden gestart, maar kunnen ook worden geautomatiseerd via Azure Automation, Logic Apps of CI/CD-pipelines, waardoor chaos engineering kan worden geïntegreerd in de reguliere development en operations-cycli.

Belangrijk bij het gebruik van Azure Chaos Studio is dat experiments altijd worden uitgevoerd binnen duidelijke safety boundaries. Dit betekent dat experiments alleen worden uitgevoerd in omgevingen die geschikt zijn voor testing, dat expliciete rollback-procedures zijn gedefinieerd, en dat alle betrokken stakeholders op de hoogte zijn van geplande experiments. Daarnaast moeten experiments worden gedocumenteerd met duidelijke hypotheses, verwachte resultaten en daadwerkelijke observaties, zodat learnings kunnen worden vastgelegd en gedeeld. Azure Chaos Studio biedt uitgebreide logging en monitoring-capaciteiten die organisaties in staat stellen om precies te observeren wat er gebeurt tijdens experiments, welke storingen worden geïnjecteerd, en hoe systemen reageren. Deze observaties vormen de basis voor het identificeren van zwakke punten en het verbeteren van veerkracht.

Governance, compliance en relatie met andere artikelen

Governance rond chaos engineering in Azure raakt meerdere disciplines: enterprise architectuur, informatiebeveiliging, cloud governance, compliance en risk management. Zonder een helder governance-model ontstaat het risico dat chaos experiments versnipperd worden uitgevoerd, dat verschillende teams verschillende standaarden hanteren, en dat niemand zich eigenaar voelt van de integrale chaos engineering-strategie. Een effectief governance-model benoemt daarom ten minste een enterprise architect die verantwoordelijk is voor de overkoepelende architectuurvisie, een cloud architect die de technische Azure-architectuur beheert, een security architect die beveiligingsaspecten waarborgt, en expliciete rollen voor CISO, privacy officer en compliance officer. Deze rollen worden vertaald naar concrete taken: wie keurt nieuwe chaos experiments goed, wie beoordeelt afwijkingen van standaarden, wie beheert de chaos engineering-documentatie, en wie beslist over het uitfaseren van verouderde experiment-scenarios.

Op compliancegebied vormt chaos engineering in Azure een kruispunt van verschillende wettelijke kaders. De AVG vereist dat persoonsgegevens adequaat worden beveiligd en dat organisaties kunnen aantonen welke technische en organisatorische maatregelen zijn genomen. De BIO en NIS2 leggen eisen op rond informatiebeveiliging, incident response en continuïteit. ISO 27001 biedt een internationaal erkend framework voor informatiebeveiligingsmanagement. Deze compliance-vereisten moeten expliciet worden vertaald naar chaos engineering-keuzes: welke experiments worden uitgevoerd, hoe vaak worden ze uitgevoerd, hoe worden resultaten gedocumenteerd, en hoe worden learnings gebruikt om veerkracht te verbeteren. Dit artikel moet daarom expliciet worden gelezen in samenhang met andere artikelen binnen de Nederlandse Baseline voor Veilige Cloud, zoals de artikelen over business continuity planning, disaster recovery testing, Azure Backup configuratie en Azure Site Recovery. Samen vormen zij een consistent raamwerk: dit artikel schetst de overkoepelende lijnen voor proactieve veerkrachttests, terwijl de deelartikelen verdieping bieden op specifieke veerkrachtpatronen en technische implementaties.

Voor auditors en toezichthouders is vooral van belang dat de samenhang tussen beleid, architectuur, implementatie en operationele controles aantoonbaar is. Dat betekent dat u niet alleen architectuurdiagrammen en procesbeschrijvingen beschikbaar heeft, maar ook concreet kunt laten zien welke chaos experiments zijn uitgevoerd, welke resultaten zijn behaald, welke zwakke punten zijn geïdentificeerd en verholpen, en hoe vaak experiments worden uitgevoerd. De in dit domein beschreven PowerShell-scripts – waaronder het script bij dit artikel en de scripts voor specifieke chaos engineering-componenten – helpen om deze informatie snel en reproduceerbaar te verzamelen. Door hun output te koppelen aan dashboards en rapportages wordt governance niet beperkt tot papieren documenten, maar ondersteund door actuele operationele data die aantoonbaar maakt dat de chaos engineering-strategie daadwerkelijk wordt nageleefd en onderhouden.

Monitoring van chaos engineering-experiments en resultaten

Gebruik PowerShell-script chaos-engineering.ps1 (functie Invoke-Monitoring) – Geeft een overzicht van uitgevoerde chaos experiments, geïdentificeerde zwakke punten en verbeteracties binnen het Azure resilience-landschap..

Monitoring van chaos engineering-experiments in Azure gaat verder dan het bewaken van individuele experiment-runs. Bestuurders, enterprise architects en security teams hebben behoefte aan een samenvattend beeld: hoeveel chaos experiments zijn uitgevoerd, welke zwakke punten zijn geïdentificeerd, welke verbeteracties zijn ondernomen, en zijn er signalen dat de chaos engineering-strategie niet meer voldoet aan compliance-vereisten. Het script bij dit artikel inventariseert de belangrijkste chaos engineering-componenten en vertaalt die naar een compacte managementsamenvatting: hoeveel experiments zijn gepland en uitgevoerd, hoeveel zwakke punten zijn geïdentificeerd en verholpen, welke experiments moeten worden herhaald, en voor welke onderdelen aanvullende acties nodig zijn. Dit vormt een startpunt voor diepgaandere analyses met gespecialiseerde scripts voor specifieke chaos engineering-componenten, en helpt om het gesprek met bestuur en auditcommissies te structureren rond feitelijke cijfers en meetbare veerkrachtvolwassenheid.

Effectieve chaos engineering-monitoring omvat zowel technische als governance-aspecten. Technisch gezien moet worden gemonitord of experiments correct zijn uitgevoerd, of systemen hebben gereageerd zoals verwacht, of failover-mechanismen correct hebben gefunctioneerd, en of er afwijkingen zijn die kunnen wijzen op security risico's of compliance-problemen. Governance-monitoring richt zich op de vraag of chaos engineering-principes worden nageleefd, of documentatie actueel is, of change management processen correct worden gevolgd, en of er regelmatige reviews plaatsvinden om de chaos engineering-strategie te evalueren en te verbeteren. Door beide aspecten te combineren ontstaat een compleet beeld van de chaos engineering-volwassenheid en kunnen gerichte verbeteracties worden ondernomen om de strategie verder te professionaliseren.

Remediatie en volwassenwording van chaos engineering

Gebruik PowerShell-script chaos-engineering.ps1 (functie Invoke-Remediation) – Genereert overzichten van chaos engineering-hiaten en biedt handvatten voor gerichte verbeteracties om de veerkrachtvolwassenheid te verhogen..

Remediatie binnen het Azure chaos engineering-domein betekent in de praktijk dat u gaten dicht tussen de gewenste chaos engineering-strategie en de werkelijkheid. In veel organisaties bestaan al wel beleidsdocumenten over cloudgebruik, informatiebeveiliging en continuïteitsprincipes, maar ontbreekt concrete vastlegging van hoe deze worden vertaald naar chaos experiments, welke experiments daadwerkelijk zijn uitgevoerd, en hoe de chaos engineering-strategie wordt onderhouden en geëvalueerd. Het script ondersteunt remediatie door automatisch te inventariseren waar chaos engineering-standaarden niet worden nageleefd, waar experiments ontbreken voor kritieke workloads, en waar documentatie verouderd of incompleet is. Op basis van deze inventarisatie kunnen gerichte verbeteracties worden gepland en uitgevoerd, waarbij prioriteit wordt gegeven aan de meest kritieke hiaten die de grootste impact hebben op beveiliging en compliance.

Een volwassen chaos engineering-strategie in Azure groeit stap voor stap door continue verbetering. Na elke experiment-ronde worden de belangrijkste verbeterpunten vastgelegd, van een eigenaar voorzien en ingepland in het reguliere change- of verbeterportfolio. Denk aan het implementeren van ontbrekende failover-mechanismen, het verbeteren van monitoring en alerting, het actualiseren van chaos engineering-documentatie of het invoeren van geautomatiseerde compliance-controles. Door de resultaten van het script te combineren met de uitkomsten van gespecialiseerde scripts voor specifieke chaos engineering-componenten ontstaat een integraal beeld van de voortgang. Uiteindelijk wordt chaos engineering in Azure zo niet alleen een technisch ontwerp, maar een aantoonbaar beheerst en verantwoord ingericht fundament voor de veerkracht van de digitale dienstverlening van de organisatie, dat continu wordt geëvalueerd en verbeterd om te blijven voldoen aan veranderende eisen en dreigingen.

Compliance & Frameworks

BIO: 08.03.01, 12.03, 12.04 - Continuïteitsbeheer, uitwijkvoorzieningen en periodiek testen van herstelvoorzieningen binnen informatiebeveiligingsmanagement voor overheidsorganisaties.
ISO 27001:2022: A.5.30, A.8.13 - Planning van informatiebeveiligingscontinuïteit en periodiek testen van herstelvoorzieningen voor cloudgebaseerde systemen.
NIS2: Artikel - Versterking van digitale weerbaarheid door gecontroleerde inzet van veerkrachttests, inclusief governance, monitoring en incident response.

Automation

Gebruik het onderstaande PowerShell script om deze security control te monitoren en te implementeren. Het script bevat functies voor zowel monitoring (-Monitoring) als remediation (-Remediation).

PowerShell

<#

================================================================================
AZURE POWERSHELL SCRIPT - Nederlandse Baseline voor Veilige Cloud
================================================================================

.SYNOPSIS
    Monitoring en remediatie voor Azure Chaos Engineering-landschap

.DESCRIPTION
    Geeft een samenvattend beeld van de belangrijkste Azure chaos engineering-componenten
    (Azure Chaos Studio-experiments, geïdentificeerde zwakke punten, verbeteracties en documentatie)
    binnen de repository en ondersteunt het gericht dichten van hiaten in chaos engineering-standaarden
    en configuratieregisters.

.NOTES
    Filename:       chaos-engineering.ps1
    Author:         Nederlandse Baseline voor Veilige Cloud
    Created:        2025-01-27
    Last Modified:  2025-01-27
    Version:        1.0
    
    Related JSON:   content/azure/resilience/chaos-engineering.json
    CIS Control:   N/A
.LINK
    https://github.com/[org]/m365-tenant-best-practise
.EXAMPLE
    .\chaos-engineering.ps1 -Monitoring
    Toont een samenvattend overzicht van Azure chaos engineering-componenten en configuratiestatus.
.EXAMPLE
    .\chaos-engineering.ps1 -Remediation
    Genereert een basisoverzicht en, indien gewenst, templates voor ontbrekende chaos engineering-documentatie.
#>


#Requires -Version 5.1

#Requires -Modules Az.Accounts, Az.Resources


[CmdletBinding()]
param(
    [Parameter(HelpMessage = "Voer een samenvattende monitoring uit van het Azure chaos engineering-landschap.")]
    [switch]$Monitoring,

    [Parameter(HelpMessage = "Genereer remediatie-overzichten en optioneel documentatietemplates.")]
    [switch]$Remediation,

    [Parameter(HelpMessage = "Toon welke acties zouden worden uitgevoerd zonder daadwerkelijk te wijzigen.")]
    [switch]$WhatIf
)

$ErrorActionPreference = 'Stop'
$VerbosePreference = 'Continue'

function Connect-RequiredServices {
    <#

    .SYNOPSIS
        Controleert en maakt verbinding met Azure-services indien nodig.
    #>

    [CmdletBinding()]
    param()

    if (-not (Get-AzContext -ErrorAction SilentlyContinue)) {
        Write-Verbose "Geen actieve Azure-verbinding gevonden. Verbinden..."
        Connect-AzAccount -ErrorAction Stop | Out-Null
        Write-Verbose "Verbonden met Azure."
    }
    else {
        Write-Verbose "Azure-verbinding actief: $((Get-AzContext).Account.Id)"
    }
}

function Get-RepositoryRoot {
    <#

    .SYNOPSIS
        Bepaalt de rootmap van de repository op basis van de locatie van dit script.
    .OUTPUTS
        String met pad naar repository-root.
    #>

    [CmdletBinding()]
    param()

    $root = Resolve-Path (Join-Path $PSScriptRoot "..\..\..") -ErrorAction SilentlyContinue
    if (-not $root) {
        throw "Kon de repository-root niet bepalen op basis van PSScriptRoot: $PSScriptRoot"
    }

    return $root.Path
}

function Get-AzureChaosEngineeringInventory {
    <#

    .SYNOPSIS
        Stelt een overzicht op van Azure chaos engineering-gerelateerde JSON- en PS1-bestanden.
    .OUTPUTS
        PSCustomObject met aantallen en details.
    #>

    [CmdletBinding()]
    param()

    $repoRoot = Get-RepositoryRoot

    $contentRoot = Join-Path $repoRoot "content\azure\resilience"
    $codeRoot    = Join-Path $repoRoot "code\azure\resilience"

    $jsonFiles = @()
    if (Test-Path -Path $contentRoot) {
        $jsonFiles = Get-ChildItem -Path $contentRoot -Filter "*.json" -File -ErrorAction SilentlyContinue
    }

    $ps1Files = @()
    if (Test-Path -Path $codeRoot) {
        $ps1Files = Get-ChildItem -Path $codeRoot -Filter "*.ps1" -File -ErrorAction SilentlyContinue
    }

    $byName = @{}
    foreach ($json in $jsonFiles) {
        $base = [System.IO.Path]::GetFileNameWithoutExtension($json.Name)
        if (-not $byName.ContainsKey($base)) {
            $byName[$base] = [pscustomobject]@{
                Name         = $base
                JsonPath     = $null
                JsonUpdated  = $null
                ScriptPath   = $null
                ScriptUpdated= $null
            }
        }
        $entry = $byName[$base]
        $entry.JsonPath    = $json.FullName
        $entry.JsonUpdated = $json.LastWriteTime
        $byName[$base] = $entry
    }

    foreach ($ps1 in $ps1Files) {
        $base = [System.IO.Path]::GetFileNameWithoutExtension($ps1.Name)
        if (-not $byName.ContainsKey($base)) {
            $byName[$base] = [pscustomobject]@{
                Name         = $base
                JsonPath     = $null
                JsonUpdated  = $null
                ScriptPath   = $null
                ScriptUpdated= $null
            }
        }
        $entry = $byName[$base]
        $entry.ScriptPath    = $ps1.FullName
        $entry.ScriptUpdated = $ps1.LastWriteTime
        $byName[$base] = $entry
    }

    $items = $byName.Values | Sort-Object Name

    $missingJson   = $items | Where-Object { -not $_.JsonPath }
    $missingScript = $items | Where-Object { -not $_.ScriptPath }

    return [pscustomobject]@{
        RepositoryRoot  = $repoRoot
        Items           = $items
        MissingJson     = $missingJson
        MissingScripts  = $missingScript
        TotalControls   = $items.Count
        WithJsonAndPs1  = ($items | Where-Object { $_.JsonPath -and $_.ScriptPath }).Count
    }
}

function Test-AzureConnection {
    <#

    .SYNOPSIS
        Controleert of er een actieve Azure-verbinding bestaat.
    .OUTPUTS
        Boolean: $true als verbonden, anders $false
    #>

    [CmdletBinding()]
    param()

    try {
        $context = Get-AzContext -ErrorAction Stop
        if ($context) {
            Write-Verbose "Azure-verbinding actief: $($context.Account.Id) in tenant $($context.Tenant.Id)"
            return $true
        }
        return $false
    }
    catch {
        Write-Verbose "Geen actieve Azure-verbinding: $_"
        return $false
    }
}

function Get-AzureChaosStudioStatus {
    <#

    .SYNOPSIS
        Inventariseert de status van Azure Chaos Studio-componenten.
    .OUTPUTS
        PSCustomObject met chaos engineering-status.
    #>

    [CmdletBinding()]
    param()

    $isConnected = Test-AzureConnection
    if (-not $isConnected) {
        Write-Warning "Geen actieve Azure-verbinding. Alleen repository-inventarisatie wordt uitgevoerd."
        return [pscustomobject]@{
            AzureConnected = $false
            ChaosStudioEnabled = $false
            RegisteredTargets = 0
            ExperimentCount = 0
        }
    }

    try {
        Write-Verbose "Inventariseren van Azure Chaos Studio-componenten..."

        # Azure Chaos Studio is een relatief nieuwe service en heeft mogelijk geen directe PowerShell-module

        # We controleren op basis van resource types en tags

        $chaosResources = @()
        try {
            # Zoek naar resources die mogelijk gerelateerd zijn aan chaos engineering

            $allResources = Get-AzResource -ErrorAction SilentlyContinue | Where-Object {
                $_.Tags -and $_.Tags.ContainsKey('ChaosEngineering') -or
                $_.ResourceType -like '*chaos*'
            }
            $chaosResources = $allResources
        }
        catch {
            Write-Verbose "Kon chaos engineering-gerelateerde resources niet ophalen: $_"
        }

        return [pscustomobject]@{
            AzureConnected = $true
            ChaosStudioEnabled = ($chaosResources.Count -gt 0)
            RegisteredTargets = $chaosResources.Count
            ExperimentCount = 0  # Experiment count zou via Azure Chaos Studio API moeten worden opgehaald

        }
    }
    catch {
        Write-Warning "Fout bij inventariseren van Azure-componenten: $_"
        return [pscustomobject]@{
            AzureConnected = $false
            ChaosStudioEnabled = $false
            RegisteredTargets = 0
            ExperimentCount = 0
        }
    }
}

function New-ChaosEngineeringDocumentationTemplate {
    <#

    .SYNOPSIS
        Maakt een eenvoudige Markdown-template aan voor aanvullende Azure chaos engineering-documentatie.
    #>

    [CmdletBinding()]
    param(
        [Parameter(Mandatory = $true)]
        [string]$Name,

        [Parameter(Mandatory = $true)]
        [string]$OutputPath
    )

    $template = @"
# Azure Chaos Engineering component: $Name


**Laatst bijgewerkt:** $(Get-Date -Format "yyyy-MM-dd")  
**Documentatie-eigenaar:** [Naam / functie]  
**Status:** Concept

## 1. Rol in het Azure chaos engineering-landschap


[Beschrijf hoe deze component (artikel, script of control) past in de totale Azure chaos engineering-strategie.]

## 2. Chaos engineering-principes en experiment-scenarios


[Beschrijf welke chaos engineering-principes en experiment-scenarios worden toegepast, inclusief hypotheses en verwachte resultaten.]

## 3. Technische implementatie


[Beschrijf de concrete Azure-services, configuraties en koppelingen voor chaos experiments, inclusief Azure Chaos Studio-configuraties.]

## 4. Safety mechanisms en rollback-procedures


[Beschrijf safety boundaries, rollback-mechanismen en procedures voor het veilig uitvoeren van chaos experiments.]

## 5. Compliance en governance


[Beschrijf hoe wordt voldaan aan BIO, NIS2, AVG en andere relevante kaders voor chaos engineering en veerkrachttests.]

## 6. Testen en verbeterpunten


[Beschrijf experiment-resultaten, geïdentificeerde zwakke punten, verbeteracties en evaluatiemomenten.]
"@

    $folder = Split-Path -Path $OutputPath -Parent
    if (-not (Test-Path -Path $folder)) {
        New-Item -Path $folder -ItemType Directory -Force | Out-Null
    }

    $template | Out-File -FilePath $OutputPath -Encoding UTF8
    Write-Host "  Template gegenereerd: $OutputPath" -ForegroundColor Green
}

function Invoke-Monitoring {
    <#

    .SYNOPSIS
        Voert een samenvattende monitoring uit van Azure chaos engineering-componenten.
    .OUTPUTS
        PSCustomObject met overzichtsresultaten.
    #>

    [CmdletBinding()]
    param()

    Write-Host "`nMonitoring: Azure Chaos Engineering overzicht" -ForegroundColor Yellow
    Write-Host "=============================================" -ForegroundColor Yellow

    $inventory = Get-AzureChaosEngineeringInventory
    $azureStatus = Get-AzureChaosStudioStatus

    Write-Host "`nRepository-root: $($inventory.RepositoryRoot)" -ForegroundColor Cyan
    Write-Host "Totaal Azure chaos engineering controls (JSON/PS1-combinaties): $($inventory.TotalControls)" -ForegroundColor Cyan
    Write-Host "Volledig gekoppeld (JSON + PS1): $($inventory.WithJsonAndPs1)" -ForegroundColor Cyan

    if ($azureStatus.AzureConnected) {
        Write-Host "`nAzure-omgeving status:" -ForegroundColor Cyan
        Write-Host "  Chaos Studio ingeschakeld: $($azureStatus.ChaosStudioEnabled)" -ForegroundColor Gray
        Write-Host "  Geregistreerde targets: $($azureStatus.RegisteredTargets)" -ForegroundColor Gray
        Write-Host "  Aantal experiments: $($azureStatus.ExperimentCount)" -ForegroundColor Gray
    }
    else {
        Write-Host "`n⚠️  Geen actieve Azure-verbinding. Verbind met Connect-AzAccount voor volledige monitoring." -ForegroundColor Yellow
    }

    if ($inventory.MissingJson.Count -gt 0) {
        Write-Host "`n❌ Ontbrekende JSON voor de volgende scripts:" -ForegroundColor Red
        foreach ($item in $inventory.MissingJson) {
            Write-Host "  - $($item.Name) (script: $($item.ScriptPath))" -ForegroundColor Red
        }
    }

    if ($inventory.MissingScripts.Count -gt 0) {
        Write-Host "`n❌ Ontbrekende PS1-scripts voor de volgende JSON-bestanden:" -ForegroundColor Red
        foreach ($item in $inventory.MissingScripts) {
            Write-Host "  - $($item.Name) (json: $($item.JsonPath))" -ForegroundColor Red
        }
    }

    if (($inventory.MissingJson.Count -eq 0) -and ($inventory.MissingScripts.Count -eq 0)) {
        Write-Host "`n✅ Alle Azure chaos engineering-artikelen hebben zowel JSON als PS1." -ForegroundColor Green
    }
    else {
        Write-Host "`n⚠️  Er zijn nog hiaten in de JSON/PS1-koppeling voor Azure chaos engineering." -ForegroundColor Yellow
        Write-Host "    Gebruik -Remediation om gericht met deze hiaten aan de slag te gaan." -ForegroundColor Yellow
    }

    return [pscustomobject]@{
        Inventory = $inventory
        AzureStatus = $azureStatus
    }
}

function Invoke-Remediation {
    <#

    .SYNOPSIS
        Ondersteunt remediatie door ontbrekende componenten inzichtelijk te maken en optioneel documentatietemplates te genereren.
    .OUTPUTS
        PSCustomObject met remediatieadvies.
    #>

    [CmdletBinding()]
    param()

    Write-Host "`nRemediatie: Azure Chaos Engineering overzicht" -ForegroundColor Yellow
    Write-Host "==============================================" -ForegroundColor Yellow

    $inventory = Get-AzureChaosEngineeringInventory
    $repoRoot  = $inventory.RepositoryRoot

    $docRoot = Join-Path $repoRoot "documentatie\azure-chaos-engineering"
    if (-not (Test-Path -Path $docRoot)) {
        New-Item -Path $docRoot -ItemType Directory -Force | Out-Null
    }

    $actions = @()

    foreach ($item in $inventory.Items) {
        $action = [pscustomobject]@{
            Name                = $item.Name
            HasJson             = [bool]$item.JsonPath
            HasScript           = [bool]$item.ScriptPath
            DocumentationPath   = $null
            DocumentationExists = $false
        }

        $docFile = Join-Path $docRoot ("ce-" + $item.Name + ".md")
        $action.DocumentationPath = $docFile
        $action.DocumentationExists = Test-Path -Path $docFile

        if (-not $action.DocumentationExists -and -not $WhatIf) {
            New-ChaosEngineeringDocumentationTemplate -Name $item.Name -OutputPath $docFile
        }
        elseif (-not $action.DocumentationExists -and $WhatIf) {
            Write-Host "  [WhatIf] Zou documentatietemplate aanmaken: $docFile" -ForegroundColor Yellow
        }

        $actions += $action
    }

    Write-Host "`nSamenvatting remediatie-status:" -ForegroundColor Cyan
    Write-Host ("  Items zonder JSON:      {0}" -f ($actions | Where-Object { -not $_.HasJson }).Count) -ForegroundColor Cyan
    Write-Host ("  Items zonder script:    {0}" -f ($actions | Where-Object { -not $_.HasScript }).Count) -ForegroundColor Cyan
    Write-Host ("  Items zonder documentatie: {0}" -f ($actions | Where-Object { -not $_.DocumentationExists }).Count) -ForegroundColor Cyan

    return $actions
}

try {
    Write-Host "`n========================================" -ForegroundColor Cyan
    Write-Host "Azure Chaos Engineering Overzichtsmonitor" -ForegroundColor Cyan
    Write-Host "Nederlandse Baseline voor Veilige Cloud" -ForegroundColor Cyan
    Write-Host "========================================`n" -ForegroundColor Cyan

    if ($Monitoring) {
        Invoke-Monitoring | Out-Null
    }
    elseif ($Remediation) {
        Invoke-Remediation | Out-Null
    }
    else {
        # Standaard: compacte compliance check via monitoring

        $result = Invoke-Monitoring
        if (($result.Inventory.MissingJson.Count -eq 0) -and ($result.Inventory.MissingScripts.Count -eq 0)) {
            Write-Host "`n✅ COMPLIANT" -ForegroundColor Green
        }
        else {
            Write-Host "`n❌ NON-COMPLIANT" -ForegroundColor Red
            Write-Host "Run met -Remediation voor een gericht overzicht van hiaten en documentatietemplates." -ForegroundColor Yellow
        }
    }
}
catch {
    Write-Error "Er is een fout opgetreden in chaos-engineering.ps1: $_"
    throw
}
finally {
    Write-Host "`n========================================`n" -ForegroundColor Cyan
}

Risico zonder implementatie

High: Zonder een doordachte chaos engineering-strategie in Azure ontstaan verborgen zwakke punten in cloudarchitecturen die pas aan het licht komen tijdens echte storingen. Dit kan leiden tot langdurige uitval van essentiële diensten, schending van wettelijke verplichtingen, verlies van vertrouwen bij burgers en bestuurlijke aansprakelijkheid. Proactieve veerkrachttests via chaos engineering identificeren en verhelpen deze zwakke punten voordat ze tot echte incidenten leiden.

Management Samenvatting

Chaos engineering in Azure biedt een systematische methode om proactief veerkracht te testen door gecontroleerde storingen te injecteren in cloudomgevingen. Met Azure Chaos Studio kunnen organisaties op veilige wijze experimenteren met verschillende failure-scenarios, zwakke punten identificeren en verhelpen, en compliance-vereisten rond business continuity aantoonbaar maken. Dit artikel beschrijft hoe organisaties een volwassen chaos engineering-programma kunnen opzetten met duidelijke experiment-scopes, safety mechanisms en learnings-capture.

Implementatietijd: 120 uur
FTE required: 0.5 FTE

Chaos Engineering In Azure: Proactieve Veerkrachttests Voor Nederlandse Overheidsorganisaties

💼 Management Samenvatting

Implementatie

Rol en scope van chaos engineering in Azure

Implementatieroadmap: van eerste experimenten naar volwassen chaos engineering

Azure Chaos Studio: gecontroleerde fault injection in Azure-omgevingen

Governance, compliance en relatie met andere artikelen

Monitoring van chaos engineering-experiments en resultaten

Remediatie en volwassenwording van chaos engineering

Compliance & Frameworks

Automation

Risico zonder implementatie

Management Samenvatting

Share artikel