Het aanpakken van hiaten in het testlandschap voor gezichtsbiometrische detectie van levendigheid
Artikel
2 mei 2024

Het aanpakken van hiaten in het testlandschap voor gezichtsbiometrische detectie van levendigheid

Serve Legal heeft met succes een testkader ontwikkeld dat een zorgvuldig en ethisch samengestelde dataset bevat voor het testen van de nauwkeurigheid en eerlijkheid van technologieën voor gezichtsbiometrische leeftijdsschatting. De toonaangevende technologieën voor het schatten van de leeftijd gaan verder dan alleen het schatten van de leeftijd van de persoon die wordt gepresenteerd en omvatten ook een mogelijkheid voor detectie van reactiviteit voor extra veiligheid.

Serve Legal overlegt met deze aanbieders van leeftijdsgarantie en digitale ID om de meest uitgebreide test voor detectie van levendigheid te ontwikkelen. Dit artikel verkent het huidige testlandschap en een aantal van de hiaten die moeten worden aangepakt om de leeftijdsgarantie en digitale ID industrieën goed te ondersteunen door potentiële gebruikers van deze technologieën in staat te stellen geïnformeerde vergelijkingen te maken.


Detectie van levendigheid is een belangrijk onderdeel van biometrische leeftijdscontrole en digitale ID-technologie.

De rol ervan is om te verifiëren dat wat aan het biometrische systeem wordt gepresenteerd een levende mens is en geen foto, prothese, digitaal geïnjecteerde video of ander kunstmatig artefact. Deze verificatie bestaat om misbruik te voorkomen, zoals het presenteren van de digitale ID van iemand anders of het injecteren van een deepfake video om de biometrische analyse te misleiden.

Detectie van levendigheid wordt gebruikt in een snel groeiend aantal toepassingen, zoals bankieren, overheidsdiensten en detailhandel, om er maar een paar te noemen.

Technieken voor detectie van reactiviteit kunnen grofweg worden gecategoriseerd als passief of actief. Passieve detectie van reactiviteit betekent dat de gebruiker geen specifieke acties hoeft te ondernemen om te communiceren met de interface die de detectie uitvoert. Actieve detectie van reactiviteit betekent dat de gebruiker acties moet ondernemen zoals knipperen, zijn hoofd draaien of de afstand van de camera aanpassen.

Elke techniek heeft voor- en nadelen en kan meer of minder geschikt zijn voor verschillende inzetcontexten. Zo zal passieve detectie van reactiviteit waarschijnlijk minder frictie in het proces voor gebruikers introduceren, omdat die gebruikers geen interactieve instructies hoeven uit te voeren. Actieve detectie van reactiviteit voegt enige frictie toe, maar leveranciers van dergelijke technologieën stellen dat deze frictie wordt gecompenseerd door de toename in nauwkeurigheid. Met de onafhankelijke tests die momenteel voor beide aanbieders beschikbaar zijn, is het niet mogelijk om deze kenmerken te kwantificeren, zodat ze kunnen worden vergeleken en beoordeeld op basis van zowel prestaties als gebruikerservaring.

Dit vormt een uitdaging voor bedrijven zoals detailhandelaren, bookmakers, banken etc. die een oplossing voor detectie van reactiviteit in hun systeem willen integreren. Bij het implementeren van een dergelijke technologie zal een bedrijf waarschijnlijk due diligence-controles uitvoeren, zoals:

  1. Is de nauwkeurigheid voldoende voor de inzetcontext?
  2. Is de gebruikerservaring goed genoeg om klanten tevreden te houden?
  3. Welke oplossing biedt de beste afweging tussen fraudepreventie en gebruikerservaring?

Op het gebied van gezichtsbiometrie is NIST (National Institute of Standards and Technology), een Amerikaanse overheidsinstelling, de gevestigde beheerder van prestatiebenchmarks voor algoritmen voor gezichtsherkenning en -analyse. Detectie van levendigheid valt echter buiten de kerntestmogelijkheden van NIST. Dit komt doordat hun biometrische gezichtstests worden vergemakkelijkt door hun toegang tot vooraf verzamelde gezichtsbeelddatasets die zijn verzameld uit politiefoto's en grenscontroles, op grond van hun status als Amerikaans overheidsagentschap.

Aangezien de tests van NIST gebaseerd zijn op datasets van statische afbeeldingen, beschikken ze niet over levende proefpersonen die tests van systemen voor detectie van levendigheid kunnen uitvoeren.

Passieve oplossingen voor het detecteren van reactiviteit die op de markt zijn en die de reactiviteit beoordelen op basis van een enkele 2D-beeldopname, kunnen worden voorgelegd aan het Face Analysis Technology Evaluation (FATE) PAD-programma van NIST, waarbij PAD staat voor Presentation Attack Detection. Dit is een term die wordt gebruikt om de doeltreffendheid te beschrijven van een gezichtsanalysetool bij het detecteren van een spoof, dat wil zeggen een slechte actor die zich voordoet als iemand anders om een gezichtsbiometrische controle te misleiden.

Helaas zorgt dit voor verwarring als we het hebben over oplossingen voor detectie van reactiviteit, want zoals NIST duidelijk maakt in hun rapport, Deel 10: Prestaties van passieve, op software gebaseerde presentatie

Aanval Detectie (PAD) Algoritmen:"In deze test evalueerden we passieve PAD-benaderingen die werkten op vooraf verzameld beeldmateriaal zonder enige vorm van gebruikersinteractie. PAD benaderingen die gebruikersinteractie vereisen vallen buiten het bereik van FATE PAD."(Lees hier meer)

De semantiek in deze verklaring is belangrijk. De evaluatie door NIST van "passieve PAD-benaderingen" is geen evaluatie van passieve liveness-benaderingen. Ter illustratie, de evaluatie van een passieve PAD-aanval zou kunnen bestaan uit het nemen van een selfie van iemand die een deskundig gemaakt en duur prothetisch masker draagt. Het 2D-beeld van de selfie kan vervolgens worden doorgegeven aan een biometrisch systeem voor evaluatie. Als de PAD-evaluatie het beeld verwerpt, is de aanval correct geïdentificeerd als een spoof en is de test geslaagd. Maar een passieve test van de echtheid vereist weliswaar geen specifieke handelingen van de gebruiker, maar wel een live interactie en niet alleen een vooraf verzameld 2D-beeld. Het systeem zou bijvoorbeeld dynamische verlichtingsinstellingen op het apparaat kunnen gebruiken tijdens het nemen van de selfie, waarbij de resulterende beeldopname in realtime wordt geëvalueerd om te beoordelen of de dynamische verlichting eruitziet zoals verwacht op menselijke huid/ogen versus latex, siliconen of zelfs glas in het geval van videoweergave.

Daarom is voorzichtigheid geboden bij het beoordelen van de prestaties van een passief hulpprogramma op basis van deze PAD-evaluatie. Hoewel een algoritme dat hoog scoort op veiligheid in deze PAD-test kan worden beschouwd als een algoritme dat goed presteert in het detecteren van aanvallen zoals 2D-afbeeldingen van personen die maskers gebruiken of foto's omhoog houden, staat dit niet gelijk aan testen dat de gebruiker fysiek aanwezig is op het moment van presentatie en kan daarom worden beschouwd als een zwakkere prestatietest.

Een hoge score voor gebruiksgemak betekent dat het algoritme een laag percentage valse detecties had. Dit is een belangrijke maatstaf, maar dit type gemak is heel anders dan de gebruikerservaring die men zou willen beoordelen bij het vergelijken van actieve en passieve oplossingen voor het detecteren van reactiviteit.

Gelukkig biedt ISO 30107-3:2023 een PAD-testkader voor detectie van veroudering. Helaas vertonen de tests die beschikbaar zijn op basis van deze norm tekortkomingen, waardoor de leeftijdsgarantie- en digitale ID-industrie behoefte hebben aan robuustere, onafhankelijke, vergelijkbare tests voor systemen voor detectie van reactiviteit.

Specifieke zorgen van de industrie zijn dat de tests te gemakkelijk zijn om te doorstaan, te verschillen tussen leveranciers en geen rekening houden met digitale injectieaanvallen.

Er zijn nog andere tekortkomingen in het testlandschap als het gaat om het waarborgen dat systemen worden ontwikkeld in overeenstemming met ethische best practices. Zo moeten er bijvoorbeeld tests worden uitgevoerd met voldoende steekproeven met de juiste diversiteit om een significant verschil in Bona Fide Presentation Classification Error Rate (BPCER) tussen demografische groepen te detecteren. Zo'n eerlijkheidsmeting is essentieel voor gebruikers van deze technologieën, of het nu banken, supermarkten of andere bedrijven zijn, om er zeker van te zijn dat ze niet in overtreding zijn met de wetgeving over gelijkheid door een systeem voor het detecteren van reactiviteit in te zetten dat een vertekend beeld geeft van de reactiviteit van bepaalde demografische groepen.

Bovendien beschikken de gebruikers van deze technologieën niet over onafhankelijk gecontroleerde meetgegevens waarmee ze op risico's gebaseerde beoordelingen kunnen maken over welk systeem de optimale balans tussen nauwkeurigheid en gebruikerservaring biedt, gezien de context waarin het systeem zal worden gebruikt.

Tenslotte is er geen metriek om de gebruikskosten van de verschillende oplossingen te vergelijken. Het is bijvoorbeeld mogelijk en misschien zelfs waarschijnlijk dat sommige benaderingen aanzienlijk meer rekenkracht vereisen dan andere om een controle op geschiktheid uit te voeren. Als deze kosten in totaal aanzienlijk zijn, kunnen ze ook van invloed zijn op de op risico gebaseerde besluitvorming van bedrijven die detectie van reactiviteit moeten integreren.

Als u een leverancier van aanwezigheidsdetectie bent, neem dan contact op met ons gezichtsbiometrie-team dat graag uw uitdagingen met betrekking tot het onafhankelijk verifiëren van de prestaties, eerlijkheid, efficiëntie en meer van uw tool zal onderzoeken.

Graham Roberts
Graham Roberts is de Chief Technology Officer (CTO) van Serve Legal. Graham's werk is cruciaal voor het handhaven van de positie van Serve Legal in de voorhoede van de compliance-industrie, met name op gebieden zoals AI, gegevensbeheer en systeemefficiëntie. Zijn leiderschap zorgt ervoor dat de technologische infrastructuur van het bedrijf naadloze operaties ondersteunt en accurate, tijdige auditresultaten voor klanten oplevert.

Abonneer je op onze nieuwsbrief

mannelijke-barista-met-afhaal-koffie-min
home-hero
4

Blijf de veranderingen in naleving voor.

Neem contact op met een lid van het Serve Legal Team om te bespreken hoe we uw bedrijf kunnen ondersteunen.