Hinweis: KI-gestützter Inhalt

Dieser Artikel wurde mit Unterstützung von KI-Technologien erstellt und redaktionell geprüft. Weitere Informationen zum Umgang mit KI-generierten Inhalten finden Sie in unserem Code of Conduct

Google führt eine neue Methode für seinen Anti-Bot-Dienst reCAPTCHA ein, die für Diskussionen sorgt. Statt wie bisher Verkehrsschilder zu identifizieren oder einfach ein Kästchen anzukreuzen, sollen Nutzer per Webcam Handbewegungen ausführen. Das System extrahiert dabei 21 Koordinatenpunkte der Hand, um einen lebendigen Menschen von einem Bot zu unterscheiden. Doch schon wenige Tage nach Bekanntwerden der Funktion berichten Tester von einer erfolgreichen Umgehung, mit einem einfachen Stockfoto.

Wie die Handgesten-Erkennung funktioniert

Das Prinzip klingt denkbar einfach: Eine Webseite, die Googles reCAPTCHA-Dienst nutzt, blendet einen Dialog mit der Aufforderung ein, die Hand vor die Kamera zu halten und eine bestimmte Geste auszuführen. Laut der offiziellen Google-Dokumentation wird dafür kurzzeitig der Kamerazugriff angefordert. Der Nutzer sieht auf dem Bildschirm, welche Bewegung nachgemacht werden soll, etwa Winken oder das Zeigen einer offenen Handfläche.

Im Hintergrund analysiert ein Machine-Learning-Modell die Aufnahme und extrahiert 21 Gelenk-Koordinaten der Hand. Dabei kommt Googles MediaPipe-Framework zum Einsatz, das bereits für andere Gestensteuerungs-Anwendungen genutzt wird. Google betont, dass weder Audio aufgezeichnet noch das Gesicht des Nutzers erfasst wird. Das Video werde in Echtzeit verarbeitet und nach Abschluss der Prüfung sofort gelöscht.

Wer keine Kamera nutzen möchte oder kann, erhält wie bisher die klassischen Bild- oder Audio-Rätsel. Die Handgesten-Prüfung ersetzt die bestehenden Verfahren nicht, sondern ergänzt sie als zusätzliche Option. Laut Android Authority ist die Funktion Teil von Googles Cloud Fraud Defense und befindet sich derzeit in einer Testphase.

Datenschutz zwischen Versprechen und Bedenken

Google versichert in seiner Dokumentation, dass die aufgenommenen Videos niemals mit der Identität des Nutzers verknüpft, nicht für das Training von Modellen verwendet und nach der Verifikation umgehend gelöscht werden. Der Dialog selbst informiert darüber, dass nur die Handbewegungen erfasst werden und bittet den Nutzer um seine Zustimmung, bevor der Vorgang startet.

Dennoch bleiben Fragen offen. Wie der Blog MEGA in einer Analyse anmerkt, enthält die Einverständniserklärung den Hinweis, dass die erfassten Informationen ‘in Übereinstimmung mit der Google-Datenschutzerklärung verwendet und gespeichert werden’, eine Formulierung, die Spielraum für Interpretationen lässt. Handgeometrie gilt rechtlich als biometrisches Datum, etwa nach dem strengen Illinois Biometric Information Privacy Act (BIPA), das eine ausdrückliche Einwilligung vor der Erhebung vorschreibt.

Ob die reCAPTCHA-Handgeste unter solche Gesetze fällt, ist rechtlich nicht abschließend geklärt. MEGA weist darauf hin, dass BIPA und ähnliche Gesetze auf biometrische Daten abzielen, die zur Identifikation einer Person genutzt werden. Googles Position ist, dass die Handdaten lediglich auf Lebendigkeit prüfen, nie mit einer Identität verknüpft werden und sofort gelöscht werden, was außerhalb des Anwendungsbereichs liegen dürfte. Fest steht: Eine Kategorie persönlicher Daten, für die Gesetzgeber besondere Schutzregeln geschrieben haben, wird hier für etwas so Alltägliches wie das Besuchen einer Webseite erhoben.

Ein Foto genügt – die Sicherheitslücke

Besonders brisant: Bereits wenige Tage nach der ersten Berichterstattung berichtete Tom's Hardware von einer erfolgreichen Umgehung des neuen Verfahrens. Tester nutzten ein einfaches Stockfoto einer winkenden Hand, das sie über eine OBS Virtual Camera in das System einspeisten. Der reCAPTCHA-Dienst akzeptierte die Aufnahme bereits beim zweiten Versuch und wertete das Standbild als legitime Handbewegung.

Das offenbart ein grundlegendes Problem der aktuellen Implementierung: Die reine Extraktion von Handkoordinaten prüft nicht verlässlich, ob tatsächlich eine Live-Kamera zugeschaltet ist. Ohne zusätzliche Sicherheitsmechanismen wie Tiefensensoren, Bewegungskontinuität oder zufällige Mehrschritt-Gesten können selbst einfache Replay-Angriffe die Prüfung umgehen. Wie das Portal ‘Let’s Data Science’ anmerkt, ist dies ein Lehrbuchfall dafür, wie eine naive gestenbasierte Lebenderkennung ausgetrickst werden kann.

Es ist nicht der erste Fehlstart einer neuen Captcha-Methode. Auch Googles ursprüngliches reCAPTCHA mit verzerrten Textzeichen galt lange als geknackt, und Bilderrätsel mit Verkehrsschildern wurden von KI-Modellen zunehmend besser gelöst. Die Ironie: Ausgerechnet der Versuch, mit modernster Gesichts- und Gestenerkennung botsicherer zu werden, scheitert zunächst an der einfachsten Angriffsmethode der Captcha-Geschichte, einem statischen Bild.

Neue Methode mit offenen Fragen

Googles Handgesten-Captcha ist ein interessanter Ansatz, der zeigt, wie sich Captcha-Verfahren angesichts immer leistungsfähigerer KI-Bots weiterentwickeln müssen. Gleichzeitig offenbart der Test beide Seiten der Medaille: Datenschutzrechtliche Bedenken auf der einen, handfeste Sicherheitslücken auf der anderen Seite. Dass ein einfaches Stockfoto ausreicht, um die Prüfung zu bestehen, wirft Fragen zur Sorgfalt der Implementierung auf.

Bislang hat Google nicht mitgeteilt, ob und wann die Handgesten-Prüfung breiter ausgerollt wird oder wie die erkannte Schwachstelle behoben werden soll. Denkbar wären tiefergehende Lebendigkeitsprüfungen, die Bewegungsabläufe oder zufällige Gesten-Sequenzen einbeziehen. Bis dahin dürften Nutzer, die ihre Privatsphäre schonen wollen, weiterhin auf die klassischen Captcha-Verfahren zurückgreifen – oder darauf hoffen, dass sich das Stockfoto im entscheidenden Moment im Browser-Tab befindet.