Wenn ein KI-Assistent Zugriff auf Websuche, Dateien oder externe Dienste hat, entstehen neue Angriffsflächen. Genau dort setzt OpenAI mit dem neuen Lockdown-Mode für ChatGPT an. Der Sperrmodus soll verhindern, dass versteckte Anweisungen aus fremden Quellen den Chatbot zu unerwünschtem Verhalten bringen.
Der neue Sicherheitsmodus wird laut OpenAI derzeit schrittweise für alle ChatGPT-Nutzer ausgerollt. Er ist nicht auf zahlende Abonnements beschränkt, sondern soll auch mit kostenfreiem Account verfügbar sein. Ziel ist ein besserer Schutz vor sogenannten Promptinjektionen.
Bei solchen Angriffen verstecken Angreifer schädliche Anweisungen beispielsweise in einer URL, einer Datei oder einem Text. Werden diese Inhalte in ChatGPT verarbeitet, kann der verborgene Prompt unter Umständen ausgeführt werden. Im ungünstigen Fall könnte ChatGPT dadurch sensible Informationen preisgeben oder an externe Ziele weiterleiten.
Der Sperrmodus reduziert dafür die Verbindung von ChatGPT zur Außenwelt. Ist er aktiv, kann ChatGPT nicht im Web browsen und keine Bilder oder anderen Dateien aus dem Internet herunterladen. Außerdem werden Funktionen wie Deep Research, Shopping Research und der agentische KI-Modus deaktiviert. Damit sinkt das Risiko, dass ein manipuliertes externes Element automatisch verarbeitet und mit weiteren Diensten kombiniert wird.
Vollständigen Schutz bietet der Modus allerdings nicht. Nutzer können weiterhin selbst Dateien hochladen und Prompts eingeben. Wird ein schädlicher Inhalt also manuell in eine Konversation eingebracht, bleibt Promptinjektion grundsätzlich möglich. Der entscheidende Sicherheitsgewinn liegt eher darin, dass ChatGPT im Sperrmodus weniger Möglichkeiten hat, Daten über Webzugriffe oder Konnektoren nach außen weiterzugeben.
Aktiviert wird der Lockdown-Mode in den ChatGPT-Einstellungen im Bereich „Sicherheit“. Dort findet sich die Option „Sperrmodus“. Nach Aktivierung gilt die Einschränkung zunächst für alle Chats. Bei Bedarf kann sie über einen Warnhinweis oberhalb der Eingabezeile für einzelne Unterhaltungen wieder deaktiviert werden. Alternativ lässt sich der Modus in den Einstellungen komplett abschalten.
