In einer Welt, in der Künstliche Intelligenz (KI) zunehmend unser Leben prägt, stellt sich Anthropic der Herausforderung, ethische Grundlagen in die AI-Entwicklung einzubetten.
Anthropic, ein führendes KI-Startup und Schöpfer des Chatbots Claude, tritt mit einem innovativen Ansatz auf das Parkett der generativen KI: „Constitutional AI“. Im März 2023 vorgestellt, zielt dieser Ansatz darauf ab, KI-Systeme mit ethischen Grundsätzen zu trainieren, um Transparenz, Sicherheit und faire Entscheidungsfindung zu gewährleisten. Einladungen zur KI-Ethik-Anhörung im Weißen Haus, neben Größen wie Microsoft und Google, bezeugen die Relevanz dieser Initiative.
Im Kern der Debatte steht die Frage, wie man KI ethisches Verhalten beibringt. Traditionelle Methoden, wie das „Reinforcement Learning from Human Feedback“ (RLHF), stoßen dabei an ihre Grenzen, da sie langwierig, fehleranfällig und mitunter belastend für die beteiligten Menschen sind. Anthropic geht einen anderen Weg: Durch die Konditionierung ihrer Modelle auf der Basis einfacher Verhaltensprinzipien möchte das Unternehmen einen automatisierten und effizienten Ansatz schaffen. Dieser basiert auf einem wachsenden Katalog von Werten, der momentan von der Menschenrechtserklärung der Vereinten Nationen bis hin zu firmeneigenen Prinzipien reicht.
Die Einbettung dieser Werte in KI-Systeme ist ein kontinuierlicher Prozess, der durch Nutzerfeedback und weitere Forschung angereichert wird. Anthropics Vision ist es, dass verschiedene Kulturen die ethischen Grundlagen ihrer KI-Modelle akzeptieren und nach Bedarf anpassen können, ohne dabei eine spezifische Ideologie zu bevorzugen. Diese flexible und progressive Haltung könnte die Zukunft der KI-Ethik maßgeblich prägen.