Anthropic hat eine beeindruckende Erweiterung seines KI-Modells Claude 3.5 Sonnet vorgestellt. Doch was kann die neue PDF-Unterstützung und wie profitieren Nutzer davon?
Das KI-Unternehmen hat eine öffentliche Beta-Version veröffentlicht, in der Claude 3.5 Sonnet PDFs lesen und verstehen kann. Dies umfasst nicht nur den Text, sondern auch Bilder, Diagramme und Tabellen. Mit dieser Funktion lassen sich komplexe Dokumente wie Finanzberichte oder juristische Texte analysieren und Informationen extrahieren. Auch Übersetzungen sind möglich. Das System funktioniert, indem es Text aus PDFs extrahiert und jede Seite in ein Bild umwandelt. Diese Kombination ermöglicht es Claude, den Inhalt umfassend zu verstehen.
Die PDF-Verarbeitung hat bestimmte Einschränkungen: Dateigrößen dürfen maximal 32 MB betragen, und die Anzahl der Seiten ist auf 100 beschränkt. Verschlüsselte oder passwortgeschützte PDFs werden nicht unterstützt. Die Tokenkosten pro Seite variieren zwischen 1.500 und 3.000 Token, abhängig von der Komplexität des Inhalts, ohne dass zusätzliche Gebühren anfallen.
Die Beta-Version ist derzeit als Feature Preview im Claude-Chat und über die API verfügbar. Künftige Integrationen in Plattformen wie Amazon Bedrock und Google Vertex AI sind bereits in Planung.
Tipps für eine optimale Nutzung
Um die besten Ergebnisse zu erzielen, empfiehlt Anthropic, auf gut lesbare Texte und korrekt ausgerichtete Seiten zu achten. Bei der API-Nutzung sollten PDFs vor dem Text in den Anfragen eingefügt werden. Große PDFs können in kleinere Abschnitte geteilt werden, wenn die Limits überschritten werden. Anthropic bietet auch Beispiele zur PDF-Verarbeitung und empfiehlt Prompt-Caching für wiederholte Analysen derselben Datei.