Innovation & Technologie

GPT-4: Neue Version der KI erkennt Bilder und besteht Eignungstests

17. März 2023
Roman Maas
3 Min.

Die Entwickler:innen nennen es den „neuesten Meilenstein” bei der Weiterentwicklung von Deep Learning. OpenAIs vierte Version des KI-Sprachmodells GPT soll Eignungstests für Berufe bestehen und Bilder erkennen und verarbeiten können. Hier ein Überblick über die erstaunlichen Verbesserungen und neuen Funktionen von GPT-4.

Die wohl bekannteste Anwendung des GPT-Systems ist der frei verfügbare Chatbot ChatGPT. Basierend auf GPT-3.5 hat das Sprachmodell in den letzten Monaten für Aufsehen gesorgt, weil es intelligente Gespräche aufrechterhalten kann, aufwändige Textarbeiten absolvieren kann, als Ideengeber dient und sogar funktionierenden Code ausgibt. Das Tech-Start-up OpenAI hat die neueste Version ihres KI-Sprachmodells vorgestellt: GPT-4 soll bessere Ergebnisse liefern, mehr Daten verarbeiten können und weniger Fehler machen. Im Gegensatz zum frei erhältlichen Vorgänger GPT-3.5 kannst Du Version vier aber vorerst nur in der kostenpflichtigen ChatGPT Plus-Anwendung testen. Wir verraten Dir, was GPT-4 mit sich bringt.

Bitte akzeptieren Sie die Nutzung von Drittanbieter-Einbindungen mit einem Klick auf den folgenden Button:

Größere Leistungsfähigkeit: GPT-4 besteht Anwaltszulassung

In einem Blogpost und einem Developer Livestream gingen die OpenAI-Entwickler:innen auf die einzelnen Neuheiten von GPT-4 ein. Wie groß der Leistungsunterschied zwischen GPT-4 und seinem Vorläufer ist, zeigt sich laut Entwickler:innen besonders, wenn die Aufgaben komplexer werden. So wurde die KI mit Testaufgaben gefüttert, die in standardisierten Prüfungen in den USA vorkommen – wie dem Studierfähigkeitstest SAT und dem Test für die Anwaltszulassung, dem Bar Exam. In letzterem schneidet GPT-3.5 noch unterdurchschnittlich ab, GPT-4 jedoch liefert Ergebnisse, die den oberen 10 Prozent aller getesteten Personen entsprechen.

Multimodalität: Der Chatbot bekommt Augen

Bislang kannst Du auf ChatGPT nur Texteingaben machen. GPT-4 ist hingegen multimodal, was bedeutet, dass es neben Text nun auch Bilder verarbeiten kann. So kann es nicht nur im Detail beschreiben, was auf den Bildern zu sehen ist, sondern auch, was daran ungewöhnlich ist – ein Entwickler demonstrierte dies im Blog am Beispiel von Bildwitzen, die von der KI erklärt werden können.

Auch Websites lassen sich mit GPT-4 verblüffend einfach anhand von Bildern erstellen. In der Developer-Präsentation ist zu sehen, wie die KI aus einer sehr groben Notizblock-Skizze binnen Sekunden eine funktionierende Webseite erstellt. Wie das funktioniert, kannst Du in obigem Video ab Minute 16:14 sehen.

Microsoft, die große Anteile an OpenAI besitzen, sind bereits dabei, die KI in ihre Suchmaschine Bing einzubauen, während Google an einer eigenen Alternative arbeitet.

Lenkbarkeit: Die KI schlüpft in jede Rolle

Damit die KI Dir genauere Ergebnisse liefert, ist es besser, ihr explizite Instruktionen zu geben. Das muss nicht über komplizierte Befehle geschehen, denn dafür ist die Funktion „System-Message“ da. Mit ihr kannst Du der KI einfach eine Rolle zuweisen. Zum Beispiel, dass sie als Steuerberater fungiert und alle kommenden Fragen Punkt für Punkt anhand des Steuergesetzes beantworten soll. Solche Instruktionen wurden in den älteren Versionen oft noch nicht umgesetzt, mit GPT-4 funktioniert dies deutlich besser.

Ist Dir das zu langweilig, kannst Du ihn alle Antworten in Reimform aufsagen lassen. Es besteht auch die Möglichkeit, den Chatbot so zu programmieren, dass er nicht direkt die richtige Lösung für ein Problem ausspuckt, sondern Dir nach und nach Hinweise gibt, so dass Du selbst auf einen geeigneten Ansatz kommst.

GPT-4 macht immer noch Fehler

So spektakulär das Update auch ist, die Ergebnisse von GPT-4 sind immer noch nicht fehlerfrei. So räumen die Entwickler:innen ein, dass auch diese Version noch oft genug Fakten „halluziniert”, und mit großer Vorsicht genutzt werden sollte. Man kann der KI also keine wichtigen Aufgaben erledigen lassen, ohne diese nicht gründlich mit menschlichem Verstand zu prüfen. GPT-4 ist wie seine Vorgänger auch nicht auf dem aktuellen Stand der Dinge. Die Sprach-KI nutzt Daten bis September 2021.

Wann und wo kannst Du GPT 4 testen?

GPT-4 kannst Du im kostenpflichtigen ChatGPT Plus Abo testen, welches 20 US-Dollar netto im Monat kostet. Einmal freigeschaltet, bist Du derzeit auf 100 Nachrichten in vier Stunden beschränkt. Wenn Du Zugriff auf die Programmierschnittstelle (API) haben möchtest, kannst Du Dich auf eine Warteliste eintragen.

Was hältst Du von GPT-4? Diskutiere hier in den Kommentaren!