Seit 2023 ist der Markt für “KI-gestützte” Software explodiert. Ein erheblicher Teil dessen, was heute unter dem Etikett “KI-Lösung” verkauft wird, ist technisch eine dünne Hülle um eine fremde API. Im Fachjargon heißt das AI-Wrapper.

Wrapper sind nicht per se schlecht. Problematisch wird es, wenn Sie einen Vollpreis für ein Spezialprodukt bezahlen, obwohl der eigentliche Mehrwert an der darunterliegenden API entsteht, die Sie mit deutlich weniger Aufwand direkt nutzen könnten.

Die folgenden vier Fragen helfen Ihnen in einem Kundengespräch oder in einer E-Mail, in rund zehn Minuten einzuschätzen, ob ein Anbieter echten Mehrwert liefert oder nur eine Schicht dazwischen.

Frage 1: “Welche KI-Modelle nutzen Sie und warum genau diese?”

Was Sie hören sollten: Eine konkrete Antwort. Etwa: “Wir nutzen ein starkes Sprachmodell für die Klassifikation, weil es in unseren Tests bei unstrukturierten Eingangsdaten am stabilsten war. Für die lokale Verarbeitung nutzen wir zusätzlich ein kleineres Open-Source-Modell, weil Kundendaten das Haus nicht verlassen dürfen.”

Was ein Warnzeichen ist: Ausweichen (“Das ist unser Betriebsgeheimnis”), Marketing-Floskeln (“unsere proprietäre KI”) oder die Aussage, man frage “mehrere KI-Modelle parallel ab”, ohne erklären zu können, warum.

Ein Anbieter, der nicht benennt, welches Modell er in welchem Schritt verwendet, hat entweder keine Kontrolle über sein eigenes Produkt, oder er will nicht sagen, dass er schlicht eine fremde API durchreicht.

Frage 2: “Was passiert zwischen Eingabe und Ausgabe, das Ihr Produkt hinzufügt?”

Was Sie hören sollten: Konkrete technische Schritte: Datenaufbereitung, domänenspezifische Prompts, eigene Wissensdatenbanken, Validierung, Korrekturschleifen. An diesen Stellen entsteht echter Mehrwert.

Was ein Warnzeichen ist: “Wir schicken Ihre Anfrage an unsere KI und geben die Antwort zurück.” Das können Sie mit einem zehnzeiligen Skript selbst, zu einem Bruchteil der Kosten.

Die ehrliche Gegenkontrolle: Lassen Sie sich ein konkretes Beispiel zeigen. Wenn die Eingabe eine E-Mail ist und die Ausgabe eine Zusammenfassung, fragen Sie: “Was würde passieren, wenn ich dieselbe E-Mail einfach in ChatGPT kopiere?” Ist das Ergebnis vergleichbar, haben Sie einen Wrapper vor sich.

Frage 3: “Was genau macht Ihr Produkt, das Claude Desktop oder ChatGPT nicht auch kann?”

Ein erheblicher Teil des “WOW-Effekts” vieler KI-Produkte kommt nicht vom Produkt selbst, sondern vom zugrundeliegenden Modell. Wer einmal eine Aufgabe direkt in Claude Desktop, Claude Code, ChatGPT oder einer vergleichbaren App gelöst hat, erkennt das schnell: Datei-Upload, Arbeiten mit langem Kontext, Tool-Use, einfache Agenten-Funktionen, Projekt-Arbeitsbereiche mit eigenen Dateien. Das alles ist dort inzwischen Standard, ohne dass ein einziger weiterer Anbieter nötig wäre.

Das bedeutet nicht, dass spezialisierte KI-Produkte überflüssig sind. Es bedeutet aber, dass sich der Vergleichsmaßstab verschoben hat.

Was Sie hören sollten: Eine konkrete Antwort, die über reine Modellfähigkeiten hinausgeht. Etwa: Zugriff auf Ihre internen Daten, branchenspezifische Prüfregeln, Anbindung an Ihre bestehenden Systeme, auditierbare Workflows, rollenbasierte Rechte, Datenschutz-Konformität in einem regulierten Umfeld.

Was ein Warnzeichen ist: Beschreibungen, die genauso für Claude Desktop oder ChatGPT Plus zutreffen könnten. “Es versteht Ihre E-Mails”, “Es fasst Dokumente zusammen”, “Es beantwortet Fragen auf Ihren Daten” sind keine Produktmerkmale. Das sind Modellfähigkeiten.

Der nüchterne Preisvergleich macht die Frage scharf: Ein Claude-Pro- oder ChatGPT-Plus-Zugang liegt aktuell bei etwa 20 Euro pro Monat und Nutzer. Viele KI-Produkte verlangen ein Mehrfaches davon. Die einzige Frage, die zählt: Rechtfertigt der Mehrwert des Wrappers diese Preisdifferenz in Ihrem konkreten Einsatzfall? In manchen Fällen ja, wenn spezifische Datenanbindung, Compliance oder Branchenlogik tatsächlich mitgebaut wurden. In vielen Fällen nein, und dann ist die Direktnutzung des Modells die ehrlichere Lösung.

Frage 4: “Zeigen Sie mir das an unseren echten Daten, nicht an Ihren Beispielen”

Die wichtigste Frage überhaupt. Demos laufen mit idealen Daten: sauberen PDFs, perfekt formatierten E-Mails, einfachen Fällen. Ihre Realität sieht anders aus.

Was ein guter Anbieter macht: Er nimmt eine kleine, anonymisierte Stichprobe Ihrer Daten (nach DSGVO-sauberer Klärung) und zeigt Ihnen das Ergebnis mit allen Problemen, die dabei auftauchen. Bei professionellen Anbietern ist das ein Standardschritt im Vorvertrag.

Was ein Warnzeichen ist: Weigerung (“Unsere Demos sind repräsentativ”), Verzögerung (“Das können wir in Phase 2 nach dem Kauf machen”) oder die Aussage, dass man zuerst “Ihre Daten aufbereiten” müsse, damit das Tool überhaupt funktioniert.

Ein Wrapper kann Ihre echten Daten oft nicht gut verarbeiten, weil die eigentliche Leistung im domänenspezifischen Prompt und in der Datenaufbereitung liegt. Beides hat der Anbieter nicht für Ihre Branche gebaut.

Was eine gute Antwort wirklich aussagt

Ein Anbieter muss bei allen vier Fragen keine perfekten Antworten geben. Aber er muss Antworten haben. Ausweichen, Vagheit oder Marketing-Sprache bei Fragen zu Modellen, Architektur und Kosten sind deutliche Signale.

Die Unterscheidung, die Sie treffen wollen, ist nicht “gute KI versus schlechte KI”. Sie lautet: Gibt es hier ein echtes Produkt mit eigener Logik? Oder bezahle ich einen Zwischenhändler für etwas, das ich mit vertretbarem Aufwand selbst haben könnte?

Die unbequeme Alternative

In vielen Fällen, gerade im klassischen Office-Umfeld, lautet die ehrliche Antwort: Für Ihr konkretes Problem braucht es weder einen Wrapper noch ein spezialisiertes KI-Produkt. Ein zielgerichtetes Skript, das eine bestehende API sauber nutzt, löst das Problem in Stunden statt in Wochen, zu einem Bruchteil der Kosten.

Das ist die Antwort, die ein guter externer Berater geben sollte, auch wenn sie den eigenen Verkauf nicht bedient.

KI-Wrapper erkennen: Vier Fragen an jeden Automatisierungsanbieter