KI, die etwas Nützliches tut — kein Chatbot im Zylinder.
Sie brauchen kein weiteres ChatGPT-Abo. Sie brauchen KI, die den konkreten Kram erledigt, der Ihre Woche auffrisst — Angebote entwerfen, dieselbe Kundenfrage zum 40. Mal heute beantworten, die Historie eines Kunden zusammenfassen, bevor Sie zum Hörer greifen. Eingebettet in die Tools, die Sie ohnehin nutzen, gestützt auf Ihre Daten, preislich so kalkuliert, dass die Rechnung aufgeht. Ab $500.
Lohnt sich KI tatsächlich für Ihr Geschäft?
Klartext, gleich vorweg.
KI rechnet sich vermutlich, wenn…
- Sie dieselbe Aufgabe immer wieder erledigen — Angebote entwerfen, dieselbe Frage beantworten, Rechnungen sortieren — und es jede Woche Stunden frisst.
- Sie einen Berg Daten haben (Aufträge, Tickets, E-Mails, PDFs, Gesprächsnotizen), die niemand Zeit hat zu lesen, in denen aber Antworten schlummern.
- Ihr Team täglich dieselben 10 Fragen von Kunden bekommt, und Ihre Website sie beantworten könnte, wenn sie wüsste wie.
- Sie mehr Aufträge annehmen wollen, ohne eine weitere Person einzustellen, um den Admin zu erledigen, der damit kommt.
- Sie selbst mit ChatGPT herumgespielt und gedacht haben: "Es muss doch einen Weg geben, das in mein tatsächliches Geschäft zu verdrahten, nicht in einen separaten Browser-Tab."
Besser noch warten, wenn…
- Das eigentliche Problem ist, dass Sie die Daten noch nicht haben. KI ohne Grundlage ist eine Halluzinationsmaschine — erst die Daten klären, dann sprechen wir.
- Sie "eine KI" wollen, aber keine konkrete Aufgabe benennen können, die sie erledigen soll. Kommen Sie mit einer echten Sache auf Ihrem Tisch zurück, und wir bauen eine gute Antwort darauf.
- Ihr Team den Prozess bereits in einer Tabelle gelöst hat und das gut funktioniert. Sparen Sie Ihr Geld — das sage ich Ihnen im Gespräch.
- Sie KI hinterherjagen, weil es Trend ist. Kunden interessieren sich nicht dafür, was unter der Haube steckt — sie interessieren sich dafür, ob Sie ans Telefon gehen.
Wenn Sie nicht sicher sind, auf welcher Seite Sie stehen — genau dafür ist das kostenlose Gespräch da.
Was jedes KI-Feature, das ich baue, standardmäßig bekommt.
Keine Upsells. Wie ich KI ehrlich halte.
- Gestützt auf Ihre echten Daten
- Kosten ab Tag eins getrackt
- Antworten in unter 3 Sekunden
- Sie sehen, was sie tut
- Backup-Plan, wenn sie ausfällt
- Menschliche Freigabe für Risikoentscheidungen
- Ihnen gehören Prompts und Daten
Wie ich KI-Features tatsächlich baue.
Pro Aufgabe gewählt. Eingebettet, wo die Arbeit ohnehin passiert. Gemessen, bevor es eine Beförderung verdient.
Das richtige Werkzeug für die Aufgabe
Claude für denklastiges Zeug, OpenAI für schnelle Klassifikation und Extraktion, kleinere, günstigere Modelle für die hochvolumige Fleißarbeit. Gemischt und gematcht, nicht an einen Anbieter gebunden — wenn nächsten Monat ein besseres Modell rauskommt, upgraden Sie mit einer Config-Änderung, nicht mit einem Neuschreiben.
Es liest Ihre Sachen, bevor es antwortet
Die KI zieht aus Ihren Dokumenten, PDFs, Aufträgen, vergangenen Kunden-E-Mails — was immer relevant ist — und nennt ihre Quellen. Das ist der Großteil des Unterschieds zwischen "nützlich" und "peinlich". Keine erfundenen Preise mehr, keine erfundenen Regeln, keine erfundenen Nachnamen.
Getestet, bevor es ausgeliefert wird
Bevor irgendetwas live geht, lasse ich es gegen 30–100 echte Beispiele aus Ihrem tatsächlichen Geschäft laufen und bewerte es. Genauigkeit, Kosten pro Antwort, wie oft es ablehnt. Wenn die Zahlen die Messlatte nicht reißen, tunen wir oder brechen ab — Sie zahlen nicht für Produktionscode, der den Test nicht besteht.
Eingebettet, wo Sie ohnehin arbeiten
KI taucht in Ihrer Website, Ihrer App, Ihren E-Mail-Entwürfen, Ihrem Power Automate Flow auf — nicht als weiterer Tab, an den man denken muss. Das beste KI-Feature ist das, in das sich niemand einloggen muss.
Ich liefere täglich KI aus — meine und die von Kunden.
Ich schreibe täglich Produktionscode mit Claude, lasse mehrstufige KI-Workflows in meiner eigenen Rec Soccer-App laufen und habe in einer früheren Rolle rund $40K/Jahr an Anbieter-Reporting durch KI-gestützte Automatisierung ersetzt. Ich verkaufe nicht etwas, worüber ich gelesen habe — ich verkaufe, was bereits auf meinen eigenen Maschinen läuft.
Die KI-Modelle, die Ihren Build antreiben.
Ich bin nicht an einen Anbieter gebunden. Ich wähle das Modell, das bei Ihrer Aufgabe gewinnt — Genauigkeit, Kosten und Geschwindigkeit — und tausche es, wenn ein besseres rauskommt. Die Nutzung wird auf Ihr Konto abgerechnet, nicht auf meins, damit Sie nie einen Token-Aufschlag zahlen.
Claude
AnthropicMein Standard für Reasoning, Long-Context-Arbeit, sorgfältiges Schreiben und Tool Use. Claude Sonnet für die meisten Aufgaben, Opus für die harten.
GPT
OpenAIGünstige, schnelle Klassifikation und strukturierte Extraktion. Meine erste Wahl, wenn Sie "lies diese E-Mail und zieh die Rechnungsnummer raus" in großem Stil brauchen.
Gemini
GoogleRiesige Kontextfenster und starkes Multimodal — ganze PDFs, lange Meeting-Transkripte oder komplette Codebasen in einem Durchgang. Spielt gut mit Google-Workspace-Daten.
Llama
MetaOpen-Weight-Modelle für den Fall, dass Sie es selbst betreiben müssen — auf eigenen Servern, in regulierten Branchen oder um Daten komplett aus einer Drittanbieter-API herauszuhalten.
ElevenLabs
VoiceDie beste Stimme, die ich gehört habe — geklonte Stimmen, mehrsprachig, dialogfähige Agenten. Wo KI wie ein Mensch klingen muss, ist das die Wahl.
Sora + Nano Banana
OpenAI · GoogleVideo von Sora, Bilder von Nano Banana (Googles Gemini 2.5 Flash Image). Für Marketingmaterial, Demo-Reels, Werbekreation, Produkt-Mockups und Social Posts — wenn Sie kein Kamerateam und keinen Designer im Budget haben.
sora.com deepmind.googlePlus Spezialdienste, wenn sie sich lohnen — Whisper und Deepgram für Speech-to-Text, Azure OpenAI oder Amazon Bedrock für regulierte oder Enterprise-Verträge, Hugging Face für den Long Tail offener Modelle. Was auch immer bei Ihrer Aufgabe gewinnt.
Drei Einstiege. Wählen Sie, was passt.
Jedes Paket ist auf Ihre Daten gestützt, vor dem Launch evaluiert und gehört Ihnen. Die Spannen sind typisch — nach einem Erstgespräch schicke ich ein festes, einseitiges Angebot.
Spark
- Zeitrahmen
- 1–2 Wochen
- Umfang
- Einzel-Feature
- Sprachen
- Englisch
- Discovery zur tatsächlichen Aufgabe — was drin ist, was gut ist, was kaputt ist
- Modell + Prompt gewählt und gegen 30+ echte Beispiele getuned
- Strukturierter Output (JSON Schema), damit nachgelagerte Tools ihn nutzen können
- Verdrahtet mit Ihrem bestehenden Posteingang, CRM, Sheet oder Workflow
Stack
- Zeitrahmen
- 3–5 Wochen
- Umfang
- Mehrstufiger Workflow
- Sprachen
- Englisch + 1
- Alles aus Spark
- RAG-Pipeline über Ihre Dokumente, PDFs, Sheets, Notion oder Slack-Export
- Vector Store + Chunking-Strategie, abgestimmt auf Ihre Inhalte
- Quellenangaben bei jeder Antwort — keine "Vertrau mir"-Antworten
Suite
- Zeitrahmen
- 6–12 Wochen
- Umfang
- Mehrere Features, App-eingebettet
- Sprachen
- 2–12 Sprachen
- Alles aus Stack
- Tool Use — KI, die Ihre APIs, CRM, Kalender, ERP oder eigene Endpunkte aufruft
- Mehrstufige Agent-Loops mit Retries, Fallbacks und menschlichen Freigabe-Gates
- Multimodal, wo es sich rechnet — Sprache (STT/TTS), Bilder, PDFs
Extras, wenn sie sich rechnen.
Stecken Sie diese in jedes Paket oder fügen Sie sie später hinzu, wenn der Use-Case wächst.
RAG-Korpus / Vector Store
$800–$2.5KAufnehmen, chunken, embedden und indexieren Ihrer Dokumente — plus ein Re-Ingest-Job für den Fall, dass sich Inhalte ändern. Firestore Vector, Pinecone oder pgvector.
Sprache (STT + TTS)
$1K–$3KWhisper oder Deepgram für Speech-to-Text, ElevenLabs oder OpenAI-Stimmen für Antworten. Telefon, Browser oder in der App.
Vision / Bildverständnis
$800–$2KBelege, Ausweise, Formulare, Screenshots, Produktfotos lesen. Strukturierte Daten extrahieren oder Fragen zum Inhalt beantworten.
Eval-Harness
$600–$1.5KEin Testset, ein Bewertungsraster und ein Ein-Befehl-Runner, damit Sie die Auswirkung jeder Prompt- oder Modelländerung vor dem Ausliefern sehen.
Prompt-Versionierungs-UI
$1K–$2.5KEin kleines Admin-Panel, in dem Sie Prompts bearbeiten, Varianten A/B-testen und zurückrollen können — ohne die App neu zu deployen.
Monatlicher KI-Retainer
$300–$1K / MonatPrompt-Tuning, Kostenmonitoring, Modell-Upgrades, wenn neue rauskommen, und "Warum hat es das gemacht"-Untersuchungen — auf Abruf.
Wie ein KI-Projekt tatsächlich abläuft.
Keine Zauberstab-Demos. Ein Gespräch, ein abgegrenzter Pilot, echte Messung, dann Produktion — oder ein ehrlicher Stopp.
20-Minuten-Discovery-Gespräch
Ich frage, welche Aufgabe Sie lösen wollen, wer sie heute macht, wie "gut" aussieht und wo die Daten liegen. Wenn KI nicht das richtige Werkzeug ist, sage ich das — manchmal ist ein Power Automate Flow oder eine SQL-View die Antwort.
Abgegrenzter Pilot
Innerhalb von 48 Stunden bekommen Sie ein Festpreis-Angebot — ein Feature, ein Modell, eine Erfolgsmetrik. Wir bauen gegen 30–100 echte Beispiele aus Ihren Daten, nicht erfundene.
Mit Evals messen
Bevor irgendetwas live geht, bewerten wir es. Genauigkeit, Kosten pro Aufruf, p95-Latenz, Ablehnungsquote. Wenn die Zahlen die Messlatte nicht reißen, tunen wir, tauschen Modelle oder brechen ab — Sie zahlen nicht für Produktionscode, der den Test nicht besteht.
Ausliefern und iterieren
Live in Ihrer App, in Echtzeit überwacht, mit Logs, die Sie sehen. Die meisten Kunden behalten mich auf einem kleinen Retainer, um Prompts zu tunen und Modell-Upgrades mitzunehmen; einige nicht. Beides ist in Ordnung.
Dinge, die Leute meistens fragen.
Weniger als in den Demos, die Sie gesehen haben, aber nie null — deshalb ist jeder Build auf Ihre Daten mit Retrieval gestützt, mit strukturierten Outputs validiert und gegen echte Beispiele gemessen, bevor er ausgeliefert wird. Für Aufgaben mit hohem Einsatz füge ich einen menschlichen Freigabeschritt hinzu. Die ehrliche Antwort lautet: KI macht Fehler, und die Engineering-Arbeit besteht darin, sie abzufangen, bevor der Nutzer sie sieht.
Ihrer, direkt auf Ihr OpenAI- / Anthropic-Konto abgerechnet. Ich verkaufe keine Tokens weiter und nehme keinen Aufschlag auf die Nutzung. Sie sehen genau, was jeder Aufruf kostet, und wenn wir uns je trennen, bleiben die Keys (und die Ausgaben) bei Ihnen.
Für ein Spark-Feature oft $5–$50/Monat an API-Aufrufen. Für einen Stack-Assistenten mit RAG typischerweise $30–$300/Monat je nach Traffic. Mit aktiviertem Prompt-Caching können wiederkehrende Queries 50–80% günstiger werden. Ich zeige Ihnen das Dashboard ab Tag eins, damit es keine Überraschungen gibt.
OpenAI und Anthropic trainieren vertraglich beide standardmäßig nicht auf API-Traffic. Ihre Daten liegen in Ihren Konten (Firestore, Pinecone, S3 — was immer Sie nutzen), die KI-Aufrufe passieren serverseitig aus Ihrer Infrastruktur, und nichts wird bei einem Drittanbieter-SaaS geloggt, es sei denn, Sie fordern es an. Für regulierte Arbeit kann ich auch Azure OpenAI oder Bedrock für zusätzliche vertragliche Absicherung nutzen.
Alle, pro Aufgabe ausgewählt. Claude (Sonnet/Opus) ist mein Standard für Reasoning, sorgfältiges Schreiben und Tool Use. OpenAI GPT ist großartig für günstige, schnelle Klassifikation und strukturierte Extraktion im Volumen. Google Gemini gewinnt, wenn der Kontext riesig ist — ganze PDFs, lange Meeting-Transkripte, komplette Codebasen — oder wenn die Daten ohnehin in Google Workspace liegen. Meta Llama ist die Wahl, wenn Sie das Modell auf eigenen Servern betreiben müssen, in einer regulierten Branche, oder um Daten komplett aus einer Drittanbieter-API herauszuhalten. Für Stimme setze ich auf ElevenLabs; für Video und Bilder Sora und Nano Banana (Googles Gemini 2.5 Flash Image). Dieselbe Codebasis, Wechsel mit einer Config-Änderung — wenn das nächste Modell rauskommt, upgraden Sie ohne Neuschreiben.
Sagen Sie mir, welche Aufgabe Sie nicht mehr machen wollen. Ich sage Ihnen, ob KI die richtige Lösung ist.
Erstgespräche dauern etwa 20 Minuten. Sie gehen mit einem klareren Plan raus — einem abgegrenzten Piloten, einer Empfehlung oder einem ehrlichen "Das ist ein Tabellenproblem, kein KI-Problem." Alle drei kommen vor.