Leistungen Websites Apps KI Automatisierung Daten & Dashboards Beratung Projekte Über Kontakt Gespräch buchen
KI für Ihr Unternehmen

KI, die etwas Nützliches tut — kein Chatbot im Zylinder.

Sie brauchen kein weiteres ChatGPT-Abo. Sie brauchen KI, die den konkreten Kram erledigt, der Ihre Woche auffrisst — Angebote entwerfen, dieselbe Kundenfrage zum 40. Mal heute beantworten, die Historie eines Kunden zusammenfassen, bevor Sie zum Hörer greifen. Eingebettet in die Tools, die Sie ohnehin nutzen, gestützt auf Ihre Daten, preislich so kalkuliert, dass die Rechnung aufgeht. Ab $500.

Kein Demo-Theater — einfach etwas, das sich rechnet.

Lohnt sich KI tatsächlich für Ihr Geschäft?

Klartext, gleich vorweg.

check_circle

KI rechnet sich vermutlich, wenn…

  • check_circleSie dieselbe Aufgabe immer wieder erledigen — Angebote entwerfen, dieselbe Frage beantworten, Rechnungen sortieren — und es jede Woche Stunden frisst.
  • check_circleSie einen Berg Daten haben (Aufträge, Tickets, E-Mails, PDFs, Gesprächsnotizen), die niemand Zeit hat zu lesen, in denen aber Antworten schlummern.
  • check_circleIhr Team täglich dieselben 10 Fragen von Kunden bekommt, und Ihre Website sie beantworten könnte, wenn sie wüsste wie.
  • check_circleSie mehr Aufträge annehmen wollen, ohne eine weitere Person einzustellen, um den Admin zu erledigen, der damit kommt.
  • check_circleSie selbst mit ChatGPT herumgespielt und gedacht haben: "Es muss doch einen Weg geben, das in mein tatsächliches Geschäft zu verdrahten, nicht in einen separaten Browser-Tab."
pause_circle

Besser noch warten, wenn…

  • remove_circle_outlineDas eigentliche Problem ist, dass Sie die Daten noch nicht haben. KI ohne Grundlage ist eine Halluzinationsmaschine — erst die Daten klären, dann sprechen wir.
  • remove_circle_outlineSie "eine KI" wollen, aber keine konkrete Aufgabe benennen können, die sie erledigen soll. Kommen Sie mit einer echten Sache auf Ihrem Tisch zurück, und wir bauen eine gute Antwort darauf.
  • remove_circle_outlineIhr Team den Prozess bereits in einer Tabelle gelöst hat und das gut funktioniert. Sparen Sie Ihr Geld — das sage ich Ihnen im Gespräch.
  • remove_circle_outlineSie KI hinterherjagen, weil es Trend ist. Kunden interessieren sich nicht dafür, was unter der Haube steckt — sie interessieren sich dafür, ob Sie ans Telefon gehen.
Unsicher? Gespräch buchen →

Wenn Sie nicht sicher sind, auf welcher Seite Sie stehen — genau dafür ist das kostenlose Gespräch da.

Was jedes KI-Feature, das ich baue, standardmäßig bekommt.

Keine Upsells. Wie ich KI ehrlich halte.

Wie ich KI-Features tatsächlich baue.

Pro Aufgabe gewählt. Eingebettet, wo die Arbeit ohnehin passiert. Gemessen, bevor es eine Beförderung verdient.

code

Das richtige Werkzeug für die Aufgabe

Claude für denklastiges Zeug, OpenAI für schnelle Klassifikation und Extraktion, kleinere, günstigere Modelle für die hochvolumige Fleißarbeit. Gemischt und gematcht, nicht an einen Anbieter gebunden — wenn nächsten Monat ein besseres Modell rauskommt, upgraden Sie mit einer Config-Änderung, nicht mit einem Neuschreiben.

translate

Es liest Ihre Sachen, bevor es antwortet

Die KI zieht aus Ihren Dokumenten, PDFs, Aufträgen, vergangenen Kunden-E-Mails — was immer relevant ist — und nennt ihre Quellen. Das ist der Großteil des Unterschieds zwischen "nützlich" und "peinlich". Keine erfundenen Preise mehr, keine erfundenen Regeln, keine erfundenen Nachnamen.

cloud_done

Getestet, bevor es ausgeliefert wird

Bevor irgendetwas live geht, lasse ich es gegen 30–100 echte Beispiele aus Ihrem tatsächlichen Geschäft laufen und bewerte es. Genauigkeit, Kosten pro Antwort, wie oft es ablehnt. Wenn die Zahlen die Messlatte nicht reißen, tunen wir oder brechen ab — Sie zahlen nicht für Produktionscode, der den Test nicht besteht.

folder_shared

Eingebettet, wo Sie ohnehin arbeiten

KI taucht in Ihrer Website, Ihrer App, Ihren E-Mail-Entwürfen, Ihrem Power Automate Flow auf — nicht als weiterer Tab, an den man denken muss. Das beste KI-Feature ist das, in das sich niemand einloggen muss.

Ich liefere täglich KI aus — meine und die von Kunden.

Ich schreibe täglich Produktionscode mit Claude, lasse mehrstufige KI-Workflows in meiner eigenen Rec Soccer-App laufen und habe in einer früheren Rolle rund $40K/Jahr an Anbieter-Reporting durch KI-gestützte Automatisierung ersetzt. Ich verkaufe nicht etwas, worüber ich gelesen habe — ich verkaufe, was bereits auf meinen eigenen Maschinen läuft.

Die KI-Modelle, die Ihren Build antreiben.

Ich bin nicht an einen Anbieter gebunden. Ich wähle das Modell, das bei Ihrer Aufgabe gewinnt — Genauigkeit, Kosten und Geschwindigkeit — und tausche es, wenn ein besseres rauskommt. Die Nutzung wird auf Ihr Konto abgerechnet, nicht auf meins, damit Sie nie einen Token-Aufschlag zahlen.

Plus Spezialdienste, wenn sie sich lohnen — Whisper und Deepgram für Speech-to-Text, Azure OpenAI oder Amazon Bedrock für regulierte oder Enterprise-Verträge, Hugging Face für den Long Tail offener Modelle. Was auch immer bei Ihrer Aufgabe gewinnt.

Drei Einstiege. Wählen Sie, was passt.

Jedes Paket ist auf Ihre Daten gestützt, vor dem Launch evaluiert und gehört Ihnen. Die Spannen sind typisch — nach einem Erstgespräch schicke ich ein festes, einseitiges Angebot.

Spark

Typische Spanne $500–$2K
Zeitrahmen
1–2 Wochen
Umfang
Einzel-Feature
Sprachen
Englisch
  • check_circleDiscovery zur tatsächlichen Aufgabe — was drin ist, was gut ist, was kaputt ist
  • check_circleModell + Prompt gewählt und gegen 30+ echte Beispiele getuned
  • check_circleStrukturierter Output (JSON Schema), damit nachgelagerte Tools ihn nutzen können
  • check_circleVerdrahtet mit Ihrem bestehenden Posteingang, CRM, Sheet oder Workflow
Spark-Projekt starten arrow_forward

Suite

Typische Spanne $8K–$15K+
Zeitrahmen
6–12 Wochen
Umfang
Mehrere Features, App-eingebettet
Sprachen
2–12 Sprachen
  • check_circleAlles aus Stack
  • check_circleTool Use — KI, die Ihre APIs, CRM, Kalender, ERP oder eigene Endpunkte aufruft
  • check_circleMehrstufige Agent-Loops mit Retries, Fallbacks und menschlichen Freigabe-Gates
  • check_circleMultimodal, wo es sich rechnet — Sprache (STT/TTS), Bilder, PDFs
Suite-Projekt starten arrow_forward

Extras, wenn sie sich rechnen.

Stecken Sie diese in jedes Paket oder fügen Sie sie später hinzu, wenn der Use-Case wächst.

RAG-Korpus / Vector Store

$800–$2.5K

Aufnehmen, chunken, embedden und indexieren Ihrer Dokumente — plus ein Re-Ingest-Job für den Fall, dass sich Inhalte ändern. Firestore Vector, Pinecone oder pgvector.

Sprache (STT + TTS)

$1K–$3K

Whisper oder Deepgram für Speech-to-Text, ElevenLabs oder OpenAI-Stimmen für Antworten. Telefon, Browser oder in der App.

Vision / Bildverständnis

$800–$2K

Belege, Ausweise, Formulare, Screenshots, Produktfotos lesen. Strukturierte Daten extrahieren oder Fragen zum Inhalt beantworten.

Eval-Harness

$600–$1.5K

Ein Testset, ein Bewertungsraster und ein Ein-Befehl-Runner, damit Sie die Auswirkung jeder Prompt- oder Modelländerung vor dem Ausliefern sehen.

Prompt-Versionierungs-UI

$1K–$2.5K

Ein kleines Admin-Panel, in dem Sie Prompts bearbeiten, Varianten A/B-testen und zurückrollen können — ohne die App neu zu deployen.

Monatlicher KI-Retainer

$300–$1K / Monat

Prompt-Tuning, Kostenmonitoring, Modell-Upgrades, wenn neue rauskommen, und "Warum hat es das gemacht"-Untersuchungen — auf Abruf.

Wie ein KI-Projekt tatsächlich abläuft.

Keine Zauberstab-Demos. Ein Gespräch, ein abgegrenzter Pilot, echte Messung, dann Produktion — oder ein ehrlicher Stopp.

01

20-Minuten-Discovery-Gespräch

Ich frage, welche Aufgabe Sie lösen wollen, wer sie heute macht, wie "gut" aussieht und wo die Daten liegen. Wenn KI nicht das richtige Werkzeug ist, sage ich das — manchmal ist ein Power Automate Flow oder eine SQL-View die Antwort.

02

Abgegrenzter Pilot

Innerhalb von 48 Stunden bekommen Sie ein Festpreis-Angebot — ein Feature, ein Modell, eine Erfolgsmetrik. Wir bauen gegen 30–100 echte Beispiele aus Ihren Daten, nicht erfundene.

03

Mit Evals messen

Bevor irgendetwas live geht, bewerten wir es. Genauigkeit, Kosten pro Aufruf, p95-Latenz, Ablehnungsquote. Wenn die Zahlen die Messlatte nicht reißen, tunen wir, tauschen Modelle oder brechen ab — Sie zahlen nicht für Produktionscode, der den Test nicht besteht.

04

Ausliefern und iterieren

Live in Ihrer App, in Echtzeit überwacht, mit Logs, die Sie sehen. Die meisten Kunden behalten mich auf einem kleinen Retainer, um Prompts zu tunen und Modell-Upgrades mitzunehmen; einige nicht. Beides ist in Ordnung.

Dinge, die Leute meistens fragen.

Weniger als in den Demos, die Sie gesehen haben, aber nie null — deshalb ist jeder Build auf Ihre Daten mit Retrieval gestützt, mit strukturierten Outputs validiert und gegen echte Beispiele gemessen, bevor er ausgeliefert wird. Für Aufgaben mit hohem Einsatz füge ich einen menschlichen Freigabeschritt hinzu. Die ehrliche Antwort lautet: KI macht Fehler, und die Engineering-Arbeit besteht darin, sie abzufangen, bevor der Nutzer sie sieht.

Ihrer, direkt auf Ihr OpenAI- / Anthropic-Konto abgerechnet. Ich verkaufe keine Tokens weiter und nehme keinen Aufschlag auf die Nutzung. Sie sehen genau, was jeder Aufruf kostet, und wenn wir uns je trennen, bleiben die Keys (und die Ausgaben) bei Ihnen.

Für ein Spark-Feature oft $5–$50/Monat an API-Aufrufen. Für einen Stack-Assistenten mit RAG typischerweise $30–$300/Monat je nach Traffic. Mit aktiviertem Prompt-Caching können wiederkehrende Queries 50–80% günstiger werden. Ich zeige Ihnen das Dashboard ab Tag eins, damit es keine Überraschungen gibt.

OpenAI und Anthropic trainieren vertraglich beide standardmäßig nicht auf API-Traffic. Ihre Daten liegen in Ihren Konten (Firestore, Pinecone, S3 — was immer Sie nutzen), die KI-Aufrufe passieren serverseitig aus Ihrer Infrastruktur, und nichts wird bei einem Drittanbieter-SaaS geloggt, es sei denn, Sie fordern es an. Für regulierte Arbeit kann ich auch Azure OpenAI oder Bedrock für zusätzliche vertragliche Absicherung nutzen.

Alle, pro Aufgabe ausgewählt. Claude (Sonnet/Opus) ist mein Standard für Reasoning, sorgfältiges Schreiben und Tool Use. OpenAI GPT ist großartig für günstige, schnelle Klassifikation und strukturierte Extraktion im Volumen. Google Gemini gewinnt, wenn der Kontext riesig ist — ganze PDFs, lange Meeting-Transkripte, komplette Codebasen — oder wenn die Daten ohnehin in Google Workspace liegen. Meta Llama ist die Wahl, wenn Sie das Modell auf eigenen Servern betreiben müssen, in einer regulierten Branche, oder um Daten komplett aus einer Drittanbieter-API herauszuhalten. Für Stimme setze ich auf ElevenLabs; für Video und Bilder Sora und Nano Banana (Googles Gemini 2.5 Flash Image). Dieselbe Codebasis, Wechsel mit einer Config-Änderung — wenn das nächste Modell rauskommt, upgraden Sie ohne Neuschreiben.

Lassen Sie uns reden

Sagen Sie mir, welche Aufgabe Sie nicht mehr machen wollen. Ich sage Ihnen, ob KI die richtige Lösung ist.

Erstgespräche dauern etwa 20 Minuten. Sie gehen mit einem klareren Plan raus — einem abgegrenzten Piloten, einer Empfehlung oder einem ehrlichen "Das ist ein Tabellenproblem, kein KI-Problem." Alle drei kommen vor.

— Quinton
Kostenloses Erstgespräch buchen