Entschuldigung, sprechen Sie…?

Welche „Sprache“ ist am besten für die Arbeit mit KI?

Wenn ich mit KI arbeite, spreche ich in mehreren „Sprachen“ zugleich: natürliche Sprache (meine Prompts), Python (Tooling & Pipelines), SQL (Daten holen/prüfen) und JSON (Struktur & Schnittstellen). Die beste Sprache ist nicht entweder-oder, sondern ein Stapel, in dem jede Ebene einen klaren Job hat.

Im Studium (und später im Job) geht es selten um den ausgefeiltesten Algorithmus, sondern darum, verlässliche Ergebnisse reproduzierbar zu erzeugen. Dafür kombiniere ich vier Sprachen strategisch:

Ich denke und steuere in natürlicher Sprache.
Ich baue mit Python.
Ich frage und prüfe mit SQL.
Ich übergebe und versioniere mit JSON.
So entsteht ein robuster Workflow von der Idee bis zum Output.

Natürliche Sprache: Prompting als Programmiersprache des Denkens

In der Zusammenarbeit mit KI ist meine natürliche Sprache die oberste Steuerschicht. Gute Prompts sind wie Testspezifikationen: Ziele, Randbedingungen, Beispiele, Qualitätskriterien.
Best Practices (kompakt):

Ziel vorgeben: Aufgabe, Zielpublikum, Qualitätsmaß (z. B. APA-Stil, Studienkontext).
Kontext bündeln: Eingaben, Datenannahmen, Risiken.
Format fixieren: Erwartete Abschnitte, Tabellenschemata, JSON-Schemas.
Eval-Schleife: „Verbessere entlang dieser Metrik…“ + kurze Iterationen.
Wann unsicher? Immer dann, wenn ich keine objektiven Kriterien nenne. Dann liefert die KI zwar etwas, aber ich kann es nicht prüfen.

Python: Klebstoff zwischen Modellen, Daten und Evaluierung

Python ist das Arbeitsross: Daten laden, Vorverarbeiten, Modellschnittstellen, Auswertungen, kleine UIs/Notebooks.
Warum Python für KI?

Reifes Ökosystem (z. B. pandas, numpy, scikit-learn, matplotlib, Vektordatenbanken-Clients, SDKs der Modellanbieter).
Schnelle Prototyp-→-Produktions-Brücke (CLI-Tools, Skripte, Jobs).
Einheitliche Eval-Pipelines: Genau hier überprüfe ich, ob das, was die KI „gut“ nennt, auch messbar gut ist.

Mini-Beispiel (Denkmuster statt Boilerplate):

# Pseudocode: Prompt → Antwort → Strukturprüfung → Persistenz
prompt = make_prompt(task="Erzeuge Lernkarten zu SQL-Joins", constraints=["kurz", "Beispieltabellen"])
raw = llm.generate(prompt)
cards = json.loads(raw)            # Erwartetes JSON-Format
assert validate(cards, schema)     # Schema-Check
save_to_parquet(cards, "cards.snappy.parquet")

So verdrahte ich Sprache (Prompt), JSON (Format), Python (Glue) – und habe am Ende prüfbare Artefakte.

SQL: Wahrheit aus den Daten holen

SQL ist die Prüfsprache. Bevor ich ein KI-Ergebnis übernehme, stelle ich Fragen an die Datenbank: Stimmt das? Wie oft? Seit wann?
Typische Muster:

Ground-Truth bauen: Gold-Sets mit SELECT … WHERE + manuellem Labeling.
Plausibilitätschecks: Aggregationen, Ausreißer, Deduplikation (GROUP BY, COUNT(DISTINCT)).
Retrieval für RAG: Saubere SELECT-Abfragen sind die Grundlage, bevor ich Vektorsuche einbaue.

Beispiel-Snippets (Denkmuster):

-- Gold-Set für Evaluierung
SELECT id, true_label, predicted_label
FROM eval_samples
WHERE split = 'test';

-- Plausibilitäts-Check: Häufigste Modellfehler
SELECT predicted_label, true_label, COUNT(*) AS n
FROM eval_confusion
GROUP BY 1,2
ORDER BY n DESC;

JSON: Gemeinsame, maschinenlesbare Vertragssprache

JSON ist die Vertragsschicht zwischen Menschen, KI-Modellen und Tools. Es zwingt zur Explizitheit: Welche Felder, welcher Typ, welche optional?
Warum ich JSON konsequent nutze:

Serialisierung: Prompt-Vorgaben, Modellantworten, Auswertungen – alles wird speicher- und versionsfähig.
Validierung: Mit Schemas (z. B. JSON Schema) fange ich Halluzinationen als Formatfehler ab, bevor sie Berichtstexte zerstören.
Portabilität: Von Notebook zu API zu Datenbank – ohne Reibungsverluste.

Beispiel-Schema (gekürzt):

{
  "title": "Lernkarte",
  "type": "object",
  "required": ["frage", "antwort", "schwierigkeitsgrad"],
  "properties": {
    "frage": {"type": "string"},
    "antwort": {"type": "string"},
    "schwierigkeitsgrad": {"type": "integer", "minimum": 1, "maximum": 5},
    "tags": {"type": "array", "items": {"type": "string"}}
  }
}

Die beste Sprache? Der abgestimmte Vierklang

Natürliche Sprache für Zielklarheit und Qualitätsspezifikation.
Python für Automatisierung, Ausführung und Evaluierung.
SQL für Daten-Wahrheit und Retrievability.
JSON als belastbarer Vertrag zwischen allen Teilen.

Für Studierende heißt das: Lerne die Rollen, nicht nur die Syntax. Ein kleines, sauberes Setup aus diesen vier Sprachen bringt dich weiter als die nächste „magische“ Library.

Forschungstagebuch

Heute habe ich mein eigenes Setup reflektiert: Immer wenn Ergebnisse wackeln, fehlt entweder ein Prompt-Kriterium, ein SQL-Check, oder ein JSON-Schema. Sobald ich diese drei schärfe, wird Python-Code einfacher – und die KI-Antworten stabiler.

Eine Erfahrung, die ich immer wieder mache: Die meisten LLMs sind originär in Englisch “erdacht” und “konzipiert”. KI versteht zwar nahezu alle Sprachen. Aber: Die originäre Sprachlogik ist Englisch. Wer z.B. Deutsch prompted sollte immer auch überlegen, welche Übersetzungsfehler in Englisch damit wahrscheinlich(!) sind. Ein ganz konkretes Beispiel, das auch alle Deutschlerner beschäftigt:

der, die, das –> the, the, the

Leitfragen

Welche Qualitätskriterien schreibe ich der KI in natürlicher Sprache konkret vor?
Wo kann ich mit SQL eine schnelle Plausibilitätsprüfung ergänzen?
Welches JSON-Schema brauche ich, um Antworten maschinenlesbar zu validieren?
Welche Teile meines Workflows kann ich mit Python automatisieren, damit Evaluierung zur Routine wird?

Discover more from SocioloVerse.AI

Subscribe to get the latest posts sent to your email.

One Response

Pingback: Vortrag: KI in der Verwaltung und Wissenschaft – Der KI Kompass für Studierende