WORK IN PROGRESS - XX.XX.2026
Erfindergeist Jülich e.V. finanziert sich ausschließlich durch Mitgliedsbeiträge und Spenden. Wir Danken allen Unterstützern, die unsere Arbeit ermöglichen!
Spenden Konto und PayPal auf unserer Webseite https://linktree.erfindergeist.org/
Heute führen wir Sie Schritt für Schritt durch die Welt der KI — von den Grundlagen bis zu echten Unternehmensanwendungen.
Wir zeigen, demonstrieren und beantworten Ihre Fragen.
Was wir erklären:
Ziel: gemeinsames Grundverständnis für alles, was danach kommt.
Was wir live vorführen — auf unserer eigenen Hardware:
Sie sehen, wie leistungsfähig KI auf lokalem Equipment läuft.
Was wir über Cloud-Dienste zeigen:
Sie sehen den Unterschied zwischen lokalem Betrieb und Cloud-Skalierung.
Was wir über HuggingFace zeigen:
Offene Modelle, die jeder kostenlos ausprobieren kann — direkt im Browser.
Echte KI-Anwendungen aus der Praxis:
Praxisbezug für alle, die KI im Berufs- oder Unternehmenskontext einsetzen wollen.
Sie sind nicht nur Zuschauer:
Kein Vorwissen nötig — jede Frage ist willkommen.
Künstliche Intelligenz (KI) bezeichnet Computersysteme, die menschliche Fähigkeiten wie Lernen, Denken oder Entscheiden nachahmen. Indem es Mathematische Modelle und Algorithmen verwendet, kann KI Muster erkennen, Vorhersagen treffen und Probleme lösen.
KI umfasst viele Bereiche: Bilderkennung, Sprachverarbeitung, Empfehlungssysteme und mehr.
Large Language Models (LLM) sind eine spezielle Form der KI, trainiert auf riesigen Textmengen — sie verstehen und erzeugen Sprache, beantworten Fragen und helfen bei der Analyse von Informationen.
Experiment. besuchen Sie https://chatgpt.com/ und fragen Sie “Nenne mir eine zufällige Zahl.”
KI generiert Antworten, indem es die wahrscheinlichsten nächsten Wörter vorhersagt, basierend auf den Mustern, die es in den Trainingsdaten gelernt hat. Daher ist die Antwort nicht wirklich zufällig, sondern eine Zahl, die in den Trainingsdaten häufig vorkommt oder als wahrscheinlich angesehen wird. In diesem Fall könnte es sein, dass die Zahl 73 oft in den Daten vorkommt.
Token sind die kleinsten Texteinheiten, in die ein KI-Modell Text zerlegt. Gleichzeitig dienen sie als Abrechnungseinheit bei Cloud-Diensten.
Jedes Wort und Satzzeichen zählt meist als 1 Token. Leerzeichen werden typischerweise dem nächsten Token vorangestellt, nicht als eigenes Token gezählt.
Ein Token ist nicht immer ein ganzes Wort. Das Wort „Apfel” ist vielleicht ein Token, „Verständnisfragen” hingegen werden in mehrere Tokens zerlegt.
Beispiel: „Hallo Welt!” → 3 Token („Hallo”, „ Welt”, „!”).
Faustregel: 100 Token entsprechen etwa 75 Wörtern.
Interaktiv ausprobieren: platform.openai.com/tokenizer

Moderne Krimis haben etwa 100.000 Wörter, das wären ca. 133.000 Token.
Bei ChatGPT (GPT-4o) würde dies ca. 0,33 USD kosten — bei teureren Modellen entsprechend mehr (vgl. nächste Folie).
Achtung: Jedes KI-Modell hat ein begrenztes Kontextfenster — die maximale Anzahl an Token, die es auf einmal verarbeiten kann (z.B. 128.000 Token bei GPT-4o). Ein ganzes Buch übersteigt dieses Limit und müsste in kleinere Abschnitte aufgeteilt werden, was die Kosten erhöhen könnte. Das Kontextfenster erklärt auch, warum eine KI frühere Gesprächsteile “vergessen” kann.
Wer KI lokal betreiben will, muss verstehen: wie viel RAM braucht ein Modell? Das hängt direkt von den Parametern ab.
Parameter sind die gelernten Zahlenwerte eines Modells. Ein 7B-Modell enthält 7.000.000.000 solcher Zahlen — sie bestimmen gemeinsam, wie das Modell auf Eingaben reagiert.
Je mehr Parameter, desto leistungsfähiger — aber auch desto mehr RAM wird benötigt.
Präzision beschreibt, wie viele Bits eine Zahl im Modell belegt. Mehr Bits = mehr RAM, aber nicht zwingend bessere Alltagsqualität.
RAM-Bedarf bei voller Präzision (FP16 = 16 Bit pro Zahl, 2 Bytes/Parameter)
In der Praxis verwendet Ollama quantisierte Modelle (4-bit) — jede Zahl belegt nur noch 4 statt 16 Bit, der RAM-Bedarf sinkt auf 25 %, bei kaum merklichem Qualitätsverlust — z.B. ~4–5 GB für ein 7B-Modell.
Tokens pro Sekunde (TPS) ist das lokale Pendant zur Cloud-Abrechnung: statt Kosten pro Token misst man hier die Geschwindigkeit — wie viele Token das Modell pro Sekunde ausgibt.
Beispiel: eine Nvidia RTX 4090 (24 GB VRAM) erreicht mit Ollama typischerweise:
| Cloud | Lokal | |
|---|---|---|
| Token = | Abrechnungseinheit | Geschwindigkeitsmaß (TPS) |
| Typische Modelle | 500B+ Parameter | 7B–13B Parameter (quantisiert) |
| Kosten | Laufend, pro Token | Einmalig (Hardware) |
| Kontextfenster | 128K+ Token | 4K–128K Token (modellabhängig) |
| RAM-Bedarf | Kein eigener | 4–26 GB je nach Modell |
OpenSCAD ist eine Programmiersprache für 3D-Modelle — statt mit der Maus zu modellieren, beschreibt man das Modell als Code.
Das Prinzip: Prompt an Claude Code → SCAD-Code → fertiges 3D-Modell
Beispiel: Der Hexenturm Jülich — ein historisches Wahrzeichen, nachgebaut aus Code.
// Beispiel: einfacher Turm mit Kuppel
cylinder(h=50, r=10);
translate([0,0,50])
sphere(r=5);
// Beispiel: parameter
// Breite
roof_w = 100;
//Tiefe
roof_d = 90;
...
Wie Claude Code beim Modellieren hilft:
“Erstelle einen zylindrischen Turm mit konischem Dach und einer spitzen Turmspitze”
KI ersetzt hier keine CAD-Kenntnisse — sie macht den Einstieg drastisch einfacher.

Der fertige Hexenturm — vollständig aus OpenSCAD-Code generiert, mit Hilfe von Claude Code.

” Erstelle ein Rechteck wo ein Tunnel durchgeht. anbei ein Bild wie ich es mir vorstelle. Generiere Parameter für x,y,z sowie breite und höhe des quaders und Tunnels. zentriere das Objekt.”


“Entlang des Tunnels hätte ich gerne an nur einer Seite eine Verzierung. Und zwar sollen das Steine darstellen, die abwechselnd größer und kleiner werden. Oben mittig ist ein Spezialstein. Anbei ein Bild, wie ich es mir etwa vorstelle.”

Ollama ist ein lokal bereitgestellter KI-Modell-Runner, der es Benutzern ermöglicht, große Sprachmodelle (LLMs) direkt auf ihrem PC auszuführen, ohne auf Cloud-Dienste angewiesen zu sein. Es bietet eine benutzerfreundliche Oberfläche und unterstützt verschiedene KI-Modelle, die lokal installiert werden können.
OpenWeb UI ist eine Open-Source-Webanwendung, die es Benutzern ermöglicht, KI-Modelle über eine benutzerfreundliche Weboberfläche zu nutzen. Es bietet Funktionen wie Textgenerierung, Chatbot-Interaktionen und mehr, und kann sowohl lokal als auch in der Cloud betrieben werden.
HuggingFace ist die größte Plattform für offene KI-Modelle — vergleichbar mit GitHub, aber für KI.
Heute zeigen wir fünf Demos aus verschiedenen Bereichen: Bild, Video, Sprache und 3D.
FLUX.1 [schnell] von Black Forest Labs erzeugt hochwertige Bilder aus Textbeschreibungen — in wenigen Sekunden.
„A red panda sitting on a rooftop at sunset, cinematic” → fertiges Bild
Demo: huggingface.co/spaces/black-forest-labs/FLUX.1-schnell
| Eigenschaft | Wert |
|---|---|
| Typ | Text-to-Image |
| Schritte | 1–4 |
| Lizenz | Offen |
| Laufzeit | ~3–8 s/Bild |
Diffusion — vereinfacht in drei Schritten:
FLUX.1 [schnell] erreicht gute Qualität schon in 4 Schritten — klassische Modelle brauchen 20–50.
Was funktioniert gut:
Was FLUX.1 nicht zuverlässig kann:
Wan2.2 ist ein offenes Video-Generierungsmodell von Wan-AI — es erzeugt aus einer Textbeschreibung ein kurzes Video.
„A cat walking through a sunlit garden” → fertiges Video
Demo: huggingface.co/spaces/r3gm/wan2-2-fp8da-aoti-preview-2
| Eigenschaft | Wert |
|---|---|
| Parameter | 14B |
| Typ | Text-to-Video |
| Lizenz | Offen |
| Laufzeit | ~30–60 s/Video |
Das Modell hat 14B Parameter — normalerweise ~28 GB RAM nötig (FP16).
Die Demo-Version nutzt FP8-Quantisierung (8 Bit statt 16 Bit pro Zahl):
HuggingFace stellt kostenlose GPU-Rechenzeit bereit (Running on Zero) — daher kann jeder die Demo gratis nutzen.
Whisper von OpenAI wandelt gesprochene Sprache automatisch in Text um — in über 90 Sprachen.
Demo: Mikrofon aufnehmen oder Audio hochladen → Text erscheint automatisch.
| Eigenschaft | Wert |
|---|---|
| Typ | Speech-to-Text |
| Sprachen | 90+ |
| Lizenz | Offen (MIT) |
| Laufzeit | Echtzeit |
Whisper ist das „Ohr” der KI — Kokoro TTS ist die „Stimme”.
Kokoro erzeugt aus geschriebenem Text natürlich klingende Sprache — die Umkehrung von Whisper.
Whisper: Sprache → Text · Kokoro: Text → Sprache
| Eigenschaft | Wert |
|---|---|
| Typ | Text-to-Speech |
| Stimmen | 50+ |
| Lizenz | Offen |
| Laufzeit | ~2–5 s |
Aus zwei Bausteinen wird ein vollständiger Sprachassistent:
Mikrofon → [Whisper] → Text → [KI-Modell] → Text → [Kokoro] → Lautsprecher
So entstehen Sprachassistenten — aus frei verfügbaren, offenen Bausteinen.
Pixal3D von Tencent ARC wandelt ein einzelnes Foto in ein vollständiges 3D-Modell um — mit Textur, direkt im Browser rotierbar.
.glb-Datei| Eigenschaft | Wert |
|---|---|
| Typ | Image-to-3D |
| Eingang | 1 Foto |
| Ausgang | .glb / .obj |
| Laufzeit | ~30–90 s |
Zwei Wege zum 3D-Modell — beide mit KI:
OpenSCAD + Claude Code
Pixal3D
https://adoption.microsoft.com/de-de/scenario-library/
xxx love xxx
KI-generierte Webseite um den Termine und erklärungen wie die Termine öffentlich zur verfügung gestellt werden.
Der Plan ist das Herzstück um die KI in die richtige richtung zu lenken. Es ist wichtig hier so genau wie möglich zu sein, damit die KI auch wirklich das generiert was man möchte.
Natürlich reicht ein guter Plan nicht aus. Verfeinerungen folgen.
im Internet manchmal als Token-Fresser gebrandmarkt kann die Claude.md sehr hilfreich sein. Man kann Claude immer wieder sagen ergänze die Claude.md mit unseren letzten erkenntnissen.
Die Minispiele wurden so angepasst dass gelber text oder anomationen diese an teaser. Es gab nur einen Prompt um den Archivment bereich zu erstellen:
Finde alle klickbaren spiele mit gelben text. Erstelle eine Archivment bereich. Archivments sind zuerst grau.
Erfindergeist Jülich e.V. finanziert sich ausschließlich durch Mitgliedsbeiträge und Spenden. Wir Danken allen Unterstützern, die unsere Arbeit ermöglichen!
Spenden Konto und PayPal auf unserer Webseite https://linktree.erfindergeist.org/
KI-Workshop 2 · Erfindergeist Jülich e.V.