
Hybrid AI: Deterministische Analyse plus LLM-Reasoning für zuverlässige Unternehmens-KI
Ingo Nowitzky beschreibt in seinem Artikel auf Towards Data Science, wie er beim Aufbau eines agentenbasierten KI-Systems zur Beratung von Fertigungswerken auf ein grundlegendes Problem stieß: Alle getesteten LLM-Systeme – ChatGPT, Gemini Enterprise, DIA Brain und Microsoft Copilot – lieferten bei der Analyse von Excel-Exportdaten mit über 800 Spalten regelmäßig falsche Ergebnisse. Selbst mit aktiviertem Code-Interpreter-Modus wurden Zeilen übersprungen, falsche Filter angewandt oder identische Ausgaben für unterschiedliche Eingaben zurückgegeben. Die Lösung war eine Hybrid-Architektur, implementiert in Microsoft Copilot Studio, die deterministische Analyseschritte klar von LLM-basiertem Reasoning trennt. Ein übergeordneter Parent-Agent orchestriert dabei spezialisierte Sub-Agenten und ein dediziertes Analytics-Modul, das Anweisungen in natürlicher Sprache entgegennimmt und reproduzierbare Ergebnisse liefert. Die Assessment-Daten umfassen Maturity-Bewertungen als Integer von 0 bis 4 sowie über 160 Freitextfelder mit qualitativen Beobachtungen. Der Artikel schlussfolgert, dass probabilistisches LLM-Reasoning für Interpretation und Interaktion geeignet ist, die eigentliche Datenanalyse jedoch deterministisch ausgeführt werden muss.
- Getestete Systeme: ChatGPT, Gemini Enterprise, DIA Brain und Microsoft Copilot zeigten alle ähnliche Fehlerbilder bei tabellarischer Datenanalyse.
- Die Excel-Quelldaten enthalten über 800 Spalten sowie mehr als 160 Freitextfelder mit Assessoren-Empfehlungen.
- Maturity-Bewertungen sind als Integer von 0 bis 4 kodiert; Zeilenzahl entspricht der Anzahl der Assessments (bis zu mehreren Hundert).
- Implementierung erfolgte in Microsoft Copilot Studio, das deterministische Topics/Flows mit LLM-Prompts kombiniert.
- Das Analytics-Modul empfängt Anweisungen als natürlichsprachige Parent_Instruction vom übergeordneten Agenten.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org3w
MAKA: Multi-Agent-Architektur für sichere CNC-Entscheidungsfindung in der Luftfahrt
- FORSCHUNGarxiv.org3w
Umfassende Analyse: LLM-basierte Agentensysteme und ihre industrielle Anwendung
- FORSCHUNGarxiv.org2w
Agentic Interpretation: Gitter-basiertes Framework für LLM-gestützte Programmanalyse
- FORSCHUNGarxiv.org2w
Position Paper: LLMs als Interfaces statt Monolithen für Enterprise-Aufgaben

Hybrid AI: Deterministische Analyse plus LLM-Reasoning für zuverlässige Unternehmens-KI
Ingo Nowitzky beschreibt in seinem Artikel auf Towards Data Science, wie er beim Aufbau eines agentenbasierten KI-Systems zur Beratung von Fertigungswerken auf ein grundlegendes Problem stieß: Alle getesteten LLM-Systeme – ChatGPT, Gemini Enterprise, DIA Brain und Microsoft Copilot – lieferten bei der Analyse von Excel-Exportdaten mit über 800 Spalten regelmäßig falsche Ergebnisse. Selbst mit aktiviertem Code-Interpreter-Modus wurden Zeilen übersprungen, falsche Filter angewandt oder identische Ausgaben für unterschiedliche Eingaben zurückgegeben. Die Lösung war eine Hybrid-Architektur, implementiert in Microsoft Copilot Studio, die deterministische Analyseschritte klar von LLM-basiertem Reasoning trennt. Ein übergeordneter Parent-Agent orchestriert dabei spezialisierte Sub-Agenten und ein dediziertes Analytics-Modul, das Anweisungen in natürlicher Sprache entgegennimmt und reproduzierbare Ergebnisse liefert. Die Assessment-Daten umfassen Maturity-Bewertungen als Integer von 0 bis 4 sowie über 160 Freitextfelder mit qualitativen Beobachtungen. Der Artikel schlussfolgert, dass probabilistisches LLM-Reasoning für Interpretation und Interaktion geeignet ist, die eigentliche Datenanalyse jedoch deterministisch ausgeführt werden muss.
- Getestete Systeme: ChatGPT, Gemini Enterprise, DIA Brain und Microsoft Copilot zeigten alle ähnliche Fehlerbilder bei tabellarischer Datenanalyse.
- Die Excel-Quelldaten enthalten über 800 Spalten sowie mehr als 160 Freitextfelder mit Assessoren-Empfehlungen.
- Maturity-Bewertungen sind als Integer von 0 bis 4 kodiert; Zeilenzahl entspricht der Anzahl der Assessments (bis zu mehreren Hundert).
- Implementierung erfolgte in Microsoft Copilot Studio, das deterministische Topics/Flows mit LLM-Prompts kombiniert.
- Das Analytics-Modul empfängt Anweisungen als natürlichsprachige Parent_Instruction vom übergeordneten Agenten.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org3w
MAKA: Multi-Agent-Architektur für sichere CNC-Entscheidungsfindung in der Luftfahrt
- FORSCHUNGarxiv.org3w
Umfassende Analyse: LLM-basierte Agentensysteme und ihre industrielle Anwendung
- FORSCHUNGarxiv.org2w
Agentic Interpretation: Gitter-basiertes Framework für LLM-gestützte Programmanalyse
- FORSCHUNGarxiv.org2w
Position Paper: LLMs als Interfaces statt Monolithen für Enterprise-Aufgaben