Wir schreiben Programme, die komplexe Probleme in Data Science, Numerik & Physik  lösen.

Komplexe Fehlersuche bei Schienenfahrzeugen

Sporadische Ausfälle sind der Worst Case im Betrieb: Sie treten selten genug auf, um sich der klassischen Diagnose zu entziehen – aber häufig genug, um Kosten, Verfügbarkeit und Vertrauen zu beeinträchtigen. Ein typisches Beispiel aus Schienenfahrzeugen: Die Klimaanlage fällt alle zwei bis vier Monate aus, manchmal ist ein halbes Jahr Ruhe, dann treten zwei Ausfälle direkt nacheinander auf. Nicht reproduzierbar, keine klare Ursache, viele mögliche Einflussgrößen.

Genau in solchen Situationen wird die Algorithmus Schmiede relevant: Wenn Standardsoftware, klassische Automatisierung oder interne Teams fachlich oder zeitlich an Grenzen stoßen. Unser Fokus liegt nicht auf „Modellen um der Modelle willen“, sondern auf belastbaren Entscheidungen im laufenden Betrieb – unter realen Randbedingungen, mit Unsicherheit, harten Nebenbedingungen und Anforderungen an Robustheit und Wartbarkeit.

Hier beschreiben wir unsere Vorgehensweise am Beispiel Klimaanlagenausfall im Schienenfahrzeug – von der automatisierten Datenanalyse mehrerer Datenquellen bis zur nachhaltigen Lösung inklusive Predictive Maintenance zum Klimaanlagenausfall.


Ausgangslage: Nicht reproduzierbare Fehler im operativen System

Wenn ein Fehler nicht deterministisch reproduzierbar ist, helfen klassische Checklisten nur begrenzt. Stattdessen braucht es:

  • vollständige und konsistente Daten über viele Zeiträume
  • Kontext über Betrieb, Umwelt und Nutzung
  • einen Ansatz, der Hypothesen automatisiert generiert, prüft und verdichtet
  • optional: Vergleichsmöglichkeiten (z. B. Fahrzeuge ohne Fehlerbild)

Das Ziel ist eine komplexe Fehleranalyse für Schienenfahrzeuge, die nicht bei einer Vermutung stehen bleibt, sondern zu einer belastbaren Fehlerursache und einer umsetzbaren Maßnahme führt.


Schritt 1: Daten automatisiert zusammenführen (statt manuell „zusammensuchen“)

Der erste Engpass ist fast immer banal und kritisch zugleich: Daten liegen verteilt vor. Typische Quellen sind:

  • PDFs (Werkstattberichte, Störungsmeldungen)
  • Excel-Dokumente (manuelle Auswertungen, Listen)
  • Datenbanken (Messwerte, Ereignislogs)
  • ERP-Systeme wie SAP (Instandhaltung, Material, Maßnahmen)
  • weitere Systeme im Fahrzeug- und Flottenkontext

Der Schlüssel ist eine automatisierte Datenanalyse mehrerer Datenquellen: Wir setzen Skripte und Datenpipelines so auf, dass die relevanten Informationen wiederholbar, vollständig und zeitlich konsistent verfügbar sind. Nicht als „Datenprojekt“, sondern als Voraussetzung, damit die Analyse überhaupt zuverlässig wird.


Schritt 2: Analyse am Problemzeitpunkt – Auffälligkeiten und untypische Kombinationen

Als Nächstes betrachten wir den Zeitpunkt des Ausfalls im Fahrzeugkontext:

  • Gibt es Werte, die auffällig ansteigen oder abfallen?
  • Gibt es Zustandskombinationen, die selten sind?
  • Gibt es Konstellationen, die nur in Ausfallnähe auftreten?

Wichtig: Es geht nicht nur um einzelne Sensorwerte, sondern um Muster über mehrere Signale. Gerade bei komplexen Systemen sind es häufig Kombinationen (z. B. Betriebsmodus + Last + Temperatur + Steuerzustände), die einen Fehler auslösen oder vorbereiten.

Schritt 2.5: Benchmarking – Vergleich mit Fahrzeugen ohne Fehlerbild

Wenn verfügbar, ist der Vergleich mit „gesunden“ Fahrzeugen extrem wertvoll:

  • Welche Merkmale unterscheiden Fahrzeuge mit Ausfall vs. ohne Ausfall?
  • Welche Muster sind im Ausfallfahrzeug ungewöhnlich?
  • Welche Grenzbereiche werden nur in der betroffenen Flotte erreicht?

Dieses Benchmarking hilft, Auffälligkeiten zu verifizieren und „falsche Fährten“ auszuschließen.


Schritt 3: Zeitliche Entwicklung und „unsichtbare“ Abnutzung quantifizieren

Viele Ursachen sind nicht direkt messbar (z. B. Abnutzung, Verschmutzung, schleichende Degradation). Dann nutzen wir zeitliche Aggregation:

  • Ereignisse aufsummieren (z. B. Bremsungen, Starts, Schalthäufigkeiten)
  • Last- und Betriebsprofile integrieren (z. B. Klimaanlagenlast über Zeit)
  • Kennwerte über Fenster bilden (z. B. letzte 7 Tage, letzter Monat, seit letzter Wartung)

So entstehen surrogate Zustandsgrößen: nicht gemessen, aber ableitbar – und oft hochgradig erklärungsstark. Entscheidend ist dabei die Automatisierung: Wir „raten“ nicht, ob Bremsen relevant sein könnte, sondern lassen systematisch viele Kandidaten prüfen.


Schritt 4: Externe Datenquellen einbeziehen (Wetter, Schichtpläne, Nutzung)

Gerade beim Klimaanlagenausfall sind externe Faktoren häufig mitentscheidend. Deshalb erweitern wir die Analyse um Kontextdaten, z. B.:

  • Wetterdaten (Temperatur, Feuchte) – auch mit Historie (z. B. letzte 7 Tage)
  • Schicht- und Einsatzpläne (Nutzung, Stillstandszeiten, Betriebsregime)
  • gefahrene Kilometer (gesamt, pro Zeitraum, seit Ereignis X)

Die Historie ist oft der Punkt, an dem sporadische Fehler erklärbar werden: Restfeuchte, thermische Zyklen, lange Standzeiten oder bestimmte Einsatzmuster können das System in Zustände bringen, die in Momentaufnahmen nicht sichtbar sind.



Ergebnis: Fehlerursache, dauerhaftes Systemwissen & Predictive Maintenance

Am Ende stehen zwei Resultate:

  1. Die identifizierte Fehlerursache (und eine umsetzbare Abstellmaßnahme im Betrieb oder in der Instandhaltung).
  2. Ein zusätzlicher, langfristiger Nutzen: Durch die strukturierte, automatisierte Analyse entsteht belastbares Wissen über das Systemverhalten. Damit können bevorstehende Ausfälle frühzeitig erkannt werden – Predictive Maintenance zum Klimaanlagenausfall. Ausfälle werden damit einplanbar statt überraschend.

Das ist der Unterschied zwischen „Feuer löschen“ und operativer Entscheidungsfähigkeit: nicht nur den aktuellen Fall beheben, sondern die Wiederholung systematisch verhindern.


Wann die Algorithmus Schmiede der richtige Partner ist

Wir werden typischerweise dann hinzugezogen, wenn intern eskaliert wird – weil:

  • Fehlerbilder selten, teuer und nicht reproduzierbar sind
  • viele Datenquellen existieren, aber keine belastbare End-to-End-Sicht
  • harte Randbedingungen gelten (Verfügbarkeit, Laufzeit, Wartbarkeit, Robustheit)
  • die Lösung verlässlich im Betrieb funktionieren muss

Die Algorithmus Schmiede ist kein Softwareanbieter, kein KI-Buzzword-Dienstleister und keine Folienberatung. Wir entwickeln und implementieren algorithmische Lösungen für Planung, Regelung und Optimierung unter realen Bedingungen – inklusive Modellierung, Umgang mit Unsicherheit, Simulation, Benchmarking und produktiver Integration.


Nächster Schritt

Wenn Sie ein ähnliches Fehlerbild haben (z. B. sporadische Ausfälle, unklare Ursachen, verteilte Datenlage) und eine Komplexe Fehleranalyse für Schienenfahrzeuge oder vergleichbare operative Systeme benötigen, ist der sinnvollste Einstieg ein technisches Erstgespräch entlang von:

  • verfügbaren Datenquellen und Zugriffsmöglichkeiten
  • Definition des Fehlerereignisses und der Zeitfenster
  • vorhandenen Vergleichsobjekten (z. B. andere Fahrzeuge)
  • Anforderungen an Umsetzung im Betrieb (Monitoring, Alarmierung, Wartungsprozess)

Kurzvideo

Präsentation