InsectTrainer

Trainiere deine eigene KI

In dieser App lernst du Schritt für Schritt, wie künstliche Intelligenz funktioniert – ganz praktisch am Beispiel von Insektenbildern. Du stellst dein eigenes Trainingsmaterial zusammen und bereitest die Bilder vor, indem du sie sortierst und zuschneidest. Anschließend kannst du damit dein KI-Modell trainieren. Eine abschließende Auswertung zeigt dir, wie gut dein Modell gelernt hat. Dabei erfährst du auch, warum Datenqualität und Vielfalt entscheidend sind, welche Einstellungen ein Training beeinflussen und woran man erkennt, ob eine KI gute Ergebnisse liefert.

Hinweis: In den nächsten Schritten geht es ausschließlich um die Trainingsdaten beziehungsweise Trainingsbilder. Die für die abschließende Evaluation benötigten Validierungsdaten werden im Hintergrund bereitgestellt und stehen dir am Ende automatisch für die Auswertung zur Verfügung.

Sobald du auf „Weiter" klickst, kannst du mit deinem KI-Training starten. Viel Spaß!

Schritt 1 – Trainingsbilder auswählen und labeln

Im ersten Schritt werden die Bilder gelabelt. Klicke auf ein Bild, um es einer Kategorie zuzuweisen und optional einen Ausschnitt (Crop) festzulegen. Das Labeln nennt man auch Klassifizieren.
Die Zahlen in den Kreisen zeigen, wie viele Bilder noch ungelabelt sind und wie viele bereits einer Kategorie zugeordnet wurden.

Hinweis: Je ausgewogener die Anzahl der Bilder zwischen den Kategorien ist und je unterschiedlicher die Bilder innerhalb einer Kategorie sind, desto besser kann dein Modell trainiert werden.

Unsortierte Bilder

[Kategorie 1]

[Kategorie 2]

[Kategorie 3]

[Kategorie 4]

Bildauswahl - Zusammenfassung

Hier siehst du eine Übersicht deiner ausgewählten und zugeschnittenen Bilder. Für ein gutes Training ist es wichtig, dass die Kategorien möglichst ausgewogen sind. Das bedeutet, dass jede Kategorie eine ähnliche Anzahl an Bildern enthält, damit das Modell aus allen Kategorien gleich viele Beispiele zum Lernen erhält.
Ebenso entscheidend ist, dass du die Insekten richtig erkannt und der passenden Kategorie zugeordnet hast. Das erkennst du an der Erkennungsrate. Fehler bei der Zuordnung werden vom Modell übernommen und können sich später in den Ergebnissen wieder zeigen. Außerdem kannst du hier sehen, wie gut dein Cropping war und ob sich deine Kästchen im Toleranzbereich des optimalen Ausschnitts befinden.

Sortier-Qualitätsindikator:

Schritt 2 – Training durchführen

Die Auswahl und Aufbereitung des Trainingsmaterials ist abgeschlossen. Nun kann das eigentliche Training beginnen. Das Modell schaut sich die von dir vorbereiteten und gelabelten Bilder an und versucht dabei zu lernen, welche Merkmale zu welcher Kategorie gehören. Es erkennt zum Beispiel Formen, Farben oder bestimmte Muster, die für eine Kategorie typisch sind.
Damit die KI richtig lernen kann, nutzt sie viele Gewichtungen. Diese bestimmen, wie stark bestimmte Bildmerkmale bei einer Entscheidung berücksichtigt werden. Am Anfang sind diese Gewichtungen noch nicht passend eingestellt. Während des Trainings vergleicht die KI ihre Vorhersage immer wieder mit der richtigen Lösung. Wenn sie falsch liegt, werden die Gewichtungen leicht verändert. So lernt das Modell Schritt für Schritt, welche Merkmale wichtig sind und welche weniger wichtig sind.
Die Bilder werden dabei mehrfach durchlaufen. Mit jedem Trainingsdurchgang kann die KI ihre Einstellungen weiter verbessern. Je nach Datenmenge und gewählten Parametern dauert das Training unterschiedlich lange. Ein gut eingestelltes Training ist wichtig, damit die KI später auch neue Bilder möglichst zuverlässig richtig einordnen kann.

Bildauswahl

Lade Bilder …

Modelparameter

Training

Training abgeschlossen

Trainingsergebnisse

Am Ende des Trainings wird überprüft, wie gut dein Modell gelernt hat. Dafür schauen wir uns noch einmal die gewählten Trainingsparameter sowie die Kennwerte deines Sortier-Qualitätsindikators an.
Jetzt kommen auch die Validierungsdaten ins Spiel, von denen zu Beginn die Rede war. Diese Bilder hast du während der Vorbereitung nicht gesehen, sondern sie werden hier automatisch bereitgestellt. Es handelt sich ebenfalls um korrekt sortierte und zugeschnittene Insektenbilder. Sie werden verwendet, um zu bewerten, wie gut dein Modell das Gelernte auf neue, unbekannte Bilder anwenden kann. Man kann sie mit Zwischen- oder Abschlusstests vergleichen.

Die linke Lernkurve, der Accuracy-Verlauf, zeigt, wie viel Prozent der Trainings- und Validierungsbilder das Modell im Verlauf des Trainings richtig erkannt hat. Zu Beginn ist der Wert meist noch niedrig, steigt dann aber an, je besser das Modell dazulernt.
Die rechte Lernkurve, der Loss-Verlauf, zeigt die Fehler des Modells während des Trainings. Am Anfang ist der Fehler meist noch hoch und nimmt im besten Fall mit dem Training ab. Bei einem guten Training verlaufen Trainings- und Validierungskurve ähnlich und der Abstand zwischen beiden ist nicht groß. Bei einem schlechten Training unterscheiden sich die Kurven dagegen deutlich stärker.
Sinken Trainings- und Validierungs-Loss deutlich und bleiben anschließend niedrig, lernt die KI gut. Wird der Trainings-Loss immer kleiner, während der Validierungs-Loss wieder ansteigt, spricht man von Overfitting: Das Modell hat die Trainingsdaten zu genau gelernt und erkennt neue Bilder schlechter. Bleiben beide Loss-Kurven auf hohem Niveau, liegt Underfitting vor, weil das Modell noch nicht ausreichend gelernt hat.

Accuracy-Verlauf

Noch keine Trainingsdaten verfügbar. Bitte Training abschließen.

Loss-Verlauf

Noch keine Loss-Daten verfügbar.

Confusion Matrix

Überprüfung der Validierungsbilder

Am Ende der Auswertung kannst du hier noch einmal die Validierungsbilder ansehen. Außerdem erkennst du, welche Bilder vom Modell richtig und welche falsch zugeordnet wurden. Richtig erkannte Bilder sind grün markiert, falsch eingeordnete Bilder haben einen roten Rahmen und zeigen, mit welcher anderen Kategorie dieses Bild verwechselt wurde.
So kannst du sehen, bei welchen Kategorien dein Modell bereits gut funktioniert und wo es noch Schwierigkeiten gibt. Das ist besonders hilfreich, wenn du ein Modell später weiter verbessern möchtest, weil du dadurch erkennst, in welchen Bereichen Trainingsdaten fehlen oder ergänzt werden sollten.

Unsortierte Bilder

[Kategorie 1]

[Kategorie 2]

[Kategorie 3]

[Kategorie 4]

Modell auswählen