DCGAN von Grund auf auf iPod-touch-4-Fotos trainiert

CompaniesOpenAI

Warum es zählt

Das Experiment zeigt, wie wenig Daten (350 Bilder, ein Objekt) für erste DCGAN-Ergebnisse ausreichen – und wie Kamera-Artefakte älterer Hardware als Trainingssignal genutzt werden können.

— Lumeric Redaktion

Der Reddit-Nutzer Remarkable-Trick-177 hat ein DCGAN (Deep Convolutional Generative Adversarial Network) vollständig von Grund auf trainiert – ausschließlich auf Fotos, die mit einem iPod touch 4 aufgenommen wurden. Als Trainingssubjekt diente ein einziger Gegenstand: ein roter Solo-Cup, fotografiert in verschiedenen Hintergründen und Lichtverhältnissen. Der aktuelle Datensatz umfasst rund 350 Bilder. Die Qualität der generierten Ausgaben vergleicht der Nutzer mit frühen DALL-E-Ergebnissen aus dem Jahr 2022. Geplant ist eine Erweiterung des Datensatzes auf etwa 5.000 Bilder. Ein erklärtes Ziel ist es herauszufinden, ob das Modell die spezifischen Sensor-Artefakte der iPod-touch-4-Kamera erlernen und reproduzieren kann. Das Projekt ist bewusst kleinskalig gehalten und dient als persönliches Lernprojekt zum Verständnis des Trainingsaufwands von Bildgenerierungsmodellen.

Was wir noch wissen

Trainingsgrundlage: ~350 Fotos eines roten Solo-Cups, aufgenommen mit iPod touch 4
Verschiedene Hintergründe und Lichtverhältnisse sollen Generalisierung fördern
Geplante Datensatzerweiterung auf ~5.000 Bilder
Ziel: Erkennung und Reproduktion kameraspezifischer Sensor-Artefakte des iPod touch 4
Generierte Bilder werden qualitativ mit DALL-E ca. 2022 verglichen

Quelle lesenreddit.com

Foundation Modelle Open Source Multimodal

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

DCGAN von Grund auf auf iPod-touch-4-Fotos trainiert

CompaniesOpenAI

Warum es zählt

Das Experiment zeigt, wie wenig Daten (350 Bilder, ein Objekt) für erste DCGAN-Ergebnisse ausreichen – und wie Kamera-Artefakte älterer Hardware als Trainingssignal genutzt werden können.

— Lumeric Redaktion

Was wir noch wissen

Trainingsgrundlage: ~350 Fotos eines roten Solo-Cups, aufgenommen mit iPod touch 4
Verschiedene Hintergründe und Lichtverhältnisse sollen Generalisierung fördern
Geplante Datensatzerweiterung auf ~5.000 Bilder
Ziel: Erkennung und Reproduktion kameraspezifischer Sensor-Artefakte des iPod touch 4
Generierte Bilder werden qualitativ mit DALL-E ca. 2022 verglichen

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

DCGAN von Grund auf auf iPod-touch-4-Fotos trainiert

Frag die KI zum Artikel

Verwandte Beiträge

DCGAN von Grund auf auf iPod-touch-4-Fotos trainiert

Frag die KI zum Artikel

Verwandte Beiträge