DCGAN von Grund auf auf iPod-touch-4-Fotos trainiert
Der Reddit-Nutzer Remarkable-Trick-177 hat ein DCGAN (Deep Convolutional Generative Adversarial Network) vollständig von Grund auf trainiert – ausschließlich auf Fotos, die mit einem iPod touch 4 aufgenommen wurden. Als Trainingssubjekt diente ein einziger Gegenstand: ein roter Solo-Cup, fotografiert in verschiedenen Hintergründen und Lichtverhältnissen. Der aktuelle Datensatz umfasst rund 350 Bilder. Die Qualität der generierten Ausgaben vergleicht der Nutzer mit frühen DALL-E-Ergebnissen aus dem Jahr 2022. Geplant ist eine Erweiterung des Datensatzes auf etwa 5.000 Bilder. Ein erklärtes Ziel ist es herauszufinden, ob das Modell die spezifischen Sensor-Artefakte der iPod-touch-4-Kamera erlernen und reproduzieren kann. Das Projekt ist bewusst kleinskalig gehalten und dient als persönliches Lernprojekt zum Verständnis des Trainingsaufwands von Bildgenerierungsmodellen.
- Trainingsgrundlage: ~350 Fotos eines roten Solo-Cups, aufgenommen mit iPod touch 4
- Verschiedene Hintergründe und Lichtverhältnisse sollen Generalisierung fördern
- Geplante Datensatzerweiterung auf ~5.000 Bilder
- Ziel: Erkennung und Reproduktion kameraspezifischer Sensor-Artefakte des iPod touch 4
- Generierte Bilder werden qualitativ mit DALL-E ca. 2022 verglichen
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org12h
Repräsentations-konditionierte Diffusionsmodelle übertreffen echte Trainingsdaten auf ImageNet100
- FORSCHUNGhuggingface.co3d
Lens: 3,8B-Parameter Text-to-Image-Modell mit reduziertem Trainingsaufwand
- FORSCHUNGarxiv.org2w
Foundation Model für hochauflösende Satellitendaten der Niederlande veröffentlicht
- FORSCHUNGarxiv.org2d
MS COCOAI: 96.000-Datenpunkte-Dataset zur KI-Bilderkennung veröffentlicht
DCGAN von Grund auf auf iPod-touch-4-Fotos trainiert
Der Reddit-Nutzer Remarkable-Trick-177 hat ein DCGAN (Deep Convolutional Generative Adversarial Network) vollständig von Grund auf trainiert – ausschließlich auf Fotos, die mit einem iPod touch 4 aufgenommen wurden. Als Trainingssubjekt diente ein einziger Gegenstand: ein roter Solo-Cup, fotografiert in verschiedenen Hintergründen und Lichtverhältnissen. Der aktuelle Datensatz umfasst rund 350 Bilder. Die Qualität der generierten Ausgaben vergleicht der Nutzer mit frühen DALL-E-Ergebnissen aus dem Jahr 2022. Geplant ist eine Erweiterung des Datensatzes auf etwa 5.000 Bilder. Ein erklärtes Ziel ist es herauszufinden, ob das Modell die spezifischen Sensor-Artefakte der iPod-touch-4-Kamera erlernen und reproduzieren kann. Das Projekt ist bewusst kleinskalig gehalten und dient als persönliches Lernprojekt zum Verständnis des Trainingsaufwands von Bildgenerierungsmodellen.
- Trainingsgrundlage: ~350 Fotos eines roten Solo-Cups, aufgenommen mit iPod touch 4
- Verschiedene Hintergründe und Lichtverhältnisse sollen Generalisierung fördern
- Geplante Datensatzerweiterung auf ~5.000 Bilder
- Ziel: Erkennung und Reproduktion kameraspezifischer Sensor-Artefakte des iPod touch 4
- Generierte Bilder werden qualitativ mit DALL-E ca. 2022 verglichen
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org12h
Repräsentations-konditionierte Diffusionsmodelle übertreffen echte Trainingsdaten auf ImageNet100
- FORSCHUNGhuggingface.co3d
Lens: 3,8B-Parameter Text-to-Image-Modell mit reduziertem Trainingsaufwand
- FORSCHUNGarxiv.org2w
Foundation Model für hochauflösende Satellitendaten der Niederlande veröffentlicht
- FORSCHUNGarxiv.org2d
MS COCOAI: 96.000-Datenpunkte-Dataset zur KI-Bilderkennung veröffentlicht