was die 4:2:0/2 rückübersetztung betrifft, teile ich wirklich rolands auffassung voll und ganz. ich bin mir nicht sicher, ob es wirklich für alle absonderlichkeiten der farbunterabtastung gilt -- immerhin gab's da auch so seltsame geschichten, wie um halbe pixel verschobene farbpositionierungen etc. --, aber in jenen einfachen fällen, mit denen wir heute in digitaler form konfrontiert sind, liegt das ausgangsmateral immer als 1:1 RGB pixelmatrix vor und wird am anderen ende der übertragung auch wieder in dieses form gebracht. die entsprechende umrechnung ist wirklich trivial und einfach nachvollziehbar. wenn man das prinzip dahinter versteht, gibt es keinen grund, warum sich hier nach dem herunterskalieren der Y plane noch ein fehler zeigen sollte bzw. keine vollwertige verkleinerte 4:4:4 entsprechung vorliegen sollte.
da könnte man ja gleich behaupten, dass es prinzipiell nicht möglich ist, bilder in einer weise zu verkleinern, die mit dem ursprünglichen ausgangsmaterial noch etwas gemeinsam hat bzw. bezogen auf resultierende größe eine befriedigende qualität liefert.
das einzige, was die skalierung hier ein klein wenig ungewöhnlich erschien lässt, ist die tatsache, dass man die einzelnen kanäle in diesem fall nicht zum selben zeitpunkt skaliert, wie das sonst beim verkleinern eines bilds im hintergrund geschieht, sondern zu verschiedenen zeitpunkten.
die 8bit -> 10bit geschichte ist aber tatsächlich ein bisserl anders gelagert.
ich finde zwar, dass rolands einwand bzgl. der homogenen flächen ziemlich überzeugend wirkt, aber das stellt mich noch immer nicht wirklich zufrieden. ich bin nämlich davon überzeugt, dass eigentlich bereits ein fehler vorliegt, wenn material, das ursprünglich in einer höhereren auflösung verfügbar ist, beim requantisieren in eine niedrigere auflösung nicht ordendlich dithert.
siehe dazu:
Requantizing and digital dither -- in: the art of digital video
das kann sogar tatsächlich in einer weise erfolgen, die jeweils viererblöcke entsprechend modifiziert -- siehe z.b. diese
konkrete umsetzung in einer bildschirmansteuerung (11ff) [das entspricht übrigens ziemlich genau jenem bsp. das ich dazu oben bereits zur illustration herangezogen habe!]. eine umsetzung, die zwar bei näherer betrachtung nicht ganz so ideal ausfällt wie man es sich wünschen würde, aber zumindest doch ein wichtiger anhaltspunkt bildet, um die entsprechenden überlegungen nicht einfach mit hinweis auf ausgeprägtes banding in manchem ursprungsmaterial gleich beiseite schieben zu können.
man müsste wirklich ganz praktisch untersuchen, wie weit sich entsprechendes dithering in realen signalen unsere kameras, aber vor allen dingen aber auch in den komprimierten dateien, die sie uns liefern, finden lässt? erst dann kann man vernünftig entscheiden, ob das wirklich ein völliger quatisch ist und wir uns tatsächlich mit
ehrlichen 8bit abfinden müssen.