slashCAM
Administrator
Administrator
Beiträge: 11262

Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von slashCAM »


Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Frank Glencairn
Beiträge: 23307

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Mit Ton:

Sapere aude - de omnibus dubitandum



7River
Beiträge: 3765

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



Frank Glencairn
Beiträge: 23307

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Was schwebt dir da vor? Sprechende Steckbriefe?
Sapere aude - de omnibus dubitandum



Tscheckoff
Beiträge: 1280

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Tscheckoff »

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767
Falls sich wer für zu lange Technik-Videos interessiert ^^: https://www.youtube.com/user/AustrianGeek
Zur Info: Mit (*) markierte bzw. "amzn.to"-Links sind Affiliate- bzw. Werbelinks (!)



7River
Beiträge: 3765

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



MK
Beiträge: 4251

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von MK »

7River hat geschrieben: Do 18 Apr, 2024 17:15 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.



Frank Glencairn
Beiträge: 23307

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

7River hat geschrieben: Do 18 Apr, 2024 20:08 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.
Sapere aude - de omnibus dubitandum



7River
Beiträge: 3765

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



 Aktuelle Beiträge [alle Foren]
 
» DaVinci Resolve 19 Public-Beta 2 zum freien Download verfügbar
von Skeptiker - Di 1:12
» DJI RS4 Pro und LiDAR: Bestes AF/Tracking (inkl. Stabilisierung) für Cine-Setups?
von roki100 - Di 0:47
» Blackmagic Pyxis PL - Kaufberatung
von roki100 - Mo 23:01
» Blackmagic PYXIS 6K: Die Vollformat „Box“-Kamera mit Viewfinder, 2x SDI, Sideplates (!) uvm.
von roki100 - Mo 22:24
» Können KI-generierte Bilder, Klänge und Videos von jedermann frei genutzt werden?
von Nathanjo - Mo 22:05
» Panasonic S5 - Allgemeine Fragen, Tipps und Tricks, Zeig deine Bilder/Videos usw.
von roki100 - Mo 21:18
» Rundfunkgebühren-Erhöhung
von DKPost - Mo 20:36
» Coppola’s “Megalopolis” - erster Clip
von iasi - Mo 18:46
» Peinlichkeiten auf der Leinwand: 10 Filme, die 2024 nicht mehr veröffentlicht werden könnten
von Darth Schneider - Mo 17:57
» DIY Heltec LoRa32 V3 Spielereien
von ruessel - Mo 17:09
» Canon USA startet Teaser Kampagne – EOS R5 Mark II kurz vor offizieller Vorstellung?
von iasi - Mo 16:01
» Heinz Hoenig Spendenaktion
von 7River - Mo 15:52
» Kooperation: Digitalschnittmesse und camgaroo film festival im ARRI-Kino
von slashCAM - Mo 13:54
» AllROUNDER oder nicht? Müssen sich Filmemacher spezialisieren?
von Nigma1313 - Mo 13:27
» externe Aufnahme Sony Alpha 73
von cantsin - Mo 9:56
» Kamera Kaufberatung Budget ca. 2000€
von aidualk - Mo 9:05
» Was schaust Du gerade?
von pillepalle - Mo 8:10
» MagicYUV Fehler
von TinyChris - Mo 0:22
» Windschutz für DPA 4560?
von berlin123 - So 20:26
» Lumix G9 II und GH 6 Sensor
von micha2305 - So 18:45
» Hollyland Pyro H 4K: HDMI Videofunkstrecke sendet an bis zu vier Empfänger
von slashCAM - So 14:18
» BIETE : Sony CFexpress 256 GB Typ B TOUGH R1700/W1480
von FocusPIT - So 13:21
» Was hast Du zuletzt gekauft?
von ruessel - So 9:56
» RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt
von iasi - Sa 15:49
» Windows 10 gewinnt weiter Marktanteile gegenüber Windows 11
von Hayos - Sa 14:42
» Dehancer Pro - Filmsimulation auf höchstem Niveau
von MK - Sa 14:20
» Bild und ton im Livestream nicht sychron
von Blackbox - Sa 13:32
» Was hörst Du gerade?
von Skeptiker - Sa 13:11
» SlashCAM - Server stark ausgelastet
von tom - Sa 11:35
» Behind The Boom with Boom Operator Ken Strain | URSA Exclusive
von Blackbox - Fr 17:39
» Atomos Ninja maximale Aufnahmezeit
von andy.de - Fr 16:52
» Apple Vision Pro - Bereits nachlassende Nachfrage in den USA?
von macaw - Fr 15:28
» Wie wichtig ist Quicksync?
von MK - Fr 14:31
» Timecodes, XML, ChatGTP...andere Lösungen??
von DKPost - Fr 13:14
» Magix VPX Version 2025
von fubal147 - Fr 12:41