Publicité

Annonce

Réduire
Aucune annonce.

Adobe VoCo, le Photoshop de la parole

Réduire
X
 
  • Filtre
  • Heure
  • Afficher
Tout nettoyer
nouveaux messages

  • Adobe VoCo, le Photoshop de la parole

    Je reprends le raccourci qui est unanimement fait dans la presse au sujet du projet présenté par Adobe il y a quelques jours. De la même manière que Photoshop permet de retravailler des images, en copiant-collant des éléments, en les générant procéduralement, etc., le projet VoCo permet de retravailler un discours de manière assez hallucinante : http://www.numerama.com/tech/206417-...strements.html

    il s’agit d’un logiciel capable de créer des mots qui ne sont pas présents dans un fichier audio. L’application permet de sculpter le son d’un discours d’une personne spécifique, en améliorant aussi la reconnaissance sémantique et la variété des mots. [...]
    Le logiciel est capable de comprendre la modulation d’une personne spécifique et de la reproduire, à condition qu’il y ait un enregistrement vocal de 20 minutes ou plus.
    On peut voir le bidule en action vers 1:52 dans la vidéo ci-dessous :



    En plus de retravailler simplement l'ordre des mots en agissant simplement sur le texte interprété depuis le fichier-son (ce qui est relativement facile à concevoir en liant les mots à des points de bouclages particuliers dans le fichier), il permet également de resynthétiser des mots qui ne sont pas dans le fichier originel. A la différence d'un TTS habituel qui propose un modèle de voix figé, VoCo est apparemment capable d'extrapoler une modélisation de la voix à imiter.
    En plus des photos-choc, il faudra se méfier des discours, désormais
    « C'est pas de l'electro...» (valable 99% du temps)
    Roland FA-06, Studiologic Sledge Black Edition

  • #2
    Je n'ai pas de mot ! C'est bluffant.
    La charte Audiokeys : https://www.audiokeys.net/forum/foru...arte-Audiokeys
    Comment mettre un avatar : https://www.audiokeys.net/forum/foru...ttre-un-avatar

    Commentaire


    • #3
      Voire inquiétant ?

      Commentaire


      • #4
        Effectivement, bluffant, et potentiellement inquiétant !
        Nord Stage 3 HP76 - Roland Fantom 06 - Piano Yamaha LU101
        RME Fireface 802 - Dell XPS 15 (Windows 10 x64) / Cubase 12 / VST Live / Camelot Pro / Plugs...
        Ibanez Electro Acoustique / Fender Precision Bass / Fender Strat

        [CHARTE AK] [Mettre un avatar (tuto)] [Choisissez un bon titre de message et de section]

        Commentaire


        • #5
          Envoyé par Méliès Voir le message
          Effectivement, bluffant, et potentiellement inquiétant !
          +1 :8)
          https://www.facebook.com/48Heures
          https://marksatedah.bandcamp.com/releases

          Yamaha : Motif XS8 - SY77 - YS200 - TG33 - TG55 - FS1R - Pocketrak CX Alesis : QS8.1 - QSR Korg : Oasys - M3R + RE1 - M1REX - LCDE - Nano Key/Pad/Kontrol Roland : A-880 TC HELICON : Voiceworks AKG : Perception 200 Senneheiser : E835 Mackie : 1604 VLZ3 Steinberg : MR816CSX - CC121 - CMC-FD Adam : P11A Digitech : RP 20 Valve t.c. eletronic : G-Force Ibanez : RG-560 Tascam : Midistudio 688 SONY : MDR-7506 MOTU : MIDI Express XT

          Commentaire


          • #6
            Notre futur est plein de surprises (bonnes ou...mauvaises) !

            -----------------------------------------------
            Claviers : KORG Kronos 2 88 - 2 YAMAHA SY77 - M-AUDIO Axiom Air 61 - PC/Soft : ASUS Zephyrus Duo GX551QS-013T / AMD Ryzen 9 5900HX / 32Go ram / 2x1 To SSD Raid0 / SSD 4 To ext. Data / Nvidia RTX3080 16Go / Windows 11 Pro - Steinberg Cubase Pro 10.5
            Contrôleur/Effet : BEHRINGER FCB1010 - H&K Tube Rotosphere MKII

            Sonos/Mix/Écoute : 2 Yamaha HS8 - 1 Prodipe Pro 10S V2 - YAMAHA MG 124C - BOSE Headphones 700 - OPPO PM-3 + DAC nomade OPPO HA-2 SE - Blue MO-FI - ZOOM H1 - 2 ROLAND CK60

            Commentaire


            • #7
              Les outils des services secrets accessibles à tout le monde...
              Il va aussi falloir déposer sa voix à la SACEM, des fois que quelqu'un fasse un tube avec...
              Sous les pavés de texte, la plage musicale...

              Commentaire


              • #8
                Interessant et.....plus que tres inquietant !
                Peu importe le matos, à condition qu'il soit de qualité, ce qui est important c'est ce qu'on a dans la tête et de bonnes oreilles !

                "Man lebt, solang man Traüme noch leben kann" (On reste vivant aussi longtemps qu'on peut encore vivre ses rêves)

                Commentaire


                • #9
                  Je pense qu'en étant à l'origine de nombre de photos frauduleusement truquées, et pas toujours à des fins innocentes, Adobe se méfie bien entendu des utilisations possibles de son projet VoCo. Photoshop est né à une époque relativement candide, les temps ont bien changé depuis ! Alors que des procédés de détections d'images truquées ont été développés par des tiers, sans être forcément infaillibles (FotoForensics par exemple), ici la firme entend intégrer d'emblée un marquage des fichiers-son générés :

                  "Ne vous inquiétez pas, nous menons des recherches sur comment prévenir les falsifications, avec quelque chose qui ressemble à une détection de filigrane" assurait lors de la présentation Zeyu Jin, développeur pour Adobe. "Nous travaillons dur pour rendre tout cela détectable". A l'oreille cependant, impossible de faire la différence entre ce qui est réellement prononcé et ce que la machine crée.
                  (ZDNet)

                  Néanmoins, cela reste effectivement un peu préoccupant, c'est vrai.
                  Et sans aller jusqu'à imaginer une utilisation résolument malhonnête, on peut aussi craindre une utilisation un peu plus tristement mercantile du système, comme inventer de nouveaux sketches de certains comiques disparus, par exemple. Il ne faut jamais sous-estimer la cupidité de certains... mais vous voilà prévenus !
                  « C'est pas de l'electro...» (valable 99% du temps)
                  Roland FA-06, Studiologic Sledge Black Edition

                  Commentaire


                  • #10
                    Cela m'a fait pensé à une expérience où j'essayais de superposer des formants à un son d'orgue. On devine un peu les voyelles, (sauf le i qui est très reconnaissable), mais le timbre de l'orgue est intact. Il faudra que je ressaye avec des filtres d'ordre supérieur pour mieux imprimer les voyelles (ou utiliser le filtre par formant de Kontakt Player que j'ai découvert entre temps).

                    Une approche consiste à reconstituer la "voix" du narrateur en mélangeant les différents sons. Après il ne reste qu'à appliquer les voyelles. Une autre approche consiste à repérer et classer chaque voyelle et chaque consonne qu'il reste à assembler (Avec un algorithme assez sioux pour éviter une jointure audible, sinon c'est trop simple). Une approche mixte peut être employée (retrouver les voyelles dans le corpus de sons classés... et synthétiser sinon).
                    Dernière modification par floyer, 10 novembre 2016, 19h28.
                    http://www.sinerj.org/~loyer/piano/

                    It's never too late to learn to play the piano. (tip of the day)

                    Côté piano : Yamaha N1X, pianos VSL Syncron et Vienna Imperial, Garritan CFX, Bechstein Digital Grand, Ivory, Galaxy et beaucoup d’autres pianos virtuels - Côté synthé : Roland A-500 Pro, Native-Instruments Komplete 13, Arturia V Collection 9, Korg Collection 3, Air Music Technology plugins, OP-X Pro II, dexed (émulateur DX7 libre), Yamaha S-YXG50 - DAW : Reaper 6, Cubase Artist 9 - Interface audio : Steinberg UR22 - Casque : AKG K-702

                    Commentaire

                    Chargement...
                    X