flask-round-potionCloner une voix pour le Changeur de voix

Clonez votre propre voix en tant que voix pour le Changeur de voix dans ACE Studio.

Qu'est-ce que le clonage pour Voice Changer ?

C'est une fonctionnalité permettant de personnaliser votre propre voix pour le Voice Changer en téléchargeant vos échantillons. L'IA apprendra le timbre d'après les échantillons que vous fournissez et clonera une version numérique de cette voix.

Après la personnalisation, vous pouvez utiliser votre profil pour convertir des voix à partir d'un audio, comme avec nos voix Voice Changer préconçues dans ACE Studio.

circle-check

Comment cloner ma voix pour Voice Changer ?

Préparer vos jeux de données

chevron-rightVoix sèches et propreshashtag

Des voix de haute qualité requièrent des échantillons vocaux propres et sans effet :

  • Sans réverbération, délai ou effets de chorus

  • Sans bruit de fond

  • Sans instrumentaux ni sons non humains

  • Sans harmonies ni doubles vocaux

30 à 100 minutes d'échantillons chantés sont recommandées pour une voix. Plus vous fournissez d'échantillons, plus l'IA peut apprendre de détails de chant, mais les bénéfices diminuent au-delà de 120 minutes.

Réflexions de la pièce

Des voix enregistrées avec de fortes réflexions de pièce peuvent provoquer des erreurs de reconnaissance et entraîner des performances inattendues du modèle.

Voix issues d'un stem splitter

Lorsque vous utilisez un vocal remover ou un stem splitter, la qualité de sortie peut être trop dégradée pour l'entraînement. Pour un modèle vocal de meilleure qualité, privilégiez, si possible, des voix extraites par stem splitter de haute qualité.

chevron-rightEnregistrer des échantillonshashtag

Microphone de qualité avec interface audio

Des microphones professionnels avec interface audio fournissent des voix de haute qualité. Vous aurez besoin d'un logiciel d'enregistrement pour connecter votre interface, enregistrer, éditer et mixer vos voix.

Pour l'enregistrement d'un modèle vocal, évitez les microphones non conçus pour le chant :

  • Micros de téléphone ou d'ordinateur portable

  • Micro-cravates ou casques-micro

  • Micros de karaoké

  • Micro d'écouteurs ou oreillettes Bluetooth comme les AirPods (conçus pour les appels téléphoniques)

Environnement d'enregistrement

  1. Les bruits de fond indésirables peuvent inclure des conversations, des bourdonnements électriques, le bruit de la circulation et des sons extérieurs, ainsi que les mouvements d'accessoires ou d'objets. Pour éviter qu'ils n'interfèrent avec votre enregistrement, il est important de choisir un endroit calme où minimiser ou éliminer ces perturbations sonores.

  2. Les réflexions sonores peuvent survenir en présence de surfaces dures et planes, entraînant réverbération ou échos dans vos enregistrements. Cela peut donner à vos pistes un caractère creux ou distant, nuisant à l'intimité et à la clarté souhaitées.

  3. Frappez des mains rapidement dans la pièce et écoutez attentivement. Si vous percevez un son qui résonne ou un écho prolongé, cela indique un problème de réverbération.

  4. Pour y remédier, incorporez des matériaux absorbants. Pensez aux tapis, carpettes ou rideaux épais pour réduire significativement les réflexions. Couvrir les sols durs et, si possible, suspendre des rideaux aux fenêtres ainsi que placer des meubles recouverts de tissu dans la pièce peut aider.

  5. Évitez les surfaces dures qui aggravent le problème. Si vous ne pouvez pas investir dans des panneaux acoustiques professionnels, utilisez des objets du quotidien comme des toiles, tapisseries ou dalles de mousse pour casser ces surfaces.

  6. Lors du positionnement du microphone, faites attention à son placement. Évitez de le placer trop près des murs ou dans les coins. Visez le centre de la pièce ou testez différents emplacements pour trouver le point optimal avec le moins de réverbération.

Fuite depuis les écouteurs

Lors des enregistrements, en particulier pour les voix, il est courant que le son des écouteurs se reporte dans le microphone. Ce phénomène survient lorsque le volume des écouteurs est trop élevé ou que des casques ouverts sont utilisés. Cela peut être toléré pour l'enregistrement d'une chanson, mais évitez cette fuite pour l'enregistrement d'un modèle vocal.

Placement du microphone

Pour un volume normal, il est recommandé de vous placer à environ 5 cm du microphone. Pour des passages plus puissants ou du belting, augmentez la distance à environ 10–15 cm. Veillez à rester toujours à moins de 30 cm du microphone pour conserver une capture audio optimale.

Créer de l'espace pour le belting

Pour les techniques de belting, laissez suffisamment d'espace, aussi bien en distance de microphone qu'en taille de pièce. Une isolation sonore excessive, comme être confiné dans un placard ou une cabine, ou entourer le micro de mousse, peut facilement surcharger la capsule du microphone. En cas de doute, intégrez davantage de son de pièce lors des passages belting.

chevron-rightLangues de chanthashtag

Pour une voix Voice Changer, vous n'avez pas besoin de conserver tous les échantillons dans une seule langue.

chevron-rightChant ou parolehashtag

Pour une voix Voice Changer, il n'y a pas de grande différence entre échantillons de parole et échantillons de chant. Toutefois, pour une voix Voice Changer destinée au chant, il est préférable d'utiliser des échantillons chantés pour l'entraînement.

chevron-rightParamètres de qualité des fichiershashtag

La qualité audio de vos échantillons influe directement sur la qualité de votre voix.

Nous vous recommandons de régler la qualité audio sur :

  • Profondeur de bits = 16-bit

  • Taux d'échantillonnage = 44.1kHz ou 48kHz

  • Format sans perte (.wav ou .flac)

chevron-rightPost-traitementhashtag

Pour préserver le caractère naturel et la clarté de la voix cible :

  • Pas de chevauchements : les voix multi-couches compliquent l'analyse de l'IA. Placez les prises superposées en arrière-plan et conservez une seule piste vocale afin que l'IA puisse traiter et apprendre correctement à partir de vos échantillons.

  • Pas de coupures nettes : les coupures nettes créent des débuts ou fins abrupts, non naturels pour le chant, et peuvent introduire des clics ou pops. Utilisez des fondus progressifs aux débuts et fins des clips vocaux pour des transitions plus naturelles.

  • Pas de sections dupliquées : Les sections dupliquées n'aident pas à l'entraînement. Votre modèle vocal bénéficie de la variation naturelle des performances.

  • Contrôlez le volume : Assurez-vous que vos échantillons restent autour de 30–50 % du vumètre. Utilisez un volume rider ou l'automation pour maintenir des niveaux cohérents sur l'ensemble du jeu de données. L'objectif est d'obtenir un niveau de volume homogène tout en conservant la dynamique au sein des sections.

Entraîner votre voix

Après avoir préparé vos jeux de données, vous pouvez aller à browserPage de voix personnalisée pour sélectionner un emplacement personnalisé, téléverser vos échantillons et lancer l'entraînement.

Vous pouvez personnaliser une voix Voice Changer par emplacement personnalisé.

Cliquez sur un emplacement pour commencer à téléverser vos échantillons.

Après le téléversement de tous les échantillons, l'entraînement commencera automatiquement. Vous pouvez vérifier son statut en actualisant la page web.

Lorsque la page revient à la liste d'emplacements avec une nouvelle voix entraînée, tout est prêt.

Cliquez sur « Open in ACE » pour ouvrir ACE Studio et utiliser votre nouvelle voix entraînée.

Ré-entraîner votre voix

Cliquez sur le Réentraîner bouton pour réentraîner votre voix.

Le réentraînement supprimera votre voix précédente dans cet emplacement. L'IA commencera à entraîner une voix complètement nouvelle à partir de zéro en utilisant le nouveau jeu de données. Avant d'initier le réentraînement, vous pouvez soit conserver les échantillons historiques dans cet emplacement et téléverser des échantillons supplémentaires, soit effacer les échantillons historiques et n'utiliser que les nouveaux échantillons téléversés.

Lors de la préparation de nouveaux échantillons, veuillez noter :

  • Si la durée des nouveaux échantillons ajoutés est significativement plus faible que celle des échantillons déjà téléversés (par exemple ajouter 1 min de nouvel échantillon à un jeu de 30 mins), le réentraînement peut ne pas apporter de changements significatifs aux performances.

  • Le réentraînement ne changera pas le type de votre emplacement.

circle-info

Quand devrais-je réentraîner ma voix ?

  • Lorsque vos jeux de données ont une meilleure qualité ou une plus grande quantité qu'auparavant, vous pouvez les utiliser pour améliorer itérativement votre voix

  • Lorsque vous n'êtes pas satisfait du résultat actuel et souhaitez ajuster vos jeux de données

Gérer votre voix

Cliquez sur le Gérer bouton pour ouvrir la fenêtre de gestion d'une voix Voice Changer personnalisée. Dans cette fenêtre, vous pouvez modifier :

  • Image de la voix

  • Nom de la voix

  • Étiquettes

  • Type de voix

  • Étiquette de langue (uniquement pour le type de voix)

Après avoir effectué des modifications, vous pouvez cliquer sur Open in ACE bouton pour actualiser la liste des voix dans ACE Studio.

Mis à jour