Hice este experimento ayer y AniMaker fue mucho mejor. Subo los archivos para que el que guste compare.Si alguien tiene mucho tiempo libre y está dispuesto a hacerlo, es bueno comparar los resultados de la transcripción de susurro (usando un modelo grande con al menos 10 GB de GPU), vosk/kaladi y animaker usando el mismo archivo fuente, ya que descubrió que este es el mejor software disponible hasta ahora que podemos usar para transcribir.
Me pregunto qué software crea una transcripción más precisa.![]()