GithubHelp home page GithubHelp logo

tortoise-tts's Introduction

Instalar tortoise-tts

Tortoise TTS es una herramienta de síntesis de voz de código abierto desarrollada por neonbjb. Utiliza modelos de lenguaje de última generación para convertir texto en voz de forma rápida y sencilla. Con Tortoise TTS, puedes generar voces humanas realistas en varios idiomas y estilos.


Paso 1: Crear una instancia de VM en Google Cloud

  1. Accede a Google Cloud Console: Ve a Google Cloud Console.

  2. Crea una nueva instancia de VM:

    • En el menú de la izquierda, selecciona Compute Engine y luego VM instances.
    • Haz clic en Create instance.
  3. Configura los detalles de tu instancia:

    • Nombre: tortoise-tts-vm
    • Región y zona: Selecciona la que prefieras.
    • Tipo de máquina: Escoge una con suficiente CPU y memoria. Una n1-standard-4 debería ser suficiente.
    • Sistema operativo: Elige una imagen basada en Ubuntu (por ejemplo, Ubuntu 20.04 LTS).
  4. Permitir tráfico HTTP/HTTPS:

    • En la sección de Firewall, marca las casillas para permitir tráfico HTTP y HTTPS.
  5. Haz clic en Create.


Paso 2: Conectarse a la VM

  1. Conéctate mediante SSH:
    • Una vez creada la instancia, haz clic en SSH para conectarte a la VM desde el navegador.

Paso 3: Configurar el entorno en la VM

  1. Actualizar el sistema
sudo apt update
sudo apt upgrade -y
  1. Instalar dependencias esenciales
sudo apt install -y git python3 python3-venv python3-pip ffmpeg
  1. Clonar el repositorio y acceder a él
git clone https://github.com/neonbjb/tortoise-tts.git
cd tortoise-tts
  1. Crear y activar un entorno virtual
python3 -m venv venv
source venv/bin/activate
  1. Instalar las dependencias requeridas
pip install -r requirements.txt
  1. Desinstalar tokenizers si está instalado
pip uninstall tokenizers
  1. Instalar la versión específica de transformers
pip install transformers==4.31.0
  1. Instalar la versión requerida de tokenizers
pip install tokenizers==0.13.3
  1. Establecer la variable PYTHONPATH
export PYTHONPATH=$(pwd)
  1. Ejecutar el script de Tortoise TTS
python tortoise/do_tts.py --text "Hola, esto es una prueba de Tortoise TTS." --voice "random" --preset "fast"

Paso 4: Configurar acceso remoto desde tu ordenador

  1. Instalar flask para crear una API simple:

    pip install flask
  2. Ir a la carpeta

    cd tortoise-tts
  3. Crear Carpeta para la API

    mkdir api_tortoise
    cd api_tortoise
  4. Crear Carpeta para la API

    nano app.py
  5. Añade el siguiente código:

    from flask import Flask, request, send_file
    import subprocess
    
    app = Flask(__name__)
    
    @app.route('/synthesize', methods=['POST'])
    def synthesize():
       text = request.form['text']
       output_file = 'output.wav'
       subprocess.run(['python3', 'tortoise/do_tts.py', '--text', text, '--voice', 'random', '--preset', 'fast', '--output_path', output_file])
       return send_file(output_file, as_attachment=True)
    
    if __name__ == '__main__':
       app.run(host='0.0.0.0', port=5000)
  6. Guardar y salir del archivo

    Para guardar y salir del editor de texto Nano, puedes seguir estos pasos:

    • Presiona Ctrl + O para guardar el archivo.
    • Aparecerá una línea en la parte inferior de la pantalla donde puedes confirmar el nombre del archivo. Simplemente presiona Enter para confirmar el nombre actual del archivo (app.py).
    • Luego, presiona Ctrl + X para salir de Nano.
  7. Ejecutar el servidor Flask:

    cd ~/tortoise-tts/api_tortoise
    python3 app.py

Paso 5: Activar todo cada vez que se entra

  1. Activar entorno virtual:

    source ~/tortoise-tts/venv/bin/activate
  2. Activar API flask

    python3 ~/tortoise-tts/api_tortoise/app.py

Paso 6: Enviar texto desde tu ordenador y obtener el audio

  1. Enviar texto mediante curl desde tu ordenador:
    curl -X POST -F "text=Hola, esto es una prueba de Tortoise TTS." http://34.125.77.15:5000/synthesize --output output.wav

tortoise-tts's People

Contributors

esanpons avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.