¿Detección de frecuencia de sonido?

¿Cuál es la solución para detectar palabras específicas del archivo de audio?

Tengo muchos archivos de audio (el mismo códec) y cada archivo dura solo unos 15 segundos. (Nota: todos los archivos de audio son de la misma persona/mismo acento)

Por ejemplo:

prueba1.mp3 PLAY Hello Tom, what are you doing today?

prueba2.mp3 PLAY Hello Paul, what are you doing today?

prueba3.mp3 PLAY Good morning John - It is lovely weather today

Necesito una forma de detectar clima agradable or Que eres palabras de cada archivo de audio.

Puedo tener 100 archivos de audio que dicen "¿qué estás haciendo hoy?" y otros archivos dicen "¿qué estás haciendo hoy?" - Solo necesito saber cuál es el estado/tipo de cada archivo.

¿Cuál es la solución para comprobar que existen bits de frecuencia en lugar de utilizar la herramienta de reconocimiento de voz?

preguntado el 03 de mayo de 12 a las 16:05

What is the solution to this? - La solución es no usar PHP. No es una buena opción para este tipo de cosas, requiere un montón de operaciones matemáticas de bajo nivel y PHP no es muy eficiente para esto. -

busque programas/bibliotecas/servicios web de reconocimiento de voz en otros idiomas y luego llámelos a través de la línea de comandos. No encontrará cosas de reconocimiento de voz directamente en php. -

debería pensar por usar PHP, el OP significa que están felices de usar bibliotecas/módulos de PHP pero no necesariamente escritos en PHP :). -

Si solo necesita hacer esto con un par de archivos, es posible que desee probar la API de voz de Google, aquí hay un buen artículo sobre cómo usarla con ejemplos de Perl. mikepultz.com/2011/03/accessing-google-speech-api-chrome-11 De hecho, he hecho esto con curl y php. Solo necesita PUBLICAR el archivo de sonido en el formato correcto:

considere cambiar el título a reconocimiento de voz. -

1 Respuestas

Básicamente, está preguntando "¿Cómo puedo hacer un reconocimiento de voz de propósito general"?

Las soluciones son:

Si su plataforma proporciona reconocimiento de voz listo para usar, utilícelo. Microsoft Windows lo hace, por ejemplo. http://msdn.microsoft.com/en-us/library/hh323805.aspx

Si su plataforma no lo hace, entonces necesita integrar un paquete de reconocimiento de voz de terceros, como Lernaut & Hauspie (ahora Nuance), Dragon, etc. Esto probablemente implique pagar dinero.

Edit: He marcado esto como un duplicado de API de texto a voz (generación de voz) y de voz a texto (reconocimiento de voz)?, que tiene una respuesta completa a "¿cómo puedo hacer reconocimiento de voz?".

contestado el 23 de mayo de 17 a las 13:05

No es la respuesta que estás buscando? Examinar otras preguntas etiquetadas or haz tu propia pregunta.