¿Cómo identificar el lenguaje de los personajes en Ruby / Rails?

Dado un carácter (una letra de una cadena), ¿cómo podría identificar a qué idioma pertenece? Las opciones son: inglés, ruso, hebreo.

Antecedentes: este carácter fue ingresado por el usuario en un formulario y luego almacenado en una base de datos.

Puede ser, por ejemplo, la primera letra de una de estas palabras:

  • Hola
  • ¡Hola
  • Hola

preguntado el 10 de mayo de 11 a las 13:05

¿Qué versión de Ruby estás usando? -

1 Respuestas

La UNICODE el estándar se divide en "bloques". Ven aquí:

http://www.unicode.org/charts/

http://en.wikipedia.org/wiki/Unicode_block

http://www.unicode.org/versions/Unicode6.0.0/

y busque bloques Unicode (intervalos) para cada idioma.

Mi conjetura:

Así que para ti es cuestión de simple comparación de números para cada carácter (valor ordinal Unicode). Muy simple.

contestado el 10 de mayo de 11 a las 17:05

@Izap: ¡Genial! Eso es lo que pensé hacer. ¿Qué función de Ruby devuelve el Unicode del personaje? - Misha Moroshko

Me alegra que te guste. stackoverflow.com/questions/308749/… - lzap

No es la respuesta que estás buscando? Examinar otras preguntas etiquetadas or haz tu propia pregunta.