Language Network

En un artículo de hace 3 años hice una comparación entre idiomas por su vocabulario, tanto por escritura (Levenshtein), como por pronunciación (Soundex o Double Metaphone).

Desde entonces, he ido incrementando el número de diccionarios, lo he limitado a la comparación Levenshtein y he mejorado la visualización. Ahora cuenta con 96 idiomas, casi 1 millón de palabras (más de 9000 palabras por idioma, de media) y está implementado usando la librería JavaScript D3.js.

Muestra curiosidades como la conexión entre el castellano y el ladino, el lenguaje que se hablaba en la comunidad judía de la Península Ibérica hasta el año 1492. O el parecido entre el castellano y el hiligainón, una lengua que se habla en Filipinas, que fue colonia española durante más de 300 años. O la agrupación automática de las lenguas romances (italiano, castellano, portugués, francés, etc.), las lenguas germanas (alemán, danés, neerlandés, noruego, islandés, etc.) y las eslavas (ruso, serbo-croata, checo, polaco, búlgaro, etc.). Sin embargo, aún tiene algunos aspectos mejorables, como que el griego aparezca como una isla, siendo uno de los idiomas que más ha influido en todos los idiomas indo-europeos.

Este es el estado actual: Language Network.

[important]Pulsa para acceder a Language Network
¡Google Chrome recomendado! En Firefox puede ser lento. En IE o Safari no está comprobado.[/important]

Language Network - Network layout

Language Network – Network layout

Language Network - Chord layout

Language Network – Chord layout