18 luglio 2011
(Cross-pubblicato sul blog e sul blog Traduci ricerca)
A partire da oggi, è possibile esplorare la diversità linguistica del sub-continente indiano con Google Translate, che ora supporta cinque lingue nuove alfa sperimentale: bengalese, gujarati, kannada, tamil e telugu.
Solo in India e Bangladesh , più di 500 milioni di persone parlano queste cinque lingue.
Dal 2009, abbiamo lanciato un totale di 11 lingue alfa, portando l'attuale numero di lingue supportate da Google Translate a 63.
Lingue indiane diverse dall'inglese in molti modi, ciò presenta una sfida interessante per lo sviluppo delle loro rispettivi sistemi di traduzione.
Lingue indiane utilizzano spesso il Verbo Soggetto Oggetto (SOV) per formare le frasi, a differenza dell' inglese, che utilizza Soggetto Oggetto Verbo (SVO) per creare frasi.
Questa differenza nella struttura della frase rende più difficile produrre traduzioni fluenti, le parole necessitano di più risorse per essere riordinate e maggiori sono le possibilità di fare degli errori durante lo spostamento.
Tamil, Telugu e Kannada sono anche molto agglutinanti, il che significa una sola parola spesso include affissi che rappresentano ulteriore significato, come tesi o numero.
Fortunatamente, la nostra ricerca per migliorare il giapponese (una lingua SOV) ci hanno aiutato con la sfida d'ordine delle parole, mentre il nostro lavoro di traduzione lingue come il tedesco, turco e russo aveva sviluppato nuovi metodi per risolvere il problema dell'agglutinazione.
Se notate traduzioni errate o mancanti per qualsiasi delle nostre lingue, si prega di correggerci, ci piace imparare dai nostri errori e il vostro feedback ci aiuta a licenziare nuovi linguaggi dallo stato alfa.
Dato che queste lingue hanno ciascuna i propri script unico, abbiamo attivato un metodo di immissione traslitterato per quelli di voi senza tastiere lingua indiana.
Per esempio, se si digita la parola "nandri", si genera la parola tamil ????? (vedi cosa vuol dire).
Per vedere tutti questi script belli d'azione, è necessario installare i font per ogni lingua. Speriamo che il lancio di questi nuovi linguaggi alfa vi aiuterà a comprendere meglio il Web indiano ed incoraggiare la pubblicazione di nuovi contenuti in lingue indiane, che con queste cinque lingue alfa più vicino ad un Web senza barriere linguistiche.
Scarica i font per ogni lingua: tamil, telugu, il bengali, gujarati e kannada.
Inviato da Ashish Venugopal, Ricercatore