对于形态丰富(拥有大量词缀等)的语言,发现【(1)使用TPT (2)使用byte-pair的变形的embedding,或对词缀作为token 】可以提高翻译效果