Mỗi lớp Encoder và Decoder trong Transformer còn bao gồm một mạng nơ-ron hồi tiếp (feed-forward network) được áp dụng cho m