จาก ep ที่แล้ว Neural Machine Translation แปลภาษาฝรั่งเศส เป็นภาษาอังกฤษ ด้วย Sequence to Sequence RNN Model ใน ep นี้ เราจะมาเรียนรู้ Neural Machine Translation กันต่อ แต่จะใช้เทคนิคที่เรียกว่า Attention Mechanism มาเพิ่มประสิทธิภาพของโมเดล
Attention Mechanism คืออะไร
ในการแปลภาษา ยกตัวอย่างเช่น การแปลประโยคภาษาฝรั่งเศส ไปเป็นภาษาอังกฤษ ขณะที่เราเขียนคำแปลแต่ละคำออกมา เราจะโฟกัสเฉพาะคำบางคำ สนใจเฉพาะข้อความบางส่วนในต้นฉบับเท่านั้น และหลาย ๆ ครั้งในขณะที่แปลคำต่อไป เราก็จะสอดส่ายสายตา ย้อนไปมองหาคำที่เกี่ยวข้องในข้อความต้นฉบับ มองไปแปลไป ทีละส่วน ๆ
เราสามารถออกแบบโมเดล Neural Machine Translation ให้มีความสามารถนี้ ด้วย Attention Mechanism โมเดลจะโฟกัสเฉพาะบางส่วนของ Input เท่านั้น ณ เวลาหนึ่ง ส่วนจะโฟกัสที่ไหนเป็น Parameter ที่เราจะเทรนให้โมเดลเรียนรู้ได้ด้วยตัวเอง ด้วย Machine Learning
โมเดลจะเรียนรู้จากข้อมูลว่าควรโฟกัสตรงไหน ณ เวลา Step ไหน จะได้ประสิทธิภาพสูงสุด