โมเดลภาษาขนาดใหญ่ (Large Language Model, LLM) เป็นรูปแบบของปัญญาประดิษฐ์ (AI) ชนิดหนึ่งที่โมเดลถูกเทรนด้วยข้อมูลข้อความมากมายมหาศาลจากอินเตอร์เน็ต สร้างเป็นโมเดลภาษา Language Model ให้สามารถมีความเข้าใจความหมายข้อความตามบริบท (Context) และสร้างข้อความที่สอดคล้องออกมาได้
ตัวอย่าง Large Language Model ในปีที่ผ่านมา
มีหลายตัวที่น่าสนใจดังรูป / ตัวที่เป็น Open-Source จะเป็นสีเหลือง
LLM มีกี่ชนิด อะไรบ้าง
LLM แบ่งได้เป็น 2 ประเภท คือ
- Base LLM: โมเดลภาษาขนาดใหญ่ ที่ถูกเทรนให้ทำนายคำถัดไป เช่น Last Christmas I gave you my “heart“
- Instruction Tuned LLM: โมเดลภาษาขนาดใหญ่ ที่นำ Base LLM มา Fine-Tuned ให้ทำงานตามคำสั่ง เช่น ตอบคำถาม เช่น What is the largest animal in the world? “The largest animal in the world is the blue whale (Balaenoptera musculus).” รวมถึงใช้เทคนิคการให้คะแนนฟีดแบ็คคำตอบจากมนุษย์ Reinforcement Learning with Human Feedback (RLHF) เพื่อป้องการเนื้อหาที่ไม่เหมาะสม
เนื่องจาก Instruction Tuned LLM สามารถรับคำสั่งจากผู้ใช้ผ่านข้อความภาษาธรรมชาติเหมือนการพูดคุยปกติ ทำให้คุณภาพของผลลัพท์หรือคำตอบที่ได้นั้น ขึ้นกับคำถาม หรือ Prompt ค่อนข้างมาก เช่น ถ้าเราให้ LLM “เขียนรีวิวร้านกาแฟ อาหารอร่อย บรรยากาศดี”
โมเดล LLM สามารถตอบได้หลายแบบมาก อาหารอร่อย นี่หมายถึง อาหารคาว หรือ ของหวาน แล้วกาแฟอร่อยไหม บรรยากาศดียังไง สว่างสดใส มินิมอล หรือบรรยากาศสงบ ร่มรื่น จะเขียนยาว หรือสั้น เขียนเป็นทางการ หรือสำหรับโพสต์ลงโซเชียล เป็นคำบรรยาย หรือเป็นข้อ ๆ
การเขียน Prompt จึงเป็นศาสตร์ที่มีความสำคัญขึ้นมา ทำให้เกิดคอนเซ็ปท์ Prompt Engineering
การทำงานของ LLM
ประกอบด้วยขั้นตอน
- การสะสมข้อมูลในรูปแบบข้อความจำนวนมหาศาลจากแหล่งต่าง ๆ เช่น อินเตอร์เน็ต
- การประมวลผลข้อมูลก่อนเทรนให้อยู่ในรูปแบบที่จะนำไปเทรนต่อได้ง่าย
- การออกแบบสถาปัตยกรรม Architecture และ โมเดล LLM ที่เหมาะสม
- การเทรนโมเดลด้วยข้อมูลมหาศาล ด้วยเวลาหลายชั่วอายุคน (GPU สามารถทำงานขนานกันได้ เพื่อประหยัดเวลา)
- การ Fine-tuned เพื่อเพิ่มประสิทธิภาพสำหรับงานที่จะนำโมเดลไปใช้ต่อ และ
- การใช้งานโมเดลในการสร้างข้อความ
เราสามารถนำ LLM ไปประยุกต์ใช้ในงานที่หลากหลาย ในทุกสาขาอาชีพ เช่น การประมวลผลภาษาธรรมชาติ การแปลภาษา การสร้างเนื้อหา การแพทย์ กฏหมาย การค้า การผลิต และงานเชิงสร้างสรรค์
การทำงานของ LLM เป็นกระบวนการที่ซับซ้อน แต่เทคโนโลยีนี้เปิดโอกาสให้เราใช้ประโยชน์จากการสร้างข้อความที่มีคุณภาพสูง ช่วยในการทำงานของเราได้อย่างสอดคล้องตามความต้องการในทุก ๆ ด้าน
ในอนาคตอันใกล้นี้ LLM อาจเป็นส่วนสำคัญในการพัฒนาและปรับปรุงการสื่อสารระหว่างมนุษย์และเทคโนโลยี ให้เกิดประสบการณ์ใหม่ ๆ ที่เพิ่มความสะดวกสบายให้คนทำงาน และทำให้การทำงานในอนาคตเปลี่ยนแปลงไป มีประสิทธิภาพมากยิ่งขึ้น