โมเดลภาษาขนาดใหญ่ (Large Language Model, LLM) เป็นรูปแบบของปัญญาประดิษฐ์ (AI) ชนิดหนึ่งที่โมเดลถูกเทรนด้วยข้อมูลข้อความมากมายมหาศาลจากอินเตอร์เน็ต สร้างเป็นโมเดลภาษา Language Model ให้สามารถมีความเข้าใจความหมายข้อความตามบริบท (Context) และสร้างข้อความที่สอดคล้องออกมาได้

ตัวอย่าง Large Language Model ในปีที่ผ่านมา

มีหลายตัวที่น่าสนใจดังรูป / ตัวที่เป็น Open-Source จะเป็นสีเหลือง

A timeline of existing large language models in recent years
A timeline of existing large language models in recent years. Credit https://www.reddit.com/r/dataisugly/comments/12a8heb/a_timeline_of_large_language_models/

LLM มีกี่ชนิด อะไรบ้าง

LLM แบ่งได้เป็น 2 ประเภท คือ

  1. Base LLM: โมเดลภาษาขนาดใหญ่ ที่ถูกเทรนให้ทำนายคำถัดไป เช่น Last Christmas I gave you my “heart
  2. Instruction Tuned LLM: โมเดลภาษาขนาดใหญ่ ที่นำ Base LLM มา Fine-Tuned ให้ทำงานตามคำสั่ง เช่น ตอบคำถาม เช่น What is the largest animal in the world? “The largest animal in the world is the blue whale (Balaenoptera musculus).” รวมถึงใช้เทคนิคการให้คะแนนฟีดแบ็คคำตอบจากมนุษย์ Reinforcement Learning with Human Feedback (RLHF) เพื่อป้องการเนื้อหาที่ไม่เหมาะสม

เนื่องจาก Instruction Tuned LLM สามารถรับคำสั่งจากผู้ใช้ผ่านข้อความภาษาธรรมชาติเหมือนการพูดคุยปกติ ทำให้คุณภาพของผลลัพท์หรือคำตอบที่ได้นั้น ขึ้นกับคำถาม หรือ Prompt ค่อนข้างมาก เช่น ถ้าเราให้ LLM “เขียนรีวิวร้านกาแฟ อาหารอร่อย บรรยากาศดี”

โมเดล LLM สามารถตอบได้หลายแบบมาก อาหารอร่อย นี่หมายถึง อาหารคาว หรือ ของหวาน แล้วกาแฟอร่อยไหม บรรยากาศดียังไง สว่างสดใส มินิมอล หรือบรรยากาศสงบ ร่มรื่น จะเขียนยาว หรือสั้น เขียนเป็นทางการ หรือสำหรับโพสต์ลงโซเชียล เป็นคำบรรยาย หรือเป็นข้อ ๆ

การเขียน Prompt จึงเป็นศาสตร์ที่มีความสำคัญขึ้นมา ทำให้เกิดคอนเซ็ปท์ Prompt Engineering

การทำงานของ LLM

ประกอบด้วยขั้นตอน

  • การสะสมข้อมูลในรูปแบบข้อความจำนวนมหาศาลจากแหล่งต่าง ๆ เช่น อินเตอร์เน็ต
  • การประมวลผลข้อมูลก่อนเทรนให้อยู่ในรูปแบบที่จะนำไปเทรนต่อได้ง่าย
  • การออกแบบสถาปัตยกรรม Architecture และ โมเดล LLM ที่เหมาะสม
  • การเทรนโมเดลด้วยข้อมูลมหาศาล ด้วยเวลาหลายชั่วอายุคน (GPU สามารถทำงานขนานกันได้ เพื่อประหยัดเวลา)
  • การ Fine-tuned เพื่อเพิ่มประสิทธิภาพสำหรับงานที่จะนำโมเดลไปใช้ต่อ และ
  • การใช้งานโมเดลในการสร้างข้อความ

เราสามารถนำ LLM ไปประยุกต์ใช้ในงานที่หลากหลาย ในทุกสาขาอาชีพ เช่น การประมวลผลภาษาธรรมชาติ การแปลภาษา การสร้างเนื้อหา การแพทย์ กฏหมาย การค้า การผลิต และงานเชิงสร้างสรรค์


Artificial General Intelligence Illustration. Credit: File:Artificial General Intelligence Illustration.png – Wikimedia Commons

การทำงานของ LLM เป็นกระบวนการที่ซับซ้อน แต่เทคโนโลยีนี้เปิดโอกาสให้เราใช้ประโยชน์จากการสร้างข้อความที่มีคุณภาพสูง ช่วยในการทำงานของเราได้อย่างสอดคล้องตามความต้องการในทุก ๆ ด้าน

ในอนาคตอันใกล้นี้ LLM อาจเป็นส่วนสำคัญในการพัฒนาและปรับปรุงการสื่อสารระหว่างมนุษย์และเทคโนโลยี ให้เกิดประสบการณ์ใหม่ ๆ ที่เพิ่มความสะดวกสบายให้คนทำงาน และทำให้การทำงานในอนาคตเปลี่ยนแปลงไป มีประสิทธิภาพมากยิ่งขึ้น

แชร์ให้เพื่อน:

Surapong Kanoktipsatharporn on FacebookSurapong Kanoktipsatharporn on LinkedinSurapong Kanoktipsatharporn on Rss
Surapong Kanoktipsatharporn
Solutions Architect at Bua Labs
The ultimate test of your knowledge is your capacity to convey it to another.

Published by Surapong Kanoktipsatharporn

The ultimate test of your knowledge is your capacity to convey it to another.