GPT-3.5 คือ โมเดล Generative Pre-trained Transformer (GPT) ตัวท็อป เวอร์ชัน Advance ที่สุดของ OpenAI GPT-3.5 เป็นตัวอย่างของโมเดลภาษาขนาดใหญ่ Large Language Model (LLM) ที่แสดงถึงความก้าวหน้าในการประมวลผลภาษาธรรมชาติ ที่พลิกโฉมวงการคอมพิวเตอร์ทั่วโลก
GPT-3.5 คือ LLM ที่ถูกเทรนด้วยข้อมูลข้อความมหาศาล และสามารถสร้างข้อความที่สอดคล้องและมีความหมายตามบริบทได้ โมเดล Deep Learning ของ GPT-3.5 ใช้สถาปัตยกรรมแบบ Transformer เพื่อเข้าใจและสร้างข้อความภาษาที่คล้ายกับมนุษย์เป็นคนสร้างอย่างแยกกันแทบไม่ออก
จำนวนพารามิเตอร์ในโมเดลของ GPT เวอร์ชันต่าง ๆ (ยิ่งพารามิเตอร์เยอะ ยิ่งมีความสามารถในการเรียนรู้เยอะ และใช้ทรัพยาการในการเทรนเยอะเป็นทวีคูณ)
- GPT-1: 117 ล้าน parameters
- GPT-2: 1.5 พันล้าน parameters
- GPT-3: 175 พันล้าน parameters
- GPT-3.5: ไม่ได้ระบุ
GPT-4
GPT-4 คือ โมเดลภาษาขนาดใหญ่ LLM ตัวล่าสุด ในโมเดลตระกูล GPT ต่อจาก GPT-3.5 ของ OpenAI GPT-4 ถูกปล่อยออกมาให้คนทั่วไปใช้งาน ในวันที่ 14 มี.ค. 2023 ผ่าน โปรแกรม ChatGPT Plus ซึ่งเป็นเวอร์ชันพรีเมียม (เก็บเงิน) ของ ChatGPT (ฟรี) GPT-4 เป็นโมเดลแบบ Transformer ที่ถูกเทรนด้วยข้อมูลมหาศาลจากอินเตอร์เน็ต ข้อมูลจากพาร์ตเนอร์หลากหลายวงการ GPT-4 ถูก Fine-tuned เพิ่มเติมด้วยเทคนิค Reinforcement Learning จากมนุษย์ และ AI เพื่อเพิ่มประสิทธิภาพ และป้องการเนื้อหาที่ไม่เหมาะสม
เปรียบเทียบประสิทธิภาพ GPT-4 กับ GPT-3.5
จะเห็นว่า GPT-4 ทำคะแนนการสอบ ได้ดีกว่า GPT-3.5 ในหลาย ๆ วิชา (สีเขียว)
GPT-4 มีการแก้ไขข้อบกพร่อง และปรับปรุงการทำงานหลายอย่างขึ้นจาก GPT-3.5 เวอร์ชันก่อนหน้า การปรับปรุงที่เห็นได้อย่างชัดเจน คือ GPT-4 สามารถประมวลผลข้อมูลในรูปแบบ ข้อความ และรูปภาพได้ จาก GPT-3.5 ที่สามารถประมวลผลข้อความได้อย่างเดียว
อ้างอิง