สอนเขียน Prompt ChatGPT จงแสดงวิธีทำ Zero Shot Chain of Thought (Zero-shot-CoT) – Prompt Engineering ep.5

Prompt Engineering เป็นศาสตร์ที่เกี่ยวกับการออกแบบ Prompt หรือคำสั่ง ที่จะชี้นำโมเดลภาษา (Language Model) ให้ผลิตผลลัพท์ที่เราต้องการ เวลาที่เราออกแบบ Prompt สำหรับงานที่ซับซ้อน เราจำเป็นต้องให้โมเดลมีเวลาในการคิด และแตกงานที่ซับซ้อนออกเป็นขั้นตอนย่อย เนื่องจากโมเดลภาษา LLM ต้องการเวลาในการประมวผลข้อมูล และตอบคำถาม เช่นเดียวกับมนุษย์

ยกตัวอย่างเช่น มนุษย์ ใช้เวลาในการ คุณเลข 5 x 6 แค่ 1 วินาที แต่ใช้เวลา 10 วินาที ในการคูณเลข 55 x 65 แล้วใช้เวลามากขึ้นเรื่อย ๆ สำหรับการคูณเลข 555 x 656 โมเดลภาษาก็ต้องการเวลาเพิ่มเช่นกัน แต่เราจะมีวิธีเขียน Prompt บอกโมเดลให้ใช้เวลาคิดเพิ่มเต็มที่เลยได้ยังไง

Continue reading “สอนเขียน Prompt ChatGPT จงแสดงวิธีทำ Zero Shot Chain of Thought (Zero-shot-CoT) – Prompt Engineering ep.5”

สอนเขียน Prompt ChatGPT ยกตัวอย่างผลลัพธ์ที่อยากได้ Few-Shot Prompting – Prompt Engineering ep.4

Prompt Engineering จะตีโจทย์ว่าเป็นงานหรือปัญหาบางอย่างที่ต้องการให้โมเดล Machine Learning หรือ LLM มาช่วยหาคำตอบ โจทย์สามารถมีได้หลากหลายตั้งแต่ ตรวจคำผิด คัดแยกอีเมล์สแปม Sentiment Analysis แปลภาษา ไปจนถึงประมวลผลรูปภาพ แยกแยะวัตถุที่อยู่ในภาพ

Continue reading “สอนเขียน Prompt ChatGPT ยกตัวอย่างผลลัพธ์ที่อยากได้ Few-Shot Prompting – Prompt Engineering ep.4”

สอนเขียน Prompt ChatGPT สั่งให้ AI ตรวจเช็คเงื่อนไขที่จำเป็น ก่อนทำงาน – Prompt Engineering ep.3

ChatGPT เป็น LLM ระดับ Advance มันจะพยายามอย่างที่สุดที่จะตอบคำถามที่เราป้อนให้ จากข้อมูลมหาศาลที่มันถูกเทรนมา อย่างไรก็ตามมันไม่มีข้อมูลความรู้จากโลกความเป็นจริงที่เป็นปัจจุบัน ไม่สามารถเข้าใจบริบทอื่น ๆ นอกจากที่อยู่ในใน Training Data ดังนั้นเมื่อเราถามคำถาม หรือสั่งอะไรที่เป็นไปไม่ได้ บางทีมันจะสร้างคำตอบที่ฟังดูดี แต่อาจจะไม่เป็นความจริง ตอบกลับมาให้เราได้ ทางแก้ก็คือเราควรรู้เท่าทัน เข้าใจว่ามันคือ โปรแกรมคอมพิวเตอร์โปรแกรมหนึ่ง ซึ่งมีข้อจำกัด ไม่สามารถรู้ทุกอย่าง ไม่สามารถทำได้ทุกอย่าง ไม่สามารถทำสิ่งที่เป็นไปไม่ได้ให้เป็นไปได้ และสั่งให้มันตรวจเช็คเงื่อนไขที่จำเป็นก่อนทำงาน ไม่ได้ก็ตอบว่าไม่ได้ตรง ๆ

Continue reading “สอนเขียน Prompt ChatGPT สั่งให้ AI ตรวจเช็คเงื่อนไขที่จำเป็น ก่อนทำงาน – Prompt Engineering ep.3”

สอนเขียน Prompt ChatGPT ระบุรูปแบบโครงสร้างผลลัพท์ – Prompt Engineering ep.2

ใน Prompt Engineering สิ่งหนึ่งที่ที่ไม่ควรมองข้าม คือ การระบุรูปแบบโครงสร้างของผลลัพท์ที่เราต้องการ เช่น Plain Text, CSV, JSON, HTML เหตุผลข้อแรกก็คือ มันช่วยให้ผลลัพท์ที่ได้ ถูกจัดให้อยู่ในรูปแบบที่เราคาดหวัง สามารถนำไปใช้งานต่อไปทันที

ตามปกติ ในระบบงานไอที Output จากระบบหนึ่งไปเป็น Input ของอีกระบบนึง ต่อไปเรื่อย ๆ เป็นเครือข่ายซับซ้อน ขึ้นกับแต่ละองค์กร ซึ่งแต่ละระบบก็จะคาดหวัง Input รูปแบบโครงสร้างข้อมูลที่แตกต่างกันไป เมื่อเราระบุรูปแบบโครงสร้างข้อมูลที่ต้องการ ใน Prompt ให้ LLM อย่างชัดเจนตั้งแต่ต้น ทำให้เราแน่ใจว่าสามารถบูรณาการระบบงานต่าง ๆ ได้อย่างไร้รอยต่อ

Continue reading “สอนเขียน Prompt ChatGPT ระบุรูปแบบโครงสร้างผลลัพท์ – Prompt Engineering ep.2”

สอนเขียน Prompt ChatGPT ใช้เครื่องหมายวรรคตอน คั่นอินพุต และคำสั่ง – Prompt Engineering ep.1

Prompt Engineering เป็นส่วนสำคัญในความสำเร็จของโมเดลภาษาขนาดใหญ่ (LLM) แบบ ChatGPT ที่จะเปิดโอกาสให้เราสามารถสื่อสาร เสริมสร้างความเข้าใจระหว่างมนุษย์ และ AI เป็นการใช้เทคโนโลยีอย่างสร้างสรรค์ พลิกโฉมการทำงานในอนาคตอันใกล้

ด้วยการออกแบบ Prompt อย่างถูกวิธี เราสามารถระบุคำสั่งและบริบทที่ต้องการได้อย่างกระจ่าง แจ่มแจ้ง ชัดเจน ไม่คลุมเครือ เพื่อกำหนดทิศทาง และเป้าหมาย ทำให้ผลลัพท์ที่ได้จากโมเดลภาษา มีความถูกต้อง แม่นยำ และสอดคล้องกับความต้องการของเรา

Continue reading “สอนเขียน Prompt ChatGPT ใช้เครื่องหมายวรรคตอน คั่นอินพุต และคำสั่ง – Prompt Engineering ep.1”

Prompt Engineering คืออะไร

Prompt Engineering คือ เป็นคอนเซ็ปต์ใหม่ ในวิชาปัญญาประดิษฐ์ (AI) อยู่ในสาขา ประมวลผลภาษาธรรมชาติ (Natural Language Processing, NLP) โดยโฟกัสที่การพัฒนาและปรับ Prompt ให้เหมาะสมสำหรับการใช้สั่งการโมเดลภาษาขนาดใหญ่ (Large Language Model, LM) อย่างมีประสิทธิภาพ Prompt Engineering เกี่ยวข้องกับทักษะและเทคนิคในการทำความเข้าใจขีดความสามารถและข้อจำกัดของโมเดลภาษาขนาดใหญ่ (LLM)

Continue reading “Prompt Engineering คืออะไร”

GPT-4 คืออะไร Generative Pre-trained Transformer (GPT) คืออะไร

GPT-3.5 คือ โมเดล Generative Pre-trained Transformer (GPT) ตัวท็อป เวอร์ชัน Advance ที่สุดของ OpenAI GPT-3.5 เป็นตัวอย่างของโมเดลภาษาขนาดใหญ่ Large Language Model (LLM) ที่แสดงถึงความก้าวหน้าในการประมวลผลภาษาธรรมชาติ ที่พลิกโฉมวงการคอมพิวเตอร์ทั่วโลก

Continue reading “GPT-4 คืออะไร Generative Pre-trained Transformer (GPT) คืออะไร”

Large Language Model (LLM) คืออะไร

โมเดลภาษาขนาดใหญ่ (Large Language Model, LLM) เป็นรูปแบบของปัญญาประดิษฐ์ (AI) ชนิดหนึ่งที่โมเดลถูกเทรนด้วยข้อมูลข้อความมากมายมหาศาลจากอินเตอร์เน็ต สร้างเป็นโมเดลภาษา Language Model ให้สามารถมีความเข้าใจความหมายข้อความตามบริบท (Context) และสร้างข้อความที่สอดคล้องออกมาได้

Continue reading “Large Language Model (LLM) คืออะไร”

ChatGPT คืออะไร ChatGPT มีค่าใช้จ่ายไหม ChatGPT นำมาใช้ประโยชน์อะไร

ChatGPT คือ แชทบอทปัญญาประดิษฐ์ (AI Chatbot) ที่ถูกสร้างโดย OpenAI เปิดตัวเมื่อ เดือน พฤษจิกายน 2022 OpenAI พัฒนา ChatGPT ขึ้นมาโดยใช้เทคนิค Deep Learning โดยถูกสร้างต่อยอดจากโมเดล GPT-3.5 และ GPT-4 ซึ่งเป็น โมเดลภาษาขนาดใหญ่ (LLM) ที่ถูกเทรนด้วยข้อมูลข้อความจำนวนมหาศาลจากอินเทอร์เน็ต ChatGPT ถูกออกแบบให้เข้าใจ และสร้างข้อความภาษาธรรมชาติ Natural Language (ภาษาที่คนใช้ในชีวิตประจำวันทั่วไป)

Continue reading “ChatGPT คืออะไร ChatGPT มีค่าใช้จ่ายไหม ChatGPT นำมาใช้ประโยชน์อะไร”

Weighted Cross Entropy Loss คืออะไร – Loss Function ep.5

ในกรณีที่จำนวนข้อมูลตัวอย่าง ในแต่ละ Class แตกต่างกันมาก เรียกว่า Class Imbalance แทนที่เราจะใช้ Cross Entropy Loss ตามปกติที่เรามักจะใช้ในงาน Classification เราจะใช้ Cross Entropy Loss เวอร์ชันพิเศษ เรียกว่า Weighted Cross Entropy Loss เข้ามาช่วย

Continue reading “Weighted Cross Entropy Loss คืออะไร – Loss Function ep.5”