MNIST Database คือ ชุดข้อมูลรูปภาพของตัวเลขอารบิก 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 ที่เขียนด้วยลายมือ 70,000 รูป MNIST คือ ชุดข้อมูลสำหรับไว้เทรน Artificial Intelligence (AI) เกี่ยวกับ Computer Vision / Image Processing
MNIST Dataset
MNIST Dataset คือ ชุดข้อมูลรูปภาพตัวเลขอารบิก ที่เขียนด้วยลายมือ เป็นรูปขาวดำ Grayscale ความละเอียด Resolution กว้าง x ยาว 28 x 28 Pixel จำนวน 70,000 รูป แบ่งเป็น 60,000 (Training Set) + 10,000 (Test Set) รูป จากการรวบรวมของ Yann Lecunn ผู้บุกเบิกวิจัยทางด้าน Computer Vision ที่ใช้พัฒนาโปรแกรม OCR ดูเช็คธนาคาร ดูรหัสไปรษณีย์บนจดหมาย ตั้งแต่ปี 1998
MNIST ย่อมาจาก The MNIST database (Modified National Institute of Standards and Technology database) ถือได้ว่าเป็นชุดข้อมูล Hello World สำหรับผู้ที่ศึกษา Deep Learning
ในชุดข้อมูล MNIST จะแบ่งเป็น Folder ดังนี้ ภายใน Folder บรรจุรูปภาพ ของตัวเลขตามชื่อของ Folder ไฟล์รูปภาพมีนามสกุล .png
minst_png
- training
- 0
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- testing
- 0
- 1
- …
เรามาเรียนรู้กันต่อ ดูตัวอย่างว่าเราจะนำ MNIST Database ไปใช้ได้อย่างไร ใน ep 3 สอนสร้างโมเดล Deep Learning จำแนกรูปภาพ ตัวเลข MNIST