Normalization คืออะไร ปรับช่วงข้อมูล Feature Scaling ด้วยวิธี Normalization, Standardization ก่อนเทรน Machine Learning – Preprocessing ep.2

การทำ Feature Scaling คือ วิธีการปรับช่วงขอบเขตของข้อมูลชนิดตัวเลข Cardinal แต่ละ Feature (Field) ให้อยู่ในช่วงเดียวกัน ที่เหมาะกับการนำไปประมวลผลต่อ เข้าสูตรคำนวณได้ง่าย เช่น ช่วง [0, 1] หรือ [-1, 1] ได้ผลลัพธ์อยู่ในช่วงที่กำหนด เรียกว่า Data Normalization นิยมทำในขั้นตอน Preprocessing จัดเตรียมข้อมูล ก่อนป้อนให้โมเดลใช้เทรน

จำนวน Cardinal Numbers, Ordinal Numbers และ Nominal Numbers คืออะไร ชนิดของตัวเลข แตกต่างกันอย่างไร

ในการที่จะวิเคราะห์ข้อมูลในรูปแบบตาราง เราจะเจอข้อมูลหลากหลาย Data Type เช่น String, Integer, Float, Date, Datetime, BLOB, Etc. แต่ใน Column ที่เป็นตัวเลข Integer เหมือนกัน ก็ยังมีความหมายแฝงที่แตกต่างกันไปได้อีก แล้วแต่ว่าเป็นชนิดตัวเลขแบบ Cardinal Numbers, Ordinal Numbers หรือ Nominal Numbers