Sentiment Classification วิเคราะห์รีวิวหนัง IMDB แง่บวก แง่ลบ ด้วย Naive Bayes และ Logistic Regression – NLP ep.5

ใน ep นี้ เราจะใช้ความรู้จาก ep ก่อน ในการสร้าง Term-Document Matrix ด้วย CountVectorizer ด้วยข้อมูลรีวิวหนัง IMDB แล้วนำ Term-Document Matrix ที่ได้ มาวิเคราะห์ Sentiment Classification ว่าเป็นรีวิวแง่บวก หรือแง่ลบ (positive/negative) ด้วยเทคนิค Naive Bayes และ Logistic Regression

สอนสร้าง Word Cloud ภาษาไทย ด้วย Python ใน Jupyter Notebook / Google Colab

ใน ep นี้เราจะมาเรียนรู้วิธีสร้างภาพ Tag Cloud ภาษาไทย สวย ๆ ด้วยภาษา Python กันแบบง่าย ๆ เหมือนในภาพ Cover ของบล็อก ep ก่อน ๆ เช่น อักษรกรีก คำอ่านภาษาไทย และ สอนวิธี Contribute Open Source Software Project

Latent Semantic Analysis (LSA) คืออะไร Text Classification ด้วย Singular Value Decomposition (SVD), Non-negative Matrix Factorization (NMF) – NLP ep.4

ใน ep นี้ เราจะมาเรียนรู้ งานจำแนกหมวดหมู่ข้อความ Text Classification ซึ่งเป็นงานพื้นฐานทางด้าน NLP ด้วยการทำ Latent Semantic Analysis (LSA) วิเคราะห์หาความหมายที่แฝงอยู่ในข้อความ โดยใช้เทคนิค Singular Value Decomposition (SVD) และ Non-negative Matrix Factorization (NMF)

Stemming คืออะไร Lemmatization คืออะไร Stemming และ Lemmatization ต่างกันอย่างไร – NLP ep.3

ตามหลักตามไวยากรณ์ภาษาอังกฤษ คำหนึ่งคำจะแปรไปได้หลายรูปแบบ เช่น organize, organizes, organized, organizing นอกจากนั้นคำยังสามารถแปลงเป็นกลุ่มคำ ที่มาจากรากศัพท์เดียวกันได้อีกหลายรูปแบบ เช่น democracy, democratic, democratization ในงาน NLP ถ้าเราต้องการค้นหาคำบางคำในกลุ่ม แล้วอยากให้ได้ผลลัพธ์ครอบคลุมทุกคำทั้งกลุ่ม แล้วเราจะทำอย่างไร

Stop Words คืออะไร ใน Natural Language Processing – NLP ep.2

Natural Language Processing (NLP) ในสมัยก่อนยุค Deep Learning เป็นที่นิยม นักวิจัยมักจะใช้วิธี Hand Engineer กับข้อมูล ในงาน NLP จะมีการเขียนโปรแกรมผูก Logic กฏระเบียบ ไวยากรณ์ ไว้หลายอย่างในโปรแกรม มีการตัดสินใจกำหนด Assumption / Bias หลายอย่าง หนึ่งในนั้นคือ Stop Words ตามรายการที่กำหนด สามารถตัดทิ้งได้ ไม่สำคัญกับความหมายของเนื้อหา ทำให้ลดจำนวนคำศัพท์ ลดความซับซ้อนของโปรแกรมลง

วิธีทำให้ Jupyter Notebook เล่นเสียงอัตโนมัติ เมื่อทำงานเสร็จ – Jupyter Notebook ep.7

ในการเทรนโมเดล Deep Neural Network ใน Jupyter Notebook แต่ละรอบมักใช้เวลาค่อนข้างนาน เราอาจจะต้องการให้มีเล่นเสียงเตือนขึ้นมา เช่น หลังจากที่เทรน Machine Learning รัน Training Loop 3 Cell นั้นเสร็จ เพื่อที่ได้ไม่ต้องมาคอยเช็คหน้าจอเป็นระยะ ดูว่าโปรแกรมทำงานเสร็จแล้วหรือยัง ต้องทำอย่างไร

พัฒนาโปรแกรม AI การแพทย์ วินิจฉัยภาวะปอดรั่ว (Pneumothorax) อัตโนมัติ จากฟิล์ม X-Ray โดยใช้ Machine Learning, Deep Neural Network – Image Segmentation ep.2

สมมติว่าอยู่ดี ๆ เราก็หายใจลำบาก หอบตัวโยน โดยไม่มีสาเหตุ ไม่มีอาการล่วงหน้าใด ๆ หรือว่าเราจะเป็น ภาวะปอดรั่ว ใน ep นี้ เราจะมาใช้ Machine Learning และ Deep Neural Network พัฒนาโปรแกรม AI การแพทย์ ช่วยวินิจฉัยภาวะปอดรั่ว หรือ Pneumothorax นี้กัน

วิเคราะห์ข้อมูลภูมิศาสตร์ หาทำเล สร้างโรงพยาบาลใหม่ Proximity Analysis อุบัติเหตุทางถนน การรับมือเหตุฉุกเฉินของโรงพยาบาล ในเมือง New York City – GeoSpatial ep.8

ใน ep นี้ เราจะสมมติตัวเองว่าอยู่ในทีม Crisis Response ที่จะวิเคราะห์อุบัติเหตุทางถนน รถชน และการรับมือเหตุฉุกเฉินของโรงพยาบาล ในเมือง New York City เพื่อตอบคำถามดังนี้

Proximity Analysis คืออะไร วิเคราะห์คุณภาพอากาศ ปริมาณฝุ่น PM 2.5 สารเคมี สารพิษในอากาศ กับสถานีตรวจวัดอากาศอัตโนมัติ ด้วยข้อมูลภูมิศาสตร์ – GeoSpatial ep.7

ใน ep นี้ เราจะสมมติตัวเองเป็นนักสิ่งแวดล้อม วิเคราะห์คุณภาพอากาศ ในบริเวณที่มีการปล่อย สารพิษ สารเคมี, ฝุ่น PM 2.5, etc. กับความสัมพันธ์กับระยะทางของสถานีตรวจวัดอากาศอัตโนมัติ ในเมืองฟิลาเดลเฟีย รัฐเพนซิลเวเนีย ประเทศสหรัฐอเมริกา

วิเคราะห์ทำเล สร้างร้านกาแฟ Starbucks Reserve Roastery สาขาใหม่ ด้วย Big Data Analysis วิเคราะห์ข้อมูลภูมิศาสตร์ ประชากร กลุ่มลูกค้า – GeoSpatial ep.6

ใน ep นี้เราจะสมมติตัวเองเป็น Big Data Analyst ของ Starbucks ที่รับมอบหมายงาน ให้หาทำเลที่บริษัทจะก่อสร้าง ร้านกาแฟสาขาพิเศษแบบ Starbucks Reserve Roastery สาขาต่อไป เราจะวิเคราะห์ข้อมูลภูมิศาสตร์ และข้อมูลประชากร ในแต่ละ County ในรัฐ California ประเทศสหรัฐอเมริกา เพื่อหาทำเลที่มีศักยภาพเหมาะสม