Data Augmentation in Natural Language Processing
สำหรับคนที่เคยทำงานด้าน Machine Learning และ Deep Learning น่าจะเป็นที่ทราบกันดีว่าการที่จะสอนให้โมเดลเรียนรู้ความสัมพันธ์ภายในข้อมูลและทำนายข้อมูลได้อย่างแม่นยำ
สำหรับคนที่เคยทำงานด้าน Machine Learning และ Deep Learning น่าจะเป็นที่ทราบกันดีว่าการที่จะสอนให้โมเดลเรียนรู้ความสัมพันธ์ภายในข้อมูลและทำนายข้อมูลได้อย่างแม่นยำ
ข้อมูลบันทึกของเครื่อง หรือ log มีความสำคัญในการวิเคราะห์ถึงความผิดปกติและปัญหาที่เกิดขึ้นกับเครื่องคอมพิวเตอร์ โดยข้อมูลใน log ประกอบด้วยข้อมูลเกี่ยวกับการติดต่อสื่อสารของคอมพิวเตอร์
หลาย ๆ คนอาจจะคุ้นเคย หรือเริ่มได้ยินการนำเอา AI (Artificial Intelligence) เข้าไปประยุกต์ใช้กับงานต่าง ๆ ทั้งด้านการแพทย์ ที่นำ AI เข้ามาช่วยดูภาพ ภาพถ่ายด้วยคลื่นแม่เหล็กไฟฟ้า หรือ MRI (Magnetic resonance imaging) เพื่อให้การดูภาพ MRI ของหมอนั้นมีความแม่นยำมากยิ่งขึ้น
การเรียนรู้ของเครื่อง (Machine learning) เป็นวิธีที่รู้จักกันดีในการวิเคราะห์ข้อมูลด้วยการสร้างแบบจำลอง ระบบการเรียนรู้ของเครื่องประกอบด้วยไฮเปอร์พารามิเตอร์จำนวนมากซึ่งเป็นพารามิเตอร์ที่ใช้ในการควบคุมความซับซ้อนของโมเดล เช่น อัตราการเรียนรู้, โมเมนตัม, epsilon และอื่น ๆ
การทำนายราคาขายของน้ำมันเป็นสิ่งที่สำคัญและทำอยู่กันอย่างแพร่หลายในปัจจุบัน แต่ทว่าด้วยปัจจัยหลาย ๆ อย่างที่ไม่มีความแน่นอน
หากพูดถึงการพัฒนาโมเดลการเรียนรู้เชิงลึก (Deep Learning) ที่มีประสิทธิภาพสูงมากในปัจจุบัน นักพัฒนาโมเดลส่วนใหญ่อาจจะนึกถึงความยุ่งยากในการปรับแต่งค่าตัวแปรต่างๆ ของโมเดล เพื่อให้โมเดลที่สร้างขึ้นสามารถทำนายได้ตามที่ต้องการ
ตามปกติแล้ว เมื่อเราสร้าง model สำหรับ classification มาแล้ว เช่น ทำนายว่าลูกค้าคนใดจะมาชำระเงินล่าช้า ทำนายว่าลูกค้าจะตอบรับการแนะนำโปรโมชั่นใหม่ๆรึเปล่า ฯลฯ
การประมวลผลภาษาธรรมชาติ (Natural Language Processing, NLP) เป็นกระบวนการในการสร้างอัลกอริทึมการคำนวณเพื่อวิเคราะห์และแสดงผลลัทธ์ที่เกี่ยวข้องกับภาษาของมนุษย์
ในปัจจุบัน ชีวิตประจำวันของเรามีการซื้อขายและใช้บริการต่าง ๆ จากเว็บไซต์หรือระบบออนไลน์มากมาย เราจะพบว่า สิ่งที่มาคู่กับขณะเลือกซื้อสินค้าหรือใช้บริการคือการแนะนำสินค้าหรือบริการอื่นที่เกี่ยวข้อง
เชื่อว่าหลายๆคนอาจจะเจอปัญหาในการเริ่มทำ Topic Modeling ด้วย LSA หรือเรียกเต็มๆว่า Latent Semantic Analysis เพราะไม่ค่อยมีใครอธิบายกระบวนการเต็มๆ หรือการนำไปใช้ ส่วนใหญ่มักจะเขียนแค่ว่าได้ตัวโมเดลแล้วจบแค่นั้น