data scientist



งานทั่วไปของ Data Scientist


Share this article

ในปี 2012 นิตยสาร Forbes ได้เรียกอาชีพ Data Scientist หรือนักวิทยาศาสตร์ข้อมูล ว่าเป็นอาชีพที่เซ็กซี่ที่สุดในศตรวรรษนี้ ซึ่งหมายถึงมีงานที่ท้าทาย มีค่าตอบแทนที่สูง และยังเป็นที่ต้องการขององค์กรทั้งหลาย ซึ่งทำให้เกิดกระแสการสร้าง Data Scientists ในวงการการศึกษาทั้งภาครัฐและเอกชนในต่างประเทศเป็นวงกว้าง จนเมื่อเร็วๆ นี้ Fortune ได้ออกมาพูดว่าอาชีพ Data Scientist นั้นอาจจะถึงจุดอิ่มตัวแล้วก็เป็นได้เพราะอีกหน่อยถ้า Supply Meet Demand จะไม่มีความขาดแคลน ซึ่งอาจจะทำให้ค่าตอบแทนที่สูงในขณะนี้ต่ำลง อย่างไรก็ตามสิ่งที่ Fortune หรือ Forbes กล่าวนั้นคือสิ่งที่เกิดขึ้นในระดับโลก ซึ่งสำหรับประเทศไทยนั้นกระแสความตื่นตัวด้าน Data Science ยังเพิ่งอยู่ในช่วงเริ่มต้น ถึงแม้เทคโนโลยีจะได้ถูกสร้างขึ้นมาแล้ว ซึ่งทำให้ Data Scientist ที่เกิดขึ้นในปัจจุบันจึงเริ่มศึกษาและมีเครื่องมือมาช่วยในการทำงานพร้อมมากกว่าในสมัยก่อนมาก แต่ไม่ว่าเราจะพูดถึง Data Scientist ในรุ่นใด งานที่พวกเขาต้องทำนั้นมีลักษณะที่เหมือนกันก็คือการคิดวิเคราะห์เพื่อแก้ปัญหาเพื่อการตัดสินใจทางธุรกิจโดยใช้ข้อมูล ซึ่งการที่จะแก้ปัญหาดังกล่าวได้นั้น Data Scientist จะมีกระบวนการทำงานพื้นฐาน ได้แก่

  • Decompose เป็นการแตกปัญหาทางธุรกิจจากปัญหาใหญ่เป็นปัญหาย่อยๆ
  • Recognize เป็นการรู้ว่าปัญหาที่เจอนั้นจะมีวิธีการแก้ทั่วไปอย่างไร โดยไม่จำเป็นต้องสร้างขึ้นมาใหม่ทั้งหมด
  • Identify เป็นการระบุงานย่อยที่ยังไม่ได้ถูกสร้างขึ้น และทำการพัฒนาขึ้นมา\r\nตัวอย่างของประเภทงานย่อย ได้แก่
  • Classification: การทำนายประเภทของข้อมูล ตัวอย่างคำถาม เช่น ลูกค้าจะยกเลิกสัญญาและย้ายค่ายหรือไม่
  • Regression: การทำนายค่าผลลัพธ์จากความสัมพันธ์ระหว่างตัวแปร ตัวอย่างคำถาม เช่น ลูกค้าน่าจะใช้งานโทรศัพท์จำนวนกี่นาที
  • Similarity matching: การหาความเหมือนระหว่างแต่ละชุดของข้อมูล ตัวอย่างคำถาม เช่น หาลูกค้า (บริษัท) ที่เหมือนกับลูกค้าบริษัทที่ดีที่สุด
  • Clustering: การจัดกลุ่มของข้อมูลโดยใช้ความเหมือน ตัวอย่างคำถาม เช่น ลูกค้าของเรามีการแบ่งกลุ่มหรือ segment อย่างไรตามข้อมูลการใช้งาน (หรือการชำระเงิน)
  • Co-occurrence: การหาความสัมพันธ์จากการเกิดร่วมกัน ตัวอย่างคำถาม เช่น สินค้าตัวไหนที่ลูกค้ามักจะซื้อไปด้วยกัน
  • Profiling: การวิเคราะห์คุณลักษณะพฤติกรรมของบุคคล กลุ่มคน หรือประชากร ตัวอย่างคำถาม เช่น ผู้บริโภคมักจะใช้จ่ายเงินอย่างไร
  • Link prediction: การทำนายความเกี่ยวข้อง ตัวอย่างคำถาม เช่น บัญชีลูกค้าคนไหนที่น่าจะรู้จักกับบัญชีลูกค้าคนหนึ่งๆ
  • Data reduction: การลดรูปความซับซ้อนของข้อมูล เช่น การลดรูปจำนวนคุณสมบัติที่สำคัญที่เกี่ยวข้องกับการใช้จ่ายของลูกค้า
  • Causal modeling: การหาเหตุการณ์หรือการกระทำที่อาจมีผลต่อเหตุการณ์หรือการกระทำอื่นๆ ตัวอย่างคำถาม เช่น การคลิกรูปแบบไหนที่แสดงถึงความพอใจของลูกค้าในงานย่อยๆ เหล่านี้

Reference Provost and Fawcett, Data Science for Business: What you need to know about data mining and data-analytic thinking, O’Reilly Media, Inc. 2013.

READ  Big Data กับการสร้างทีมที่ใช่ให้กับแผนขับเคลื่อนธุรกิจที่ได้ผล

Share:

ลงทะเบียนรับข่าวสาร

ไม่พลาดทุกการอัพเดทจาก Big Data Experience Center

Big Data Experience Center (BX)

ชั้น 14 อาคาร Knowledge Exchange Center (KX)
110/1 ถนนกรุงธนบุรี, แขวงบางลำภูล่าง เขตคลองสาน กรุงเทพฯ 10600
อีเมล์: [email protected]