การประมาณการทรัพยากรเครือข่ายและการสูญหายของข้อมูลในระบบบันทึกข้อมูล (Network Resource and Loss Estimation in Log Data Collection Systems)


Share this article

งานวิจัยนี้เป็นส่วนหนึ่งขององค์การวิจัยนิวเคลียร์ยุโรป (European Organization for Nuclear Research) หรือเรียกโดยทั่วไปคือ เซิร์น (CERN) ซึ่งคือองค์การความร่วมมือระหว่างประเทศเพื่อวิจัยและพัฒนาด้านนิวเคลียร์ในการดำเนินการงานวิจัยและการทดลองในสาขาฟิสิกส์อนุภาค CERN ถูกก่อตั้งขึ้นในปี 1950 และปัจจุบันเป็นที่รู้จักในฐานะห้องทดลองสำหรับฟิสิกส์ของอนุภาค เป้าหมายของเซิร์นคือเพื่อทำเข้าใจเกี่ยวกับธรรมชาติของจักรวาล เช่น การเริ่มต้นของเอกภพหรือการที่อนุภาคมีปฏิสัมพันธ์ซึ่งกันและกัน ซึ่งนำไปสู่การค้นพบใหม่ เพื่อค้นหาว่าอนุภาคมีปฏิกิริยาต่อกันอย่างไร และประกอบมาจากอะไร เซิร์นได้สร้างเครื่องเร่งอนุภาคขนาดใหญ่ (The Large Hadron Collider: LHC) เพื่อใช้ในการวิจัยซึ่งมีขนาดใหญ่ที่สุดในโลก LHC ตั้งอยู่ลึกลงไปใต้พื้นดินของฝรั่งเศสและสวิตเซอร์แลนด์ ทำหน้าที่เร่งโปรตอนและไอออนด้วยความเร็วที่เข้าใกล้ความเร็วแสง ไอออนที่เพิ่มขึ้นจะชนกัน ในระหว่างที่ทำการทดลองนั้นจะมีการบันทึกผลลัพธ์ที่รวบรวมได้จากการทดลองบนเครื่องเร่งอนุภาค ข้อมูลที่ได้มาจากการทดลองนั้นจะถูกนำไปใช้ในการวิจัยหรือการทดลองอื่น ๆ ต่อไป

LHC ประกอบไปด้วยเครื่องตรวจวัดอนุภาค 6 จุดซึ่งตั้งอยู่รอบ ๆ อาณาบริเวณของเครื่องเร่งอนุภาค โดยเครื่องตรวจวัดอนุภาคจุดที่เราสนใจนั้นคือ LHC Large Ion Collider Experiment (ALICE) ซึ่งเป็นเครื่องตรวจจับไอออนหนักซึ่งเป็นหนึ่งใน 6 เครื่องตรวจจับอนุภาค โดยภายในปี 2020 นี้ ALICE จะมีการปรับปรุงที่สำคัญเกี่ยวข้องกับตัวเครื่องตรวจจับอนุภาคและการประมวลผล ดังนั้น ALICE จึงออกแบบและพัฒนาระบบการจัดการและประมวลผลที่ชื่อว่า Online and Offline (O2) ขึ้นมาเพื่อรองรับปริมาณข้อมูลที่เพิ่มขึ้นจากการทำการทดลอง ภายในระบบ O2 นั้นจะประกอบไปด้วยโหนดคอมพิวเตอร์ประมาณ 1,000 โหนดซึ่งอยู่ในในสภาพแวดล้อมที่ต่างกัน ประกอบด้วย First-Level Processing (FLP) จำนวน 250 โหนด และ Event Processing Node (EPN) จำนวน 750 โหนด [1,2] ดังแสดงในรูปที่ 1

รูปที่ 1 โครงสร้างของระบบ O2

การทำงานร่วมมือกันของ CERN และมหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี (KMUTT) นำไปสู่การพัฒนาระบบบันทึกข้อมูลการจราจรของคอมพิวเตอร์ (Logging system) ในงานวิจัยนี้มุ่งเน้นไปที่โหนด FLP ซึ่งมีการจัดทำและบันทึกข้อมูลการจราจรของคอมพิวเตอร์ (Log) ประเภทต่าง ๆ เช่น ข้อมูลการจราจรของคอมพิวเตอร์เกี่ยวกับแอปพลิเคชัน (Application log) และข้อมูลการจราจรของคอมพิวเตอร์เกี่ยวกับบริการ (Service log)  ตามรูปที่ 2. ในการรวบรวมข้อมูลการจราจรของคอมพิวเตอร์จากโหนด FLP นั้น  เราใช้ Agent หรือตัว Log Shipper ในการโอนถ่ายข้อมูลการจราจรของคอมพิวเตอร์ โดยข้อมูลดังกล่าวสามารถถูกนำไปใช้ในการวิเคราะห์และแสดงผลกับในภายหลัง ระบบบันทึกข้อมูลการจราจรของคอมพิวเตอร์ที่พัฒนานั้นจะใช้ประโยชน์จากข้อมูลการจราจรของคอมพิวเตอร์ที่มีอยู่เป็นจำนวนมาก เพื่อทำการปรับปรุงประสิทธิภาพของระบบโดยการวิเคราะห์บันทึกเหล่านั้น เพื่อใช้ในการจัดการการและวางแผนการใช้ทรัพยากร

รูปที่ 2 โครงสร้างการทำงานของระบบ Logging system

เครือข่ายคอมพิวเตอร์ในระบบ O2 จะต้องรองรับข้อมูลการจราจรที่ส่งออกมาจากโหนด FLP ไปยัง Logging server หากมีจำนวนโหนด FLP ทำงานอยู่มากเกินไป  จะทำให้เกิดปริมาณข้อมูลการจราจรที่เกินความจุของเครือข่าย ส่งผลให้เครือข่ายล่มและการสูญเสียของข้อมูล โดยปัญหาที่พบในการวิจัยนี้คือ ความสัมพันธ์ระหว่างจำนวนโหนด FLP ที่ระบบหรือเครือข่ายสามารถรองรับได้ในสภาพแวดล้อม O2 หากรู้ถึงความสัมพันธ์นี้ จะมีส่วนช่วยในการตัดสินใจว่าจำนวนโหนดที่ควรจะมีในระบบนั้น ควรมีปริมาณเท่าไหร่ เพื่อไม่ให้มีการสูญเสียข้อมูลหรืออาจจะมีการโอกาสในการสูญเสียข้อมูล แต่อยู่ในระดับที่ยอมรับได้ ดังนั้นการประมาณการทรัพยากรเครือข่ายและการสูญหายของข้อมูลในระบบบันทึกข้อมูลจึงเป็นกุญแจสำคัญในการแก้ไขปัญหานี้

จุดประสงค์ของงานวิจัยนี้คือ เพื่อพัฒนาแบบจำลองทางคณิตศาสตร์หรือแบบจำลองสถานการณ์ที่สามารถประมาณการความน่าจะเป็นของการสูญเสียข้อมูล ทั้งในเครือข่ายและใน Logging เซิร์ฟเวอร์ จากการรวมปริมาณข้อมูลในการรับส่งของทุก FLP โหนด ไปยังเซิร์ฟเวอร์เพื่อทำการประมวลผล และเพื่อประมาณการจำนวนโหนดที่ระบบหรือเครือข่ายสามารถรองรับได้ โดยงานวิจัยนี้มีข้อแตกต่างจากกับงานวิจัยอื่น ๆ ที่ผ่านมาคือ จะนำข้อมูลที่ได้จากระบบบันทึกข้อมูลการจราจรของคอมพิวเตอร์ (Logging system) มาใช้ในการศึกษาวิจัย โดยข้อมูลเหล่านี้ถูกจัดเก็บโดย Packetbeat และส่งข้อมูลไปยัง ระบบ ELK stack ซึ่งคือระบบการจัดการข้อมูลการจราจรที่ได้รับความนิยมอย่างมากในปัจจุบัน รวมถึงจะมีการนำ Apache Kafka มาใช้เป็นส่วนหนึ่งของระบบ เพื่อใช้ในการบัฟเฟอร์ข้อมูลในเพื่อช่วยในการรองรับปริมาณการรับส่งข้อมูลที่มีจำนวนมาก [3,4,5]. จากการศึกษาค้นคว้าเพื่อนำความรู้มาใช้ในการประมาณการทรัพยากรเครือข่ายและการสูญหายของข้อมูลในระบบบันทึกข้อมูลนั้น จำเป็นที่จะต้องศึกษาลักษณะของข้อมูลก่อนว่าข้อมูลที่จะถูกนำมาใช้นั้น มีลักษณะอย่างไร สามารถใช้แบบจำลองข้อมูลอะไรมาจำลองข้อมูลเหล่านี้ได้ (Traffic source modeling) การใช้แบบจำลองที่ไม่ตรงกับลักษณะข้อมูลจริง จะส่งผลให้การประเมินประสิทธิภาพของเครือข่ายไม่ดี ซึ่งอาจจะทำให้ประเมินค่าความสูญเสียข้อมูลต่ำไปหรือสูงเกินไป และส่งผลต่อการจัดการความจุของเครือข่าย (network capacity) [6-8]

 

References

[1] Vino, G., Elia, D., Barroso, V., Wegrzynek, A., 2017, “A MONITORING SYSTEM FOR THE NEW ALICE O2 FARM”, International Conference on Accelerator and Large Experimental Control Systems (16th), 10 October 2017.

[2] ALICE collaboration, 2015, “Upgrade of the Online – Offline computing system Technical Design Report” [Online], Available: https://cds.cern.ch/record/2011297 [2020, December 15].

[3] Kreps, J., 2014, “Benchmarking Apache Kafka: 2 Million Writes Per Second (On Three Cheap Machines)” [Online], Available: https://engineering.linkedin.com/kafka/benchmarking-apache-kafka-2-million-writes-second-three-cheap-machines [2020, March 19].

[4] Apache Kafka, “Kafka 2.4 Documentation” [Online], Available: https://kafka.apache.org/documentation/ [2020, March 19].

[5] Elasticsearch B.V., “Elastic Stack and Product Documentation” [Online], Available: https://www.elastic.co/guide [2020, March 19].

[6] Fraleigh, C., Tobagi, F., Diot,  C.,“Provisioning IP backbone networks to support latency sensitive traffic”, IEEE INFOCOM 2003. Twenty-second Annual Joint Conference of the IEEE Computer and Communications Societies (IEEE Cat. No.03CH37428), 30 March-3 April 2003, San Francisco, CA, USA

[7] Meent, R. V. D., Mandjes, M., Pras, A., 2006, “Gaussian traffic everywhere?”, IEEE International Conference on Communications, 11-15 June 2006, Istanbul, Turkey

[8] Solomon, T., Zungeru, M., A., Selvaraj, R., Mangwala, M.,2017, “A Packet Distribution Traffic Model for Industrial Application: A Case of BIUST NETWORK”, International Journal of Information and Electronics Engineering, Vol.7, No.5, pp. 136-140.

READ  Big Data: สิ่งควรรู้เพื่อความสำเร็จ

ลงทะเบียนรับข่าวสาร

ไม่พลาดทุกการอัพเดทจาก Big Data Experience Center

Big Data Experience Center (BX)

ชั้น 14 อาคาร Knowledge Exchange Center (KX)
110/1 ถนนกรุงธนบุรี, แขวงบางลำภูล่าง เขตคลองสาน กรุงเทพฯ 10600
อีเมล์: [email protected]
Tel: 097-941-9889

ABOUT

SERVICES