Big Data คืออะไร มีความสำคัญหรือไม่

News

Big Data คืออะไร มีความสำคัญหรือไม่ ในยุคปัจจุบันที่โลกถูกขับเคลื่อนด้วยข้อมูล ยิ่งข้อมูลยิ่งมาก ข้อมูลขนาดใหญ่ บิ๊ก ดาต้า (Big Data) การตัดสินใจต่างๆ ยิ่งถูกต้องและแม่นยำมากยิ่งขึ้น กระบวนการคิดของคนทั่วไปหรือแม้แต่องค์กรต่างๆในทุกวันนี้ส่วนใหญ่อยู่บนฐานของการรวบรวมข้อมูล ประมวลผล เพื่อประกอบการตัดสินใจทำอะไรบางอย่าง

Big Data คืออะไร สำคัญอย่างไร
ข้อมูลหรือ Data คือ ค่าของตัวแปรในเชิงคุณภาพหรือเชิงปริมาณ ข้อเท็จจริง ข้อความหรือเรื่องราวที่เกี่ยวข้องกับสิ่งต่าง ๆ โดยอยู่ในรูปแบบที่เหมาะสมต่อการแปลความหมายและการประมวลผลซึ่งข้อมูลอาจจะได้มาจากการสังเกต การเก็บรวบรวม การวัด ข้อมูลเป็นได้ทั้งข้อมูลตัวเลขหรือสัญลักษณ์ใด ๆ ซึ่งถ้าเป็นข้อมูลที่ใช้ในระบบคอมพิวเตอร์ที่สามารถนำไปประมวลผลได้แบ่งได้เป็น

-ข้อมูลตัวเลข (Numeric Data)
-ข้อมูลตัวอักษร (Text Data)
-ข้อมูลเสียง (Audio Data)
-ข้อมูลภาพ (Images Data)
-ข้อมูลภาพเคลื่อนไหว (Video Data)

Big Data คืออะไร
Big Data คือปริมาณข้อมูล(Data)จำนวนมหาศาล ที่เกิดขึ้นแต่ละวัน เช่น ข้อมูลจากการทำธุรกิจ ข้อมูลจากการซื้อขายสินค้า ข้อมูลคนผ่านเข้าออกสถานีรถไฟ หรือ ข้อมูลคนที่ใช้บริการของ facebook ข้อมูลที่มีปริมาณมหาศาลจนซอฟต์แวร์หรือฮาร์ดแวร์ธรรมดานั้นไม่สามารถที่จะจัดการหรือวิเคราะห์ได้อย่างมีประสิทธิภาพ ดังนั้นต้องมีเทคโนโลยีและสถาปัตยกรรมไอทีรุ่นใหม่ ซึ่งอาจมาในรูปแบบซอฟต์แวร์ ที่สามารถรองรับการจัดเก็บ การจัดการ กรองเลือกข้อมูล การวิเคราะห์ แสดงผล และการใช้งานข้อมูลที่มีคุณลักษณะดังต่อไปนี้

คุณลักษณะของ Big Data
Big Data หมายถึงข้อมูลที่มีขนาดใหญ่ เร็ว หรือซับซ้อนจนยากหรือเป็นไปไม่ได้ที่จะประมวลผลโดยใช้วิธีการแบบเดิม ช่วงต้นปีค.ศ. 2000 เมื่อดั๊ก ลานีย์ นักวิเคราะห์อุตสาหกรรมได้ให้คำจำกัดความที่เป็นที่เข้าใจกันในขณะนี้ว่า ข้อมูลขนาดใหญ่ประกอบด้วย

ปริมาณมาก (Volume) ซึ่งได้จากการที่องค์กรต่างๆ รวบรวมข้อมูลจากหลากหลายแหล่ง ซึ่งรวมถึงธุรกรรมของธุรกิจ อุปกรณ์อัจฉริยะ (IoT) อุปกรณ์อุตสาหกรรม วิดีโอ โซเชียลมีเดีย ซึ่งสามารถเป็นได้ทั้งรูปแบบ Online และ Offline ซึ่งส่วนมากแล้วจะมีปริมาณมากกว่าหน่วย TB (Terabyte) ขึ้นไป

มีการเปลี่ยนแปลงอย่างรวดเร็ว (Velocity) ด้วยเทคโนโลยีที่ล้ำหน้าขึ้นทุกวัน ความเร็วในการได้รับข้อมูลที่เพิ่มขึ้นและต้องได้รับการจัดการในเวลาที่เหมาะสม ข้อมูลเหล่านี้ในแบบเรียลไทม์ ส่งผ่านข้อมูลกันอย่างต่อเนื่อง (Real-time) จนทำให้การวิเคราะห์ง่ายๆ เกินขีดข้อจำกัด หรือไม่สามารถจับรูปแบบหรือทิศทางของข้อมูลได้

หลากหลายประเภทหรือแหล่งที่มา (Variety) หมายถึงรูปแบบของข้อมูลที่แตกต่างกันออกไป นับตั้งแต่ข้อมูลที่มีโครงสร้าง ตัวเลขในฐานข้อมูลแบบดั้งเดิม ไปจนถึงเอกสารข้อความ ทั้งในรูปแบบ ตัวอักษร วิดีโอ รูปภาพ ไฟล์ต่างๆ และหลากหลายแหล่งที่มาเช่น Social Network ต่างๆ อีเมล วิดีโอ เสียง ข้อมูลหุ้น และธุรกรรมทางการเงิน

ยังไม่ผ่านการประมวลผล (Veracity) ข้อมูลที่มีระดับคุณภาพปะปนกันไป ยังไม่ผ่านการ Process ให้อยู่ในรูปแบบของข้อมูลที่สามารถใช้สร้างประโยชน์ต่อองค์กร ซึ่งเป็นข้อมูลที่ยังไม่สมบูรณ์จึงยังไม่สามารถนำไปประกอบการตัดสินใจได้