ระบบ Cloud Storage คืออะไร ทำไมหลายองค์กรจึงเริ่มใช้กัน
Cloud Storage คือการเก็บข้อมูลบนเครื่อง Server และอยู่ในโลกออนไลน์ที่เราเรียกว่า Cloud ผ่านการเชื่อมต่ออินเทอร์เน็ตในการเรียกดูและใช้งานข้อมูลบน Cloud ซึ่งอาจจะเก็บข้อมูลไว้ใน server หลาย ๆ ตัว โดยกระจายข้อมูลออกเป็นเครื่องละเล็กละน้อย ผู้ให้บริการคลาวด์ (Host) จะดูแลเป็นคนจัดการบำรุงรักษาฮาร์ดแวร์และซอฟต์แวร์ทั้งหมดที่ใช้ในการจัดเก็บข้อมูล ทำให้ผู้ใช้บริการสามารถลดต้นทุนในส่วนที่เกี่ยวข้องกับฮาร์ดแวร์และซอฟต์แวร์ได้
อย่างไรก็ตาม เทคโนโลยีที่จะตอบรับกับสถานการณ์ยุค Big data ที่มีข้อมูลขนาดใหญ่ นั่นคือ Cloud storage ที่เป็น Software Defined Storage โดยหลักการง่าย ๆ ของ software defined storage คือ การรวมศูนย์ควบคุมให้เป็นจุดเดียวแล้ว Virtualize Storage Layer แบ่งเป็น pools ตามจุดประสงค์การใช้งานที่ต้องการ
รูปที่ 1 แสดง Infratructure แบบเก่า (ด้านบน) และแบบใหม่ที่ใช้ Software Defined Storage (ด้านล่าง)
ซึ่งจะพบว่าในระบบแบบเดิม แต่ละ Application จะมี Storage Tier เป็นของตัวเองและแยกจากกันโดยสมบูรณ์ ทำให้ Cluster ตรงกลางสองอัน มีปริมาณการใช้งานจนเต็มหรือเกือบเต็มแต่ว่า ใน Cluster ด้านข้างทั้งสองอันยังเหลือพื้นที่ที่ไม่ได้ใช้ประโยชน์อยู่ Action ที่ทีม Infra ขององค์กรจะต้องทำคือ ต้องขยาย พื้นที่ในส่วนของ Cluster ตรงกลางสองอัน ทั้งที่ยังมีพื้นที่เหลือให้ใช้งานในระบบโดยรวมด้วยซ้ำ นอกจาก Cost ที่ต้องซื้อเพิ่มแล้ว ในแง่ของการใช้งานทรัพยากรให้คุ้มค่าก็ล้มเหลวอีก
แต่หากเป็น Software Define Storage ปัญหานี้ก็จะหมดไป เนื่องจากใน Software Define Storage เรารวมศูนย์การควบคุม Storage Tiers ของทุก Application มาไว้ที่จุดเดียวกันแล้ว ทำให้เราสามารถ manage ได้อย่างอิสระว่า Application ตัวไหนเราจะให้พื้นที่เท่าไหร่ QoS แบบไหนและเมื่อเกิดเหตุการณ์แบบภาพด้านบนขึ้นเราก็สามารถโยกย้ายพื้นที่ที่ยังไม่ถูกใช้งานไปให้กับส่วนที่ต้องการการใช้งานเยอะได้ทันทีโดยไม่ต้องลงทุนเพิ่มเฉพาะจุด ภาพที่ทางฝ่าย Infrastructure จะมอง Capacity ของระบบก็จะเป็นภาพใหญ่ๆ ภาพเดียว ลดความยุ่งยากในการบริหารจัดการได้อีกด้วย
ความแตกต่างระหว่าง Traditional Storage กับ Software Defined Storage
รูปที่ 2 เปรียบเทียบความแตกต่างระหว่าง Traditional Storage กับ Software Defined Storage
ภาพรวมความแตกต่างระหว่าง Traditional Storage กับ Software Defined Storage (SDS) สามารถสรุปได้ดังนี้
- ในส่วนของ architecture แบบดั้งเดิม architecture ของแต่ละ application จะแยกจากกันชัดเจน ก้อนใครก้อนมัน แต่ว่าถ้าเป็น SDS ตัว Storage Tier จะเป็น pooled ที่ใช้งานร่วมกันโดยมีหน่วยบริหารจัดการเดียวกันในทุก Application
- ในระบบแบบดั้งเดิมเนื่องจากการที่ศูนย์ควบคุมของแต่ละ application มันแยกกันทำให้การดีไซน์ระบบจะต้องคำนึงถึงความเข้ากันได้ของ Hardware ค่อนข้างเยอะซึ่งอาจจะนำไปสู่สถานการณ์ที่เรียกว่า Vendor Lock-in ได้ ขณะเดียวกัน ถ้ารวมศูนย์บริหารจัดการของทุก application มาไว้ที่เดียว อิสระในการเลือกและขยายจำนวน Hardware ก็จะมีมากขึ้นไม่ถูกจำกัดอีกต่อไป
- เป็นเรื่องของการกระจาย Workload ถ้าเป็นแบบดั้งเดิม Workload และ Capacity จะไป Overload อยู่ในจุดที่ถูกใช้งานมากและบริหารจัดการ Load ได้ค่อนข้างยาก แต่ว่าถ้าเป็น SDS เราจะสามารถบริหารจัดการ Workload ให้กระจายไปทั่วทั้ง Cluster ได้ดังรูปที่ 1
และนี่ก็คือสรุปภาพรวมข้อดีและข้อเสียของ SDS ที่จะเข้ามาแก้ไขปัญหาของการดีไซน์ Cloud Storage Infrastructure ในปัจจุบัน นอกจากนี้ยังมีอีก 1 การทำนายที่น่าสนใจ เมื่อ Gartner ทำนายไว้ว่าภายในปี 2024 หรืออีกสองเกือบสามปีต่อจากนี้ 50% ของ Storage ทั้งหมดจะถูก Deploy แบบ SDS
อย่างไรก็ตาม เรามีความเชื่อมั่นว่าในอีกไม่กี่ปีข้างหน้า โลกของเราจะถูกขับเคลื่อนด้วย data และสิ่งที่สำคัญทีสุดคือ Cloud Storage หรือ Storage ขนาดมหึมา เหตุผลที่เรามีความเชื่อเช่นนั้นเนื่องจากการที่เราจะประสบสำเร็จในการทำ AI ได้ นั้น จำเป็นต้องมีข้อมูลมหาศาล และการจะมีข้อมูลมหาศาลได้นั้นจำเป็นต้องมีที่เก็บในต้นทุนต่ำ และ Software defined storage จะเป็น Cloud storage ที่สามารถตอบโจทย์นี้ได้อย่างดีที่สุด