Compute, Storage & Cloud

Compute, Storage & Cloud

Compute

Επώνυμοι servers σε διάταξη υψηλής διαθεσιμότητας

Dell EMC servers με FASTPATH branding

Το ιδιωτικό μας Cloud τρέχει σε Dell PowerEdge και Supermicro enterprise servers τελευταίας γενιάς. Δεν πρόκειται για consumer hardware σε rack-mount θήκες — αλλά για servers σχεδιασμένους για 24/7 datacenter λειτουργία, με enterprise-grade components, redundant power supplies, και remote management (iDRAC/IPMI) σε dedicated out-of-band management network.

Γενιά Αρχιτεκτονική Πυρήνες Μνήμη
AMD EPYC “Turin” 9005 Zen 5 96 cores DDR5-5600 ECC
AMD EPYC “Genoa” 9004 Zen 4 64 cores DDR5-4800 ECC
AMD EPYC “Milan” 7003 Zen 3 64 cores DDR4-3200 ECC

Τρεις γενιές, ένα κοινό χαρακτηριστικό: κάθε SKU επιλέγεται μετά από benchmarking στα δικά μας workloads — PHPBench, PassMark, mysqlslap — και όχι βάσει marketing specs. Αυτό μας δίνει εμπιστοσύνη ότι κάθε αναβάθμιση φέρνει πραγματική βελτίωση στις υπηρεσίες μας.

Γιατί EPYC και όχι Ryzen

EPYC

  • 64-96 πυρήνες ανά CPU
  • Sustained all-core boost clocks
  • 128 PCIe 5.0 lanes
  • 24/7 datacenter σχεδίαση
  • Περισσότερη μνήμη (12 channels)

Ryzen

  • Desktop/gaming σχεδίαση
  • Throttle μετά από boost window
  • Περιορισμένα PCIe lanes
  • Burst-oriented, όχι sustained
  • Περιορισμένη μνήμη (2 channels)

Η διαφορά δεν είναι μόνο στους αριθμούς. Ο EPYC είναι σχεδιασμένος για sustained, multi-threaded workloads σε datacenter περιβάλλον — εκεί που ένας server εξυπηρετεί εκατοντάδες ταυτόχρονα requests, 24/7. Ο Ryzen είναι εξαιρετικός επεξεργαστής — για desktops. Σε server περιβάλλον, η αρχιτεκτονική του δεν μπορεί να παρέχει τα ίδια επίπεδα σταθερής απόδοσης, μνήμης και I/O.

Και σε αντίθεση με «cloud» providers που τρέχουν σε Ryzen ή ακόμα και σε Intel desktop CPUs, εμείς χρησιμοποιούμε αποκλειστικά server-class επεξεργαστές σε server-class hardware.

Μνήμη

Αποκλειστικά επώνυμα, enterprise-grade Samsung ECC modules σε κάθε γενιά:

  • DDR5-5600 στα Turin — η τρέχουσα κορυφή σε bandwidth και latency
  • DDR5-4800 στα Genoa — η πρώτη γενιά DDR5 server-class
  • DDR4-3200 στα Milan — η τελευταία και ταχύτερη γενιά DDR4

Η μετάβαση από DDR4 σε DDR5 δεν είναι απλά μια αύξηση σε MHz. DDR5 φέρνει σημαντικά μεγαλύτερο memory bandwidth, χαμηλότερη κατανάλωση ισχύος, και on-die ECC — χαρακτηριστικά κρίσιμα για workloads που εξυπηρετούν χιλιάδες requests ταυτόχρονα.

Σύνδεση ανά node

2×25
Gbit/s LACP — Production
2×100
Gbit/s LACP — Ceph Storage

Κάθε server node συνδέεται στο δίκτυο με δύο ξεχωριστά, φυσικά διαχωρισμένα δίκτυα: ένα για production traffic και ένα αποκλειστικό δίκτυο για Ceph storage replication. Αυτός ο διαχωρισμός εξασφαλίζει ότι το storage traffic δεν ανταγωνίζεται ποτέ το production traffic. Δες τη σελίδα δικτύου →

Storage

NVMe-backed Ceph: Κατανεμημένο, ανθεκτικό storage

Το storage μας δεν βασίζεται σε local disks κάθε server — βασίζεται σε Ceph, ένα κατανεμημένο αποθηκευτικό σύστημα που εξαπλώνει τα δεδομένα σε πολλαπλούς nodes ταυτόχρονα.

  • 3x replication — κάθε block σε 3 αντίγραφα, κατανεμημένα σε διαφορετικούς nodes. Αν πέσει ένας node, τα δεδομένα παραμένουν διαθέσιμα και η αποκατάσταση ξεκινά αυτόματα.
  • Dedicated 2×100GbE storage network — αποκλειστικό, εφεδρικό δίκτυο 200Gbit μόνο για storage replication. Δεν μοιράζεται bandwidth με production traffic.
  • Enterprise NVMe SSDs — Samsung και Intel enterprise-grade drives με power-loss protection, σχεδιασμένα για sustained random I/O.

Τα περισσότερα setups φιλοξενίας βασίζονται σε local disks: 2 δίσκοι σε RAID 1 (ή χειρότερα, RAID 0) σε κάθε server. Αν πέσει ο server, πέφτουν και τα δεδομένα. Αν πέσει ένας δίσκος κατά τη διάρκεια rebuild, χάνονται τα πάντα. Σε Ceph, ένα hardware failure δεν σημαίνει downtime — σημαίνει automatic rebalancing.

Backups

Dedicated Ceph cluster για backups

Τα backups δεν αποθηκεύονται σε local disks ή σε κάποιο NAS — τρέχουν σε ξεχωριστό, αποκλειστικό Ceph cluster, πλήρως ανεξάρτητο από το production storage. Ίδια τεχνολογία, ίδια αξιοπιστία — αλλά φυσικά και λογικά απομονωμένο.

NVMe

Write-Ahead Log (WAL) σε write-intensive NVMe PCIe devices

SSD

Metadata — γρήγορη αναζήτηση δομής και τοποθεσίας δεδομένων, σε Samsung SSDs

HDD

Data storage — υψηλή χωρητικότητα σε enterprise drives

  • Ξεχωριστό Ceph cluster — φυσικά διαφορετικά μηχανήματα από τα production nodes. Πρόβλημα στο production δεν επηρεάζει τα backups, και αντίστροφα.
  • Containerized Ceph daemons — OSD, MON και MGR τρέχουν σε containers, για ευκολία deployment, upgrades και isolation.
  • Tiered storage — NVMe για WAL, SSD για metadata, HDD για data. Κάθε tier βελτιστοποιημένος για τον ρόλο του.
  • Erasure coding — προστασία δεδομένων με αποδοτική χρήση χωρητικότητας.
  • High-availability storage gateways — ξεχωριστοί gateway servers σε all-active διάταξη. Η πρόσβαση στα backups δεν εξαρτάται από ένα μόνο σημείο — αν πέσει ένας gateway, οι υπόλοιποι συνεχίζουν κανονικά.

Η αποκατάσταση (restore) γίνεται μέσω των gateway servers, χωρίς να φορτώνεται ο production storage cluster. Τα backups λαμβάνονται σε τακτά χρονικά διαστήματα (ανάλογα με το πλάνο) και διατηρούνται σε πολλαπλά σημεία αποκατάστασης.

Η συχνότητα και η πολιτική διατήρησης ρυθμίζονται ανά υπηρεσία. Αν χρειαστείς restore, επικοινωνείς μαζί μας — δεν σε αφήνουμε μόνο σου σε ένα panel να ψάχνεις.

Στα Managed Cloud Servers, υπάρχει επίσης η δυνατότητα mount ενός block device απευθείας από το backup cluster στο server σου.

Cloud / Virtualization

Εγγυημένοι πόροι, χωρίς overcommitment

Η υποδομή που περιγράφεται παραπάνω τροφοδοτεί και τις τρεις σειρές υπηρεσιών μας — Cloud SSD, Managed Cloud Servers, και Managed Cloud Hosting.

Overcommitment σημαίνει ότι ο provider πουλάει περισσότερους πόρους από αυτούς που φυσικά υπάρχουν — στοιχηματίζοντας ότι δεν θα τους χρησιμοποιήσουν όλοι οι πελάτες ταυτόχρονα. Αυτό λειτουργεί μέχρι να μην λειτουργεί — π.χ. ένα WooCommerce e-shop σε Black Friday, viral traffic, ή απλά σε ώρες αιχμής. Εμείς δεν κάνουμε overcommit — ούτε CPU, ούτε RAM, ούτε storage. Οι πόροι που βλέπεις είναι εγγυημένα δικοί σου. Αυτό σημαίνει ότι η χωρητικότητα υπάρχει — αλλά σημαίνει και ότι οι πόροι κοστίζουν αυτό που πραγματικά αξίζουν.

  • Linux KVM Hypervisor — ο de facto standard για enterprise virtualization
  • Κατανεμημένο storage (Ceph) — τα VMs δεν εξαρτώνται από τον local disk ενός server
  • Dedicated CPU, RAM & storage ανά VM — δεν μοιράζεσαι πόρους με κανέναν
  • Αυτόματο failover — αν πέσει physical node, τα VMs μεταφέρονται αυτόματα
  • Διπλά τροφοδοτικά ανά server — ανεξάρτητα bus bars, UPS, generators