Crediti immagine: Warner Bros./Getty Images/Getty Images
fantasma, la startup di test di affidabilità nota per i suoi strumenti di ingegneria caotica, ha annunciato oggi il lancio della sua funzionalità di rilevamento dei rischi. Grazie a ciò, Gremlin può ora identificare automaticamente problemi di affidabilità ad alta priorità come errori di configurazione o valori predefiniti errati nei servizi basati su Kubernetes e quindi classificarli in base alla gravità del rischio che rappresentano. Il servizio suggerirà anche possibili soluzioni.
“L’importanza dell’affidabilità continua a crescere”, ha affermato Colton Andrus, CTO e fondatore di Gremlin. “La nostra infrastruttura digitale è importante tanto quanto la nostra infrastruttura fisica. Il governo, la sanità, i trasporti, le comunicazioni e la finanza dipendono tutti da questa base digitale e comporta dei rischi. Fortunatamente, molti di questi rischi, se conosciuti, sono facili Ecco perché siamo entusiasti di annunciare i nuovi rischi scoperti.Abbiamo lavorato duramente per scoprire rapidamente i problemi critici all’interno dei sistemi dei nostri clienti, rischi che possono quindi mitigare per migliorare qualitativamente la postura dei loro sistemi.
Mentre gli strumenti di ingegneria del caos di Gremlin cercano situazioni insolite che potrebbero spingere l’infrastruttura di un’azienda ai suoi limiti, Detected Risks utilizza una serie di test preconfigurati, con altri 20 test in arrivo entro la fine dell’anno. Questi test verificano la presenza di problemi comuni che possono influire sull’affidabilità e sulla resilienza dell’infrastruttura di un’azienda. I rischi rilevati funzionano senza la necessità di complicati esperimenti di ingegneria o test di affidabilità.
Nel complesso, questi test sono molto semplici e includono best practice, come garantire che la distribuzione sia configurata per essere eseguita in più zone di disponibilità per garantire la ridondanza. Potrebbe sembrare buon senso, ma esaminando le migliaia di post pubblicati dai suoi clienti, Gremlin ha scoperto che il 26% di essi non aveva duplicati e l’80% dei post non aveva due duplicati. L’azienda rileva che il sistema cerca anche le configurazioni errate comuni di Kubernetes che potrebbero, ad esempio, influenzare il ridimensionamento automatico.
“Nel nostro settore ci sono molte brillanti aziende SRE che lavorano duramente per mitigare personalmente questi problemi, ma questo approccio non è scalabile”, ha affermato Andrus. “Stiamo risolvendo questo problema costruendo qualcosa di facile utilizzo che fornisce informazioni preziose su migliaia di applicazioni del mondo reale. Fornire alla leadership tecnica una visione chiara dei rischi attuali li aiuta a stabilire le priorità e a portare a termine questo importante lavoro in modo che possano continuare a proteggere l’esperienza del cliente e creare software di alta qualità”.
“Esploratore. Scrittore appassionato. Appassionato di Twitter. Organizzatore. Amico degli animali ovunque.”