Dynamo: Amazon's Highly Available Key-value Store — DeCandia et al. (2007)

Dynamo: El almacén de clave-valor altamente disponible de Amazon — DeCandia et al. (2007)

15 de nov de 2024•1 min de lectura•visitas

Disponibilidad sobre todo

Amazon aprendió de la peor manera que en e-commerce, un carrito de compras inaccesible cuesta millones de dólares por hora. Dynamo nació de esa premisa: construir un almacén clave-valor que siempre esté disponible para escritura, incluso durante particiones de red o fallos de nodos. Para lograrlo, Amazon hizo un trade-off radical — relajar la consistencia en favor de la disponibilidad, apostando por la consistencia eventual.

Las técnicas que Dynamo combinó se convirtieron en vocabulario estándar de la industria:

Consistent hashing para particionar datos sin coordinación central
Vector clocks para detectar y resolver conflictos entre réplicas
Sloppy quorum y hinted handoff para mantener escrituras durante fallos
Merkle trees para sincronización eficiente de réplicas

El impacto del paper trasciende a Amazon. Dynamo inspiró directamente a Cassandra (Facebook), Riak, Voldemort (LinkedIn) y toda la ola NoSQL de 2008-2015. También popularizó el teorema CAP como herramienta de diseño: si no podés tener consistencia, disponibilidad y tolerancia a particiones al mismo tiempo, al menos elegí conscientemente cuál sacrificar. Hoy DynamoDB, la versión gestionada en AWS, es uno de los servicios más usados del mundo.

Paper original: https://www.allthingsdistributed.com/files/amazon-dynamo-sosp2007.pdf

Newsletter

Subscribite al Newsletter

Un email semanal con un resumen de los últimos artículos.

También en Magacín

sistemas · industria-4.0 · manufactura

Una arquitectura de sistemas ciberfísicos para sistemas de fabricación basados en Industria 4.0 — Lee, Bagheri y Kao (2015)

Traducción al español del paper seminal sobre sistemas ciberfísicos e Industria 4.0 (Lee, Bagheri & Kao, 2015). Define la arquitectura de 5 niveles (5C) para implementar CPS en manufactura inteligente. El texto fundacional de Industry 4.0 en español.

Leer→

sistemas · distribuidos · Google

El sistema de archivos de Google — Ghemawat, Gobioff & Leung (2003)

Traducción al español de 'The Google File System' (Ghemawat, Gobioff & Leung, 2003). El sistema de archivos distribuido que hizo posible indexar internet. Diseñado para fallar: asume que los discos se rompen y sigue funcionando igual.

Leer→

sistemas · distribuidos · consenso

En busca de un algoritmo de consenso comprensible — Ongaro & Ousterhout (2014)

Traducción al español del paper Raft (Ongaro & Ousterhout, 2014). El algoritmo de consenso diseñado para ser entendido: una alternativa legible a Paxos que se convirtió en el estándar de facto para sistemas distribuidos modernos.

Leer→