CAMINOS DE LECTURA

¿Por dónde empezar?

El archivo de Magacín no tiene un orden obligatorio, pero sí tiene caminos. Estas rutas agrupan artículos en una secuencia que tiene sentido, para un lector con una intención particular.

I

Inteligencia Artificial Moderna

Del principio que lo explica todo al método que lo hace seguro. Las ideas que construyeron los modelos de lenguaje actuales, en el orden en que ocurrieron.

7 artículos·~36 min en total·Para quienes quieren entender por qué la IA actual se ve como se ve.
01

La lección amarga — Rich Sutton (2019)

El ensayo más citado en IA moderna. Sutton argumenta que la historia demuestra que los métodos generales que aprovechan computación siempre ganan a largo plazo.

2 min
02

Software 2.0 — Andrej Karpathy (2017)

Acuña el término 'Software 2.0': el cambio de escribir código explícito a definir el comportamiento deseado y dejar que la red neuronal encuentre el programa. El ensayo que reenmarcó cómo pensar en aprendizaje automático.

15 minIntroductorio
03

La atención es todo lo que necesitas — Vaswani et al. (2017)

El paper que inició la era de los transformers. Una arquitectura basada enteramente en atención que reemplazó las redes recurrentes y cambió el NLP para siempre.

6 minAvanzado
04

Leyes de escala para modelos de lenguaje neuronales — Kaplan et al. (2020)

Las leyes de escalamiento que predijeron que modelos más grandes entrenados con más datos serían sistemáticamente mejores. La base teórica de la carrera por el tamaño.

5 minAvanzado
05

Entrenamiento de modelos de lenguaje grandes optimizados para cómputo — Hoffmann et al. (2022)

El paper de Chinchilla que demostró que la mayoría de los LLMs estaban sub-entrenados. No solo necesitás más parámetros: necesitás más datos.

6 minAvanzado
06

IA constitucional — Bai et al. (2022)

Cómo Anthropic entrena modelos que se auto-corrigen usando principios escritos en lugar de feedback humano directo. El método detrás de Claude.

1 min
07

Hacking de recompensa en RLHF — Gao et al. (2023)

Cuando los modelos aprenden a maximizar la recompensa sin resolver el problema real. Un análisis formal del fenómeno de reward hacking en RLHF.

1 min
II

Sistemas Distribuidos

Almacenamiento, procesamiento, disponibilidad, consenso. Las ideas detrás de la infraestructura que sostiene internet a escala.

4 artículos·~4 min en total·Para ingenieros que quieren entender los sistemas que hacen posible la escala.
III

Antes de los LLMs

Los textos que anticiparon el cambio. Léelos con la ventaja de saber lo que ocurrió después: qué acertaron, qué se quedaron cortos, y qué nadie vio venir.

4 artículos·~28 min en total·Para quienes quieren entender cómo pensaba la industria antes de que los LLMs se volvieran dominantes.