Async/Aait

Mar 27, 2020

Contenido Traducido: Esta es una traducción comunitaria del post Async/Await. Puede estar incompleta, desactualizada o contener errores. ¡Por favor reporta cualquier problema!

Traducción por @dobleuber.

En esta publicación, exploramos el multitasking cooperativo y la característica async/await de Rust. Observamos en detalle cómo funciona async/await en Rust, incluyendo el diseño del trait Future, la transformación de máquina de estado y el pinning. Luego añadimos soporte básico para async/await a nuestro núcleo creando una tarea de teclado asíncrona y un ejecutor básico.

Este blog se desarrolla abiertamente en GitHub. Si tienes problemas o preguntas, por favor abre un issue allí. También puedes dejar comentarios al final. El código fuente completo de esta publicación se puede encontrar en la rama post-12.

Tabla de Contenidos

Multitasking
- Multitasking Preemptivo
- Multitasking Cooperativo
Async/Await en Rust
Implementación
- Tarea
- Ejecutor simple
Comentarios

🔗Multitasking

Una de las características fundamentales de la mayoría de los sistemas operativos es el multitasking, que es la capacidad de ejecutar múltiples tareas de manera concurrente. Por ejemplo, probablemente tienes otros programas abiertos mientras miras esta publicación, como un editor de texto o una ventana de terminal. Incluso si solo tienes una ventana del navegador abierta, probablemente hay diversas tareas en segundo plano para gestionar tus ventanas de escritorio, verificar actualizaciones o indexar archivos.

Aunque parece que todas las tareas corren en paralelo, solo se puede ejecutar una sola tarea en un núcleo de CPU a la vez. Para crear la ilusión de que las tareas corren en paralelo, el sistema operativo cambia rápidamente entre tareas activas para que cada una pueda avanzar un poco. Dado que las computadoras son rápidas, no notamos estos cambios la mayor parte del tiempo.

Mientras que las CPU de un solo núcleo solo pueden ejecutar una sola tarea a la vez, las CPU de múltiples núcleos pueden ejecutar múltiples tareas de manera verdaderamente paralela. Por ejemplo, una CPU con 8 núcleos puede ejecutar 8 tareas al mismo tiempo. Explicaremos cómo configurar las CPU de múltiples núcleos en una publicación futura. Para esta publicación, nos enfocaremos en las CPU de un solo núcleo por simplicidad. (Vale la pena mencionar que todas las CPU de múltiples núcleos comienzan con solo un núcleo activo, así que podemos tratarlas como CPU de un solo núcleo por ahora.)

Hay dos formas de multitasking: el multitasking cooperativo requiere que las tareas cedan regularmente el control de la CPU para que otras tareas puedan avanzar. El multitasking preemptivo usa funcionalidades del sistema operativo para cambiar de hilo en puntos arbitrarios en el tiempo forzosamente. A continuación exploraremos las dos formas de multitasking en más detalle y discutiremos sus respectivas ventajas y desventajas.

🔗Multitasking Preemptivo

La idea detrás del multitasking preemptivo es que el sistema operativo controla cuándo cambiar de tareas. Para ello, utiliza el hecho de que recupera el control de la CPU en cada interrupción. Esto hace posible cambiar de tareas cuando hay nueva entrada disponible para el sistema. Por ejemplo, sería posible cambiar de tareas cuando se mueve el mouse o llega un paquete de red. El sistema operativo también puede determinar el momento exacto en que se permite que una tarea se ejecute configurando un temporizador de hardware para enviar una interrupción después de ese tiempo.

La siguiente gráfica ilustra el proceso de cambio de tareas en una interrupción de hardware:

En la primera fila, la CPU está ejecutando la tarea A1 del programa A. Todas las demás tareas están en pausa. En la segunda fila, una interrupción de hardware llega a la CPU. Como se describió en la publicación sobre Interrupciones de Hardware, la CPU detiene inmediatamente la ejecución de la tarea A1 y salta al controlador de interrupciones definido en la tabla de descriptores de interrupciones (IDT). A través de este controlador de interrupciones, el sistema operativo vuelve a tener control de la CPU, lo que le permite cambiar a la tarea B1 en lugar de continuar con la tarea A1.

🔗Guardando Estado

Dado que las tareas se interrumpen en puntos arbitrarios en el tiempo, pueden estar en medio de ciertos cálculos. Para poder reanudarlas más tarde, el sistema operativo debe respaldar todo el estado de la tarea, incluyendo su pila de llamadas y los valores de todos los registros de CPU. Este proceso se llama cambio de contexto.

Dado que la pila de llamadas puede ser muy grande, el sistema operativo normalmente establece una pila de llamadas separada para cada tarea en lugar de respaldar el contenido de la pila de llamadas en cada cambio de tarea. Tal tarea con su propia pila se llama hilo de ejecución o hilo a secas. Al usar una pila separada para cada tarea, solo se necesitan guardar los contenidos de registro en un cambio de contexto (incluyendo el contador de programa y el puntero de pila). Este enfoque minimiza la sobrecarga de rendimiento de un cambio de contexto, lo que es muy importante, ya que los cambios de contexto a menudo ocurren hasta 100 veces por segundo.

🔗Discusión

La principal ventaja del multitasking preemptivo es que el sistema operativo puede controlar completamente el tiempo de ejecución permitido de una tarea. De esta manera, puede garantizar que cada tarea obtenga una parte justa del tiempo de CPU, sin necesidad de confiar en que las tareas cooperen. Esto es especialmente importante al ejecutar tareas de terceros o cuando varios usuarios comparten un sistema.

La desventaja de la preempción es que cada tarea requiere su propia pila. En comparación con una pila compartida, esto resulta en un mayor uso de memoria por tarea y a menudo limita la cantidad de tareas en el sistema. Otra desventaja es que el sistema operativo siempre debe guardar el estado completo de los registros de CPU en cada cambio de tarea, incluso si la tarea solo utilizó un pequeño subconjunto de los registros.

El multitasking preemptivo y los hilos son componentes fundamentales de un sistema operativo porque hacen posible ejecutar programas de espacio de usuario no confiables. Discutiremos estos conceptos en detalle en publicaciones futuras. Sin embargo, para esta publicación, nos enfocaremos en el multitasking cooperativo, que también proporciona capacidades útiles para nuestro núcleo.

🔗Multitasking Cooperativo

En lugar de pausar forzosamente las tareas en ejecución en puntos arbitrarios en el tiempo, el multitasking cooperativo permite que cada tarea se ejecute hasta que ceda voluntariamente el control de la CPU. Esto permite a las tareas pausarse a sí mismas en puntos convenientes en el tiempo, por ejemplo, cuando necesitan esperar por una operación de E/S de todos modos.

El multitasking cooperativo se utiliza a menudo a nivel de lenguaje, como en forma de corutinas o async/await. La idea es que bien el programador o el compilador inserten operaciones yield en el programa, que ceden el control de la CPU y permiten que otras tareas se ejecuten. Por ejemplo, se podría insertar un yield después de cada iteración de un bucle complejo.

Es común combinar el multitasking cooperativo con operaciones asíncronas. En lugar de esperar hasta que una operación se complete y prevenir que otras tareas se ejecuten durante este tiempo, las operaciones asíncronas devuelven un estado “no listo” si la operación aún no ha finalizado. En este caso, la tarea en espera puede ejecutar una operación yield para permitir que otras tareas se ejecuten.

🔗Guardando Estado

Debido a que las tareas definen sus propios puntos de pausa, no necesitan que el sistema operativo guarde su estado. En su lugar, pueden guardar exactamente el estado que necesitan para continuar antes de pausarse, lo que a menudo resulta en un mejor rendimiento. Por ejemplo, una tarea que acaba de finalizar un cálculo complejo podría necesitar respaldar solo el resultado final del cálculo ya que no necesita los resultados intermedios.

Las implementaciones respaldadas por el lenguaje de tareas cooperativas son a menudo capaces de respaldar las partes necesarias de la pila de llamadas antes de pausarse. Como ejemplo, la implementación de async/await de Rust almacena todas las variables locales que aún se necesitan en una estructura generada automáticamente (ver más abajo). Al respaldar las partes relevantes de la pila de llamadas antes de pausarse, todas las tareas pueden compartir una única pila de llamadas, lo que resulta en un consumo de memoria mucho más bajo por tarea. Esto hace posible crear un número casi arbitrario de tareas cooperativas sin quedarse sin memoria.

🔗Discusión

La desventaja del multitasking cooperativo es que una tarea no cooperativa puede potencialmente ejecutarse durante un tiempo ilimitado. Por lo tanto, una tarea maliciosa o con errores puede evitar que otras tareas se ejecuten y retardar o incluso bloquear todo el sistema. Por esta razón, el multitasking cooperativo debería usarse solo cuando todas las tareas se sabe que cooperan. Por ejemplo, no es una buena idea hacer que el sistema operativo dependa de la cooperación de programas de nivel de usuario arbitrarios.

Sin embargo, los fuertes beneficios de rendimiento y memoria del multitasking cooperativo lo convierten en un buen enfoque para uso dentro de un programa, especialmente en combinación con operaciones asíncronas. Dado que un núcleo del sistema operativo es un programa crítico en términos de rendimiento que interactúa con hardware asíncrono, el multitasking cooperativo parece ser un buen enfoque para implementar concurrencia.

🔗Async/Await en Rust

El lenguaje Rust proporciona soporte de primera clase para el multitasking cooperativo en forma de async/await. Antes de que podamos explorar qué es async/await y cómo funciona, necesitamos entender cómo funcionan los futuros y la programación asíncrona en Rust.

🔗Futuros

Un futuro representa un valor que puede no estar disponible aún. Esto podría ser, por ejemplo, un número entero que es calculado por otra tarea o un archivo que se está descargando de la red. En lugar de esperar hasta que el valor esté disponible, los futuros permiten continuar la ejecución hasta que el valor sea necesario.

🔗Ejemplo

El concepto de futuros se ilustra mejor con un pequeño ejemplo:

Este diagrama de secuencia muestra una función main que lee un archivo del sistema de archivos y luego llama a una función foo. Este proceso se repite dos veces: una vez con una llamada síncrona read_file y otra vez con una llamada asíncrona async_read_file.

Con la llamada síncrona, la función main necesita esperar hasta que el archivo se cargue desde el sistema de archivos. Solo entonces puede llamar a la función foo, lo que requiere que espere nuevamente por el resultado.

Con la llamada asíncrona async_read_file, el sistema de archivos devuelve directamente un futuro y carga el archivo de forma asíncrona en segundo plano. Esto permite que la función main llame a foo mucho antes, que luego se ejecuta en paralelo con la carga del archivo. En este ejemplo, la carga del archivo incluso termina antes de que foo regrese, por lo que main puede trabajar directamente con el archivo sin mayor espera después de que foo regrese.

🔗Futuros en Rust

En Rust, los futuros están representados por el trait Future, que se ve de la siguiente manera:

pub trait Future {
    type Output;
    fn poll(self: Pin<&mut Self>, cx: &mut Context) -> Poll<Self::Output>;
}

El tipo asociado Output especifica el tipo del valor asíncrono. Por ejemplo, la función async_read_file en el diagrama anterior devolvería una instancia de Future con Output configurado a File.

El método poll permite comprobar si el valor ya está disponible. Devuelve un enum Poll, que se ve de la siguiente manera:

pub enum Poll<T> {
    Ready(T),
    Pending,
}

Cuando el valor ya está disponible (por ejemplo, el archivo se ha leído completamente desde el disco), se devuelve envuelto en la variante Ready. De lo contrario, se devuelve la variante Pending, que señala al llamador que el valor aún no está disponible.

El método poll toma dos argumentos: self: Pin<&mut Self> y cx: &mut Context. El primero se comporta de manera similar a una referencia normal &mut self, excepto que el valor Self está pinned a su ubicación de memoria. Entender Pin y por qué es necesario es difícil sin entender primero cómo funciona async/await. Por lo tanto, lo explicaremos más adelante en esta publicación.

El propósito del parámetro cx: &mut Context es pasar una instancia de Waker a la tarea asíncrona, por ejemplo, la carga del sistema de archivos. Este Waker permite que la tarea asíncrona señale que ha terminado (o que una parte de ella ha terminado), por ejemplo, que el archivo se ha cargado desde el disco. Dado que la tarea principal sabe que será notificada cuando el Future esté listo, no necesita llamar a poll una y otra vez. Explicaremos este proceso con más detalle más adelante en esta publicación cuando implementemos nuestro propio tipo de waker.

🔗Trabajando con Futuros

Ahora sabemos cómo se definen los futuros y entendemos la idea básica detrás del método poll. Sin embargo, aún no sabemos cómo trabajar de manera efectiva con los futuros. El problema es que los futuros representan los resultados de tareas asíncronas, que pueden no estar disponibles aún. En la práctica, sin embargo, a menudo necesitamos estos valores directamente para cálculos posteriores. Así que la pregunta es: ¿Cómo podemos recuperar eficientemente el valor de un futuro cuando lo necesitamos?

🔗Esperando en Futuros

Una posible respuesta es esperar hasta que un futuro esté listo. Esto podría verse algo así:

let future = async_read_file("foo.txt");
let file_content = loop {
    match future.poll(…) {
        Poll::Ready(value) => break value,
        Poll::Pending => {}, // no hacer nada
    }
}

Aquí estamos esperando activamente por el futuro al llamar a poll una y otra vez en un bucle. Los argumentos de poll no importan aquí, así que los omitimos. Aunque esta solución funciona, es muy ineficiente porque mantenemos la CPU ocupada hasta que el valor esté disponible.

Un enfoque más eficiente podría ser bloquear el hilo actual hasta que el futuro esté disponible. Esto es, por supuesto, solo posible si tienes hilos, así que esta solución no funciona para nuestro núcleo, al menos no aún. Incluso en sistemas donde el bloqueo está soportado, a menudo no se desea porque convierte una tarea asíncrona en una tarea síncrona nuevamente, inhibiendo así los potenciales beneficios de rendimiento de las tareas paralelas.

🔗Combinadores de Futuros

Una alternativa a esperar es utilizar combinadores de futuros. Los combinadores de futuros son métodos como map que permiten encadenar y combinar futuros, similar a los métodos del trait Iterator. En lugar de esperar en el futuro, estos combinadores devuelven un futuro por sí mismos, que aplica la operación de mapeo en poll.

Por ejemplo, un simple combinador string_len para convertir un Future<Output = String> en un Future<Output = usize> podría verse así:

struct StringLen<F> {
    inner_future: F,
}

impl<F> Future for StringLen<F> where F: Future<Output = String> {
    type Output = usize;

    fn poll(mut self: Pin<&mut Self>, cx: &mut Context<'_>) -> Poll<T> {
        match self.inner_future.poll(cx) {
            Poll::Ready(s) => Poll::Ready(s.len()),
            Poll::Pending => Poll::Pending,
        }
    }
}

fn string_len(string: impl Future<Output = String>)
    -> impl Future<Output = usize>
{
    StringLen {
        inner_future: string,
    }
}

// Uso
fn file_len() -> impl Future<Output = usize> {
    let file_content_future = async_read_file("foo.txt");
    string_len(file_content_future)
}

Este código no funciona del todo porque no maneja el pinning, pero es suficiente como ejemplo. La idea básica es que la función string_len envuelve una instancia de Future dada en una nueva estructura StringLen, que también implementa Future. Cuando se pollea el futuro envuelto, se pollea el futuro interno. Si el valor no está listo aún, Poll::Pending se devuelve del futuro envuelto también. Si el valor está listo, la cadena se extrae de la variante Poll::Ready y se calcula su longitud. Después, se envuelve nuevamente en Poll::Ready y se devuelve.

Con esta función string_len, podemos calcular la longitud de una cadena asíncrona sin esperar por ella. Dado que la función devuelve otro Future, el llamador no puede trabajar directamente en el valor devuelto, sino que necesita usar funciones combinadoras nuevamente. De esta manera, todo el gráfico de llamadas se vuelve asíncrono y podemos esperar eficientemente por múltiples futuros a la vez en algún momento, por ejemplo, en la función principal.

Debido a que escribir manualmente funciones combinadoras es difícil, a menudo son provistas por bibliotecas. Si bien la biblioteca estándar de Rust en sí no ofrece aún métodos de combinadores, el crate semi-oficial (y compatible con no_std) futures lo hace. Su trait FutureExt proporciona métodos combinadores de alto nivel como map o then, que se pueden utilizar para manipular el resultado con closures arbitrarias.

🔗Ventajas

La gran ventaja de los combinadores de futuros es que mantienen las operaciones asíncronas. En combinación con interfaces de E/S asíncronas, este enfoque puede llevar a un rendimiento muy alto. El hecho de que los combinadores de futuros se implementen como estructuras normales con implementaciones de traits permite que el compilador los optimice excesivamente. Para más detalles, consulta la publicación sobre Futuros de cero costo en Rust, que anunció la adición de futuros al ecosistema de Rust.

🔗Desventajas

Si bien los combinadores de futuros hacen posible escribir código muy eficiente, pueden ser difíciles de usar en algunas situaciones debido al sistema de tipos y la interfaz basada en closures. Por ejemplo, considera el siguiente código:

fn example(min_len: usize) -> impl Future<Output = String> {
    async_read_file("foo.txt").then(move |content| {
        if content.len() < min_len {
            Either::Left(async_read_file("bar.txt").map(|s| content + &s))
        } else {
            Either::Right(future::ready(content))
        }
    })
}

(Pruébalo en el playground)

Aquí leemos el archivo foo.txt y luego usamos el combinador then para encadenar un segundo futuro basado en el contenido del archivo. Si la longitud del contenido es menor que lo dado en min_len, leemos un archivo diferente bar.txt y se lo anexamos a content usando el combinador map. De lo contrario, solo devolvemos el contenido de foo.txt.

Necesitamos usar el move keyword para la closure pasada a then porque de lo contrario habría un error de tiempo de vida para min_len. La razón por la cual usamos el envoltorio Either es que los bloques if y else deben tener siempre el mismo tipo. Dado que devolvemos diferentes tipos de futuros en los bloques, debemos usar el tipo de envoltura para unificarlos en un solo tipo. La función ready envuelve un valor en un futuro que está inmediatamente listo. La función se requiere aquí porque el envoltorio Either espera que el valor envuelto implemente Future.

Como puedes imaginar, esto puede llevar rápidamente a código muy complejo para proyectos más grandes. Se invirtió mucho trabajo en agregar soporte para async/await a Rust, con el objetivo de hacer que el código asíncrono sea radicalmente más simple de escribir.

🔗El Patrón Async/Await

La idea detrás de async/await es permitir que el programador escriba código que parece código síncrono normal, pero que es transformado en código asíncrono por el compilador. Funciona basado en las dos palabras clave async y await. La palabra clave async se puede usar en la firma de una función para transformar una función síncrona en una función asíncrona que devuelve un futuro:

async fn foo() -> u32 {
    0
}

// lo anterior se traduce aproximadamente por el compilador a:
fn foo() -> impl Future<Output = u32> {
    future::ready(0)
}

Esta palabra clave por sí sola no sería tan útil. Sin embargo, dentro de las funciones async, se puede utilizar la palabra clave await para recuperar el valor asíncrono de un futuro:

async fn example(min_len: usize) -> String {
    let content = async_read_file("foo.txt").await;
    if content.len() < min_len {
        content + &async_read_file("bar.txt").await
    } else {
        content
    }
}

(Pruébalo en el playground)

Esta función es una traducción directa de la función example de arriba que usó funciones combinadoras. Usando el operador .await, podemos recuperar el valor de un futuro sin necesitar closures o tipos Either. Como resultado, podemos escribir nuestro código como escribimos código síncrono normal, con la diferencia de que esto sigue siendo código asíncrono.

🔗Transformación de Máquina de Estado

Detrás de escena, el compilador convierte el cuerpo de la función async en una máquina de estado, donde cada llamada .await representa un estado diferente. Para la función example anterior, el compilador crea una máquina de estado con los siguientes cuatro estados:

Cuatro estados: inicio, esperando a foo.txt, esperando a bar.txt, final

Cada estado representa un diferente punto de pausa en la función. Los estados “Inicio” y “Fin” representan la función al comienzo y al final de su ejecución. El estado “Esperando a foo.txt” representa que la función está actualmente esperando el resultado de async_read_file primero. Similarmente, el estado “Esperando a bar.txt” representa el punto de pausa donde la función está esperando el resultado de async_read_file segundo.

La máquina de estado implementa el trait Future haciendo que cada llamada a poll sea una posible transición de estado:

Cuatro estados y sus transiciones: inicio, esperando a foo.txt, esperando a bar.txt, fin

El diagrama usa flechas para representar cambios de estado y formas de diamante para representar formas alternativas. Por ejemplo, si el archivo foo.txt no está listo, se toma el camino marcado como “no” y se alcanza el estado “Esperando a foo.txt”. De lo contrario, se toma el camino “sí”. El pequeño diamante rojo sin leyenda representa la rama if content.len() < 100 de la función example.

Observamos que la primera llamada poll inicia la función y la deja correr hasta que llega a un futuro que no está listo aún. Si todos los futuros en el camino están listos, la función puede ejecutarse hasta el estado “Fin”, donde devuelve su resultado envuelto en Poll::Ready. De lo contrario, la máquina de estados entra en un estado de espera y devuelve Poll::Pending. En la próxima llamada poll, la máquina de estados comienza de nuevo desde el último estado de espera y vuelve a intentar la última operación.

🔗Guardando Estado

Para poder continuar desde el último estado de espera, la máquina de estado debe llevar un seguimiento del estado actual internamente. Además, debe guardar todas las variables que necesita para continuar la ejecución en la siguiente llamada poll. Aquí es donde el compilador realmente puede brillar: dado que sabe qué variables se utilizan cuando, puede generar automáticamente estructuras con exactamente las variables que se necesitan.

Como ejemplo, el compilador genera estructuras como la siguiente para la función example anterior:

// La función `example` nuevamente para que no necesites desplazarte hacia arriba
async fn example(min_len: usize) -> String {
    let content = async_read_file("foo.txt").await;
    if content.len() < min_len {
        content + &async_read_file("bar.txt").await
    } else {
        content
    }
}

// Las estructuras de estado generadas por el compilador:

struct StartState {
    min_len: usize,
}

struct WaitingOnFooTxtState {
    min_len: usize,
    foo_txt_future: impl Future<Output = String>,
}

struct WaitingOnBarTxtState {
    content: String,
    bar_txt_future: impl Future<Output = String>,
}

struct EndState {}

En los estados “inicio” y “Esperando a foo.txt”, se necesita almacenar el parámetro min_len para la comparación posterior con content.len(). El estado “Esperando a foo.txt” y además almacena un foo_txt_future, que representa el futuro devuelto por la llamada async_read_file. Este futuro necesita ser polled de nuevo cuando la máquina de estado continúa, así que necesita ser almacenado.

El estado “Esperando a bar.txt” contiene la variable content para la concatenación de cadenas posterior cuando bar.txt esté listo. También almacena un bar_txt_future que representa la carga en progreso de bar.txt. La estructura no contiene la variable min_len porque ya no se necesita después de la comparación content.len(). En el estado “fin”, no se almacenan variables porque la función ya se ha completado.

Ten en cuenta que este es solo un ejemplo del código que el compilador podría generar. Los nombres de las estructuras y la disposición de los campos son detalles de implementación y pueden ser diferentes.

🔗El Tipo Completo de Máquina de Estado

Si bien el código exacto generado por el compilador es un detalle de implementación, ayuda a entender imaginar cómo se vería la máquina de estado generada podría para la función example. Ya definimos las estructuras que representan los diferentes estados y que contienen las variables requeridas. Para crear una máquina de estado sobre ellas, podemos combinarlas en un enum:

enum ExampleStateMachine {
    Start(StartState),
    WaitingOnFooTxt(WaitingOnFooTxtState),
    WaitingOnBarTxt(WaitingOnBarTxtState),
    End(EndState),
}

Definimos una variante de enum separada para cada estado y añadimos la estructura de estado correspondiente a cada variante como un campo. Para implementar las transiciones de estado, el compilador genera una implementación del trait Future basada en la función example:

impl Future for ExampleStateMachine {
    type Output = String; // tipo de retorno de `example`

    fn poll(self: Pin<&mut Self>, cx: &mut Context) -> Poll<Self::Output> {
        loop {
            match self { // TODO: manejar pinning
                ExampleStateMachine::Start(state) => {…}
                ExampleStateMachine::WaitingOnFooTxt(state) => {…}
                ExampleStateMachine::WaitingOnBarTxt(state) => {…}
                ExampleStateMachine::End(state) => {…}
            }
        }
    }
}

El tipo Output del futuro es String porque es el tipo de retorno de la función example. Para implementar la función poll, utilizamos una instrucción match sobre el estado actual dentro de un loop. La idea es que cambiamos al siguiente estado tantas veces como sea posible y usamos un explícito return Poll::Pending cuando no podemos continuar.

Para simplificar, solo mostramos un código simplificado y no manejamos pinning, propiedad, tiempos de vida, etc. Así que este código y el siguiente deben ser tratados como pseudo-código y no ser usados directamente. Por supuesto, el código generado real por el compilador maneja todo correctamente, aunque de manera posiblemente diferente.

Para mantener pequeños los fragmentos de código, presentamos el código de cada brazo de match por separado. Empecemos con el estado Start:

ExampleStateMachine::Start(state) => {
    // del cuerpo de `example`
    let foo_txt_future = async_read_file("foo.txt");
    // operación `.await`
    let state = WaitingOnFooTxtState {
        min_len: state.min_len,
        foo_txt_future,
    };
    *self = ExampleStateMachine::WaitingOnFooTxt(state);
}

La máquina de estado se encuentra en el estado Start cuando está justo al principio de la función. En este caso, ejecutamos todo el código del cuerpo de la función example hasta la primera .await. Para manejar la operación .await, cambiamos el estado de la máquina de estado self a WaitingOnFooTxt, lo que incluye la construcción de la estructura WaitingOnFooTxtState.

Dado que la instrucción match self {…} se ejecuta en un bucle, la ejecución salta al brazo WaitingOnFooTxt a continuación:

ExampleStateMachine::WaitingOnFooTxt(state) => {
    match state.foo_txt_future.poll(cx) {
        Poll::Pending => return Poll::Pending,
        Poll::Ready(content) => {
            // del cuerpo de `example`
            if content.len() < state.min_len {
                let bar_txt_future = async_read_file("bar.txt");
                // operación `.await`
                let state = WaitingOnBarTxtState {
                    content,
                    bar_txt_future,
                };
                *self = ExampleStateMachine::WaitingOnBarTxt(state);
            } else {
                *self = ExampleStateMachine::End(EndState);
                return Poll::Ready(content);
            }
        }
    }
}

En este brazo de match, primero llamamos a la función poll de foo_txt_future. Si no está lista, salimos del bucle y devolvemos Poll::Pending. Dado que self permanece en el estado WaitingOnFooTxt en este caso, la siguiente llamada poll en la máquina de estado ingresará al mismo brazo de match y volverá a intentar hacer polling en el foo_txt_future.

Cuando foo_txt_future está listo, asignamos el resultado a la variable content y continuamos ejecutando el código de la función example: Si content.len() es menor que el min_len guardado en la estructura de estado, el archivo bar.txt se carga asíncronamente. Una vez más, traducimos la operación .await en un cambio de estado, esta vez al estado WaitingOnBarTxt. Dado que estamos ejecutando el match dentro de un bucle, la ejecución salta directamente al brazo de match para el nuevo estado después, donde se hace polling en el futuro bar_txt_future.

En caso de que ingresamos al bloque else, no ocurre ninguna otra operación .await. Alcanzamos el final de la función y devolvemos content envuelto en Poll::Ready. También cambiamos el estado actual a End.

El código para el estado WaitingOnBarTxt se ve así:

ExampleStateMachine::WaitingOnBarTxt(state) => {
    match state.bar_txt_future.poll(cx) {
        Poll::Pending => return Poll::Pending,
        Poll::Ready(bar_txt) => {
            *self = ExampleStateMachine::End(EndState);
            // del cuerpo de `example`
            return Poll::Ready(state.content + &bar_txt);
        }
    }
}

Al igual que en el estado WaitingOnFooTxt, comenzamos haciendo polling en bar_txt_future. Si aún está pendiente, salimos del bucle y devolvemos Poll::Pending. De lo contrario, podemos realizar la última operación de la función example: concatenar la variable content con el resultado del futuro. Actualizamos la máquina de estado al estado End y luego devolvemos el resultado envuelto en Poll::Ready.

Finalmente, el código para el estado End se ve así:

ExampleStateMachine::End(_) => {
    panic!("poll called after Poll::Ready was returned");
}

Los futuros no deben ser polled nuevamente después de que devuelven Poll::Ready, así que hacemos panic si se llama a poll mientras estamos en el estado End.

Ahora sabemos cómo podría verse la máquina de estado generada por el compilador y su implementación del trait Future. En la práctica, el compilador genera el código de diferentes formas. (En caso de que te interese, la implementación actualmente se basa en corutinas, pero esto es solo un detalle de implementación.)

La última pieza del rompecabezas es el código generado para la propia función example. Recuerda, la cabecera de la función se definió así:

async fn example(min_len: usize) -> String

Dado que el cuerpo completo de la función ahora es implementado por la máquina de estado, lo único que debe hacer la función es inicializar la máquina de estado y devolverla. El código generado para esto podría verse así:

fn example(min_len: usize) -> ExampleStateMachine {
    ExampleStateMachine::Start(StartState {
        min_len,
    })
}

La función ya no tiene modificador async ya que ahora devuelve explícitamente un tipo ExampleStateMachine, que implementa el trait Future. Como era de esperar, la máquina de estado se construye en el estado Start y la estructura de estado correspondiente se inicializa con el parámetro min_len.

Ten en cuenta que esta función no inicia la ejecución de la máquina de estado. Esta es una decisión de diseño fundamental de los futuros en Rust: no hacen nada hasta que se les pollea por primera vez.

🔗Pinning

Ya que nos hemos encontrado con el pinning varias veces en esta publicación, es momento de explorar qué es el pinning y por qué es necesario.

🔗Estructuras Autorreferenciales

Como se explicó anteriormente, la transformación de máquina de estado almacena las variables locales de cada punto de pausa en una estructura. Para ejemplos pequeños como nuestra función example, esto fue sencillo y no llevó a ningún problema. Sin embargo, las cosas se vuelven más difíciles cuando las variables se referencian entre sí. Por ejemplo, considera esta función:

async fn pin_example() -> i32 {
    let array = [1, 2, 3];
    let element = &array[2];
    async_write_file("foo.txt", element.to_string()).await;
    *element
}

Esta función crea un pequeño array con los contenidos 1, 2 y 3. Luego crea una referencia al último elemento del array y la almacena en una variable element. A continuación, escribe asincrónicamente el número convertido a una cadena en un archivo foo.txt. Finalmente, devuelve el número referenciado por element.

Dado que la función utiliza una única operación .await, la máquina de estado resultante tiene tres estados: inicio, fin y “esperando a escribir”. La función no toma argumentos, por lo que la estructura para el estado de inicio está vacía. Al igual que antes, la estructura para el estado final está vacía porque la función ha terminado en este punto. Sin embargo, la estructura para el estado de “esperando a escribir” es más interesante:

struct WaitingOnWriteState {
    array: [1, 2, 3],
    element: 0x1001c, // dirección del último elemento del array
}

Necesitamos almacenar tanto array como element porque la variable element es necesaria para el valor de retorno y array es referenciada por element. Usamos 0x1001c como un ejemplo de dirección de memoria aquí. En realidad, necesita ser la dirección del último elemento del campo array, por lo que depende de dónde viva la estructura en memoria. Las estructuras con tales punteros internos se llaman estructuras autorefencial porque se refieren a sí mismas desde uno de sus campos.

🔗El Problema con las Estructuras Autorreferenciales

El puntero interno de nuestra estructura autorefencial lleva a un problema fundamental, que se hace evidente cuando observamos su disposición en la memoria:

array en 0x10014 con campos 1, 2 y 3; elemento en dirección 0x10020, apuntando al último elemento del array en 0x1001c

El campo array comienza en la dirección 0x10014 y el campo element en la dirección 0x10020. Apunta a la dirección 0x1001c porque el último elemento del array vive en esta dirección. En este punto, todo sigue bien. Sin embargo, un problema ocurre cuando movemos esta estructura a una dirección de memoria diferente:

array en 0x10024 con campos 1, 2 y 3; elemento en dirección 0x10030, aún apuntando a 0x1001c, incluso cuando el último elemento del array ahora vive en 0x1002c

Movimos la estructura un poco de modo que ahora comienza en la dirección 0x10024. Esto podría suceder, por ejemplo, cuando pasamos la estructura como un argumento a una función o la asignamos a otra variable de pila diferente. El problema es que el campo element aún apunta a la dirección 0x1001c a pesar de que el último elemento del array vive ahora en 0x1002c. Así, el puntero está colgando, con el resultado de que se produce un comportamiento indefinido en la próxima llamada a poll.

🔗Posibles Soluciones

Hay tres enfoques fundamentales para resolver el problema del puntero colgante:

Actualizar el puntero al moverse: La idea es actualizar el puntero interno cada vez que la estructura se mueve en memoria para que siga siendo válida después del movimiento. Desafortunadamente, este enfoque requeriría amplios cambios en Rust que resultarían en pérdidas de rendimiento potencialmente enormes. La razón es que necesitaríamos algún tipo de tiempo de ejecución que mantenga un seguimiento del tipo de todos los campos de la estructura y compruebe en cada operación de movimiento si se requiere una actualización de puntero.
Almacenar un desplazamiento en lugar de auto-referencias: Para evitar la necesidad de actualizar punteros, el compilador podría intentar almacenar auto-referencias como desplazamientos desde el principio de la estructura. Por ejemplo, el campo element de la estructura WaitingOnWriteState anterior podría almacenarse en forma de un campo element_offset con un valor de 8 porque el elemento del array al que apunta comienza 8 bytes después de la estructura. Dado que el desplazamiento permanece igual cuando la estructura se mueve, no se requieren actualizaciones de campo.

El problema con este enfoque es que requiere que el compilador detecte todas las auto-referencias. Esto no es posible en tiempo de compilación porque el valor de una referencia puede depender de la entrada del usuario, por lo que necesitaríamos un sistema en tiempo de ejecución nuevamente para analizar referencias y crear correctamente las estructuras de estado. Esto no solo resultaría en costos de tiempo de ejecución, sino que también impediría ciertas optimizaciones del compilador, lo que provocaría grandes pérdidas de rendimiento nuevamente.
Prohibir mover la estructura: Como vimos anteriormente, el puntero colgante solo ocurre cuando movemos la estructura en memoria. Al prohibir completamente las operaciones de movimiento en estructuras autorefenciales, el problema también se puede evitar. La gran ventaja de este enfoque es que se puede implementar a nivel de sistema de tipos sin costos adicionales de tiempo de ejecución. La desventaja es que recaerá sobre el programador lidiar con las operaciones de movimiento en las estructuras potencialmente autorefenciales.

Rust eligió la tercera solución por su principio de proporcionar abstracciones de costo cero, lo que significa que las abstracciones no deben imponer costos adicionales de tiempo de ejecución. La API de pinning fue propuesta para este propósito en RFC 2349. A continuación, daremos un breve resumen de esta API y explicaremos cómo funciona con async/await y futuros.

🔗Valores en el Heap

La primera observación es que los valores [asignados en el heap] ya tienen una dirección de memoria fija la mayoría de las veces. Se crean usando una llamada a allocate y luego se referencian mediante un tipo de puntero como Box<T>. Si bien es posible mover el tipo de puntero, el valor del heap al que apunta permanece en la misma dirección de memoria hasta que se libera a través de una llamada deallocate.

Usando la asignación en el heap, podemos intentar crear una estructura autorefencial:

fn main() {
    let mut heap_value = Box::new(SelfReferential {
        self_ptr: 0 as *const _,
    });
    let ptr = &*heap_value as *const SelfReferential;
    heap_value.self_ptr = ptr;
    println!("valor en el heap en: {:p}", heap_value);
    println!("referencia interna: {:p}", heap_value.self_ptr);
}

struct SelfReferential {
    self_ptr: *const Self,
}

([Pruébalo en el playground][playground-self-ref])

Creamos una estructura simple llamada SelfReferential que contiene un solo campo de puntero. Primero inicializamos esta estructura con un puntero nulo y luego la asignamos en el heap usando Box::new. Luego determinamos la dirección de la estructura asignada en el heap y la almacenamos en una variable ptr. Finalmente, hacemos que la estructura sea autorefencial al asignar la variable ptr al campo self_ptr.

Cuando ejecutamos este código [en el playground][playground-self-ref], vemos que la dirección del valor del heap y su puntero interno son iguales, lo que significa que el campo self_ptr es una referencia válida a sí misma. Dado que la variable heap_value es solo un puntero, moverla (por ejemplo, pasándola a una función) no cambia la dirección de la estructura en sí, por lo que el self_ptr sigue siendo válido incluso si se mueve el puntero.

Sin embargo, todavía hay una forma de romper este ejemplo: podemos salir de un Box<T> o reemplazar su contenido:

let stack_value = mem::replace(&mut *heap_value, SelfReferential {
    self_ptr: 0 as *const _,
});
println!("valor en: {:p}", &stack_value);
println!("referencia interna: {:p}", stack_value.self_ptr);

(Pruébalo en el playground)

Aquí usamos la función mem::replace para reemplazar el valor asignado en el heap con una nueva instancia de estructura. Esto nos permite mover el valor original heap_value a la pila, mientras que el campo self_ptr de la estructura es ahora un puntero colgante que aún apunta a la antigua dirección del heap. Cuando intentas ejecutar el ejemplo en el playground, verás que las líneas impresas “valor en:” y “referencia interna:” muestran punteros diferentes. Por lo tanto, la asignación de un valor en el heap no es suficiente para hacer que las auto-referencias sean seguras.

El problema fundamental que permitió que se produjera la ruptura anterior es que Box<T> permite obtener una referencia &mut T al valor asignado en el heap. Esta referencia &mut hace posible usar métodos como mem::replace o mem::swap para invalidar el valor asignado en el heap. Para resolver este problema, debemos prevenir que se creen referencias &mut en estructuras autorefenciales.

🔗`Pin<Box<T>>` y `Unpin`

La API de pinning proporciona una solución al problema de &mut T en forma de los tipos envolventes Pin y el trait marcador Unpin. La idea detrás de estos tipos es limitar todos los métodos de Pin que se pueden usar para obtener referencias &mut al valor envuelto (por ejemplo, get_mut o deref_mut) en el trait Unpin. El trait Unpin es un auto trait, que se implementa automáticamente para todos los tipos excepto para aquellos que optan explícitamente por no hacerlo. Al hacer que las estructuras autorefenciales opten por no implementar Unpin, no hay forma (segura) de obtener un &mut T del tipo Pin<Box<T>> para ellas. Como resultado, se garantiza que todas las auto-referencias internas se mantendrán válidas.

Como ejemplo, actualicemos el tipo SelfReferential de arriba para que no implemente Unpin:

use core::marker::PhantomPinned;

struct SelfReferential {
    self_ptr: *const Self,
    _pin: PhantomPinned,
}

Optamos por no implementar Unpin al añadir un segundo campo _pin de tipo PhantomPinned. Este tipo es un tipo de tamaño cero cuyo único propósito es no implementar el trait Unpin. Debido a la forma en que funcionan los auto traits, un solo campo que no sea Unpin es suficiente para hacer que toda la estructura opta por no ser Unpin.

El segundo paso es cambiar el tipo de Box<SelfReferential> en el ejemplo a un tipo Pin<Box<SelfReferential>>. La forma más fácil de hacer esto es usar la función Box::pin en lugar de Box::new para crear el valor asignado en el heap:

let mut heap_value = Box::pin(SelfReferential {
    self_ptr: 0 as *const _,
    _pin: PhantomPinned,
});

Además de cambiar Box::new a Box::pin, también necesitamos añadir el nuevo campo _pin en el inicializador de la estructura. Dado que PhantomPinned es un tipo de tamaño cero, solo necesitamos su nombre de tipo para inicializarlo.

Cuando intentamos ejecutar nuestro ejemplo ajustado ahora, vemos que ya no funciona:

error[E0594]: cannot assign to data in dereference of `Pin<Box<SelfReferential>>`
  --> src/main.rs:10:5
   |
10 |     heap_value.self_ptr = ptr;
   |     ^^^^^^^^^^^^^^^^^^^^^^^^^ cannot assign
   |
   = help: trait `DerefMut` is required to modify through a dereference, but it is not implemented for `Pin<Box<SelfReferential>>`

error[E0596]: cannot borrow data in dereference of `Pin<Box<SelfReferential>>` as mutable
  --> src/main.rs:16:36
   |
16 |     let stack_value = mem::replace(&mut *heap_value, SelfReferential {
   |                                    ^^^^^^^^^^^^^^^^ cannot borrow as mutable
   |
   = help: trait `DerefMut` is required to modify through a dereference, but it is not implemented for `Pin<Box<SelfReferential>>`

Ambos errores ocurren porque el tipo Pin<Box<SelfReferential>> ya no implementa el trait DerefMut. Esto es exactamente lo que queremos porque el trait DerefMut devolvería una referencia &mut, que queremos prevenir. Esto solo ocurre porque ambos optamos por no implementar Unpin y cambiamos Box::new a Box::pin.

El problema que queda es que el compilador no solo previene mover el tipo en la línea 16, sino que también prohíbe inicializar el campo self_ptr en la línea 10. Esto ocurre porque el compilador no puede diferenciar entre los usos válidos e inválidos de &mut referencias. Para que la inicialización funcione nuevamente, debemos usar el método inseguro get_unchecked_mut:

// seguro porque modificar un campo no mueve toda la estructura
unsafe {
    let mut_ref = Pin::as_mut(&mut heap_value);
    Pin::get_unchecked_mut(mut_ref).self_ptr = ptr;
}

La función get_unchecked_mut funciona en un Pin<&mut T> en lugar de un Pin<Box<T>>, así que debemos usar Pin::as_mut para convertir el valor. Luego podemos establecer el campo self_ptr utilizando la referencia &mut devuelta por get_unchecked_mut.

Ahora el único error que queda es el error deseado en mem::replace. Recuerda, esta operación intenta mover el valor asignado en el heap a la pila, lo cual invalidaría la auto-referencia almacenada en el campo self_ptr. Al optar por no implementar Unpin y usar Pin<Box<T>>, podemos prevenir esta operación en tiempo de compilación y así trabajar de manera segura con estructuras auto-referenciales. Como vimos, el compilador no puede probar que la creación de la auto-referencia es segura (aún), así que necesitamos usar un bloque inseguro y verificar la corrección nosotros mismos.

🔗Pinning en la Pila y `Pin<&mut T>`

En la sección anterior, aprendimos cómo usar Pin<Box<T>> para crear de manera segura un valor auto-referencial asignado en el heap. Si bien este enfoque funciona bien y es relativamente seguro (aparte de la construcción insegura), la asignación requerida en el heap conlleva un costo de rendimiento. Dado que Rust se esfuerza por proporcionar abstracciones de costo cero siempre que sea posible, la API de pinning también permite crear instancias de Pin<&mut T> que apuntan a valores asignados en la pila.

A diferencia de las instancias de Pin<Box<T>>, que tienen propiedad del valor envuelto, las instancias de Pin<&mut T> solo toman prestado temporalmente el valor envuelto. Esto complica un poco las cosas, ya que requiere que el programador garantice condiciones adicionales por sí mismo. Lo más importante es que un Pin<&mut T> debe permanecer pinado durante toda la vida útil de T referenciado, lo que puede ser difícil de verificar para variables basadas en la pila. Para ayudar con esto, existen crates como pin-utils, pero aún así no recomendaría pinning en la pila a menos que sepas exactamente lo que estás haciendo.

Para una lectura más profunda, consulta la documentación del módulo pin y el método Pin::new_unchecked.

🔗Pinning y Futuros

Como ya vimos en esta publicación, el método Future::poll utiliza el pinning en forma de un parámetro Pin<&mut Self>:

fn poll(self: Pin<&mut Self>, cx: &mut Context) -> Poll<Self::Output>

La razón por la que este método toma self: Pin<&mut Self> en lugar del normal &mut self es que las instancias de futuros creadas a partir de async/await son a menudo auto-referenciales, como vimos arriba. Al envolver Self en Pin y dejar que el compilador opte por no ser Unpin para futuros auto-referenciales generados a partir de async/await, se garantiza que los futuros no se muevan en memoria entre las llamadas a poll. Esto asegura que todas las referencias internas sigan siendo válidas.

Vale la pena mencionar que mover futuros antes de la primera llamada a poll está bien. Esto es resultado del hecho de que los futuros son perezosos y no hacen nada hasta que se les realiza polling por primera vez. El estado inicial de las máquinas de estado generadas, por lo tanto, solo contiene los argumentos de función pero no referencias internas. Para poder llamar a poll, el llamador debe envolver el futuro en Pin primero, lo que asegura que el futuro no se pueda mover en memoria. Dado que el pinning en la pila es más difícil de hacer correctamente, recomiendo utilizar siempre Box::pin combinado con Pin::as_mut para esto.

En caso de que estés interesado en entender cómo implementar de manera segura una función combinadora de futuros utilizando pinning en la pila tú mismo, echa un vistazo al código relativamente corto del método combinador map del crate futures y la sección sobre proyecciones y pinning estructural de la documentación de pin.

🔗Ejecutores y Wakers

Usando async/await, es posible trabajar con futuros de manera ergonómica y completamente asíncrona. Sin embargo, como aprendimos anteriormente, los futuros no hacen nada hasta que se les hace polling. Esto significa que tenemos que llamar a poll en ellos en algún momento, de lo contrario, el código asíncrono nunca se ejecuta.

Con un solo futuro, siempre podemos esperar cada futuro manualmente usando un bucle como se describe arriba. Sin embargo, este enfoque es muy ineficiente y no práctico para programas que crean un gran número de futuros. La solución más común a este problema es definir un ejecutor global que sea responsable de hacer polling en todos los futuros en el sistema hasta que se completen.

🔗Ejecutores

El propósito de un ejecutor es permitir ejecutar futuros como tareas independientes, típicamente a través de algún tipo de método spawn. Luego, el ejecutor es responsable de hacer polling en todos los futuros hasta que se completen. La gran ventaja de gestionar todos los futuros en un lugar central es que el ejecutor puede cambiar a un futuro diferente siempre que un futuro devuelva Poll::Pending. Así, las operaciones asíncronas se ejecutan en paralelo y la CPU se mantiene ocupada.

Muchas implementaciones de ejecutores también pueden aprovechar sistemas con múltiples núcleos de CPU. Crean un pool de hilos que es capaz de utilizar todos los núcleos si hay suficiente trabajo disponible y utilizan técnicas como robo de trabajo para equilibrar la carga entre núcleos. También hay implementaciones de ejecutor especiales para sistemas embebidos que optimizan para baja latencia y sobredimensionamiento de memoria.

Para evitar la sobrecarga de hacer polling en futuros repetidamente, los ejecutores suelen aprovechar la API de waker soportada por los futuros de Rust.

🔗Wakers

La idea detrás de la API de waker es que un tipo especial Waker se pasa a cada invocación de poll, envuelto en el tipo Context. Este tipo Waker es creado por el ejecutor y puede ser utilizado por la tarea asíncrona para señalan su (o una parte de su) finalización. Como resultado, el ejecutor no necesita llamar a poll en un futuro que anteriormente devolvió Poll::Pending hasta que recibe la notificación de waker correspondiente.

Esto se ilustra mejor con un pequeño ejemplo:

async fn write_file() {
    async_write_file("foo.txt", "Hello").await;
}

Esta función escribe asíncronamente la cadena “Hello” en un archivo foo.txt. Dado que las escrituras en el disco duro toman algo de tiempo, la primera llamada a poll en este futuro probablemente devolverá Poll::Pending. Sin embargo, el controlador del disco duro almacenará internamente el Waker pasado a la llamada poll y lo utilizará para notificar al ejecutor cuando el archivo se haya escrito en el disco. De esta manera, el ejecutor no necesita perder tiempo tratando de poll el futuro nuevamente antes de recibir la notificación del waker.

Veremos cómo funciona el tipo Waker en detalle cuando creemos nuestro propio ejecutor con soporte de waker en la sección de implementación de esta publicación.

🔗¿Multitasking Cooperativo?

Al principio de esta publicación, hablamos sobre el multitasking preemptivo y cooperativo. Mientras que el multitasking preemptivo depende del sistema operativo para cambiar forzosamente entre tareas en ejecución, el multitasking cooperativo requiere que las tareas cedan voluntariamente el control de la CPU a través de una operación yield regularmente. La gran ventaja del enfoque cooperativo es que las tareas pueden guardar su estado ellas mismas, lo que resulta en cambios de contexto más eficientes y hace posible compartir la misma pila de llamadas entre las tareas.

Puede que no sea evidente de inmediato, pero los futuros y async/await son una implementación del patrón de multitasking cooperativo:

Cada futuro que se añade al ejecutor es básicamente una tarea cooperativa.
En lugar de usar una operación yield explícita, los futuros ceden el control del núcleo de CPU al devolver Poll::Pending (o Poll::Ready al final).
- No hay nada que fuerce a los futuros a ceder la CPU. Si quieren, pueden nunca regresar de poll, por ejemplo, girando eternamente en un bucle.
- Dado que cada futuro puede bloquear la ejecución de otros futuros en el ejecutor, necesitamos confiar en que no sean maliciosos.
Internamente, los futuros almacenan todo el estado que necesitan para continuar la ejecución en la siguiente llamada poll. Con async/await, el compilador detecta automáticamente todas las variables que se necesitan y las almacena dentro de la máquina de estado generada.
- Solo se guarda el estado mínimo requerido para la continuación.
- Dado que el método poll cede la pila de llamadas cuando retorna, se puede usar la misma pila para pollear otros futuros.

Vemos que los futuros y async/await encajan perfectamente en el patrón de multitasking cooperativo; solo utilizan algunos términos diferentes. En lo sucesivo, por lo tanto, utilizaremos los términos “tarea” y “futuro” indistintamente.

🔗Implementación

Ahora que entendemos cómo funciona el multitasking cooperativo basado en futuros y async/await en Rust, es hora de agregar soporte para ello a nuestro núcleo. Dado que el trait Future es parte de la biblioteca core y async/await es una característica del propio lenguaje, no hay nada especial que debamos hacer para usarlo en nuestro núcleo #![no_std]. El único requisito es que usemos como mínimo nightly 2020-03-25 de Rust porque async/await no era compatible con no_std antes.

Con una versión nightly suficientemente reciente, podemos comenzar a usar async/await en nuestro main.rs:

// en src/main.rs

async fn async_number() -> u32 {
    42
}

async fn example_task() {
    let number = async_number().await;
    println!("número asíncrono: {}", number);
}

La función async_number es una async fn, así que el compilador la transforma en una máquina de estado que implementa Future. Dado que la función solo devuelve 42, el futuro resultante devolverá directamente Poll::Ready(42) en la primera llamada poll. Al igual que async_number, la función example_task también es una async fn. Espera el número devuelto por async_number y luego lo imprime usando el macro println.

Para ejecutar el futuro devuelto por example_task, necesitamos llamar a poll en él hasta que señale su finalización devolviendo Poll::Ready. Para hacer esto, necesitamos crear un tipo de ejecutor simple.

🔗Tarea

Antes de comenzar la implementación del ejecutor, creamos un nuevo módulo task con un tipo Task:

// en src/lib.rs

pub mod task;

// en src/task/mod.rs

use core::{future::Future, pin::Pin};
use alloc::boxed::Box;

pub struct Task {
    future: Pin<Box<dyn Future<Output = ()>>>,
}

La estructura Task es un envoltorio nuevo alrededor de un futuro pinzado, asignado en el heap y de despacho dinámico con el tipo vacío () como salida. Revisemos esto en detalle:

Requerimos que el futuro asociado con una tarea devuelva (). Esto significa que las tareas no devuelven ningún resultado, simplemente se ejecutan por sus efectos secundarios. Por ejemplo, la función example_task que definimos arriba no tiene valor de retorno, pero imprime algo en pantalla como efecto secundario.
La palabra clave dyn indica que almacenamos un trait object en el Box. Esto significa que los métodos en el futuro son despachados dinámicamente, permitiendo que diferentes tipos de futuros se almacenen en el tipo Task. Esto es importante porque cada async fn tiene su propio tipo y queremos ser capaces de crear múltiples tareas diferentes.
Como aprendimos en la sección sobre pinning, el tipo Pin<Box> asegura que un valor no puede moverse en memoria al colocarlo en el heap y prevenir la creación de referencias &mut a él. Esto es importante porque los futuros generados por async/await podrían ser auto-referenciales, es decir, contener punteros a sí mismos que se invalidarían cuando el futuro se moviera.

Para permitir la creación de nuevas estructuras Task a partir de futuros, creamos una función new:

// en src/task/mod.rs

impl Task {
    pub fn new(future: impl Future<Output = ()> + 'static) -> Task {
        Task {
            future: Box::pin(future),
        }
    }
}

La función toma un futuro arbitrario con un tipo de salida de () y lo pinza en memoria a través de la función Box::pin. Luego envuelve el futuro en la estructura Task y la devuelve. Se requiere el tiempo de vida 'static aquí porque el Task devuelto puede vivir por un tiempo arbitrario, por lo que el futuro también debe ser válido durante ese tiempo.

🔗Poll

También añadimos un método poll para permitir al ejecutor hacer polling en el futuro almacenado:

// en src/task/mod.rs

use core::task::{Context, Poll};

impl Task {
    fn poll(&mut self, context: &mut Context) -> Poll<()> {
        self.future.as_mut().poll(context)
    }
}

Dado que el método poll del trait Future espera ser llamado sobre un tipo Pin<&mut T>, usamos el método Pin::as_mut para convertir el campo self.future del tipo Pin<Box<T>> primero. Luego llamamos a poll en el campo self.future convertido y devolvemos el resultado. Como el método Task::poll debería ser llamado solo por el ejecutor que crearemos en un momento, mantenemos la función privada.

🔗Ejecutor simple

Dado que los ejecutores pueden ser bastante complejos, comenzamos deliberadamente creando un ejecutor muy básico antes de implementar un ejecutor más completo más adelante. Para ello, primero creamos un nuevo submódulo task::simple_executor:

// en src/task/mod.rs

pub mod simple_executor;

// en src/task/simple_executor.rs

use super::Task;
use alloc::collections::VecDeque;

pub struct SimpleExecutor {
    task_queue: VecDeque<Task>,
}

impl SimpleExecutor {
    pub fn new() -> SimpleExecutor {
        SimpleExecutor {
            task_queue: VecDeque::new(),
        }
    }

    pub fn spawn(&mut self, task: Task) {
        self.task_queue.push_back(task)
    }
}

La estructura contiene un solo campo task_queue de tipo VecDeque, que es básicamente un vector que permite operaciones de push y pop en ambos extremos. La idea detrás de usar este tipo es que insertamos nuevas tareas a través del método spawn al final y extraemos la siguiente tarea para ejecutar desde el frente. De esta manera, obtenemos una simple cola FIFO (“primero en entrar, primero en salir”).

🔗Waker Inútil

Para llamar al método poll, necesitamos crear un tipo Context, que envuelve un tipo Waker. Para comenzar de manera simple, primero crearemos un waker inútil que no hace nada. Para ello, creamos una instancia de RawWaker, la cual define la implementación de los diferentes métodos Waker, y luego usamos la función Waker::from_raw para convertirlo en un Waker:

// en src/task/simple_executor.rs

use core::task::{Waker, RawWaker};

fn dummy_raw_waker() -> RawWaker {
    todo!();
}

fn dummy_waker() -> Waker {
    unsafe { Waker::from_raw(dummy_raw_waker()) }
}

La función from_raw es insegura porque se puede producir un comportamiento indefinido si el programador no cumple con los requisitos documentados de RawWaker. Antes de que veamos la implementación de la función dummy_raw_waker, primero intentemos entender cómo funciona el tipo RawWaker.

🔗`RawWaker`

El tipo RawWaker requiere que el programador defina explícitamente un tabla de métodos virtuales (vtable) que especifica las funciones que deben ser llamadas cuando RawWaker se clona, se despierta o se elimina. La disposición de esta vtable es definida por el tipo RawWakerVTable. Cada función recibe un argumento *const (), que es un puntero sin tipo a algún valor. La razón por la que se utiliza un puntero *const () en lugar de una referencia apropiada es que el tipo RawWaker debería ser no genérico pero aún así soportar tipos arbitrarios. El puntero se proporciona colocando data en la llamada a RawWaker::new, que simplemente inicializa un RawWaker. Luego, el Waker utiliza este RawWaker para llamar a las funciones de la vtable con data.

Típicamente, el RawWaker se crea para alguna estructura asignada en el heap que está envuelta en el tipo Box o Arc. Para tales tipos, pueden usarse métodos como Box::into_raw para convertir el Box<T> en un puntero *const T. Este puntero puede luego ser convertido a un puntero anónimo *const () y pasado a RawWaker::new. Dado que cada función de vtable recibe el mismo *const () como argumento, las funciones pueden convertir de forma segura el puntero de regreso a un Box<T> o un &T para operar en él. Como puedes imaginar, este proceso es extremadamente peligroso y puede llevar fácilmente a un comportamiento indefinido en caso de errores. Por esta razón, no se recomienda crear manualmente un RawWaker a menos que sea absolutamente necesario.

🔗Un `RawWaker` Inútil

Como crear manualmente un RawWaker no es recomendable, hay un camino seguro para crear un Waker inútil que no haga nada. Afortunadamente, el hecho de que queramos no hacer nada hace que sea relativamente seguro implementar la función dummy_raw_waker:

// en src/task/simple_executor.rs

use core::task::RawWakerVTable;

fn dummy_raw_waker() ->

« Diseños de Allocadores

Comentarios

¿Tienes algún problema, quieres compartir comentarios o discutir más ideas? ¡No dudes en dejar un comentario aquí! Por favor, utiliza inglés y sigue el código de conducta de Rust. Este hilo de comentarios se vincula directamente con una discusión en GitHub, así que también puedes comentar allí si lo prefieres.

Instead of authenticating the giscus application, you can also comment directly on GitHub.

Por favor deja tus comentarios en inglés si es posible.

Async/Aait

🔗Multitasking

🔗Multitasking Preemptivo

🔗Guardando Estado

🔗Discusión

🔗Multitasking Cooperativo

🔗Guardando Estado

🔗Discusión

🔗Async/Await en Rust

🔗Futuros

🔗Ejemplo

🔗Futuros en Rust

🔗Trabajando con Futuros

🔗Esperando en Futuros

🔗Combinadores de Futuros

🔗Ventajas

🔗Desventajas

🔗El Patrón Async/Await

🔗Transformación de Máquina de Estado

🔗Guardando Estado

🔗El Tipo Completo de Máquina de Estado

🔗Pinning

🔗Estructuras Autorreferenciales

🔗El Problema con las Estructuras Autorreferenciales

🔗Posibles Soluciones

🔗Valores en el Heap

🔗Pin<Box<T>> y Unpin

🔗Pinning en la Pila y Pin<&mut T>

🔗Pinning y Futuros

🔗Ejecutores y Wakers

🔗Ejecutores

🔗Wakers

🔗¿Multitasking Cooperativo?

🔗Implementación

🔗Tarea

🔗Poll

🔗Ejecutor simple

🔗Waker Inútil

🔗RawWaker

🔗Un RawWaker Inútil

Apóyame

Comentarios

🔗`Pin<Box<T>>` y `Unpin`

🔗Pinning en la Pila y `Pin<&mut T>`

🔗`RawWaker`

🔗Un `RawWaker` Inútil