Блог*

#prog #rust #моё

Как многие из вас знают (а если не знаете — узнаете сейчас), в Rust нельзя перемещать (move) поля из значения типа, имеющего нетривиальную реализацию Drop. В частности, значение типа, реализующего Drop, нельзя деструктурировать. Однако надо отметить, что если тип поля реализует Copy, то к этому полю можно обратиться, в том числе и пре деструктуризации, при этом значение этого поля скопируется. Проиллюстрирую только что сказанное:

struct NonCopy;

struct Dropping<T>(T, NonCopy);

impl<T> Drop for Dropping<T> {
    fn drop(&mut self) {
        println!("dropped");
    }
}

fn main() {
    // ⬇️ если раскомментировать эту строку, то программа не скомпилируется с E0509
    // let Dropping(_non_copy, _) = Dropping(NonCopy, NonCopy);

    // А вот это — компилируется и печатает "dropped".
    // Обратите внимание, паттерн `_`

*не* перемещает значение.
    let Dropping(_x, _) = Dropping(0_u32, NonCopy);
}

Где это может выстрелить? При написании биндингов к сишным либам. Одна их техник обеспечения инкапсуляции в C — это определение структуры в заголовочном файле без определения её полей. Это позволяет получить доступ к полям структуры только там, где дано её определение, а внешний код может обращаться к ней лишь по указателю. И указатель — это Copy-тип, да.

Пусть это выглядит примерно так:

extern "C" {
    // extern types ещё не стабилизированы, так что
    // в реальной библиотеке, скорее всего, будут использовать *mut std::ffi::c_void

    type Some_C_Struct;
    fn c_lib_release_resources(arg: *mut Some_C_Struct);
}

struct Handle(*mut Some_C_Struct);

impl Drop for Handle {
    fn drop(&mut self) {
        unsafe { c_lib_release_resources(self.0) }
    }
}

Что произойдёт, если мы попытаемся деструктурировать Handle? Скажем, нам зачем-то потребовалась реализация метода leak:

impl Handle {
    fn leak(self) -> *mut Some_C_Struct {
        // Здесь мы разбираем значение, но так как указатель — Copy-тип,
        // имя ptr привязывается к копии значения, перемещения не происходит.
        let Handle(ptr) = self; // <-- после этой точки с запятой кончается время жизни self, и вызывается деструктор
        // Ура, у нас на руках невалидный указатель!
        ptr
    }
}

Что можно с этим сделать? Использовать ManuallyDrop. Этот тип предотвращает вызов деструктора (а также деструктуризацию, поскольку у него приватные поля), но при этом не предотвращает доступ к полям значения внутри (через Deref). Возникает вопрос, почему не использовать std::mem::forget? В принципе, в документации подробно расписано, но если коротко, то std::mem::forget значительно сложнее корректно использовать.

doc.rust-lang.org

ManuallyDrop in std::mem - Rust

A wrapper to inhibit compiler from automatically calling `T`’s destructor. This wrapper is 0-cost.

639 viewsedited 13:28

Блог*

Сишный код в двух словах:

Бе ды
с
вла дением

688 views13:41

Блог*

Прошу прощения, в предыдущем опросе один диапазон возрастов просто не был представлен

699 viewsedited 14:34

Блог*

Сколько вам лет?
(диапазон с включающей нижней и исключающей верхней границами)

Final Results

312 voters923 views14:39

Блог*

Блог* pinned «Сколько вам лет?
(диапазон с включающей нижней и исключающей верхней границами)»

14:39

Блог*

Если вы не можете, потому что у вас лапки — значит, вы котик.

933 views16:13

Блог*

#prog #rust

PR, добавляющий поддержку кастомных аллокаторов для Vec 🎉. Первый шаг на пути к стандартным коллекциям с полностью настраиваемым аллокатором.

Интересным является тот факт, что тип остался тот же, но на stable указать аллокатор пока нельзя. Это стало возможным благодаря этому PR, который позволил вешать аннотации стабильности на ти́повые параметры.

GitHub

Add support for custom allocators in `Vec` by TimDiekmann · Pull Request #78461 · rust-lang/rust

This follows the roadmap of the allocator WG to add custom allocators to collections.
r? @Amanieu
This pull request requires a crater run.
Prior work:

#71873: Crater-test to solve rust-lang/wg-all...

792 viewsedited 15:41

Блог*

#prog #abnormalprogramming #retroit

710 views18:47

Блог*

Forwarded from Generative Anton

К-А-Й-Ф

Гайд по тому, как DOS записать на винил и грузиться с него.

695 views18:47

Блог*

image_2020-11-23_22-59-37.png

99.2 KB

#prog #meme #rust

@DogeShibu всё правильно говорит

2.23K views20:05

Блог*

А у кого день рождения? У @ihatereality день рождения!

С днём рождения, наше любимое умное асексуальное кондитерское изделие!

715 views07:22

Блог*

#prog

Пока гром не грянет...

674 views20:18

Блог*

Forwarded from Информация опасносте

Go SMS Pro, популярный мессенджер на Андроид, при пересылке картинок или файлов между пользователями закачивает их на свой сервер, чтобы ссылка была доступна для просмотра даже без приложения. Но нумерация этих файлов идёт по порядку, и при желании можно перебором просматривать чужие файлы, которые могут содержать конфиденциальную информацию. Попытки связаться с разработчиками не увенчались успехом, проблема остаётся неисправленной

https://www.trustwave.com/en-us/resources/blogs/spiderlabs-blog/go-sms-pro-vulnerable-to-media-file-theft/

659 views20:18

Блог*

Forwarded from You Had No Job

На свидании выяснилось, что кандидат завёл интрижку с Rust

628 views16:03

Блог*

"Тут как бы сишные нестандартизированные API, я бы назвал это pain driven developement"

#quotes #трудовыебудни

612 viewsedited 21:21

Блог*

Завтра (технически сегодня) будет пост про Rust

628 views21:22

Блог*

#prog #abnormalprogramming

"Змейка" на клавиатуре с подсветкой.

Видеодемонстрация
Статья с разбором реализации
Перевод на Хабре

YouTube

Playing Snake with hacked Coolermaster Rapid-I firmware

I hacked the firmware for my Coolermaster Rapid-I to replace one of the lighting modes with a Snake game. It already does the other modes out of the box. Article on how I did it: https://spritesmods.com/?art=rapidisnake&f=yt

713 views13:08

Блог*

#prog #rust #моё

В Rust есть такая удобная вещь, как сопоставление с образцом (pattern matching), и она работает в том числе и для строк. К сожалению, оно позволяет сопоставлять только строки целиком, но не по частям. В частности (no pun intended), match не позволяет разделить строку на некоторый фиксированный префикс и всё остальное.

Или всё же позволяет? В конце-концов, можно написать так:

match str_value.as_bytes() {
    [b'p', b'r', b'e', b'f, b'i', b'x', rest @ ..] => {}
    _ => {}
}

, и тут даже будет помогать компилятор — он подскажет нам, если мы будем дважды проверять один и тот же префикс. Но тут есть и недостатки: остаток строки (rets во второй строчке) — не &str, а &[u8], ну и, конечно, это довольно неудобно писать. Первый недостаток отчасти перекрывается str::get_unchecked/std::str::from_utf8_unchecked — отчасти, поскольку в паттерн байта можно написать и часть многобайтового символа, а вот второй недостаток обойти сложнее. В идеале мы бы хотели написать матч в виде сопоставления части строки, чтобы потом он скомпилировался в примерно такой же код, как наверху — чтобы к нему могли быть применены те же оптимизации, что и к обычному матчу, и чтобы получить выгоду от проверки полноты покрытия — но это довольно существенное вмешательство в синтаксис, требующее написания процедурного макроса, написание которого отводится читателю в качестве самостоятельного упражнения.

Если же ослабить требование максимальной эффективности генерируемого кода (серьёзно, Rust и так достаточно быстрый), то можно обойтись более слабыми macro_rules!. Как можно переписать сопоставление с префиксом на обычные функции? Один из способов — это написать match, в котором значение ни с чем не сопоставляется, а условие "начинается с заданного префикса" задаётся в охранном выражении (guard clause). Сказано — сделано:

macro_rules! prefixes {
    (match $value:ident {
        $($prefix:literal.. => $arm:expr,)*
        _ => $catch_all:expr $(,)?
    }) => {
        match $value {
            $(x if x.starts_with($prefix) => $arm,)*
            _ => $catch_all,
        }
    }
}

Ну и давайте сделаем какую-нибудь функцию, которая использует этот макрос:

fn use_prefixes(s: &str) -> String {
    prefixes!(match s {
        "foo".. => s.to_string(),
        "bar".. => [s, s].concat(),
        _ => String::new(),
    })
}

fn main() {
    let inputs = [
        "foobar",
        "barfoo",
        "overall",
    ];

    for input in &inputs[..] {
        println!("{:?}", use_prefixes(input));
    }
}

Но, погодите-ка, так потеряли одно из преимуществ компилятора: проверку полноты покрытия! Как мы можем её восстановить? Пойдём ленивым путём: сделаем свою функцию, в которой будем матчить по переданным строкам и позволим компилятору сделать работу за нас. Однако возникает вопрос, где эту функцию хранить? Простейший способ добиться этого — обернуть весь итоговый match в один блок и сделать внутри этого блока функцию. Так как функция не будет использована, она будет помечена #[allow(dead_code)], а на внутренний match повесим #[warn(unreachable_patterns)], чтобы предупреждения компилятора были даже в том случае, если они по каким-то причинам выключены на верхнем уровне:

macro_rules! prefixes {
    (match $value:ident {
        $($prefix:literal.. => $arm:expr,)*
        _ => $catch_all:expr $(,)?
    }) => {{
        #[allow(dead_code)]
        fn non_repeating() {
            #[warn(unreachable_patterns)]
            match "" {
                $($prefix => (),)*
                _ => (),
            }
        }
        match $value {
            $(x if x.starts_with($prefix) => $arm,)*
            _ => $catch_all,
        }
    }}
}

Попробуем оставить в use_prefixes одинаковые префиксы:

fn use_prefixes(s: &str) -> String {
    prefixes!(match s {
        "foo".. => s.to_string(),
        "foo".. => [s, s].concat(), // <--
        _ => String::new(),
    })
}

Что же скажет компилятор?

746 viewsedited 19:36

Блог*

warning: unreachable pattern
  --> src/main.rs:10:19
   |
10 |                   $($prefix => (),)*
   |                     ^^^^^^^
...
22 | /     prefixes!(match s {
23 | |         "foo".. => s.to_string(),
24 | |         "foo".. => [s, s].concat(),
25 | |         _ => String::new(),
26 | |     })
   | |______- in this macro invocation
   |
note: the lint level is defined here
  --> src/main.rs:8:20
   |
8  |               #[warn(unreachable_patterns)]
   |                      ^^^^^^^^^^^^^^^^^^^^
...
22 | /     prefixes!(match s {
23 | |         "foo".. => s.to_string(),
24 | |         "foo".. => [s, s].concat(),
25 | |         _ => String::new(),
26 | |     })
   | |______- in this macro invocation
   = note: this warning originates in a macro (in Nightly builds, run with -Z macro-backtrace for more info)

Окей, сообщение об ошибке могло бы быть и получше, но компилятор предупреждает нас о баге.

Можем ли мы улучшить результат? Безусловно: сейчас мы можем сматчить префикс, но не получаем остаток строки после него! Мы можем одновременно проверить, что строка начинается с указанного префикса, и получить остаток строки при помощи str::strip_prefix. Генерировать код при помощи такой функции несколько более хлопотно, поскольку при этом вместо match придётся писать связанные в цепочку if let, но задача решаема: для каждого префикса мы пытаемся отрезать префикс от строки, и, если это не выходит, пробуем следующий, а если не сработал ни один из префиксов, то исполняем ветку $catch_all:

macro_rules! cut_prefixes {
    (match $value:ident {
        $($prefix:literal ..= $rest:ident => $arm:expr,)*
        _ => $catch_all:expr $(,)?
    }) => {{
        #[allow(dead_code)]
        fn non_repeating() {
            #[warn(unreachable_patterns)]
            match "" {
                $($prefix => (),)*
                _ => (),
            }
        }
        $(if let Some($rest) = $value.strip_prefix($prefix) {
            $arm
        } else)* {
            $catch_all
        }
    }}
}

Напишем очередную малоосмысленную функцию, которая использует этот макрос:

fn use_cut_prefixes(s: &str) -> String {
    cut_prefixes!(match s {
        "foo"..=rest => rest.to_string(),
        "bar"..=tail => [tail, tail].concat(),
        _ => String::new(),
    })
}

Функция main останется той же. Программа выдаёт:

"bar"
"foofoo"
""

То есть всё как и ожидалось. Защита от повторяющихся префиксов также работает.

570 views19:36

Есть, однако ещё один аспект match, который нельзя использовать внутри наших макросов: охранные выражения на ветках! Можем ли мы интегрировать их? В случае с prefixes — безусловно: наш макрос в итоге в конечном счёте разворачивается в те же охранные выражения, в которые несложно добавить ещё одно условие. Надо лишь учесть, что эта часть синтаксиса опциональна:

macro_rules! prefixes {
    (match $value:ident {
        $($prefix:literal .. $(if $condition:expr)? => $arm:expr,)*
        //         это новое ^^^^^^^^^^^^^^^^^^^^^^
        _ => $catch_all:expr $(,)?
    }) => {{
        /* функция для отлова одинаковых префиксов */
        match $value {
            $(x if x.starts_with($prefix) $(&& $condition)? => $arm,)*
            // вставляем условие          ^^^^^^^^^^^^^^^^^
            // из if clause, если оно есть
            _ => $catch_all,
        }
    }}
}

И да, если в use_prefixes добавить ветку с if clause, то оно будет работать — с вашего позволения, я это опущу.

А вот что делать с cut_prefixes? В идеале нам бы хотелось просто взять и добавить к if let булево условие, но соответствующий RFC даже не принят, так что придётся выкручиваться. Один из возможных путей — это использовать тот же подход, что и в use_prefixes: сделать фиктивный match и поместить всё в охранные выражения. Доставать префикс тогда придётся при помощи split_at:

macro_rules! cut_prefixes {
    (match $value:ident {
        $($prefix:literal..=$rest:ident $(if $cond:expr)? => $arm:expr,)*
        //                  новая часть ^^^^^^^^^^^^^^^^^
        _ => $catch_all:expr $(,)?
    }) => {{
        /* проверочная функция, бла-бла */
        match $value {
            $(x if x.starts_with($prefix) $(&& $cond)? => {
                let (_, $rest) = x.split_at($prefix.len());
                $arm
            },)*
            _ => $catch_all,
        }
    }}
}

И оно даже работает!

В заключение мне хотелось бы рассмотреть ограничения продемонстрированных подходов:

* в силу принципа организации генерируемого кода (цепочка условий против набора веток в ванильном матче) этот код почти наверняка хуже оптимизируется компилятором
* из-за ограничений macro_rules! значение, по которому происходит разбор, не может быть выражением (expr), а лишь идентификатором
* синтаксически макросы всегда требуют запятых в конце веток match, даже не смотря на то, что они не опциональны в match в тех случаях, когда ветки обрамлены в фигурные скобки
* паттерн для отлова всех необработанных случаев может быть только _ вместо также произвольного идентификатора в

match

* в охранных выражениях в cut_prefix нельзя использовать имя, привязываемое к остатку строки
* вариант cut_prefixes, поддерживающий охранные выражения, менее эффективен — в подобном самодельном cut_prefix остаётся путь исполнения, ведущий к панике, даже на уровне оптимизации -O3. Это можно решить двумя способами:

1. str::split_at_unchecked — но это требует unsafe и потому не будет работать в кодовых базах с #![forbid(unsafe_code)];
2. Сделать функцию с атрибутом #[doc[hidden)] со str::split_at_unchecked внутри, не пометив её unsafe, и вызывать её в генерируемом коде — но это грязный хак, который нарушает гарантии safe Rust.

Как всегда, весь код в гисте.

P. S.: разумеется, ничто не мешает сделать похожие штуки для матчинга по суффиксам

GitHub

Tracking issue for eRFC 2497, "if- and while-let-chains, take 2" · Issue #53667 · rust-lang/rust

Note: This feature was stabilized in 1.88.0 but on edition 2024 only. If you are using 1.88.0+ and get an error that the feature is still unstable, please upgrade the edition. The error message is ...

573 viewsedited 19:36

About

Blog

Apps

Platform