Programming News and Articles

#ml #article

Large Language Foobar

Суммировать всю статью до одного предложения можно цитатой из неё:

Stop treating GPT-4 as if it can understand things when it absolutely and fundamentally cannot and will not.

Разумеется, сам по себе этот призыв не особо убедителен, так что настоятельно рекомендую прочитать всю статью и ознакомиться с конкретными примерами, когда ChatGPT просто не может.

(алсо про частный случай того, что ChatGPT не могёт, я уже выкладывал статью)

overengineer.dev

Large Language Foobar - Dennis Schubert

Random thoughts, articles and projects by a chronic overengineer.

22 views05:04

Programming News and Articles

Forwarded from Experimental chill

1. Сначала ты пишешь о BurntSushi, а потом BurntSushi пишет тебе https://github.com/BurntSushi/memchr/pull/114. Статье указанной в PR почти год, а всё ещё раз в несколько месяцев меня кто-нибудь тегает.

2. Может, кто-то знает литературу по кешам, где eviction policies как-нибудь учатся по тому насколько тяжело будет бекенду отвечать на запрос промаха? Ситуация такая: иметь 90% попаданий лучше, чем 85% попаданий, но если 10% промахов нагибают бекенд в два раза больше, то кажется можно выбрать второй. Хотелось бы узнать, умеет ли что-то наука тут или есть ли какие-нибудь датасеты по тому как ведут себя кеши и их бекенды.

3. Поизучал я тут Iguana compression. Заявленные цифры действительно хорошо выглядят на реальных тестах. Сок Iguana заключается в том, что они очень много используют предпосчитанных масок вместе с инструкцией VPTERNLOGD. Эта инструкция расшифровывается как vector packed ternary logic. Фактически умеет делать тернарные операторы по битам 512 битных регистров -- по маске брать биты из одного или другого регистра, чего не было так быстро до AVX-2. Также ещё используются VPCOMPRESSD и тем самым хорошо умеет упаковывать биты как PEXT для скаляров. По формату им надо переводить base254 в base256 и обратно, что тоже делается табличками. В целом ощущение, что AVX-512 сейчас очень сильно растёт. Скажем, avx-512-sort и avx-512-partial-sort достаточно хорошо обгоняют мою библиотеку https://github.com/danlark1/miniselect -- хотя моя дала много буста тому же кликхаусу. Но пока всё для чисел, для более сложных компараторов не так всё просто.

Скептически долгое время относился к AVX-512, но кажется начинаем понимать как использовать для реальных задач. Интересные прорывы есть.

GitHub

Add initial aarch64 neon support by redzic · Pull Request #114 · BurntSushi/memchr

This PR adds a NEON implementation of all mem{r}chr functions. This PR does not add NEON support for memmem, as deeper changes in the code are needed for the Vector trait for it to work efficiently...

23 views20:43

Programming News and Articles

https://www.avestura.dev/blog/explaining-the-postgres-meme

Avestura's Blog

Explaining The Postgres Meme

Have you seen this legendary SQL iceberg meme? Let's talk about it while wearing our PostgreSQL hat!

27 views11:56

Programming News and Articles

https://twitter.com/samcallah/status/1712128988611563803