IT Insights
660 subscribers
769 photos
4 videos
3 files
1.07K links
Новости разработки, технологий, немножко науки и техники
Download Telegram
Forwarded from Generative Anton (Anton Repushko)
Длинный текст про то, как я сходил с ума от отчаяния в последние 8 месяцев и начал учить древнегреческий.

Выше уже мелькали посты про непонятные белые буковки и шутки про ленивых древнегреческих писцов. Настало время собрать всё в цельную картинку и объясниться. Я не могу из-за правил публиковать и в деталях рассказать техническое решение (оно в процессе ревью), но порассказываю всякое другое.

Соревнование называется Vesuvius Challenge. Когда извергался Везувий и уничтожил Помпеи, он уничтожил еще и город Геркуланум, который находился тоже у его подножия. Нас интересует Геркуланум из-за того, что там откопали виллу, в которой была очень богатая библиотека. И в этой библиотеки уже нашли/ожидают найти около 4-5 тысяч свитков. Важное уточнение: до нас из Античности дошло очень небольшое количество текстов: Одиссея, Иллиада, вся философия — лишь небольшой процент от всех существовавших тогда текстов. Представьте, сколько знания и истории хранится в этих тысячах свитков. Но разумеется есть проблема: они выглядят как сгоревшая на углях картошка из-за консервации в лаве и пепле (но именно благодаря этому они и пролежали в земле 2000 лет).

На сцену выходит профессор из Кентуки Dr. Brent Seales, который всю карьеру потратил на пропихивание следующего метода: давайте мы сделаем этим свиткам МРТ, а потом как-то хитро попытаемся восстановить все и прочитать. План — надежный, как швейцарские часы, если бы не одно но: чернила, которые там были, не содержат металла (carbon-based) и на результатах МРТ не видны. Были еще попытки отсканировать один и тот же свиток с разной фазой пучка и вычтя результаты этого получить какие-то буковки. Буковок хватило на статью в Nature, но выглядит это довольно паршиво. Что же с этим делать дальше?

На сцену выходит ex-CEO Github’a Nat Freedman: меценат, организует всякие AI гранты и инвестриует в AI-стартапы. Очень приятный дядечка, который помог организовать это соревнование и завалил деньгами призовой фонд. Вот его частный фонд и вообще он мне пока кажется Илоном Маском здорового человека.

В феврале прошлого года стартует само соревнование с призовым фондом в 1M USD. Сначала на Kaggle, а потом это все продолжается в Дискорде. Есть МРТ-сканы свитков и нужно прочитать оттуда текст. Сам (предложенный организаторами) процесс виртуального разворачивания текста довольно сложный и хитрый, а данных сейчас уже примерно на 7-8Tb, что устанавливает довольно высокий технический барьер для входа.

После Kaggle’овского соревнования все немного затихло до момента, пока в августе два студента (один из штатов, второй из Берлина) независимо друг от друга глазками(!) нашли какие-то непонятные рельефы, которые подтвердили изначальную идею: не смотря на то, что чернилы не видны, бумага осталась деформированной в местах написанных букв. В итоге задачей стало пытаться программно научиться определять вот эти деформированные места (иногда глазу и незаметные) и читать буковки. Где-то в этот момент (начало августа) я и ушел в соревнование с головой.

Очень много бессонных ночей, переживаний и всего остального было на протяжении этих месяцев. Я приходил и надоедал к каждому, кто мог мне хоть как-то помочь советом/идеей (спасибо вам всем, друзья. Без вас я бы не справился). Когда обсуждал новости и произошедшее за день с девушкой, я десятки раз думал про то, что у меня не произошло вообще ничего: я решал свитки. Как и вчера. Как и продолжу завтра.

И не смотря на то, что я не смог выполнить официальные требования для главного приза (4 куска текста по 140 читаемых символов каждый), мне кажется, что никто не смог. Со слов организаторов, всего они получили около дюжины сабмишнов. И вот уже где-то месяц мы с другими участниками ждем результатов анализа папирологов. За эти полгода я познакомился с кучей интересных людей, выиграл промежуточный приз в 5200 USD, начал учить древнегреческий и сильно прокачался в решении таких вот непонятных проблем.
👍4
Сам написал, сам поиграл: как работали трёхмерные игры на кнопочных телефонах нулевых? Пишем 3D-шутер с нуля

Сегодня мы узнаем как разрабатывали игры под J2ME, какие графические API существовали и на каких телефонах поддерживались, почему игры на Sony Ericsson шли лучше, чем на Nokia, а на «закуску» сами с нуля напишем 3D-бродилку в практической части!

Статья: https://habr.com/ru/companies/timeweb/articles/787548/
😱2
Как через Push-уведомления на iPhone утекают данные пользователей

Исследователь безопасности Томми Мыск продемонстрировал, как push-уведомления на iPhone могут использоваться популярными приложениями для скрытой отправки данных о пользователе.

Новость и видео: https://apptractor.ru/info/news/kak-cherez-push-uvedomleniya-na-iphone-utekayut-dannye-polzovateley.html
Новая ИИ-модель Morpheus-1 может вызывать люцидные сновидения

Компания Prophetic, специализирующаяся на нейротехнологиях, разработала новую модель искусственного интеллекта под названием Morpheus-1, которая, как она утверждает, может помочь людям войти в состояние люцидного сна. Модель воспринимает текущее состояние мозга как подсказку и генерирует ультразвуковые голограммы, которые могут быть отправлены в мозг для начала состояния люцидного сна и поддержания его стабильности. Люцидное сновидение - это состояние, в котором сновидец осознает, что спит, и может управлять сном. Весной компания Prophetic планирует выпустить в бета-версии устройство под названием The Halo. Устройство посылает звуковые волны в мозг, чтобы соединиться с текущим состоянием мозга и перевести сознание в люцидное состояние.

Новость: https://www.tomsguide.com/ai/would-you-let-ai-into-your-mind-a-new-model-called-morpheus-1-claims-to-induce-lucid-dreaming
Курс по большим языковым моделям

Курс по изучению моделей с дорожными картами, списками материалов и блокнотами Colab.

GitHub: https://github.com/mlabonne/llm-course
👍1
10 нестандартных уроков, полученных за 10 лет работы инженером-программистом

Десять лет назад я переехал в Манчестер, чтобы начать свою карьеру инженера-программиста. Чтобы отметить это событие и поразмышлять о пройденном пути, я сел за чашку хорошего кофе и собрал свои мысли о том, какие, на мой взгляд, самые важные уроки я получил на этом пути.

В результате получился список из десяти уроков, которые помогли мне больше всего.

1. Выбирайте обучение, а не деньги
2. Инвестируйте в принципы и практики
3. Станьте инженером, с которым все хотят работать
4. Разнообразьте свою жизнь
5. Относитесь к отзывам как к золоту
6. Сначала широкий уровень
7. Лидерство без титула
8. Думайте о сферах влияния
9. Наточите инструменты
10. Показывайте свою работу

Статья: https://apptractor.ru/info/articles/10-nestandartnyh-urokov-poluchennyh-za-10-let-raboty-inzhenerom-programmistom.html
Boardzilla - веб фреймворк для создания настольных игр

Boardzilla - это место для разработки настольных игр для вашего браузера. Boardzilla позволяет легко выразить правила игры и предоставляет игрокам простой интерфейс для выбора.

Сайт: https://www.boardzilla.io/
Как добиться успеха, если вы не очень умны и не обладаете талантом

Эта статья предназначена для людей, которые хотят выполнять важную работу или вносить значимый вклад в работу, но считают, что они не настолько умны и не обладают талантом.

Статья: https://adaobi.substack.com/p/how-to-do-things-if-youre-not-that

Поставьте 👍, если вы не настолько умны и не обладаете талантом, чтобы прочитать это на английском ☺️
👍6
Как использовать персонажей в интерфейсах, и почему сова из Duolingo пугает пользователей

Если маскот удачно ложится в концепцию бренда, в одном случае его будет достаточно упомянуть в визуале сайта, а в другом — разгуляться и сделать целую игру с ним в главной роли. Подключайте аналитиков и маркетологов, которые помогут проанализировать аудиторию и понять, готова ли она принять персонажа и как его появление скажется на интерфейсе.

Статья: https://dsgners.ru/ui/3886-kak-ispolzovat-personajey-v-interfeysah-i-pochemu-sova-iz-duolingo-pugaet-polzovateley
Утечки памяти, которые не утечки

Статью я захотел написать после работы над одним конкретным багом, который со всех точек зрения напоминал классическую утечку памяти, но на практике оказался чем то совершенно другим. Я нигде не встречал описание такого поведения и поэтому решил этой информацией поделиться.

Статья: https://habr.com/ru/companies/alfa/articles/789782/
👍2
MobileDiffusion: быстрая text-to-image генерация на устройстве

Модели диффузии текста в изображение продемонстрировали исключительные возможности в генерации высококачественных изображений по текстовым подсказкам. Однако ведущие модели имеют миллиарды параметров и, соответственно, дороги в исполнении, требуя мощных настольных компьютеров или серверов (например, Stable Diffusion, DALL-E и Imagen). Несмотря на то, что за последний год были достигнуты значительные успехи в разработке решений для вывода данных на Android с помощью MediaPipe и iOS с помощью Core ML, быстрая (субсекундная) генерация текста в изображение на мобильных устройствах оставалась недоступной.

Google в статье "MobileDiffusion: Субсекундная генерация текста в изображение на мобильных устройствах" представил новый подход, который может обеспечить быструю генерацию текста в изображение на устройстве. MobileDiffusion - это эффективная модель скрытой диффузии, специально разработанная для мобильных устройств. Авторы также используют DiffusionGAN для достижения одношаговой выборки при выводе, которая точно настраивает предварительно обученную модель диффузии, одновременно используя GAN для моделирования шага денонсации. В тестах MobileDiffusion на устройствах премиум-класса под управлением iOS и Android способна за полсекунды сгенерировать высококачественное изображение размером 512x512. Сравнительно небольшой размер модели - всего 520 М параметров - делает ее уникальной для мобильного применения.

Описание: https://blog.research.google/2024/01/mobilediffusion-rapid-text-to-image.html
👍1
Насколько сложно обмануть с ChatGPT на технических собеседованиях? Мы провели эксперимент

Если отбросить этику, то обман - это сложная, напряженная и не совсем простая задача. Вместо этого мы советуем вкладывать усилия в практику, которая сослужит вам хорошую службу, когда компании изменят свои процессы, что, надеемся, произойдет в ближайшее время. В конечном итоге, мы надеемся, что появление ChatGPT станет катализатором, который наконец-то сдвинет стандарты собеседований в нашей индустрии от зубрежки и заучивания к реальной проверке инженерных способностей.

Исследование: https://interviewing.io/blog/how-hard-is-it-to-cheat-with-chatgpt-in-technical-interviews
👍2
10 правил Питера Янга по созданию продуктов, которые нравятся покупателям

В этой статье подчеркивается важность постоянного совершенствования смысла продукта, использования эмпатии при диагностике проблем и баланса между концентрацией на больших идеях и ежедневным исполнением. В ней содержатся практические советы для руководителей по личностному росту, влиянию на команду и разработке продуктов, ориентированных на клиента.

Статья: https://www.figma.com/blog/peter-yangs-10-rules-for-making-products-that-customers-love/
1
Подход Митчелла Хашимото к созданию крупных технических проектов

Митчелл Хашимото - сооснователь компании HashiCorp (IaaC-компания и создатель Terraform). В прошлом году он опубликовал пост в своем блоге, в котором рассказал о своем подходе к созданию крупных технических проектов. Его советы включают разбивку задач на управляемые подпроекты, приоритет ранних результатов через тестируемые компоненты и стремление к частым функциональным демонстрациям.

Статья: https://mitchellh.com/writing/building-large-technical-projects
Обнаружение речи и музыки в аудиоконтенте

Чтобы улучшить магию кино и улучшить звуковые впечатления, нужен способ систематического изучения взаимодействия всех аудиокомпонентов, которые обычно делятся на диалоги, музыку и эффекты. В этой статье разработчики рассказывают об обнаружении речи и музыки как о технологии, позволяющей решать различные задачи в кино и телевидении, а также представляют систему обнаружения речевой и музыкальной активности (SMAD).

Статья: https://netflixtechblog.com/detecting-speech-and-music-in-audio-content-afd64e6a5bf8
Написание кода никогда не было самой сложной частью

Конечно, все это немного несправедливо: ChatGPT - это генеративная модель искусственного интеллекта, и она не была разработана для инженеров-программистов. Но в том-то и дело, что как бы ни было впечатляюще видеть, как ИИ генерирует код, я еще не видел ни одного ИИ, который мог бы делать все остальные вещи - действительно трудные части в работе инженера-программиста.

Статья: https://apptractor.ru/info/articles/napisanie-koda-nikogda.html
👏1
Эксперимент: насколько сложно обмануть на технических собеседованиях с помощью ChatGPT?

ChatGPT произвел революцию в работе, какой мы ее знаем. Его полезность трудно переоценить: от помощи малому бизнесу в автоматизации административных задач до создания целых React-компонентов для веб-разработчиков.

На сайте Interviewing.io мы много думали о том, как ChatGPT изменит проведение технических собеседований. Один из главных вопросов — позволит ли ChatGPT легко обманывать на собеседованиях? Чтобы ответить на этот вопрос, мы привлекли нескольких наших профессиональных интервьюеров и пользователей к участию в эксперименте с ИИ-обманом! В этой статье мы расскажем обо всем, что мы обнаружили, и объясним, что это значит для вас. В качестве небольшого предисловия просто знайте: компаниям необходимо немедленно изменить типы вопросов, которые они задают на собеседовании.

Статья: https://apptractor.ru/info/articles/eksperiment-naskolko-slozhno-obmanut-na-tehnicheskih-sobesedovaniyah-s-pomoschyu-chatgpt.html
Где-то по пути мы забыли о мастерстве программиста

"Поставляйте!"
"Мы теперь agile, детка. Двигайтесь быстро и ломайте вещи!"
"Мы оцениваем наших инженеров по тому, какое влияние они оказывают!"

Где-то по пути, в разгар agilification программного обеспечения или золотой лихорадки зарплат инженеров-программистов, мы забыли о мастерстве.

Я работал в крупных технологических компаниях, стартапах, консалтинговых фирмах и даже в правительстве. Все это разные среды с одним ключевым сходством: качество кода низкое, особенно в последнее время.

Не поймите меня неправильно, есть участки с хорошим качеством кода. Отдельные примеры настоящей заботы и мастерства. Но, по большому счету, то, что я вижу сейчас, - это люди, пытающиеся как можно быстрее выпустить продукт, не обращая внимания на бремя сопровождения через 1, 2, 5, 10 лет.

Так что же происходит? Я не знаю точно, но вот мои основные теории.

Статья: https://www.pcloadletter.dev/blog/craftsmanship/

Поставьте 👍, если хотите знать!
👍5
Как я поменял профессию: из тканевой инженерии в adult-индустрию

И вот тут меня внезапно позвали на собеседование в крупный телеком… Короче, очнулся я уже будучи DevOps в компании, которая занимается сложными проектами, некоторые из которых про adult‑видео. Ну вот те самые специальные обучающие фильмы для взрослых, которые двигатель прогресса. С петабайтами отданного трафика, набегами миллионов пользователей и прочими радостями.

Статья: https://habr.com/ru/companies/wiseops/articles/791774/