Big Data AI
16.9K subscribers
875 photos
102 videos
19 files
875 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
🛠️ Приложение CADAM: текст в 3D-модели

CADAM — это веб-приложение с открытым исходным кодом, которое преобразует текст и изображения в 3D-модели. Использует AI для генерации, поддерживает экспорт в различные форматы и работает в браузере благодаря WebAssembly.

🚀 Основные моменты:
- AI-генерация 3D-моделей из текстовых описаний
- Интерактивные параметры для мгновенной настройки
- Экспорт в форматы .STL и .SCAD
- Полностью браузерное приложение
- Поддержка библиотек BOSL и MCAD

📌 GitHub: https://github.com/Adam-CAD/CADAM
👍3🔥1
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
🤖 XLeRobot — домашний робот за $660, который управляется с геймпада Xbox.

XLeRobot — это открытый проект, который позволяет собрать настоящего двухрукого мобильного робота своими руками.

Автор — студент Rice University Gaotian Wang, в проектеон сделал упор на доступность и практичность.

💡 Основное:
- Цена сборки ≈ $660 — полноценный робот с двумя руками и колесной базой.
- Можно собрать упрощённую версия за $250 на базе LeKiwi + SO-100, которая собирается быстрее.
- В комплекте: URDF-модели, симуляция, управление через VR, Joy-Con или Xbox-геймпад.
- Подходит для экспериментов в симуляции и переноса в реальный мир (**Sim2Real**).
взаимодействия с окружающей средой.

📈 Популярность: проект уже собрал 1.7k+ звёзд и десятки форков на GitHub.

XLeRobot — это недорогая и открытая платформа для тех, кто хочет попробовать себя в робототехнике, исследовать управление, симуляцию и AI-алгоритмы на реальном роботе.

🟢Репозиторий: github.com/Vector-Wangel/XLeRobot

@ai_machinelearning_big_data


#robotics #opensource #AI
Please open Telegram to view this post
VIEW IN TELEGRAM
5🤣2
Тонны промтов, гайдов и курсов в одном месте — запустилась первая соцсеть для экспериментов с ИИ.

То, что начиналось как простой обмен промтами, всего за пару месяцев превратилось в активное комьюнити.
Здесь есть удобный поиск, фильтры по темам, моделям и задачам, а лучшие находки сами выходят в топ благодаря участникам.

Не трать время на изобретение с нуля — скорее всего, кто-то уже придумал промт за тебя 😋

Присоединяйтесь — это именно то место, где стоит быть.

https://altsociety.ai/
3👍1
🤖 Легковесный AI-агент на C для командной строки

Agent-C — это ультралегкий AI-агент, который взаимодействует с OpenRouter API и выполняет команды оболочки. Он оптимизирован для работы на macOS и Linux, обеспечивая минимальный размер бинарников и эффективное управление памятью.

🚀Основные моменты:
- Выполнение команд оболочки через AI-ответы
- Минимальный размер: 4.4KB для macOS, ~16KB для Linux
- Эффективное управление памятью с помощью скользящего окна
- Кроссплатформенная поддержка

📌 GitHub: https://github.com/bravenewxyz/agent-c

#c
3👍2
AI нельзя напрямую сравнивать с привычными историческими технологиями — оно развивается и впервые становится качественно иной технологией, способной превосходить человека во всех областях.

По данным Revelio Labs, с января 2023 года число вакансий для начинающих специалистов в США сократилось примерно на 35%, и в этом значительную роль сыграл AI.

Особенно сильно снижение ощущают молодые люди 16–24 лет: рынок труда в США переживает самый сложный период со времён пандемии.

Однако главный вопрос — не текущие проблемы занятости, а прогнозы о том, что AI может вытеснить значительную часть стартовых должностей в будущем.

#AI #JobMarket #FutureOfWork #Automation
4👍2🔥2🤡1
Forwarded from Golang
👣 Google объявил релиз **Genkit Go 1.0** — стабильную, готовую к продакшену версию open-source фреймворка для разработки AI-приложений на Go.
Также представлена новая команда genkit init:ai-tools для лёгкой интеграции с AI-ассистентами в процессе разработки.

🔑 Что нового в Genkit Go 1.0

1. Production-ready
API признан стабильным: все программы, написанные на Genkit 1.*, будут работать и собираться в будущих минорных версиях.

2. Type-safe AI-flows
- Определение “flows” через Go-структуры и JSON Schema.
- Повышенная типобезопасность, тестируемость, наблюдаемость и удобство при деплое.

3. Унифицированный интерфейс моделей
Поддержка разных провайдеров (Google AI, Vertex AI, OpenAI, Ollama и др.) через единый API — легко переключаться между ними.

4. Tool calling, RAG и мультимодальность
- Вызов внешних инструментов (tool calling).
- Retrieval-augmented generation (RAG).
- Поддержка мультимодальных сценариев (текст, изображения и др.).

5. Инструменты для разработчиков
- Независимая CLI-утилита для локальной разработки.
- Developer UI: тестирование промтов, отладка flows, отслеживание производительности и трассировка.

6. Команда `genkit init:ai-tools`
Автоматическая интеграция с AI-ассистентами разработки: Gemini CLI, Firebase Studio, Claude Code, Cursor и др.

7. Примеры кода
В официальной документации показано, как определять flows, запускать HTTP endpoints, работать с моделями и инструментами.

🚀 Почему это важно
- Быстрая и безопасная разработка AI-приложений на Go.
- Унифицированный API позволяет экспериментировать и менять провайдеров без переписывания логики.
- Встроенные dev-инструменты ускоряют отладку и интеграцию.
- Подходит как для прототипов, так и для production-решений.

📌 Официальный анонс: https://developers.googleblog.com/en/announcing-genkit-go-10-and-enhanced-ai-assisted-development/?linkId=16710004Нужно

@Golang_google


#Genkit #GoLang #GoogleAI #AIDevelopment #OpenSource #RAG
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍2🔥2
🧩 Высокопроизводительный инструмент для дедупликации текста

Этот репозиторий предлагает оптимизированное решение для удаления дубликатов в больших текстовых наборах. Он сочетает в себе точную дедупликацию с помощью Content-Defined Chunking и обнаружение почти идентичных документов с использованием SimHash и Faiss. Сердце проекта написано на C++ и использует параллельные вычисления для максимальной производительности.

🚀 Основные моменты:
- Многоступенчатая дедупликация: точная и почти идентичная.
- Высокопроизводительный C++ код с параллельной обработкой.
- Интеграция с Python через чистый API.
- Эффективен для очистки данных перед обучением моделей.

📌 GitHub: https://github.com/conanhujinming/text_dedup

#cpp
4🔥3🥰1
Создавая будущее: магистратура по прикладному ИИ

Нейросети пишут код, создают контент и даже помогают в разработке лекарств. Спрос на ИИ-специалистов взлетел на 80% всего за год. А IT-гиганты, банки и телеком охотятся за талантами. 

Станьте таким специалистом с онлайн-магистратурой «Прикладной искусственный интеллект» от УрФУ и Нетологии. Это программа, где вы не просто учитесь, а решаете реальные задачи от Яндекса, МТС Банка и Dodo Brands. Где вместо скучных лекций — проекты и хакатоны, а преподаватели — практики из ведущих компаний.

За 2 года вы научитесь:

Использовать Python и его библиотеки.
Генерировать гипотезы и подбирать алгоритмы для разных моделей.
Строить конвейеры обработки данных.
Автоматизировать ML-пайплайн.

А ещё узнаете, как ИИ применяют в медицине, e-commerce и банковском секторе. Потому что будущее AI — не только в IT.
Эта программа — одна из немногих, куда можно поступить в сентябре. Если после летнего отдыха вы полны сил и готовы к новому, сделайте уверенный шаг в ИИ-сферу.

Подать документы можно до 18 сентября. 
Узнайте подробности по ссылке: https://netolo.gy/emS1

Реклама. ООО "Нетология". ИНН 7726464125. Erid:2VSb5xqAdd3
🤖 Прорыв в разработке наноботов

Учёные из Penn State сделали важный шаг к созданию настоящих наноботов.

🔬 С помощью нового микро-флюидного устройства они создали крошечные частицы, которые могут обмениваться сигналами и действовать вместе - как муравьи, оставляющие следы для других.
- Одна группа частиц двигалась по химическому градиенту и оставляла «след».
- Другая группа улавливала этот след и шла за ним.

👉 Это выглядит просто, но именно так закладывается основа программируемых роёв наноботов.

💡 Возможные применения:
- наночастицы находят опухоль и зовут другие с лекарством,
- мини-системы доставляют груз в нужную клетку,
- наноботы очищают организм от токсинов или восстанавливают повреждённые ткани.

Раньше учёные могли наблюдать за таким процессом всего несколько секунд. Теперь, с новым инструментом Penn State, поведение можно изучать минутами, что позволяет проводить более сложные эксперименты.

🌱 Вдохновение пришло из природы - у пчёл и муравьёв есть распределение ролей и совместная работа. Если частицы смогут делать то же самое, это приблизит нас к самоорганизующимся автономным наносистемам, которые могут изменить медицину и материалы.

Это пока ранняя стадия, но именно такие шаги строят фундамент для будущих роёв наноботов.

https://www.psu.edu/news/eberly-college-science/story/can-nanobots-play-follow-leader
7👏2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 obsidian-smart-composer — это ИИ-помощник чата для Obsidian с контекстной осведомленностью, интеллектуальной помощью при написании и редактированием одним кликом! Он включает в себя разговоры с поддержкой хранилища, семантический поиск и поддержку локальной модели.

🔐 Лицензия: MIT

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩32👍2
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI выпустила Codex-CLI 0.36 с новым GPT-5-Codex

Теперь система динамически выбирает время «размышлений»: на простые запросы отвечает почти мгновенно, а на сложных проектах может работать часами — вплоть до 7 часов подряд, выполняя рефакторинг, исправляя ошибки и доводя решение до финала.

Одним из главных нововведений стала функция codex resume, позволяющая возобновлять старые сессии. Также обновили интерфейс: появилось анимированное онбординг-руководство, улучшены отображение статусов и обработка прерываний. Важным изменением стала и новая система авторизации с более надёжной работой API-ключей и кастомных провайдеров.

По производительности GPT-5-Codex показывает заметный скачок. На бенчмарке SWE-bench модель набирает 74,5%, обгоняя GPT-5 high. На внутренних тестах по рефакторингу результат вырос с 34% до 51%, что говорит о серьёзном улучшении качества работы с большими кодовыми базами.
OpenAi

✔️ Релиз TimesFM 2.5 от Google

Google Research представила TimesFM 2.5 — обновлённую версию Time Series Foundation Model для прогнозирования временных рядов.

В версии 2.5 разработчики улучшили точность по сравнению с 2.0 и значительно расширили максимальную длину контекста, что позволяет обрабатывать более сложные и длинные временные зависимости.

Особое достижение — первое место в рейтинге GiFT-Eval: TimesFM 2.5 заняла лидирующую позицию сразу по всем метрикам среди zero-shot foundation-моделей, подтвердив статус одной из самых точных систем для анализа временных рядов.
Github

✔️ OpenAI и Anthropic: инструменты используются по-разному и приносят разные результаты

Согласно новому анализу от TipRanks, компании OpenAI и Anthropic показали, что их ИИ-инструменты применяются в существенно разных контекстах — и дают разные эффекты.
OpenAI в основном используется для создания контента, разработки кода и поддержки творческих задач, где гибкость и масштабируемость — ключевые аргументы. Его модели помогают пользователям генерировать текст, автоматизировать рабочие процессы и решать задачи, требующие воображения и нестандартного подхода.

Anthropic, напротив, чаще применяют в областях, где особенно важны точность, контроль бессознательных смещений и высокая надёжность — например, в юридических, медицинских или регулируемых средах. В таких сценариях делают упор на безопасность, на минимизацию ошибок и на возможность аудита и объяснений того, как пришёл к решению ИИ.

Отчёт подчёркивает: разные компании и пользователи выбирают OpenAI или Anthropic не просто на основе производительности, но и в зависимости от ценностей — что важнее: скорость и творческий потенциал или строгие гарантии и прозрачность.

Эксперты TipRanks полагают, что оба подхода — сильны в своих нишах. Поскольку спрос на ИИ-решения растёт, смешанные и гибридные модели применений, вероятно, станут всё более популярными: когда часть задач решается с помощью гибкого и креативного ИИ, а часть — с помощью инструментов повышенной эмпатии и осторожности.
Отчет

✔️ Reve выпустили свой нейрофотошоп

Reve представили AI-редактор изображений, который уже окрестили «текстовым фотошопом». В отличие от конкурентов, здесь почти нет цензуры, а ограничения на генерацию трудно заметить.

Функция Image creator & remixer позволяет создавать и перерабатывать изображения на основе текстовых подсказок. Интерактивный drag-and-drop редактор даёт возможность перемещать, масштабировать и изменять объекты прямо мышкой — так, как в привычных графических редакторах. Вместо стандартного поля для ввода появился чат-ассистент, превращающий взаимодействие в диалог, что облегчает настройку и доработку картинок.
Reve

✔️ Alphabet впервые достигла рыночной капитализации в $3 трлн

Компании Alphabet, материнской структуры Google, впервые удалось преодолеть отметку в $3 трлн стоимости на бирже. Акции выросли на 4 % на фоне судебного решения по антимонопольному делу, по которому не потребовалось разделение бизнеса (Chrome и Android). Сильный рост показали облачная служба и заинтересованность инвесторов в AI-продуктах, особенно модели Gemini.
Новость

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2🥰2
🦀 Rust LLM from Scratch

RustGPT — это реализация языковой модели на основе трансформеров, созданная с нуля на Rust без внешних ML-фреймворков. Проект включает предобучение на фактическом тексте, настройку для диалогового ИИ и интерактивный режим тестирования.

🚀 Основные моменты:
- Полное предобучение и настройка модели
- Модульная архитектура с четким разделением задач
- Использование ndarray для операций с матрицами
- Поддержка градиентного спуска и обрезки градиентов
- Интерактивный режим для тестирования модели

📌 GitHub: https://github.com/tekaratzas/RustGPT

#rust
👍43🔥2
🚀 Новый датасет для исследований в области речи и NLP!

OleSpeech-IV-2025-EN-AR-100 (100 часов)

🎤 Реальные, непоставленные диалоги на английском
🗂️ Человеческие транскрипты с разметкой спикеров
🔎 Отметки времени и пересечения реплик
📂 Сырые, несжатые аудиофайлы

Идеален для задач ASR, диалоговых систем и анализа речи.

https://huggingface.co/datasets/olewave/OleSpeech-IV-2025-EN-AR-100
👍21🔥1
Маршрут построен: в пятницу – на VK JT Meetup!

Это неформальная встреча для ML-инженеров и Java-разработчиков от VK.

О чём расскажут:
• Какие вызовы возникают перед бэкендером в процессе создания B2B-продукта
• Как строят единую инфраструктуру поисковой платформы

А также поделятся пошаговым гайдом по выпуску RAG в прод

Дальше гостей ждут два потока: нетворкинг-зона и групповое решение кейсов по ML и Java.

Мероприятие пройдёт только офлайн — редкий шанс пообщаться с коллегами, задать вопросы экспертам и выиграть призы от VK. Регистрируйтесь!

📍 Нижний Новгород, только офлайн
📅 3 октября, сбор с 18:00
🎟 Вход по регистрации
🧩 Multi-View 3D Point Tracking

MVTracker — это инновационный инструмент для отслеживания 3D-точек с использованием данных с нескольких камер. Он объединяет многоview-функции в единую 3D-точечную облачную модель, применяя корреляцию на основе kNN для учета пространственно-временных взаимосвязей. Модель адаптируется к различным условиям съемки и эффективно справляется с затенениями.

🚀Основные моменты:
- Первое решение для отслеживания 3D-точек с нескольких ракурсов.
- Использует трансформеры для итеративного улучшения треков.
- Поддерживает работу с различными настройками камер без оптимизации для каждой последовательности.
- Доступен через PyTorch Hub для быстрого начала работы.

📌 GitHub: https://github.com/ethz-vlg/mvtracker

#python
1👍1🔥1
🛠️ Интересное исследование от IBM Research

Учёные предложили способ сделать использование инструментов LLM точнее с помощью специального «судьи» для вызовов функций.

Что не так сейчас
Обычные модели-судьи оценивают только текст, а не сами вызовы. Поэтому они не замечают ошибки:
- неправильное имя инструмента,
- неверные или пропущенные параметры,
- лишние вызовы.

⚡️ Что сделали
- Создали датасет из 1,500 запросов, где для каждого есть один правильный и один ошибочный вызов.
- Обучили ToolRM — reward-модель, которая смотрит на список инструментов, диалог и вызов, и выдаёт оценку качества.
- ToolRM превзошёл обычные reward-модели и даже крупные LLM-судьи, оставаясь при этом эффективным.

🧩 Как это работает
- Генератор делает несколько кандидатов-вызовов.
- ToolRM оценивает их и выбирает лучший.
- Этот подход помогает и маленьким, и большим моделям делать точные вызовы.

📊 Бонус: ToolRM может фильтровать тренировочные данные, оставляя качественные примеры. Благодаря этому даже модели, обученные на меньших выборках, показывают уровень, сопоставимый с полными данными.

🔗 Подробнее: arxiv.org/abs/2509.11963v1
3🔥3👍1
⚡️ Предотвращаем потерю данных с ACID-транзакциями в DuckDB!

Без транзакций:
- Списание у Alice прошло
- Пополнение у Bob сломалось
➡️ Итог: деньги «пропали».

С транзакцией (ACID):
- Оба обновления либо проходят вместе, либо откатываются
- Баланс остаётся консистентным
- Никаких «висящих» операций

Пример:

conn.execute("BEGIN TRANSACTION")
try:
conn.execute("UPDATE accounts SET balance = balance - 200 WHERE name = 'Alice'")
conn.execute("UPDATE accounts SET balance = balance + 200 WHERE name = 'Bob'")
conn.execute("COMMIT")
except:
conn.execute("ROLLBACK")


🔹 Atomicity — либо всё, либо ничего
🔹 Consistency — база не ломается
🔹 Isolation — параллельные операции не мешают
🔹 Durability — данные не теряются

🛡 ACID гарантирует надёжность даже при сбоях.
👍21
Канал о серверной и облачной инфраструктуре для ИИ.

Подписывайся на Telegram-канал HOSTKEY — здесь вы найдете:

🔹тесты производительности и бенчмарки GPU-карт и серверного «железа»
🔹новости рынка и технологий
🔹лайфхаки и инструкции по интеграции ИИ в проекты
🔹практические советы для разработчиков и бизнеса

🔥 Последние популярные публикации канала:

🔹 Сравнение NVIDIA RTX 6000 Blackwell 96 ГБ с RTX 5090, A5000 и H100 в задачах LLM и генерации видео — результаты удивляют!
🔹Тестирование NVIDIA GeForce RTX 5090 в задачах ИИ.
🔹10 советов по Open WebUI, которые помогут в работе с нейросетями.
🔹Как добавить генерацию изображений через ComfyUI в Open WebUI.

🎁 А еще мы каждый месяц разыгрываем Telegram Premium среди подписчиков!

Если вы работаете с ИИ и нейросетями — вам точно будет интересно и полезно! 
Подписывайтесь! 

#реклама
О рекламодателе
1