Progres Post
Битва за 3% эффективности вместо монетизации По данным MIT, до 70% компаний используют большие данные преимущественно для снижения себестоимости продуктов. Эту экономию и называют монетизацией. Мы считаем это лукавством. Вы ведь монетизируете то, что монетизировали…
Кто на что учился
За 3 года Авито вложит в текстовые и мультимодальные нейросети ₽12 млрд и планирует заработать на этом ₽21 млрд.
Об этом говорят все.
Мало кто говорит, что ивестируя в ИИ, Авито параллельно инвестирует в образование студентов, которые будут с этим ИИ работать:
- В 2024 году Авито уже запустил магистратуру по Data Science в МФТИ.
- В 2025 году Авито запустит еще три программы: по разработке, Data Science и продуктовому менеджменту в ИТМО и ВШЭ.
- В 2025 году Авито полностью оплатит обучение 118 из 140 студентов на этих направлениях.
- Авито также планирует получить образовательную лицензию и открыть на базе Академии аналитиков собственные курсы по продуктовому менеджменту и Data Science.
Яндекс со своей Школой анализа данных тоже молодцы. Однако эти образовательные программы не решают проблем, о которых мы вчера писали.
Про что никто не говорит:
В школах, появляющихся тут и там, учат механике работы с данными. Это образование для тех, кто будет непосредственно взаимодействовать с айти-инструментами.
Индустрии же не хватает университетов, где будут учить не специалистов, а топ-менеджеров. В таких университетах должны учить не решению задач, а умению правильно задавать вопросы к данным с позиции управленцев.
С айти-инфраструктурой все неплохо, школы данных справляются. Методология обучения в университетах должна готовить кадры, которые будут формулировать и проверять с помощью данных новые гипотезы, а не решать рутинные задачи.
Сегодня проваливается 70% программ цифровой трансформации. Все из-за того, что современные методы и инструменты спотыкаются об архаичные подходы.
В статье «Корпоративный университет данных: искусство малых шагов» автор подробно рассуждает, как решить эту проблему.
#ии #образование
За 3 года Авито вложит в текстовые и мультимодальные нейросети ₽12 млрд и планирует заработать на этом ₽21 млрд.
Об этом говорят все.
Мало кто говорит, что ивестируя в ИИ, Авито параллельно инвестирует в образование студентов, которые будут с этим ИИ работать:
- В 2024 году Авито уже запустил магистратуру по Data Science в МФТИ.
- В 2025 году Авито запустит еще три программы: по разработке, Data Science и продуктовому менеджменту в ИТМО и ВШЭ.
- В 2025 году Авито полностью оплатит обучение 118 из 140 студентов на этих направлениях.
- Авито также планирует получить образовательную лицензию и открыть на базе Академии аналитиков собственные курсы по продуктовому менеджменту и Data Science.
Яндекс со своей Школой анализа данных тоже молодцы. Однако эти образовательные программы не решают проблем, о которых мы вчера писали.
Про что никто не говорит:
В школах, появляющихся тут и там, учат механике работы с данными. Это образование для тех, кто будет непосредственно взаимодействовать с айти-инструментами.
Индустрии же не хватает университетов, где будут учить не специалистов, а топ-менеджеров. В таких университетах должны учить не решению задач, а умению правильно задавать вопросы к данным с позиции управленцев.
С айти-инфраструктурой все неплохо, школы данных справляются. Методология обучения в университетах должна готовить кадры, которые будут формулировать и проверять с помощью данных новые гипотезы, а не решать рутинные задачи.
Сегодня проваливается 70% программ цифровой трансформации. Все из-за того, что современные методы и инструменты спотыкаются об архаичные подходы.
В статье «Корпоративный университет данных: искусство малых шагов» автор подробно рассуждает, как решить эту проблему.
#ии #образование
🔥4👌3❤2
Национальная биржа больших данных
В Китае данные воспринимают как топливо для цифровой трансформации государства и бизнеса. Впервые создать национальную биржу данных китайцы попробовали в 2014 году, но попытка провалилась.
В 2015 году в китайском Гуйяне запустили Глобальную биржу по обмену большими данными. К 2024 году на платформе работали 1466 субъектов, а совокупный объем торгов составил $736 млн, из которых $408 млн — только за 2024 год.
В 2022 году весь китайский рынок торговли большими данными оценивался в $12 млрд. Эксперты считают, что к 2030 году он вырастет до $72 млрд.
Развитие торговли данными в Китае обеспечил принятый в 2021 году закон о защите персональной информации. По уровню защиты данных он напоминает европейский GDPR, но не ограничивает рынки торговли обезличенными данными.
В России подобный закон внесли в Госдуму еще в 2020 году, в первом чтении приняли в 2021, а потом все подвисло аж на 3 года. Полностью приняли закон только в 2024 году.
Надеемся, что теперь и у нас подобная биржа появится, а разработчикам и бизнесу станет проще получать данные.
#деньги
В Китае данные воспринимают как топливо для цифровой трансформации государства и бизнеса. Впервые создать национальную биржу данных китайцы попробовали в 2014 году, но попытка провалилась.
В 2015 году в китайском Гуйяне запустили Глобальную биржу по обмену большими данными. К 2024 году на платформе работали 1466 субъектов, а совокупный объем торгов составил $736 млн, из которых $408 млн — только за 2024 год.
В 2022 году весь китайский рынок торговли большими данными оценивался в $12 млрд. Эксперты считают, что к 2030 году он вырастет до $72 млрд.
Развитие торговли данными в Китае обеспечил принятый в 2021 году закон о защите персональной информации. По уровню защиты данных он напоминает европейский GDPR, но не ограничивает рынки торговли обезличенными данными.
В России подобный закон внесли в Госдуму еще в 2020 году, в первом чтении приняли в 2021, а потом все подвисло аж на 3 года. Полностью приняли закон только в 2024 году.
Надеемся, что теперь и у нас подобная биржа появится, а разработчикам и бизнесу станет проще получать данные.
#деньги
👍4❤3🔥2
Первоапрельская аналитика данных: можно ли есть кебабы у вокзала?
Гуляя по Парижу, один любитель кебабов задумался: а правда ли, что чем ближе к метро или вокзалу, тем хуже кебаб? Он решил не строить догадок и провести исследование.
Он вооружился Python и собрал рейтинги сотен заведений через Google Places API. Выгрузил карту улиц с OpenStreetMap с помощью OSMnx. Затем использовал GeoPandas и Shapely, чтобы рассчитать точные расстояния от каждой кебабной до ближайшей станции. Для поиска кратчайших пешеходных маршрутов он применил NetworkX, а для анализа зависимостей — статистические методы.
Результаты оказались неожиданными: никакой зависимости между расстоянием и рейтингами не нашлось. Да, среди заведений у станций были посредственные варианты, но в целом их качество не отличалось от тех, что прятались в глубине кварталов.
Круто, что аналитика данных позволяет не только разбираться в бизнес-процессах, но и разрушать городские легенды.
Комменты можно почитать на Реддите.
Отправьте друзьям, может перестанут брезговать перекусами на вокзалах.
Вот бы кто-то сделал такое для Москвы или Питера.
#исследования
Гуляя по Парижу, один любитель кебабов задумался: а правда ли, что чем ближе к метро или вокзалу, тем хуже кебаб? Он решил не строить догадок и провести исследование.
Он вооружился Python и собрал рейтинги сотен заведений через Google Places API. Выгрузил карту улиц с OpenStreetMap с помощью OSMnx. Затем использовал GeoPandas и Shapely, чтобы рассчитать точные расстояния от каждой кебабной до ближайшей станции. Для поиска кратчайших пешеходных маршрутов он применил NetworkX, а для анализа зависимостей — статистические методы.
Результаты оказались неожиданными: никакой зависимости между расстоянием и рейтингами не нашлось. Да, среди заведений у станций были посредственные варианты, но в целом их качество не отличалось от тех, что прятались в глубине кварталов.
Круто, что аналитика данных позволяет не только разбираться в бизнес-процессах, но и разрушать городские легенды.
Комменты можно почитать на Реддите.
Отправьте друзьям, может перестанут брезговать перекусами на вокзалах.
Вот бы кто-то сделал такое для Москвы или Питера.
#исследования
😁7👏6🔥3🌭3❤2
В крупных соцопросах участвует менее 0,1% населения, но мы делаем выводы про всех россиян. Как это работает?
В «Если быть точным» объяснили, как устроены выборки и откуда берется репрезентативность:
- Почему нет разницы в точности опроса при 1000 и 5000 участников.
- Как в США опросили 250 тысяч человек, а результаты получились столь же точные, как если бы опрос был сделан на случайной выборке в 10 человек.
- Почему опросы не смогли предсказать победу Трампа в 2016 году.
- По какой формуле посчитать, сколько респондентов должно быть в выборке.
Крутой материал для тех, кто работает с данными: много инсайтов про методологии, скрытые искажения и случайности.
#аналитика #статьи
В «Если быть точным» объяснили, как устроены выборки и откуда берется репрезентативность:
- Почему нет разницы в точности опроса при 1000 и 5000 участников.
- Как в США опросили 250 тысяч человек, а результаты получились столь же точные, как если бы опрос был сделан на случайной выборке в 10 человек.
- Почему опросы не смогли предсказать победу Трампа в 2016 году.
- По какой формуле посчитать, сколько респондентов должно быть в выборке.
Крутой материал для тех, кто работает с данными: много инсайтов про методологии, скрытые искажения и случайности.
#аналитика #статьи
👍4🔥3👌2
На что уходят мировые инвестиции в генеративный ИИ
В Gartner прогнозируют, что в 2025 году мировые расходы на генеративный ИИ составят $644 млрд. Это на 76% больше, чем в 2024.
Разберемся, насколько вырастут инвестиции в разных отраслях по сравнению с прошлым годом:
1. Программное обеспечение: $37 млрд, +93%
2. Устройства: $398 млрд, +99%
Кстати, в IDC считают, что доля ПК с встроенным ИИ вырастет с 5% в 2023 году до 94% уже к 2028 году. Такие цифры в IDC получили, опросив 670 руководителей крупных айти-компаний по всему миру.
3. Серверы: $180 млрд, +33%
4. Услуги: $27 млрд, +162%
Пока вы думаете, много это или мало, на Кафедре когнитивных наук Калифорнийского университета сообщили, что GPT-4.5 прошла трехсторонний тест Тьюринга:
В трехстороннем тесте испытуемые в течение 5 минут общаются одновременно с машиной и человеком и должны определить, кто есть кто. В 73% случаев GPT-4.5 приняли за человека.
#ии #деньги #исследования
В Gartner прогнозируют, что в 2025 году мировые расходы на генеративный ИИ составят $644 млрд. Это на 76% больше, чем в 2024.
Разберемся, насколько вырастут инвестиции в разных отраслях по сравнению с прошлым годом:
1. Программное обеспечение: $37 млрд, +93%
2. Устройства: $398 млрд, +99%
Кстати, в IDC считают, что доля ПК с встроенным ИИ вырастет с 5% в 2023 году до 94% уже к 2028 году. Такие цифры в IDC получили, опросив 670 руководителей крупных айти-компаний по всему миру.
3. Серверы: $180 млрд, +33%
4. Услуги: $27 млрд, +162%
Пока вы думаете, много это или мало, на Кафедре когнитивных наук Калифорнийского университета сообщили, что GPT-4.5 прошла трехсторонний тест Тьюринга:
Полученные данные представляют собой первое эмпирическое доказательство того, что искусственная система проходит стандартный трехсторонний тест Тьюринга.
В трехстороннем тесте испытуемые в течение 5 минут общаются одновременно с машиной и человеком и должны определить, кто есть кто. В 73% случаев GPT-4.5 приняли за человека.
#ии #деньги #исследования
❤🔥2🔥2👌2
Яндекс выпустил бета-версию Нейроэксперта для работы с документами, презентациями, аудио и видео
Нейроэксперт превратит загруженные файлы в базу знаний. Вы можете создавать разные папки с файлами. Изучая файлы внутри отдельных пространств-папок, Нейроэксперт может пересказывать содержимое, проводить сравнительный анализ, написать на основе файлов текст и так далее.
Папки работают, как в облачных хранилищах — ими можно делиться по ссылкам.
В Яндексе пояснили:
Зачем это надо?
- Отправляете ссылки на несколько длиннющих видеообзоров от любимых блогеров на новый гаджет и просите Нейроэксперта помочь. Он сопоставит мнения, сравнит оценки и сделает общий вывод, а вы сэкономите несколько часов.
- Загружаете сразу несколько отчетов, исследований и презентаций на любую тему объемом хоть в сотни страниц и просите Нейроэксперта подготовить метаисследование. Получаете в нужном стиле и формате документ, который основан сразу на нескольких источниках.
- Загружаете презентации продукта от разных поставщиков и просите Нейроэксперта подготовить сравнительную таблицу. Берете этот отчет и идете к руководителю, чтобы на основании таблицы решить, у кого покупать.
Яндекс планирует в будущем выпустить расширенную версию для бизнес-задач, в которой появятся новые опции — поиск сведений во внутренних базах данных и документации, систематизация работы, упрощение процессов адаптации и повышение эффективности сотрудников.
Сервис пригодится студентам, преподавателям, бухгалтерам, маркетологам и кому угодно, если ему приходится на работе изучать много документов.
#ии
Нейроэксперт превратит загруженные файлы в базу знаний. Вы можете создавать разные папки с файлами. Изучая файлы внутри отдельных пространств-папок, Нейроэксперт может пересказывать содержимое, проводить сравнительный анализ, написать на основе файлов текст и так далее.
Папки работают, как в облачных хранилищах — ими можно делиться по ссылкам.
В Яндексе пояснили:
По всей загруженной информации пользователь может задавать вопросы в режиме диалога — как при общении с обычным чат-ботом. Нейроэксперт подготовит ответ только на основе источников пользователя и не добавит ничего от себя. После выхода сервиса из бета-тестирования пользователи смогут добавлять больше 25 файлов или ссылок.
Зачем это надо?
- Отправляете ссылки на несколько длиннющих видеообзоров от любимых блогеров на новый гаджет и просите Нейроэксперта помочь. Он сопоставит мнения, сравнит оценки и сделает общий вывод, а вы сэкономите несколько часов.
- Загружаете сразу несколько отчетов, исследований и презентаций на любую тему объемом хоть в сотни страниц и просите Нейроэксперта подготовить метаисследование. Получаете в нужном стиле и формате документ, который основан сразу на нескольких источниках.
- Загружаете презентации продукта от разных поставщиков и просите Нейроэксперта подготовить сравнительную таблицу. Берете этот отчет и идете к руководителю, чтобы на основании таблицы решить, у кого покупать.
Яндекс планирует в будущем выпустить расширенную версию для бизнес-задач, в которой появятся новые опции — поиск сведений во внутренних базах данных и документации, систематизация работы, упрощение процессов адаптации и повышение эффективности сотрудников.
Сервис пригодится студентам, преподавателям, бухгалтерам, маркетологам и кому угодно, если ему приходится на работе изучать много документов.
#ии
🔥5👍3👏2
Инвесторы используют альтернативные данные для прогноза продаж
Инвесторы розничных сетей все чаще используют альтернативные данные, а не финансовую отчетность для анализа рынка и прогнозов. Это могут быть опросы покупателей, данные по кредиткам и геолокации, обсуждения в соцсетях.
Кто и как собирает альтернативные данные?
- Партнер Goldman Sachs, HundredX проводит опросы о намерениях покупателей через НКО и продает эти данные клиентам.
- В Placer отслеживают перемещения людей для оценки посещаемости магазинов и эффективности рекламы на билбордах.
- В Reddit проводят вебинары для ритейлеров: соцсеть анализирует посты и комменты для прогнозирования спроса.
Зачем инвесторам альтернативные данные?
В ноябре 2024 года аналитики Facteus заметили, изучая данные кредиток, что средний чек в Tik Tok Shop вырос на 16%. Клиентам Facteus это стало известно за неделю до публикации квартального отчета. Так хедж-фонды, которые опирались на альтернативные данные, купили акции выгоднее тех, кто ждал официальной информации.
Ну и сами аналитики на этом заработали. Из-за подобных кейсов на Уолл-стрит вырос спрос на альтернативные данные, и выручка Facteus выросла с 2023 года на 300%.
Какая-то узаконенная торговля инсайдерской инфой получается.
#деньги
Инвесторы розничных сетей все чаще используют альтернативные данные, а не финансовую отчетность для анализа рынка и прогнозов. Это могут быть опросы покупателей, данные по кредиткам и геолокации, обсуждения в соцсетях.
Кто и как собирает альтернативные данные?
- Партнер Goldman Sachs, HundredX проводит опросы о намерениях покупателей через НКО и продает эти данные клиентам.
- В Placer отслеживают перемещения людей для оценки посещаемости магазинов и эффективности рекламы на билбордах.
- В Reddit проводят вебинары для ритейлеров: соцсеть анализирует посты и комменты для прогнозирования спроса.
Зачем инвесторам альтернативные данные?
В ноябре 2024 года аналитики Facteus заметили, изучая данные кредиток, что средний чек в Tik Tok Shop вырос на 16%. Клиентам Facteus это стало известно за неделю до публикации квартального отчета. Так хедж-фонды, которые опирались на альтернативные данные, купили акции выгоднее тех, кто ждал официальной информации.
Ну и сами аналитики на этом заработали. Из-за подобных кейсов на Уолл-стрит вырос спрос на альтернативные данные, и выручка Facteus выросла с 2023 года на 300%.
Какая-то узаконенная торговля инсайдерской инфой получается.
#деньги
👍7🔥3👌2❤🔥1
Data Mesh умер на стройке Вавилонской башни
Успешно внедрить этот подход смогли не более 5% компаний, которым он теоретически был бы полезен.
Как это выглядит в теории:
Отделы маркетинга, продаж и финансов внутри одной компании собирают и хранят данные как полноценный продукт. Все рассматривают данные как полезный актив не только для себя, но и для коллег.
Розовых пони с единорогами только не хватает.
Как это получается на практике:
Единые стандарты не внедряются, что усложняет интеграцию. Все собирают данные по-своему, что приводит к проблемам с анализом.
Например, в крупном корпоративном бизнес-блоке банка клиентом называют одну сущность, а в отделе кредитования малого бизнеса — другую. Как только эти отделы захотят обменяться данными, им потребуется чудо, чтобы не повторить историю с Вавилонской башней.
#статьи #аналитика
Успешно внедрить этот подход смогли не более 5% компаний, которым он теоретически был бы полезен.
Как это выглядит в теории:
Отделы маркетинга, продаж и финансов внутри одной компании собирают и хранят данные как полноценный продукт. Все рассматривают данные как полезный актив не только для себя, но и для коллег.
Розовых пони с единорогами только не хватает.
Как это получается на практике:
Единые стандарты не внедряются, что усложняет интеграцию. Все собирают данные по-своему, что приводит к проблемам с анализом.
Например, в крупном корпоративном бизнес-блоке банка клиентом называют одну сущность, а в отделе кредитования малого бизнеса — другую. Как только эти отделы захотят обменяться данными, им потребуется чудо, чтобы не повторить историю с Вавилонской башней.
#статьи #аналитика
🔥4👍3❤🔥2
Какой российский бизнес готов к экономике данных, а какой — нет
Вышка выпустила сборник «Готовность российского бизнеса к экономике данных», где рассказала, сколько компаний в разных отраслях использует большие данные:
- Продажи, доставка, постпродажное обслуживание: 45%.
- Производство услуг и продуктов, обслуживание оборудования: 41%.
- Администрирование: бухгалтерия, финансы, кадры: 35%.
- Маркетинг и реклама: 32%.
- Логистика и склад: 23%.
Многие ли готовы покупать и продавать данные
Среди тех, кто уже их использует или только планирует:
- 19% готовы продавать данные или делиться ими бесплатно.
- 23% хотели бы покупать данные у других организаций.
- 39% хотели бы получить доступ к государственным данным.
Неожиданный аутсайдер
В России среди всех организаций, использующих большие данные, в бизнес-процессах их применяют только 23% складских и логистических компаний.
Это самый низкий показатель среди всех отраслей бизнеса. То ли там работают луддиты, то ли это какой-то саботаж.
Пока российские логисты игнорируют большие данные, в Амазон за 2019-2023 годы с их помощью вот к чему пришли:
- На 40% сократили задержки в доставке.
- На 30% нарастили рентабельность цепочки поставок.
- На 10% сократили среднее время доставки.
- На 30% снизили избыточные запасы на складах.
Если просто повторять, что данные — новая нефть, никаких дивидендов не будет. Надо бурить, детка, бурить.
#исследования
Вышка выпустила сборник «Готовность российского бизнеса к экономике данных», где рассказала, сколько компаний в разных отраслях использует большие данные:
- Продажи, доставка, постпродажное обслуживание: 45%.
- Производство услуг и продуктов, обслуживание оборудования: 41%.
- Администрирование: бухгалтерия, финансы, кадры: 35%.
- Маркетинг и реклама: 32%.
- Логистика и склад: 23%.
Многие ли готовы покупать и продавать данные
Среди тех, кто уже их использует или только планирует:
- 19% готовы продавать данные или делиться ими бесплатно.
- 23% хотели бы покупать данные у других организаций.
- 39% хотели бы получить доступ к государственным данным.
Неожиданный аутсайдер
В России среди всех организаций, использующих большие данные, в бизнес-процессах их применяют только 23% складских и логистических компаний.
Это самый низкий показатель среди всех отраслей бизнеса. То ли там работают луддиты, то ли это какой-то саботаж.
Пока российские логисты игнорируют большие данные, в Амазон за 2019-2023 годы с их помощью вот к чему пришли:
- На 40% сократили задержки в доставке.
- На 30% нарастили рентабельность цепочки поставок.
- На 10% сократили среднее время доставки.
- На 30% снизили избыточные запасы на складах.
Если просто повторять, что данные — новая нефть, никаких дивидендов не будет. Надо бурить, детка, бурить.
#исследования
👍5🔥3❤🔥2🤨1
Искусственный интеллект и большие данные в строительстве
По оценке ДОМ.РФ, к 2028 году вклад искусственного интеллекта в строительство в России составит ₽1 трлн. Это при том, что ИИ на своих объектах использует только 26% строительных компаний. Так что есть, куда расти и после этого.
Самые примечательные кейсы:
- Средняя точность оценки стоимости строительства тоннелей на ранних этапах не превышает 60%. Греческие исследователи разработали модель, которая анализирует всего 12 характеристик и выдает значительно более точный прогноз.
- Строительные спецификации и документы — источник головной боли, где каждое предложение может быть длиной в 7-10 строк. В них сложно разобраться. В сеульском университете автоматизировали анализ строительных спецификаций.
- Подбор строительных материалов требует учета десятков и сотен параметров. В Лидском университете Беккета разработали решение для инженеров: оно подскажет, какой материал класть на пол в санузлах на четвертом этаже, а какой — в гостиной на первом.
- В американской строительной компании Savko & Sons оснастили всю технику на своих стройках датчиками. Так руководство отслеживает производительность, время работы и простоя и прочие показатели.
- Объединение строителей Тулы использует умные каски. С датчиков на касках собираются данные, которые используются для контроля за соблюдением техники безопасности. Каска сообщит диспетчеру, если работник получит удар или упадет. Кроме того, устройства повышают производительность труда.
Технологии помогают сокращать сроки строительства, оптимизировать ресурсы и минимизировать риски, что в долгосрочной перспективе снижает расходы и повышает рентабельность проектов.
За счет ИИ производительность на стройке можно увеличить на 40%.
#ии #аналитика #исследования
По оценке ДОМ.РФ, к 2028 году вклад искусственного интеллекта в строительство в России составит ₽1 трлн. Это при том, что ИИ на своих объектах использует только 26% строительных компаний. Так что есть, куда расти и после этого.
Самые примечательные кейсы:
- Средняя точность оценки стоимости строительства тоннелей на ранних этапах не превышает 60%. Греческие исследователи разработали модель, которая анализирует всего 12 характеристик и выдает значительно более точный прогноз.
- Строительные спецификации и документы — источник головной боли, где каждое предложение может быть длиной в 7-10 строк. В них сложно разобраться. В сеульском университете автоматизировали анализ строительных спецификаций.
- Подбор строительных материалов требует учета десятков и сотен параметров. В Лидском университете Беккета разработали решение для инженеров: оно подскажет, какой материал класть на пол в санузлах на четвертом этаже, а какой — в гостиной на первом.
- В американской строительной компании Savko & Sons оснастили всю технику на своих стройках датчиками. Так руководство отслеживает производительность, время работы и простоя и прочие показатели.
- Объединение строителей Тулы использует умные каски. С датчиков на касках собираются данные, которые используются для контроля за соблюдением техники безопасности. Каска сообщит диспетчеру, если работник получит удар или упадет. Кроме того, устройства повышают производительность труда.
Технологии помогают сокращать сроки строительства, оптимизировать ресурсы и минимизировать риски, что в долгосрочной перспективе снижает расходы и повышает рентабельность проектов.
За счет ИИ производительность на стройке можно увеличить на 40%.
#ии #аналитика #исследования
👍5🔥3❤🔥2💯2
В OpenAI открыли бесплатный доступ к ChatGPT Plus для студентов
До конца мая все американские и канадские студенты смогут бесплатно пользоваться всеми функциями платной версии модели.
Почему до конца мая?
Потому что надо готовиться к сессии.
Кажется, мы теперь точно в новой реальности: плохие студенты просят ИИ написать за них работу, хорошие — готовятся к экзаменам с его помощью. Но почти никто не сидит больше над книгами в библиотеках.
Круто, что в OpenAI не просто не боятся признать это, но и пестуют использование нейросетей в подготовке к экзаменам.
Можно сколько угодно сетовать, что раньше читали больше, но рано или поздно реальность принять придется.
Вот вам, кстати, крутой подкаст: физик и астроном допрашивают главного по ИИ в Яндексе о том, куда мы движемся.
#ии
До конца мая все американские и канадские студенты смогут бесплатно пользоваться всеми функциями платной версии модели.
Почему до конца мая?
Потому что надо готовиться к сессии.
Кажется, мы теперь точно в новой реальности: плохие студенты просят ИИ написать за них работу, хорошие — готовятся к экзаменам с его помощью. Но почти никто не сидит больше над книгами в библиотеках.
Круто, что в OpenAI не просто не боятся признать это, но и пестуют использование нейросетей в подготовке к экзаменам.
Можно сколько угодно сетовать, что раньше читали больше, но рано или поздно реальность принять придется.
Вот вам, кстати, крутой подкаст: физик и астроном допрашивают главного по ИИ в Яндексе о том, куда мы движемся.
#ии
👍4👨💻4🔥3❤🔥2 2
Чего ждать от GenAI в 2025 году по версии red_mad_robot
Тренд-репорт от Аналитического центра red_mad_robot рассказывает, чего ждать бизнесу от рынка GenAI в 2025 году.
- Китайские модели навязывают конкуренцию. Пример DeepSeek показал, что ризонинг-модели с открытым исходным кодом могут конкурировать с ChatGPT по ключевым бенчмаркам и при этом оставаться более эффективными экономически. В Forbes назвали это новой гонкой вооружений.
- Понимая, что Китай угрожает лидерству США в сфере ИИ, Трамп анонсировал проект StarGate, который инвестирует $500 млрд в развитие искусственного интеллекта и суперкомпьютеров. Основные направления: AGI, персонализированная медицина и фундаментальные модели.
- Компании начинают монетизировать данные с помощью ИИ. Будет появляться все больше маркетплейсов данных и основанных на данных ИИ-агентов. В Slack уже создали хаб с ИИ-агентами от разных поставщиков.
- ИИ постепенно будет влиять на дизайн интерфейсов. OpenAI уже выпустила ИИ-агента Operator, который выполняет задачи в браузере за пользователя. Чем больше будет подобных агентов, тем сильнее будет меняться дизайн под их влиянием.
- Синтетические данные станут мейнстримом. По прогнозу Gartner, к 2026 году 75% компаний будут использовать генеративный ИИ для получения синтетических клиентских данных. В 2023 таких компаний было меньше 5%.
Вообще-то прогнозы — дело неблагодарное, но в сфере ИИ все происходит на таких скоростях, что проверить качество предсказаний получается очень скоро после их публикации. Ждем, наблюдаем.
#ии #исследования
Тренд-репорт от Аналитического центра red_mad_robot рассказывает, чего ждать бизнесу от рынка GenAI в 2025 году.
- Китайские модели навязывают конкуренцию. Пример DeepSeek показал, что ризонинг-модели с открытым исходным кодом могут конкурировать с ChatGPT по ключевым бенчмаркам и при этом оставаться более эффективными экономически. В Forbes назвали это новой гонкой вооружений.
- Понимая, что Китай угрожает лидерству США в сфере ИИ, Трамп анонсировал проект StarGate, который инвестирует $500 млрд в развитие искусственного интеллекта и суперкомпьютеров. Основные направления: AGI, персонализированная медицина и фундаментальные модели.
- Компании начинают монетизировать данные с помощью ИИ. Будет появляться все больше маркетплейсов данных и основанных на данных ИИ-агентов. В Slack уже создали хаб с ИИ-агентами от разных поставщиков.
- ИИ постепенно будет влиять на дизайн интерфейсов. OpenAI уже выпустила ИИ-агента Operator, который выполняет задачи в браузере за пользователя. Чем больше будет подобных агентов, тем сильнее будет меняться дизайн под их влиянием.
- Синтетические данные станут мейнстримом. По прогнозу Gartner, к 2026 году 75% компаний будут использовать генеративный ИИ для получения синтетических клиентских данных. В 2023 таких компаний было меньше 5%.
Вообще-то прогнозы — дело неблагодарное, но в сфере ИИ все происходит на таких скоростях, что проверить качество предсказаний получается очень скоро после их публикации. Ждем, наблюдаем.
#ии #исследования
👍5❤🔥3⚡2🔥1
Конфиденциальность данных — потребность бизнеса или требование закона?
На первый взгляд кажется, что соблюдение требований к конфиденциальности не приносит бизнесу никаких выгод — одни расходы и трудности. Да и на второй взгляд тоже. Однако, если присмотреться в третий раз, можно кое-что разглядеть.
В презентации «Конфиденциальность данных» с Datatalks 5.0 от Ростелекома Андрей Буланов посмотрел на это под неочевидным углом. Разберем ключевые тезисы.
Минусы
- Потеря точности данных.
- Ограничения маркетинговых стратегий.
- Затраты на внедрение и поддержку технологий.
- Ограниченные возможности для глубокого анализа.
Плюсы
+ Поддержка социальной ответственности.
+ Соблюдение законодательства.
+ Снижение риска штрафов.
+ Повышение уровня доверия клиентов.
+ Снижение класса ИС и сопутствующих расходов.
Выводы
Конфиденциальность данных — не просто формальность, а баланс между законом, бизнес-интересами и технологиями. Как сказано в презентации:
Внедрение современных методов и грамотная классификация ИС помогут бизнесу сохранить доверие клиентов, избежать штрафов и остаться конкурентоспособным.
Интересный кейс с обезличиванием данных
Ситуация:
Нужно провести соцопрос на чувствительную тему. Например, вы хотите спросить людей на улице, употребляли ли они наркотические средства без рецепта в этом году? Разумеется, многие респонденты откажутся честно отвечать на вопрос из-за опасения, что их ответы станут известны другим людям.
Решение:
Вводим рандомизацию. Респонденту предлагается подбросить монетку и сохранить результат броска в тайне.
Если выпадает орел, то он должен ответить «Да» вне зависимости от реального положения дел. Если выпадает решка, то он должен ответить честно.
Мы получаем данные с ответами, но не знаем, сколько из них были честными. Теперь нам надо распутать этот клубок.
Допустим, в опросе участвовало 1000 человек. И 640 ответили «Да».
Вероятность выпадения орла — 50%. Это значит, что из 640 только 140 — это честные ответы «Да» тех, у кого выпала решка.
Экстраполируем. Решка выпадает только у 50% людей, значит истинная доля ответивших «Да» вдвое больше — 280 человек.
Теперь мы можем написать, что в рамках опроса мы выяснили: 28% людей принимали наркотические средства без рецепта в этом году.
#ии #исследования #аналитика
На первый взгляд кажется, что соблюдение требований к конфиденциальности не приносит бизнесу никаких выгод — одни расходы и трудности. Да и на второй взгляд тоже. Однако, если присмотреться в третий раз, можно кое-что разглядеть.
В презентации «Конфиденциальность данных» с Datatalks 5.0 от Ростелекома Андрей Буланов посмотрел на это под неочевидным углом. Разберем ключевые тезисы.
Минусы
- Потеря точности данных.
- Ограничения маркетинговых стратегий.
- Затраты на внедрение и поддержку технологий.
- Ограниченные возможности для глубокого анализа.
Плюсы
+ Поддержка социальной ответственности.
+ Соблюдение законодательства.
+ Снижение риска штрафов.
+ Повышение уровня доверия клиентов.
+ Снижение класса ИС и сопутствующих расходов.
Выводы
Конфиденциальность данных — не просто формальность, а баланс между законом, бизнес-интересами и технологиями. Как сказано в презентации:
Нет идеального решения, но есть инструменты, которые позволяют искать оптимальный компромисс.
Внедрение современных методов и грамотная классификация ИС помогут бизнесу сохранить доверие клиентов, избежать штрафов и остаться конкурентоспособным.
Интересный кейс с обезличиванием данных
Ситуация:
Нужно провести соцопрос на чувствительную тему. Например, вы хотите спросить людей на улице, употребляли ли они наркотические средства без рецепта в этом году? Разумеется, многие респонденты откажутся честно отвечать на вопрос из-за опасения, что их ответы станут известны другим людям.
Решение:
Вводим рандомизацию. Респонденту предлагается подбросить монетку и сохранить результат броска в тайне.
Если выпадает орел, то он должен ответить «Да» вне зависимости от реального положения дел. Если выпадает решка, то он должен ответить честно.
Мы получаем данные с ответами, но не знаем, сколько из них были честными. Теперь нам надо распутать этот клубок.
Допустим, в опросе участвовало 1000 человек. И 640 ответили «Да».
Вероятность выпадения орла — 50%. Это значит, что из 640 только 140 — это честные ответы «Да» тех, у кого выпала решка.
Экстраполируем. Решка выпадает только у 50% людей, значит истинная доля ответивших «Да» вдвое больше — 280 человек.
Теперь мы можем написать, что в рамках опроса мы выяснили: 28% людей принимали наркотические средства без рецепта в этом году.
#ии #исследования #аналитика
👍5🔥3❤🔥2💯1 1
Рекомендации Банка России.pdf
1.5 MB
В Банке России выпустили рекомендации по работе с данными
В документе рекомендации по разработке систем управления данными: методология, цели, роли, требования, методы, показатели эффективности и контрольные процедуры.
Кому?
- Руководителям и экспертам финансовых организаций, ответственным за управление данными.
- Специалистам, занимающимся внедрением технологий, обеспечением качества данных и регуляторной отчетностью.
- Организациям всех уровней зрелости СУД — от начинающих до продвинутых.
Зачем?
- Повысить качество данных и их ценность для бизнеса.
- Минимизировать риски, связанные с некорректной отчетностью и нарушением регуляторных требований.
- Оптимизировать затраты на управление данными.
- Развить культуру работы с данными и обеспечить их безопасность.
- Создать прозрачные процессы для принятия решений на основе данных.
Документ написан на кондовом финансово-канцелярском языке. Впрочем, финансистам и бухгалтерам его читать будет не так сложно, даже привычно.
Делитесь с коллегами из финансового сектора.
#деньги
В документе рекомендации по разработке систем управления данными: методология, цели, роли, требования, методы, показатели эффективности и контрольные процедуры.
Кому?
- Руководителям и экспертам финансовых организаций, ответственным за управление данными.
- Специалистам, занимающимся внедрением технологий, обеспечением качества данных и регуляторной отчетностью.
- Организациям всех уровней зрелости СУД — от начинающих до продвинутых.
Зачем?
- Повысить качество данных и их ценность для бизнеса.
- Минимизировать риски, связанные с некорректной отчетностью и нарушением регуляторных требований.
- Оптимизировать затраты на управление данными.
- Развить культуру работы с данными и обеспечить их безопасность.
- Создать прозрачные процессы для принятия решений на основе данных.
Документ написан на кондовом финансово-канцелярском языке. Впрочем, финансистам и бухгалтерам его читать будет не так сложно, даже привычно.
Делитесь с коллегами из финансового сектора.
#деньги
👍5❤🔥2🙏2⚡1🔥1
Гугл представит инструменты анализа инфраструктуры и трафика в городах
Google Maps Platform расширяет возможности для анализа городской инфраструктуры и транспортных потоков, интегрируя новые наборы данных в BigQuery. Данные откроют для застройщиков, городских администраций и бизнеса.
Подробности читайте на Хабре.
#аналитика #статьи
Google Maps Platform расширяет возможности для анализа городской инфраструктуры и транспортных потоков, интегрируя новые наборы данных в BigQuery. Данные откроют для застройщиков, городских администраций и бизнеса.
Подробности читайте на Хабре.
#аналитика #статьи
👍4❤🔥3👌2 1
Презентации и видео по Data Governance
На сайте DataTalks от Ростелекома доступны презентации и видео с докладами по теме Data Governance. Кое-какие конкретные прикладные вещи уже не свежие, но концептуально там много пользы.
1. DataGovernance на минималках
Наталья Хапаева из МТС рассказывает, как внедрить процессы и технологии Data Governance с минимальными усилиями для достижения максимального результата.
Презентация / Видео
2. DataGovernance своими руками
Александр Юрасов из Ростелекома рассказывает о причинах создания собственных инструментов Data Governance.
Презентация / Видео
3. Как процессам Data Governance догнать самый быстрорастущий бизнес
Алевтина Тинас и Герман Соколов из Т2 на примере сотового оператора рассказывают, можно ли построить эффективный и прибыльный бизнес без инструментов Data Governance.
Презентация / Видео
4. Кадры для DataGovernance: где найти и как вырастить
Круглый стол с обсуждением кадровых вопросов с экспертами управления данными крупнейших телеком-компаний.
Видео
Особенно рекомендуем тем, кто работает с данными в телекоме или около него.
#исследования
На сайте DataTalks от Ростелекома доступны презентации и видео с докладами по теме Data Governance. Кое-какие конкретные прикладные вещи уже не свежие, но концептуально там много пользы.
1. DataGovernance на минималках
Наталья Хапаева из МТС рассказывает, как внедрить процессы и технологии Data Governance с минимальными усилиями для достижения максимального результата.
Презентация / Видео
2. DataGovernance своими руками
Александр Юрасов из Ростелекома рассказывает о причинах создания собственных инструментов Data Governance.
Презентация / Видео
3. Как процессам Data Governance догнать самый быстрорастущий бизнес
Алевтина Тинас и Герман Соколов из Т2 на примере сотового оператора рассказывают, можно ли построить эффективный и прибыльный бизнес без инструментов Data Governance.
Презентация / Видео
4. Кадры для DataGovernance: где найти и как вырастить
Круглый стол с обсуждением кадровых вопросов с экспертами управления данными крупнейших телеком-компаний.
Видео
Особенно рекомендуем тем, кто работает с данными в телекоме или около него.
#исследования
🔥5❤🔥3👍3🙏1