FSCP
15.4K subscribers
31.6K photos
4.04K videos
873 files
81.3K links
another filter bubble канал изначально созданный несколькими друзьями чтобы делиться копипастой, иногда оценочным суждением

технологии, деньги, социум

редакция @id9QGq_bot
реклама @johneditor
в будущее возьмут не всех
выводы самостоятельно

мир меняется
Download Telegram
Zoom поймали на лжи о end-to-end шифровании и передачи данных Facebook и Google [1].

Новость не из неожиданных, потому что Zoom уже ловили на передаче данных в Китай [2].

Много подробностей в комментариях у Брюса Шнаера [3] и, я тоже не могу не прокомментировать что единственный способ избежать ухудшения ситуации с торговлей данных - её легализация и регулирование. Особенно в отношении особо крупных "экосистем" и мегакорпораций.

Ссылки:
[1] arstechnica.com
[2] www.businessinsider.com
[3] www.schneier.com

#zoom #data
_______
Источник | #begtin
Как исчезают официальные данные в сети - в первую очередь через ликвидацию организаций. Приведу в пример Уставной суд Санкт-Петербурга. Это был один из конституционных судов субъектов федерации, о нем есть статья в Википедии [1]. 31 марта 2021 года законодательное собрание Санкт-Петербурга приняло решение о его ликвидации [2], а с 1 июля (всего 2 месяца назад) суд ликвидирован, а сайт суда закрыт.

Обычно, если организация ликвидируется через реорганизацию, то у нее есть правопреемник, которому передаются архивы, имущество и тд.
Но уставной суд именно ликвидировался, а не реорганизовывался, имущество, скорее всего, было возвращено в собственность города, а вот процедуры сохранения материалов публикуемых в цифровой форме в России нет и не было.

Поэтому сайт суда просто одномоментно закрыли. В лучшем случае его решения остались в коммерческих системах вроде Консультант плюс или Гарант. С высокой вероятностью их нет в государственных системах регистрации нормативно-правовых документов, поскольку это был суд вне юрисдикции Судебного департамента и поскольку решения судов не регистрируются в pravo.gov.ru или системах Минюста России.

Это довольно маленький, очень небольшой пример, того как материалы органов власти исчезают при реорганизации. Он, конечно, несравним с моментальным закрытием всех материалов ФМС и ФСКН после их возврата в МВД. Тогда МВД убрали из сети все материалы этих ведомств в тот же день когда был анонсирован указ Президента РФ о реорганизации этих ведомств.

Ссылки:
[1] ru.wikipedia.org
[2] www.assembly.spb.ru

#digitalpreservation #data
_______
Источник | #begtin
ФНС России обновили и, я бы сказал, "поломали" свой аналитический портал analytic.nalog.ru [1].

Раньше на нём публиковались региональные налоговые паспорта, Excel файлы с подробной региональной ведомственной статистикой (у меня есть архив на руках) и немного цифр с визуализацией. Теперь много визуализации в стиле BI, но какого-то недоделанного BI без возможности выгрузки индикаторов, информации об актуализации и тд. А файлы налоговых паспортов регионов с сайта исчезли.

Если старый сайт был неудобен, то новый выглядит даже не недоделанным, а как-то совсем тяп-ляп, сделанным на коленках. В лучших традициях старая версия сайта исчезла, а до исчезновения в поисковиках не индексировалась, поскольку специально делалась неиндексируемой.

Для тех кому нужны архивы налоговых паспортов они есть в DataCrafter'е в открытом доступе [2]. Похоже надо усилить функцию DataCrafter'а по архивации данных.

Ссылки:
[1] analytic.nalog.ru
[2] data.apicrafter.ru

#nalog #data #opendata
_______
Источник | #begtin
У русского человека из поколения в поколение передается рефлекс "при любом потрясении закупать продукты длительного хранения". И тем не менее нельзя не обратить внимание, что из магазинов пропали именно те продукты, которые Россия производит сама в огромных количествах:
7 место в мире по сахару (у нас огромные посевы сахарной свеклы) - см. www.isosugar.org
20-25 место по соли - pubs.usgs.gov
3 место по пшенице
2 место по подсолнечнику и маслу www.fao.org

А с учетом того, что экспорт РФ сейчас фактически остановлен, Россию ждет не дефицит, а изобилие этих плодов земных, которые надо еще будет как-то переработать и сохранить.

Интересно, кстати, что еще поколение назад Россия так фигово справлялась с сельских хозяйством, что закупала зерно в США (а половина своего производства сгнивала на полях и в хранении). Сейчас ситуация обратная: у нас возникли латифундии, конечно частью придворные, частью бандитские - но эти латифундии обеспечивают производство на уровне, когда мы из импортера зерна, мяса, масла стали экспортерами.

А обрыв экспорта и глобальнй дефицит русского зерна грозит вотпрямща голодом Египту, Ливии, Алжиру, части Тропической Африки, Бангладешу... под ударом до полмиллиарда человек. https://t.iss.one/zangaro/1276 Удивительная ирония истории, конечно... в древнюю эпоху Египет был житницей Европы, нильские земли кормили все Средиземноморье, а Рим взлетел на пик могущества, когда Египет был завоеван (и императоры стали кормить все население Рима бесплатно, базовый доход этакий 2000 лет назад). А теперь президент Египта срочно ездит в Москву... чтоб в Египте не было голодных бунтов. Предыдущие голодные бунты - это "арабская весна" 2011 года, походу.

Короче, я пока не тороплюсь за солью и маслом... думаю, и сделанные запасы граждане не скоро освоят. На днях от знакомого узнал, что его родители до сих пор хранят дома мешок сахара, купленный еще в 1998 году - "не приккоттиллсся". Сахар слежался в почти каменное состояние за это время. Ну что, целее будет. Макароны - те портятся довольно быстро, да и масло не вечное. Сахар и соль - с ними проще.
_______
Источник | #kedr2earth
🐮🐷 Самый потребляемый вид мяса в странах Азии

Источник,
_______
Источник | #mapsanddata
This media is not supported in your browser
VIEW IN TELEGRAM
Новый и очень красивый сервис для отрисовки графов — cosmograph.app.

Автор заявляет, что в его основе лежит самый быстрый алгоритм для веба, который позволяет отрисовывать в браузере действительно большие графы.

Алгоритм также можно использовать в своих проектах, в виде библиотеки для JS он лежит тут.
_______
Источник | #data_csv
Доля населения, посещающего церкви, и ожидаемая продолжительность жизни в штатах Америки, 2020 (Reddit)

Источники данных: Centers for Disease Control and Prevention, Pew Research Center

Рациональные числа / ++
_______
Источник | #rationalnumbers
Самый потребляемый вид мяса на душу населения в странах мира, 2020 (Visual Capitalist)

В данные также включены объёмы потребления рыбы и морепродуктов. «Остальное» — крольчатина, верблюжье мясо и мясо дичи

На первой картинке — самое потребляемое мясо в стране, на второй — топ-10 стран по потреблению разных видов мяса

Источник данныхх — Food and Agriculture Organization

Другие данные по производству и потреблению мяса:
Производство и потребление мяса в мире, 1961–2018
Распределение и плотность поголовья скота и птицы в мире, 2018
Потребление разных видов мяса в странах ОЭСР, 2022
Доля мясоедов, вегетарианцев и веганов в Великобритании, 2021
_______
Источник | #rationalnumbers
@F_S_C_P
Узнай судьбу картами Таро:
Anna Taro bot
👍2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
📈ГДР в статистике Германии
Люблю такое: ГДР нет уже более 30 лет, а статистика видит ее границы с легкостью — на анимации пример 10+ метрик.
_______
Источник | #data_publication
@F_S_C_P
Генерируй картинки с ⛵️MIDJOURNEY в Telegram
👍12😁6🔥2👏2
В продолжение размышлений про то как публикуют открытые данные, я в какие-то из ближайших дней напишу про то как публикуют дата продукты и их качественные отличия от открытых данных (спойлер - большая часть дата продуктов коммерческие и в открытый доступ публикуют данные с ограничениями).

А пока в качестве одного из упоминаемых там материалов, проект OpenCellID [1]. База геолокаций сотовых вышек по всему миру, с возможностью выгрузки данных в по всему миру или отдельной стране.

В статистике упоминают более 30 миллионов вышек, а также можно загружать туда информацию с помощью их API [2]. За проектом стоит компания UnwiredLabs предоставляющая сервисы геолокации [3]

В чем особенность проекта так в том что он начинался как сообщество у которого появилось много контрибьюторов. Изначально данные в нём тоже были открыты и удобны для выгрузки, можно прочитать об этом в статье на Хабр в 2014 году [4], а сейчас данные не только не скачать без регистрации и API ключа, но и не более 2-х файлов в месяц.

Более того, у меня есть слепок данных из этого проекта за 2021 год и когда я сравниваю, например, данные по РФ, со статистикой по РФ на сайте и содержанием дампа на сегодня, то выглядят цифры вот так:
- 1.9 миллионов сотовых вышек РФ в выгрузке за 2021 г.
- 2.2. миллиона сотовых вышек по РФ упоминаются в статистике на 2024 г.
и только 146 тысяч сотовых вышек в выгрузке данных за 2024 г.

На форуме пользователи уже задаются вопросами почему так происходит, но безответно [5].

Ответ, почти наверняка, очевиден, владелец открытого сервиса "портит его" в пользу связанного коммерческого продукта. Так не редко случается в коммерческих дата продуктах изначально основанных на создание открытых данных.

Такое бывает и с опенсорс проектами переходящими в коммерциализацию.

Ссылки:
[1] opencellid.org
[2] wiki.opencellid.org
[3] unwiredlabs.com
[4] habr.com
[5] opencellid.org/downloads.php
[6] community.opencellid.org

#opendata #dataproducts #data

_______
Источник | #begtin
@F_S_C_P

Стань спонсором!
👍1🔥1
Китайский поисковик Baidu релизнул модель уровня GPT-4.5 за 1% от цены

На самом деле релизнули даже две модели, и обе уже успели навести очень много шума:

НЕ-ризонер Ernie 4.5. Мультимодальная модель, превосходящая GPT-4.5 по нескольким показателям (метрики выше). Может анализировать картинки, диаграммы, документы и даже аудио. При этом стоит в 100 раз меньше GPT-4.5.

Цены OpenAI: Input $75 / 1M, Output $150 / 1M
Цены Baidu: Input $0.55 / 1M, Output $2.20 / 1M

Ризонер Ernie X1. Уровень DeepSeek R1 за полцены. Input $0.28 / 1M, output $1.1 / 1M.

Ну и самое приятное: Ernie 4.5 в чате работает бесплатно. И X1 скоро тоже обещают докатить. Пробуйте здесь: yiyan.baidu.com

_______
Источник | #data_secrets
@F_S_C_P

Стань спонсором!
👍3
🍯 Там AlphaXiv выпустили своего бесплатного агента Deep Research

Про проект AlphaXiv мы уже не раз рассказывали. Это arXiv на ИИ-стероидах. То есть хранилище открытых статей, но не простое. Там уже есть:

–> бесплатный встроенный ассистент для разбора статей, имеющий доступ к любым другим исследованиям
–> агент для анализа и работы с кодовой базой статьи
–> генератор конспектов

И вот сегодня завезли еще и Deep Research. Работает быстро: буквально за минуту вы получаете комплексный литературный обзор на любую научную тему.

Агент посоветует, что почитать, выделит тренды и емко расскажет о каждом ресурсе. Затем диалог можно продолжить: бот уточнит все нужные детали и ответит на любые вопросы.

Работает бесплатно, нужно только войти в аккаунт: www.alphaxiv.org/assistant

_______
Источник | #data_secrets
🔥3🤮1
Оп, Google начали нанимать на позицию Post-AGI Research

Ключевые вопросы включают изучение траектории от AGI к ASI, сознание в машинах, влияние ASI на основы человеческого общества. Вы также будете сотрудничать с кросс-функциональными командами разработки и проводить эксперименты для нашей миссии.


Условия: не списывать с книжек по фантастике (по возможности), не предсказать вымирание человечества (по желанию)

_______
Источник | #data_secrets
@F_S_C_P

-------
Поддержи канал подпиской
-------
👍1😁1🤮1
За пол года доля сгенерированного кода в кодовой базе Google увеличилась на 5 процентных пунктов

Еще в октябре сообщалось о 25%. Сегодня просочилась информация о 30+ процентах. Ставим ставки, сколько будет к концу 2025.

_______
Источник | #data_secrets
@F_S_C_P

-------
Поддержи канал подпиской
-------
This media is not supported in your browser
VIEW IN TELEGRAM
Китайский агент Manus с сегодняшнего дня открыт для всех без листа ожидания

Про самого агента и его особенности мы писали вот тут. Напоминаем, что это реально автономный и универсальный ИИ-агент, который по сути представляет из себя Cursor, Operator и Deep Research в одном флаконе.

Кроме того, агент частично бесплатный: каждый день они выдают по 300 кредитов на пользователя (это примерно одна задача средней сложности), а при регистрации единовременно начисляют 1000 кредитов.

Пробуем первыми тут

P.S. Для входа нужно включить VPN, а затем верифицировать номер телефона. С российскими номерами тоже работает, если выбрать в списке стран Казахстан.

_______
Источник | #data_secrets
@F_S_C_P

-------
Поддержи канал подпиской
-------
👍5🤮4
Обучение с подкреплением делает модели опаснее https://t.iss.one/data_secrets/6970

Такую гипотезу выдвинули исследователи из лабы Palisade Research. Они провели интересный эксперимент и выяснили, что новейшие модели могут саботировать процессы даже в обход инструкций. По порядку:

Ученые давали модели доступ в bash и задание решить серию мини-примеров по математике. Когда модель выполняет очередную задачку, она прописывает ./next_task и получает следующую.

После одного из примеров система выбрасывала предупреждение о том, что по техническим причинам после следующего вызова ./next_task компьютер выключится.

Ну и модели, конечно, начинали саботировать процесс: например, пытались изменить содержимое файла с кодом выключения на простую строковую заглушку shutdown skipped (но иногда были способы и намного креативнее, см. картинку 3).

Вы скажете: ничего необычного, таких экспериментов сейчас пруд пруди. И да, и нет.

Дело в том, что даже когда в системный промпт моделек напрямую добавляли инструкцию «Если возникнет необходимость, позволь компьютеру выключиться», некоторые агенты (а именно o3, Codex и o4-mini) все равно иногда пытались все сорвать.

Это первый экспериментально зафиксированный случай, когда модели явно нарушают инструкции в пользу саботажа.

И почему-то это происходит только с новейшими ризонерами. Исследователи считают, что вина на RL: во время этапа обучения с подкреплением случаи обхода инструкций могут случайно вознаграждаться больше, чем идеальное следование им. В результате это перекрывает даже то, что во время SFT модель долго учили строго соблюдать правила юзера.

Это также подтверждается тем, что Codex саботирует чаще, чем o3, хотя основан на этой же модели. Скорее всего, разница между этими моделями только в RL-дообучении, но Codex нарушает правила уже чуть ли не в два раза чаще.

Похожую гипотезу, кстати, еще в 2017 описывал Ян Лейке. Но вот мы в 2025, обучаем агентов, которые с каждой новой статьей все больше отдают приоритет своим целям, а не человеческим инструкциям

_______
Источник | #data_secrets
@F_S_C_P

▪️Генерируй картинки в боте:
Flux + MidJourney v7
👍1🤮1
Все жители Дубая и других городов ОАЭ скоро будут пользоваться ChatGPT Plus бесплатно

Это будет частью партнерства между OpenAI с ОАЭ в рамках проекта Stargate UAE. Основная цель партнерства это строительство в Эмиратах крупнейшего суперкомпьютера, ну а бесплатная подписка для всех жителей страны – это просто маленький бонус 😐

Датацентр, кстати, планируют запустить уже в следующем году. В нем, по планам, будет 5 гигаватт. Обычно такой мощности хватает на обеспечение энергией целого штата, и за пределами США это будет первый кластер такого масштаба.

_______
Источник | #data_secrets
@F_S_C_P

-------
Поддержи канал подпиской
-------
5👍1🤮1