Тёмный Лорд Коммуникаций

Технокейс о том, как настроить сбор данных с сайта в Google Таблицу без плагинов, используя только штатные функции.

В моём варианте таблица время от времени забирает количество подписчиков со страниц избранных каналов на TGStat (чтобы удобнее сравнивать из одного окна).

Код

=ЗНАЧЕН(REGEXREPLACE(REGEXEXTRACT(IMPORTXML(G20; "//div[@class='tgme_page_extra']"); "\d\d\s\d\d\d"); "\s"; ""))

Что есть что? В коде вы можете увидеть несколько вложенных друг в друга функций:
— ЗНАЧЕН — преобразует любые данные, поддерживаемые Google Таблицами, в число;
— REGEXREPLACE — заменяет часть строки на другой текст с помощью регулярного выражения.;
— REGEXEXTRACT — извлекает определенную часть текста, соответствующую регулярному выражению.;
— IMPORTXML — импорт данных из источников в формате XML, HTML, CSV, TSV, а также RSS и ATOM XML. В моём случае — формат HTML, функция указывает место на странице из ячейки G20 с помощью атрибута @class='tgme_page_extra' (т.е. html-элемент с css-классом tgme_page_extra). Соответственно, для вашей страницы указываем другое место, которое находится с помощью инструментов разработчика в браузере.

"\d\d\s\d\d\d" — регулярное выражение, указывающее примерный шаблон числа подписчиков (число из 5 цифр с одним пробелом). Для каналов с другим диапазоном нужно другое регулярное выражение (это ничего страшного, каналы не так часто переходят границы диапазона).

Я потратил на конструирование скрипта много времени, пользуйтесь)
Единственное неудобство — когда таких скриптов много в одной таблице, скрэпинг начинает серьёзно тормозить.

#кейс #IT #программирование

633 views15:46

Тёмный Лорд Коммуникаций

Ну камон, его даже не выделить нормально для переводчика, потому что текст справа налево!

P.S. На греческом тоже непонятно, но у них буквы прикольные.

#мемы #PR #работа

486 viewsedited 07:12

Тёмный Лорд Коммуникаций

Коллега говорит, что от коронавируса помогает пурген, но я ему не верю (больно моська хитрая). Зато верю данным ресурсам:

— коронавирусный портал ВОЗ (доступен на русском);
— коронавирусный портал университета Джона Хопкинса;
— официальный портал Правительства РФ СтопКоронавирус (и, в частности, его Telegram-канал);
— официальная страница «Меры Правительства по борьбе с коронавирусной инфекцией»;
— коронавирусный портал на сайте Минздрава РФ;
— коронавирусный ликбез на Госуслугах;
— коронавирусный портал Правительства Москвы;
— коронавирусная статистика от Яндекса (также отдельный подпортал открывается в результатах поиска);
— коронавирусная вкладка на Яндекс Новостях;
— коронавирусный портал Google (также отдельный подпортал открывается в результатах поиска);
— коронавирусные вкладки на Google Новостях: раз и два;
— подтверждённый Telegram-канал Corona со списком официальных каналов по разным странам;
— коронавирусный центр информации на Facebook;
— коронавирусная страничка Вконтакте.

В случае новостей, естественно, нужно смотреть на авторитетность издания.

#подборка #коронавирус #статистика #фейки #Facebook #Google #Яндекс #Вконтакте

486 viewsedited 08:01

Тёмный Лорд Коммуникаций

Ого, оказывается ВОЗ правда это советует!

(Шучу, на самом деле нет. Открываете инструменты разработчика, и можно изменить любой текст на странице. Это к слову о том, насколько легко делаются фейки.)

#IT #программирование #фейки

452 viewsedited 08:06

Тёмный Лорд Коммуникаций

Во вчерашней колонке на IJNet Элизабет Стойчефф предлагает 4 совета по защите себя от дезинформации. Разбираем по пунктам.

1. Сами ищите новости о политике, чтобы избежать воздействия рекомендательного алгоритма технологических платформ и социальных медиа. По мнению автора, лучше пользоваться новостными приложениями и (между строк) прямыми ссылками.

2. Проверяйте приводимую в публикациях статистику на авторитетных ресурсах.

3. Учитывайте неполитические стереотипы: такие, как информация, подтверждающая ваши верования и уверенность, что видеоконтент заслуживает большего доверия, чем текстовый.

4. Узнавайте не только о национальных новостях, но также о местных и международных, и пытайтесь связать их между собой.

#теория #журналистика #дезинформация #фейки

Международная журналистская сеть

Советы по защите от дезинформации | Международная журналистская сеть

Возможно, вам случалось обманываться и верить распространенной кем-то дезинформации. И это не ваша вина.

Даже если потребители новостей руководствуются самыми лучшими намерениями, им непросто разобраться в лавине политической информации, которая обрушивается…

489 views09:00

Тёмный Лорд Коммуникаций

Редакция сервиса управления соцсетями smmplanner делает нужное дело: публикует в своём блоге книгу по основам SMM. На данный момент уже 7 глав, выходит по главе в неделю.

#теория #SMM #новости

SMMplanner blog

Как искать и анализировать блогеров в соцсетях

Как не слить бюджет на блогеров? Учимся работать с лидерами мнений в соцсетях.

512 viewsedited 11:06

Тёмный Лорд Коммуникаций

Любопытно, что телевизионщики всегда делают себе пафосные автомобили, обклеенные со всех сторон, чтобы ну все вот увидели, кто едет))

Это какой-то общий тренд. Я вот не припомню, чтобы так же делали их коллеги по профессии: новостные интернет-порталы или, там, рекламные агентства👆

#наблюдения #работа #медиа #журналистика

510 views12:38

Тёмный Лорд Коммуникаций

Подходит к завершению мой анализ #БольшиеМедиа, посвящённый деятельности Агентства США по глобальным медиа.

Предыдущие четыре части:
— часть 1;
— часть 2;
— часть 3;
— часть 4.

По USAGM выйдет ещё две части, потом, вероятно, придумаю ещё что-то интересное😎

Telegraph

U.S. Agency for Global Media: справка, ч. 5

2. Радио Свободная Азия (Radio Free Asia, RFA). Основные характеристики подразделения: Годовой бюджет: $ 43,1 млн. Количество сотрудников: 253 Поддерживаемые языки: 9 Оценка аудитории: 50,7 миллиона человек. Руководитель — Парамешваран Поннудурай (Parameswaran…

548 viewsedited 14:16

Тёмный Лорд Коммуникаций

Про сложности поиска инфоповодов

Сколько я себя помню в медиа, ситуация всегда одна и та же: для поиска внешних инфоповодов (и соответствующего контента для соцсетей) нужно прошерстить сотню источников, чтобы обойти информационный шум и найти несколько (обычно — пару) действительно интересных, подходящих и не устаревших новостей.

И это никак не меняется со временем, хотя источников становится только больше. Интересно, у всех же так?

(Иллюстрация отсюда.)

#наблюдения #работа #PR #журналистика #мемы

563 viewsedited 15:21

Тёмный Лорд Коммуникаций

Сколько пиарщиков нужно, чтобы вкрутить лампочку?

Трое. Один продаст идею электрику, другой напишет пресс-релиз, а третий договорится с агентством.

#наблюдения #PR #мемы

600 viewsedited 07:20

Тёмный Лорд Коммуникаций

Мой анонимный эксперт #СерыйКардинал анализирует дебаты Байдена и Трампа и то, кто же в них на самом деле выиграл.

#новости #США #выборы #политика #WashingtonPost

Telegraph

Серый Кардинал: выпуск 30 сентября 2020

Американские выборы — царство грязи, глупости, подлости и абсолютного цинизма. Дебаты состоялись, и как всегда, ничего нового, за исключением одного, но важного фактора: это не два кандидата одной страны, это два представителя двух РАЗНЫХ стран. В преддверии…

598 viewsedited 08:05

Тёмный Лорд Коммуникаций

Когда в стране и мире происходит какое-то длительное и значимое событие, находятся ушлые сеошники, которые создают анонимные аналоги порталов с официальной информацией, копируют или переписывают её и оптимизируют для поиска.

В результате такие субституты обходят в поиске официалов и сбивают людей с толку. Так было при переходе России на цифровое вещание с аналогами портала РТРС, теперь вот с коронавирусом. А знаете, зачем?

Реклама. Особенно видно по количеству заблокированных трекеров, есть включен блокировщик.

#наблюдения #SEO #реклама #коронавирус

551 viewsedited 09:06

Тёмный Лорд Коммуникаций

Понимаю огорчение, но всё-таки не могу без возражений присоединиться к критике подобных новостей, и вот почему. Новостные СМИ находятся в жёсткой ситуации конкуренции с другими изданиями и социальными сетями, и их главная задача — получать трафик.

Если что-то может зайти людям, то нужно это постить, даже если интеллектуальная ценность таких публикаций низка. Так во всём мире.

Интеллектуальное чтиво — в других рубриках (если позволяет позиционирование). Какой выход из ситуации — никто не знает.

Но и есть хорошая сторона — каждый найдёт новости себе по вкусу.

#наблюдения #журналистика #медиа

541 viewsedited 09:14

Тёмный Лорд Коммуникаций

К обсуждаемой сейчас новости, что Fox News использует слово «ненависть» чаще, чем MSNBC или CNN, могу добавить одно соображение из собственного опыта (как-то проводили похожее исследование): изучение сюжетов телеков — та ещё задачка и, фактически, двойная работа.

Дело в том, что это не текстовый контент, а видеоряд. Он не собирается автоматически в базы. Здесь мы не можем просто применить поиск по тексту, который является довольно типичной функцией в любом современном софте, а следовательно — просто открыть какую-нибудь Медиалогию и вбить, что нас интересует.

Конкретно в данном случае исследователи использовали транскрипции текстов сюжетов (откуда они взялись, не уточняется).

#новости #журналистика #медиа #теория #иносми #наблюдения

Nieman Lab

Fox News uses the word “hate” much, much more often than MSNBC or CNN

"Fox’s use of 'hate' really took off when Trump’s presidency began. Beginning in January 2017, the mean usage of 'they hate' on the network doubled."

509 viewsedited 10:49

Тёмный Лорд Коммуникаций

Трудовые будни в редакции

— Коллега (парень): видит мерзкую новость про змей, ржёт, кидает другой коллеге (девушке).

— Из угла раздаётся «фуууу!».

— Я: что там? И мне!!1

— Шеф-редактор: работать начинайте! А не змей смотреть!
Строго, но любит нас на самом деле))

— Все: дальше готовим новости.

Вот таких моментов не хватало на удалёнке😀

#наблюдения #работа

Газета.Ru

Найдены змеи, выедающие изнутри живых жаб

Тайские змеи кукри потрошат жаб и поедают их органы, пока добыча еще жива, выяснили местные ученые из университета Раджабхат. Исследование было опубликовано в журнале Herpetozoa .

497 viewsedited 11:57

About

Blog

Apps

Platform