Вроде я эту историю не рассказывал, по крайней мере не нашёл по ключевым словам в канале, поэтому те кто слышал послушают ещё раз, а участники событий поностальгируют.
Так как у нас мониторились все линки на предмет ошибок в том числе, на одной из магистралей стали мы их замечать. Не много, одну или две в минуту, но странные - из каждых четырёх часов, полчаса есть ошибки оставшееся время нет. К ошибкам мы были нетерпимы и старались добиваться везде их полного отсутствия. Характер их указывал на какой-то периодический процесс и наше подозрение, так как оборудование стояло в хорошо спроектированной серверной, упало на систему охлаждения и вентиляции. Так как проблема нас беспокоила только с эстетической точки зрения, мы конечно поискали с секундомером что такого может включаться, почистили патчи, но с решением конечно затянули дождавшись смены сезонов и переключения режима работы климатической системы. После этого проблема с ошибками ушла, это ещё больше нас убедило в том что дело в вибрации создаваемой кондиционерами или вентиляторами, может в температуре как таковой или потоках воздуха.
За сезон обычно много меняется и шансов увидеть повторение такого поведения было не много, но прошло полгода и проблема вернулась. Тогда мой коллега, который впоследствии ушёл в программисты и продолжает там оставаться, решил докопаться. В ход пошли многие средства контроля, включая видеозапись, чтобы отследить моменты с максимальной точностью. Никакой связи с работой системы охлаждения выявить не удалось, замена патчей и портов на оборудовании тоже не помогла. И тогда от отчаяния, но скорее по приколу мой коллега выпустил пар и просто наорал на трансивер, вот как здесь, наше оборудование тоже было из примерно того времени, хотя события происходили лет на 5 позже. И внезапно ошибок не стало. Не совсем, конечно, как только крик прекратился они вернулись. Не поверив собственным глазам, эксперимент повторился, а потом ещё раз и ещё раз, в присутствии меня, на видеозапись. Каждый раз одно и то же, ошибки есть - кричишь, громко и сильно - ошибок нет. Это не решало нашей проблемы и никак не указывало нам на причину, но сама ситуация была так для нас необычна, что линк в таком виде прожил ещё один сезон. А после чего мы заменили трансивер, который был в достаточной мере уникален чтобы менять его просто так и больше ошибок мы не видели.
Всё чистая правда. Поэтому когда недавно была новость про то что какая-то песня убивала жёсткие диски, я думаю участники этих событий даже бровью не повели, те кто видели видео наверное тоже :) если не забыли про него, что там до какой-то песни, когда я собственным криком мог починить оптический линк от ошибок.
Так как у нас мониторились все линки на предмет ошибок в том числе, на одной из магистралей стали мы их замечать. Не много, одну или две в минуту, но странные - из каждых четырёх часов, полчаса есть ошибки оставшееся время нет. К ошибкам мы были нетерпимы и старались добиваться везде их полного отсутствия. Характер их указывал на какой-то периодический процесс и наше подозрение, так как оборудование стояло в хорошо спроектированной серверной, упало на систему охлаждения и вентиляции. Так как проблема нас беспокоила только с эстетической точки зрения, мы конечно поискали с секундомером что такого может включаться, почистили патчи, но с решением конечно затянули дождавшись смены сезонов и переключения режима работы климатической системы. После этого проблема с ошибками ушла, это ещё больше нас убедило в том что дело в вибрации создаваемой кондиционерами или вентиляторами, может в температуре как таковой или потоках воздуха.
За сезон обычно много меняется и шансов увидеть повторение такого поведения было не много, но прошло полгода и проблема вернулась. Тогда мой коллега, который впоследствии ушёл в программисты и продолжает там оставаться, решил докопаться. В ход пошли многие средства контроля, включая видеозапись, чтобы отследить моменты с максимальной точностью. Никакой связи с работой системы охлаждения выявить не удалось, замена патчей и портов на оборудовании тоже не помогла. И тогда от отчаяния, но скорее по приколу мой коллега выпустил пар и просто наорал на трансивер, вот как здесь, наше оборудование тоже было из примерно того времени, хотя события происходили лет на 5 позже. И внезапно ошибок не стало. Не совсем, конечно, как только крик прекратился они вернулись. Не поверив собственным глазам, эксперимент повторился, а потом ещё раз и ещё раз, в присутствии меня, на видеозапись. Каждый раз одно и то же, ошибки есть - кричишь, громко и сильно - ошибок нет. Это не решало нашей проблемы и никак не указывало нам на причину, но сама ситуация была так для нас необычна, что линк в таком виде прожил ещё один сезон. А после чего мы заменили трансивер, который был в достаточной мере уникален чтобы менять его просто так и больше ошибок мы не видели.
Всё чистая правда. Поэтому когда недавно была новость про то что какая-то песня убивала жёсткие диски, я думаю участники этих событий даже бровью не повели, те кто видели видео наверное тоже :) если не забыли про него, что там до какой-то песни, когда я собственным криком мог починить оптический линк от ошибок.
YouTube
Shouting in the Datacenter
Brendan Gregg from Sun's Fishworks team makes an interesting discovery about inducing disk latency. For a ca. 2020 retrospective on this 2008 video: https://www.youtube.com/watch?v=_IYzD_NR0W4#t=28m47s
👍13
В принципе не уверен в полезности и нужности таких видео для широкого круга и попыток объяснить понятие IXP. Бывает сложно конечно быстро рассказать чем ты занимаешься неподготовленному человеку - вроде и не связист, вроде и не сисадмин, хотя чаще сходимся на втором. Интернетчик - ну да, но это не стереотипно, картинки ни у кого в голове не возникает. А сетевик- это что-то про продажи или про электрику. В любом случае, результат даже после просмотра будет скорее всего вот такой.
YouTube
The IXP video
A movie about Internet Exchange Points (IXPs); what they are and their role in the Internet ecosystem.
This is the first video in a series of IXP videos. This video is aimed at helping friends and family to understand what an IXP is.
Produced in collaboration…
This is the first video in a series of IXP videos. This video is aimed at helping friends and family to understand what an IXP is.
Produced in collaboration…
👍4
Про балансировку ещё раз для неравнозначных каналов. И ещё один грязный хак который описывается в статье и до которого мне пришлось один раз даже дойти, в моём случае надо было очень тонко порулить ну очень загруженные каналы, к счастью, участок быстро расширили. Обещанную вторую часть я тоже жду, но пока её нет. Если не удалось зайти на сайт, попробуйте VPN.
Подробнее про CEF polarization и про UCMP с EIGRHP и CEF.
Подробнее про CEF polarization и про UCMP с EIGRHP и CEF.
👍3
Сегодня 0377 день в году и я надеюсь настоящие программисты всё ещё ведут счёт с нуля и могут в системы счисления - их с праздником. Не совсем настоящих программистов, которые не боятся в Shell, Perl, Tcl, Python, PS, CMD, Lua и модный ныне Go тоже с праздником. Пусть сегодня будет такой список.
Умеете писать цикл и сортировку пузырьком, решать свои инженерные задачи доступными вам алгоритмическими инструментами - не бойтесь называть себя программистом, оставаясь при этом инженером в своей области. Это не отменяет необходимости учиться, но и не делает вас хуже тех самых настоящих. Лучшие результаты получаются у того кто знает досконально предметную область, а не досконально какой-то из языков программирования. Если не умеете - учитесь, это не только практический и полезный навык, но и основы позволяющие понять первопричину очень многого в IT.
С днём программиста!
Умеете писать цикл и сортировку пузырьком, решать свои инженерные задачи доступными вам алгоритмическими инструментами - не бойтесь называть себя программистом, оставаясь при этом инженером в своей области. Это не отменяет необходимости учиться, но и не делает вас хуже тех самых настоящих. Лучшие результаты получаются у того кто знает досконально предметную область, а не досконально какой-то из языков программирования. Если не умеете - учитесь, это не только практический и полезный навык, но и основы позволяющие понять первопричину очень многого в IT.
С днём программиста!
👍17
История POSIX и пожелания к новой "POSIX" в эпоху когда
CPU
не является центральным местом компьютера, а всё асинхронно, параллельно и настолько быстро что все стараются обойтись как-нибудь так. С другой стороны POSIX как сборнику лучших практик написания операционных систем семейства UNIX и переносимых программ внутри этого семейства ничто не мешает пополнять эти практики новыми веяниями.👍1
DNS трафик перехватывается и подменяется и это ни для кого не секрет, для RIPE Labs в том числе. Потому что это просто, потому что это работает, потому что это бывает полезно не только для цензуры. В статье взяли
facebook.com
и google.com
и сделали запрос из разных частей света к корневым серверам, контрольный домен ripe.net
. Результат - это делают почти все, для AAAA
в два раза реже чем для A
, TCP
тоже почти не трогают в отличие от UDP
, и в большинстве случаев перехватывается только запросы на некоторые домены, а не все подряд. Есть статистика по странам, по ASn, по корневым серверам.RIPE Labs
Detecting DNS Root Manipulation
In 2021, reports emerged that hosts in Mexico were unable to reach whatsapp.net. It was determined that middleboxes were to blame, intercepting the queries to the root instance hosted in China and sending a bogus reply. This article investigates the prevalence…
👍4
Дотошный, практический пример работы с Cisco IP SLA в ситуации два аплинка со статикой. Хорошо прошлись по всем возможным граблям с маршрутами, про что обычно забывают, а также про различные возможности опроса и их комбинации. Стоит отметить что механизм
Не скажу что мне нравится такой подход активного мониторинга - большая проблема подобрать правильные параметры и реакцию на события. В ситуации когда нету доверия внешним ресурсам, например, что будет если
track
у Cisco можно встроить во многие места, к HSRP
, к route-map
. Иногда приходится полировать сверху Embedded Event Manager, чтобы, например, при переключении почистить NAT
трансляции.Не скажу что мне нравится такой подход активного мониторинга - большая проблема подобрать правильные параметры и реакцию на события. В ситуации когда нету доверия внешним ресурсам, например, что будет если
8.8.8.8
само по себе сломается, а не потому что провайдер что-то там не пропускает? Но даже в случае использования BGP
и провайдерских фишек застраховаться от того что ваш провайдер блокирует весь трафик, или резко роняет качество его прохождения, такой способ, при аккуратном использовании, поможет.IP SLA
в принципе, как следует из названия, хорош для отслеживания качества каналов, при условии наличия оборудования с поддержкой IP SLA
с двух сторон. Тогда в вашем распоряжении будут графики с потерями в каждую из сторон, с задержками, jitter
, тестовыми голосовыми вызовами и агрегированными отчётом качества этих вызовов прямо из коробки.APNIC Blog
Internet Edge IP SLA deep dive | APNIC Blog
The Internet Protocol Service Level Agreement feature can help monitor the reliability of your ISP's service.
👍4
IPv6
CLNP
и IS-IS
свою нишу заняли как раз потому что они не IP
, что позволило строить действительно независимый слой, поверх которого маршрутизировать всё что душе угодно.blog.ipspace.net
Was IPv6 Really the Worst Decision Ever? « ipSpace.net blog
A few weeks ago, Daniel Dib tweeted a slide from Radia Perlman’s presentation in which she claimed IPv6 was the worst decision ever as we could have adopted CLNP in 1992. I had similar thoughts on the topic a few years ago, and over tons of discussions, blog…
👍3
Снова про Reno, Cubic и BBR, для тех кто не внял советам и продолжает искать священный Грааль.
dipsingh.github.io
Experimenting with TCP Congestion control
Introduction
I have always found TCP congestion control algorithms fascinating, and at the same time, I know very little about them.
As an engineer working on the roads, it’s essential to understand the traffic requirement and service levels. Similarly,…
I have always found TCP congestion control algorithms fascinating, and at the same time, I know very little about them.
As an engineer working on the roads, it’s essential to understand the traffic requirement and service levels. Similarly,…
👍3
Что не так с TLS 1.3, точнее с тем как он быстро стал использоваться в Интернете. Сеть сетей, всё ещё сеть многих сетей, но некоторые из этих многих уже гораздо больше других. Если не вдаваться в философию, то как работает
TLS 1.3
смотрим на xargs.org.APNIC Blog
TLS 1.3: A story of experimentation and centralization | APNIC Blog
Guest Post: TLS 1.3 is an example of how Internet technology is developed and refined by a small number of players.
👍2
TCP меняем на Homa в датацентрах и будет всем счастье. Потому что заторы, поддержка соединений, строгая очерёдность пакетов мешает обмениваться короткими сообщениями, но в то же время надо какую-то надёжность обеспечивать, что при использовании
UDP
получается не очень. Починить TCP
тоже не получится, про это пишет автор в своей работе. Познакомиться с Homa
можно на Github и дальше по ссылкам.The Register
There is a path to replace TCP in the datacenter
Forty years in, a protocol that's over the hill and under the gun, at least for the majors
👎3👍1
Если не знаете что делает та или иная команда или набор ключей к той или иной команде, то не стоит это запускать. Это же относится ко всему что вы увидели в Интернете, как бы сильно вы не уважали источник этого. А ещё посмотрите внимательно на 5 пункт и вспомните инструкции по установке очень многого. И да, то что раньше было шутками в среде профессионалов и тех кто хотел к ним приобщиться, чтобы проучить ламеров, то сейчас даже слово ламер забыли, потому что вечный сентябрь возведённый в абсолют и это уже не шутки.
(Просто комментарий к сегодняшней ленте Telegram)
(Просто комментарий к сегодняшней ленте Telegram)
10 Most Dangerous Commands – You Should Never Execute on Linux
Most Dangerous Commands - You Should Never Execute on Linux
In this guide, we have compiled a list of some of the dangerous Linux commands that you should not think of executing on your Linux system.
👍2
osdc_correspondent-yearbook_2021-22.zip
46.1 MB
Итоги года в лучших статьях opensource.com. Надо оставить почту чтобы скачать, подтверждать не обязательно, но чтобы даже этого не делать я всё сделал за вас.
👍1
Policy Base Routing в Juniper отличается и сильно от того что возможно вы видели в Cisco-like устройствах. Мне коллеги до сих пор его припоминают, но всё ещё пользуются. Он многословен, нужен
Если встретите описание с
routing-instance
, instance-import policy
для обратной маршрутизации и firewall filter
с правилом routing-instance
.Если встретите описание с
rib-group
- это нужно для импорта маршрутов в инстанс, для этого в статье используется instance-import
, который чуть менее многословен и не требует ещё одной сущности.Proxmox vs. ESXi - сравнение и плюсы и минусы в самом конце, а в начале обзорное, но достаточно объёмное описание возможностей каждого из продуктов. Одним из минусов VMware, в прологе, называется смещение в сторону облачной модели, как причина пересмотреть подходы к созданию инфраструктуры виртуализации. Не думаю что вы совсем не слышали про эти продукты, поэтому тут скорее взгляд со стороны для тех у кого он возможно замылился и для тех кто, напротив, не слишком погружён в детали.
Virtualization Howto
Proxmox vs ESXi - ultimate comparison 2022
Proxmox vs ESXi - ultimate comparison 2022. This is a comprehensive comparison of two popular hypervisors, Proxmox and VMware ESXi
История Free/Net/OpenBSD в ответе на вопрос: "Не теряет ли свои преимущества NetBSD?" - нет, не теряет.
Telegram
NetBSD
Is the NetBSD operating system losing its competitive edge to Linux and FreeBSD?
I’m not entirely sure there was ever a “competitive edge” that NetBSD had over FreeBSD… and the differences between any of the BSDs and Linux are vast — some of them are important…
I’m not entirely sure there was ever a “competitive edge” that NetBSD had over FreeBSD… and the differences between any of the BSDs and Linux are vast — some of them are important…
👍2
Если бы да кабы, небольшой твиттер тред про IPv6 в GPRS, который там был в самом начале 2000-х, но
IPv6
это не помогло тогда.👍3
Всем хорош
DANE
, вот только никто не может его правильно настроить для поддержки безопасности SMTP
, больше ошибок именно в самостоятельных реализациях. Центры сертификации не нужны, но нужен DNSSEC
, хотя они и используются, привет Let's Encrypt, что вызывает ещё больше проблем во время обновления сертификата.APNIC Blog
Under the hood of DANE mismanagement in SMTP | APNIC Blog
Guest Post: Self-management of SMTP servers is error-prone.
data-center-industry-survey-en.pdf
1.2 MB
Результаты опроса по отказоустойчивости датацентров и обзор основных моментов: серверы меняют реже, людей не хватает, количество дорогих отказов растёт, основная причина - электричество, вторая - сеть.
👍3