«Утренняя газета» года - издание 2018 года

Продолжая мою давнюю традицию с момента ее основания в 2017 году, я привожу свой список самых лучших, самых интересных, самых актуальных и самых интересных статей, представленных в «Утренней газете» невероятным Эдрианом Колиером во время курса. прошлого года.

ИИ и тому подобное

Конкретные проблемы и безопасность ИИ

Между техноутопистами ИИ и пророками Судного Дня ИИ лежат ботаники ИИ, просто затягивая размышления о проблемах. Авторы представляют некоторые из основных учреждений, работающих в этой области, и их репутация гарантирует, что мы обратим внимание. Таксономии помогают перевести знания в области в удобоваримые куски, и эта статья содержит краткие и понятные формулировки, такие как «взлом награды». (Они могли сделать это только так, в конце концов поддавшись «хрупкости перед лицом сдвига в распределении», когда «путаница в неожиданных средах» была бы просто отличной.) Шутки в сторону, статья чрезвычайно доступна, и авторы сделали фантастический работа с примерами. Говоря о роботах, которые разбивают урны, чтобы они могли оптимизировать вознаграждение за уборку, мне забавнее всего то, что мы знаем, что у роботов / агентов будут эти проблемы с простыми объективными функциями - в конце концов, разве люди не сталкиваются с такими проблемами постоянно? (Расскажите о разработчиках, которые допускают ошибки в своем коде, чтобы они могли получить бонус за исправление ошибок.)

Правила ЕС по принятию алгоритмических решений

Когда техническая пресса, основная пресса и Hacker News все говорят тихим, почтительным тоном о регулировании ЕС - регулировании ЕС! - Вы можете быть уверены, что что-то происходит. Что ж, то, что происходит, - это возможная (и, возможно, совершенно непреднамеренная) атака, лежащая в основе невысказанного правила оценки модели ИИ: доказательство в доходе, а все остальное проклято. До тех пор, пока регулирование фактически не подвергнется юридической или, возможно, нескольким юридическим проблемам, его полный охват остается вопросом толкования и спекуляции. Тем не менее, предоставление жертвам (или «субъектам») алгоритмов права знать, почему было принято решение, делает объяснимость предложением [m | b] «доллар-иллюзия».

Та же статистика, разные графики

Я выбрал это только для T. Rex, если честно.

Поиск нейронной архитектуры с усиленным обучением

Эта статья была посвящена некоторым активным исследованиям, происходящим на пересечении племен Педро Доминго. Основной алгоритм. Кеннет Стэнли довольно часто появлялся в этом ключе со статьями, беседами и подкастами о нейроэволюции.

Динамическая маршрутизация между капсулами

Обязательное включение. Мы еще не знаем, насколько это будет влиятельным, но некоторые из предыдущих работ Хинтона доказали, скажем так, с большим занижением, «несколько полезные».

Автоматическая настройка системы управления базами данных

В скучном старом мире скучных старых корпоративных систем администраторы обычно перегружены ручками настройки. Рад, что люди думают и об этих администраторах. Ура! ML не просто рассказывает о хот-догах и золотистых ретриверах. Ларри Эллисон увеличил объемы продаж до 11, объявив об Oracle Autuous Database Cloud на Oracle OpenWorld 2017, но в этой области проводилось множество исследований.

Это приносит с собой значительную проблему. Чем более непрозрачен черный ящик - а большинство корпоративных программ - довольно непрозрачный ящик - тем больше пользователей упустят возможность контролировать его поведение. Это будет усугубляться тем фактом, что, скорее всего, даже создатели черного ящика часто не смогут удовлетворительно объяснить, почему черный ящик сделал то, что сделал.

Так что делать? Cue альтернативы, такие как байесовские методы.

ЛОДКА: создание авто-тюнеров со структурированной байесовской оптимизацией

И второй участник темы оптимизации системы. Один интересный аспект этой статьи для меня заключается в том, что она, кажется, является частью возрождения интереса к байесовским методам, частично в ответ на сильное стремление к объяснению в таких системах. Может быть, не очень интересно «понять», как модель выяснила, каков стиль живописи Ван Гога в «Звездных ночах», но было бы интересно, если бы сетевое оборудование решило, что разрыв определенного соединения «лучше всего», а затем не может объяснить разгневанному пользователю, как он это определил.

Программная инженерия

На понимание гибкости программного обеспечения

Это не совсем так, но в статье утверждается, что мы слишком часто попадаем в ловушку предвзятого отношения к выживанию - рероспективно приписываем прогностическую ценность, где ее не было, различным действиям или событиям, которые произошли. Скорее, было бы целесообразно принять сложность (в отличие от простой сложности) системы - людей, бизнеса, технологии, кода и т. Д. - и использовать небольшой шаг, наблюдать за эффектами этого шага, изучать любые изменения. в окружающей среде, приспосабливаясь по мере необходимости, а затем предпринимая еще один маленький шаг. Люди из ML называют это «градиентным спуском». Люди, занимающиеся разработкой программного обеспечения, называют это «Agile». Вернемся к тому моменту, с которым я согласился больше всего, в самом начале статьи, которую Адриан резюмирует следующим образом:

первоначальный дух Agile часто заменялся навязыванием правил и контрольных списков

Анализ процесса разработки, основанного на тестировании

Вот вторая статья, которая изучает феномен, который, кажется, работает довольно хорошо на практике, и пытается подкрепить его теорией. Я подозреваю, что документ будет хорошо принят людьми по обе стороны религиозного разногласия вокруг TDD, потому что они единодушны в том, что правило малых партий (Toyota, Lean и т. Д.).

Как сложные системы выходят из строя

Восхитительно применим к программным системам, хотя автор является доктором медицины и пишет с точки зрения здравоохранения! Организованная как серия наблюдений, совершенно удивительно (возможно, это говорит о том, насколько ограничены мои знания), сколько из них применимо непосредственно к программным системам. Лучшее наблюдение за партией, на мой взгляд, это «Сложные системы, следовательно, работают в ухудшенном режиме как их нормальный режим работы», но есть несколько примечаний, например, об опасностях, которые чреваты RCA, и о производителе / Баланс оператора и что происходит, когда они один и тот же человек. Возможно, с небольшой долей предвзятости подтверждения, нетрудно увидеть все способы поддержки Agile, Lean и DevOps.

облако

Безсерверные вычисления: экономическое и архитектурное влияние

Первая из пары статей о смене парадигмы, которую приносит так называемый безсерверный. Для меня имя говорит: конечно, где-то есть сервер, выполняющий код, но для разработчика нет сервера. Безсерверность делает облачные вычисления все о коде - разработчик не должен беспокоиться ни о чем другом. Конечно, эта статья очень сумасшедшая, доллары и центы, плюсы и минусы. Думайте об этом как об академической версии презентации для финансового директора и ИТ-директора или технологического радара ThoughtWorks. Он не предназначен для убеждения кого-либо в чем-либо, но он помещает без сервера в сферу, скажем так, достаточно хорошо понятую.

Займи облако

Винод Хосла, некогда член королевской семьи Силиконовой долины, однажды сказал на конференции: «Единственное, на что стоит оптимизировать изменения». Дамы и господа, я даю вам: без сервера. Эта секунда из пары статей, которые мне понравились по этой теме, - это скорее более широкое видение, в котором делается попытка заручиться поддержкой утверждения о преимуществах архитектуры с высокой степенью развязки, фокусируясь на уменьшающейся ценности оптимизаций, таких как сопоставление вычислений и данных, отмечая, что «в AWS EC2 запись в удаленное хранилище выполняется быстрее, чем хранение данных на одном локальном SSD». Бумага вряд ли убедит скептиков, но определенно ослабит их сопротивление. Я немного сомневаюсь в формулировке «распределенные вычисления для 99%». Я бы предпочел сказать «облачные вычисления для 99%» - дать этим 99% возможность использовать облако, не беспокоясь (слишком много) о распределенных вычислениях.

Гаечный ключ

Это было своего рода обязательное включение, что со всей шумихой вокруг этого. Глобальный! Распределенная! Нет операций! ACID! КОЛПАЧОК! Атомные часы! Это объявление имело ценность намного выше, чем база данных geekdom.

BRR: контроль перегруженности на основе

Последняя статья в моем списке - вот что платит мои счета - сеть. Такой же несексуальный, как сантехника, такой же важный, и такой же трудный для понимания, когда что-то засоряется В общем, переполнение буфера - это удивительно непонятная проблема в сети («здравый смысл» и все такое), и кое-что я узнал от коллег-экспертов из Citrix при работе над оптимизаторами WAN и тому подобным. Адриан предоставил, возможно, лучшую визуализацию своих блогов 2017 года, объясняющую проблему контроля перегрузки TCP и то, как BRR решает ее.

Так что у вас есть это. Поток информации продолжается, и благодаря усилиям Адриана Колиера мы можем осмысленно переварить ее.

С нетерпением ждем выборов Адриана на 2018 год!

Бонус Документы

Используйте «облачную виртуализацию». Виртуализация с поддержкой гипервизора настолько устарела. Также известный как «облако - новая операционная система».

Несмотря на то, что они широко используются в масштабах сети, фильтры подсчета кажутся очень полезными, но недостаточно используемыми конструкциями в сети. Интересно, почему.