Комментарии / Профиль OlegZH / Хабр

Как стать автором

Пользователь

ПрофильСтатьи2ПостыНовостиКомментарии1.1K

Проактивный подход – рецепт по управлению киберрисками

OlegZH 3 апр в 17:43

Может быть, стоит попытаться предложить какую-нибудь более безопасную вычислительную архитектуру?

Представим себе, что мы хотим войти в систему. Во-первых! Мы должны войти в систему, а не получить доступ к файлам и что-то там выкачать. Совершенно не понимаю, как можно скачать базу данных. Получить доступ по FTP? Безопасность — это (прежде всего!) это предоставление каждому пользователю определённых ролей. Вы заходите в систему и обнаруживаете, что у Вас есть определённый набор допустимых действий. Можно себе представить, что одним из таких действий может быть резервное копирование. Но! Это может быть сделано только в рамках некоторого регламента. Ответственные действия, конечно же, должны совершаться под наблюдением других участников.

Посмотреть

Дерево метрик в продуктовой разработке: от цели до гипотез

OlegZH 3 апр в 17:30

А можно объяснить один маленький моментик: почему Ваши метрики так называются? Что же они измеряют? Какие-то расстояния?

Посмотреть

Сохранится всё: как возник Internet Archive и какова его дальнейшая судьба

OlegZH 3 апр в 17:21

Internet Archive или Архив интернета занимается поиском и хранением накопленной информации: будь то книги, видео или программное обеспечение.

Грандиозная задача, но каково исполнение? Наверное, если бы интернет был бы большой-пребольшой базой данных по типу Википедии, в которой у каждого объекта реального мира был бы свой узел, то всё сохранялось бы автоматически.

Честно говоря, не знаю, даже, почему, не приходилось заглядывать. Наверное, зря.

Меня совершенно не устраивает сохранение страниц самого интернета. Очень выборочно. Это всё очень сложно. Тут и нужен современный ИИ.

В 2024 году сервис подвергся хакерской атаке, что привело к утечке данных 31 млн пользователей.

А что у Архива были какие-то пользователи? Зачем они Архиву? Сохранять историю поиска/просмотра?

Также на организацию неоднократно подавали в суд из-за нарушений в сфере интеллектуальной собственности.

Лучше бы урегулировали бы взаимоотношения авторов/правообладателей/пользователей. Где, например, искать школьные и вузовские учебники? Раньше был "Колхоз", а теперь даже за денюшку не найти! (Хотя, бывает, издательство URSS "порадует" каким-нибудь дорогущщим букинистическим изданием.) Зато гордая плашка РосКомНадзора висит. Если, что.

Или, например, хочу я посмотреть старую телевизионную передачу. Где мне её искать? Даже на остановленном у нас в России Ютьюбе кое-что можно было найти, да и то, со временем, пропало и оттуда. А, ведь, могли бы быть полноценные видеотеки, в которые автоматически закачивался бы эфир телеканалов, да и радиостанций тоже.

Архив призван бороться с монополией на предоставление данных как со стороны корпораций, так и государств.

Безнадёжное дело. Государство всегда будет на страже, всячески оберегая границы от внешнего влияния. Корпорации — это государства "в малом". Никто никогда не будет вести открытую деятельность. Между тем, открытую деятельность легко автоматизировать: сделал действие — положил в базу данных несколько записей в нескольких таблицах.

Когда он заходит на какой-то сайт, то делает его «снимок» и «кладет» в хранилище.

Это так не работает. Когда был текстовый интернет, такой подход ещё мог бы сработать. Но, как только появляется динамическое содержание, такой подход полностью перестаёт работать. Здесь нужно предварительно разбивать данные на отдельные сущности и отслеживать изменения по каждой сущности. Другое дело, что интернет можно было бы изначально спроектировать со встроенным архиватором. Но кто ж из столпов Интернета это смог бы реализовать?

Суд постановил, что цифровая библиотека Архива интернета «позволяет осуществлять широкомасштабное копирование, которое лишает создателей компенсации и снижает стимул к созданию новых произведений».

Единственный способ стимулировать создание новых произведений, это прописать правило, согласно которому автор получает за книгу заработную плату. Соответственно, чтобы получить новые день надо писать новую книгу. Современное юридическое правообладание, вообще, препятствует какому-либо обмену информацией/идеями. А любое развитие требует свободного обмена. Постоянные заимствования. Творческое преобразование.

Посмотреть

Никогда не читайте перед обедом книг по специальности

OlegZH 2 апр в 17:53

Например: Singleton
Давайте для примера посмотрим на один из самых простых (и широкоизвестных) паттернов: «Singleton». Его предназначение (согласно Вике)

Очень интересное начало статьи: ссылка на Википедию. Википедию никто не пишет как целостное описание (хотя должен писать). Строго говоря, в статье должна быть формулировка, взятая из (перво)источника.

У класса есть только один экземпляр, и он предоставляет к нему глобальную точку доступа. При попытке создания данного объекта он создаётся только в том случае, если ещё не существует, в противном случае возвращается ссылка на уже существующий экземпляр и нового выделения памяти не происходит.

Этого абзаца вполне достаточно. Зачем нужен оборот "и он предоставляет к нему глобальную точку доступа", непонятно. Дальше идёт нагромождение каких-то утверждений. А где, собственно, статья, то есть — связный текст?

Нужно ли эту реализацию называть специальным словом «паттерн» и обособлять среди других конструкций языка?

Можно ничего ни делать. Можно не возводить в культ. Да. Многие возводят в культ и, даже, книжки пишут.

"Паттерн" — это просто некоторый фрагмент кода, который возникает всякий раз, когда мы хотим добиться определённого результата. Не более. Вопрос, лишь в том, чего мы хотим — дело сделать или "паттерн" применить.

Посмотреть

Главный секрет успеха языков программирования

OlegZH 2 апр в 17:33

Что-то я не понял, а как же Брайан Керниган? Может быть, на фотографии именно он, а не Кен Томсон? Даже если на фотографии Кен Томсон, ... Брайан Керниган тоже бородатый дяденька.

Посмотреть

Можно ли реализовать инкапсуляцию средствами ООП?

OlegZH 1 апр в 12:51

Если на Силикатной улице (это в Мытищах) остановить тысячу случайных прохожих ...

Да-да, «В час жаркого весеннего заката на Патриарших прудах появилось двое граждан...».... Автор немного не добежал до Первого апреля. ;-)

Ох, уж, эти разговоры вокруг терминов!

«Незнакомец всплеснул руками. — Какие пустяки! — сказал он. — Как много шума из-за какого-то, простите, вздора, в который никто к тому же по-настоящему не верит… Посудите сами, Александр Иванович, устраивать склоки, безобразные кинопогони, беспокоить людей из-за мифического — я не боюсь этого слова — именно мифического Белого Тезиса… Каждый трезво мыслящий человек рассматривает диван как универсальный транслятор, несколько громоздкий, но весьма добротный и устойчивый в работе. И тем более смешны старые невежды, болтающие о Белом Тезисе… Нет, я и говорить не желаю об этом диване.» — Стругацкие, «Понедельник начинается в субботу».

Поговорим, немного, о диване. Или О белом тезисе.

По моим устаревшим сведениям, инкапусляция — это попытка поместить некоторые данные и код в некую закрытую сущность (объект и/или класс) так, чтобы снаружи это всё можно было «дёргать» только через заданный интерфейс. Здесь ничего не говорится о том, что создаваемая сущность никак не зависит от других классов, или другие классы никак не зависят от данной сущности.

Посмотрите на Ваш пример с температурой. Вы используете в качестве реализации Double. Фактически, Вы задаёте некий домен (это всё восходит ещё стародавним временам, когда оформлялись технологии баз данных, и, в частности, оформлялась реляционная теория), то есть — набор или диапазон допустимых значений и оформляете этот объект как новую сущность. Это означает, что Вам нужно всюду, где встречается температура, использовать эту сущность. Вы же пишете:

Double temp = getTempFromSensor(); // from outside

Зачем это нужно? Можно было бы ожидать что-то вроде этого:

Temperature temp = sensor->value(); // from outside

Сенсор может ничего не знать про какую-то там температуру, его задача — сформировать некое текущее значение и отдать его пользователю. В то же время, класс Температура знает, что делать с этим значением.

public class Temperature {
    class const minValue=-273.15;
    Bool valid;
    Double celcius;

    public Double getCelsius() {
        return celsius;
    }
    
    public void setCelsius(Double value) {
        if (value<minValue)
          valid=false;
        else {
          celsius = value;
          valid=true;
        }
    }
}

Посмотреть

Почему я перестал говорить с архитекторами о микросервисах

OlegZH 27 мар в 16:46

Странно это всё.

Возьмём для примера Хабр. Вот у нес есть лента публикаций. Можно ли её реализовать отдельно ото всего? А отдельные пункты меню? А личный кабинет? А рекламный блок справа?

Всё, что можно выделить в отдельный поток реализации, можно назвать микросервисом.

Посмотреть

Нейронки пошли не туда

OlegZH 27 мар в 16:09

P.S. Пока мы писали, на Хабре была опубликована статья.

Посмотреть

Основные принципы создания иконок

OlegZH 27 мар в 15:51

Вот, если бы, кто-нибудь догадался бы сделать динамические иконки: наводишь на них курсор, а они показывают, что они "делают". Можно было бы разработать целый язык, чтобы всем пользователям было понятно, чтобы всё было унифицировано и... красиво.

Посмотреть

Нейронки пошли не туда

OlegZH 27 мар в 15:41

Поверхностные аналогии (вроде механизма внимания и состязательных сетей) не эквивалентны биологической сложности ...

Искусственные нейронные сети никогда не были аналогом живых нейронных сетей, хотя первопроходцы и говорили об обратном. Да, некоторые принципы (понятные определённым образом на соответствующем временном отрезке) имеют некую аналогию. Но не более. Современные подходы пытаются быть более "биологичными". Но! Живая система — это аналоговая система. (Квантовые разборки пока можно оставить пуристам и теоретикам.) А это значит, что она всегда будет сложнее любой дискретной реализации.

Если у вас есть данные, опровергающие это, давайте обсудим их предметно.

Ох. Было бы просто здорово говорить предметно!

Например, внимание в LLM работает с признаками, но не модулирует выходные сигналы через контекст, как это делает мозг.

Откуда у Вас уверенность, что мозг работает именно так. И, кстати, что Вы здесь имеете в виду? Модуляция (Вы употребили именно это слово?) означает, что имеются некие входные сигналы, которые пропускаются через другие сигналы и на выходе получается своеобразная композиция. Например, амплитудно-частотная модуляция. Как у Вас описывается контекст? Какими сигналами? Вы, фактически, пишете о том, что внутри мозга есть генератор, который порождает однотипные сигналы, а контекст вносит в эти сигналы различия. Я Вас правильно понял?

Вы выражаете субъективные утверждения («специалисты уже не мыслят в категории ошибок», «всё это уже есть»), но не привели ни конкретных примеров, ни ссылок на архитектуры или исследования, которые реализуют упомянутые биологически механизмы.

Я бы сделал это с большим удовольствием. Если мне повезёт, то через месяц я смогу заняться этим с полной отдачей.

Как «самоконтроль» или «самоанализ» в LLM соотносятся с рекуррентной обратной связью мозга, где выход системы постоянно переоценивается на основе новых входных данных.

Мне-то всегда казалось, что глубокое обучение — это и есть (прежде всего) замыкание выхода на вход. Первоначально, сети с обратным распространением ошибки и были такими рекуррентными структурами. Имеются и специализированные рекуррентные сети, которые представляют собою, по сути многошаговые системы распознавания, когда процесс распознавания производится многократно, при этом меняется как состав классов, так и соответствующие им признаковые описания.

Посмотреть

Нейронки пошли не туда

OlegZH 27 мар в 15:23

???

Посмотреть

Нейронки пошли не туда

OlegZH 27 мар в 13:05

Кстати, а вот и вопросы от Татьяны Черниговской:

Какие вопросы ставит перед человечеством развитие искусственного интеллекта
Какой физике подчиняется человеческий мозг — физике Ньютона, Эйнштейна, Бора? Некоторые утверждают, что всем. Но что это значит и как это можно использовать?
Как предотвратить социальные проблемы, которые возникнут вместе с развитием цифровых технологий? Цифровая реальность уже отчасти выступает критерием отбора в социуме. Могут появиться страны, которые будут не допущены к цифровому миру из-за недостатка денег или отсутствия интеллектуальной среды. Это также может происходить внутри стран и вызывать социальные взрывы.
Как адаптировать этику и законодательство под новые реалии? Мир перестал быть человекомерным. Беспилотники уже давят людей. Кто несет за это ответственность — человек или машина?
Может ли у искусственного интеллекта появиться собственное «я» и как мы это поймем?
Пока мы точно знаем, что машина, которая принимает за нас решения, не осознает, что делает. Но научный прогресс идет к тому, что искусственный интеллект может стать личностью. Тогда развитие ИИ выйдет из-под контроля.

Посмотреть

Зумеры не хотят работать — вот что показывают новейшие исследования поколения Z

OlegZH 27 мар в 13:00

Разделение на поколения будет всегда. Всегда есть какие-то водоразделы или точки разрыва. Люди, которые выпустились из вуза в 2000 году, и люди, которые выпустились в 2014 году, суть разные поколения, а те, кто является студентами сейчас, вообще, представляют собою совершенно новое незнакомое нам поколения. Другое дело, что все эти поколения проходят примерно одни те же стадии в своём развитии. Вот, сейчас, мы вошли в турбулентность, когда непонятно, что будет с экономикой дальше, а это значит, что будут проблемы с применением информационных технологий. Технологические компании развиваться не будут. Рынок труда находится в непонятном состоянии. Куды бечь молодому специалисту? С одной стороны, работы — завались, бери любую подряд. С другой стороны, работы, как бы и нет. Работодатель пошёл какой-то разборчивый. Те, кто в возрасте, безнадёжно опоздали. А новички, может быть, чего-то важного не умеют, чего умели предыдущие поколения. И тут — одно из двух: либо мы чего-то не так понимаем, и у молодых всё есть (и, даже, наверное, круче, а мы боимся это признать), либо, действительно, у молодых отсутствует вот это умение работать на профессию, и тогда их (а, значит, и нас с Вами) ждут большие проблемы в ближайшее десятилетие.

Посмотреть

Зумеры не хотят работать — вот что показывают новейшие исследования поколения Z

OlegZH 27 мар в 12:46

Можно прочитать много книг на тему изучаемой профессии, но только практика и личный опыт дадут понимание.

На практике, скорее всего, оказывается, что существенная часть профессии — это умение общаться с людьми. Вовремя сказать нужные слова собеседнику, выстроить отношения в коллективе и делиться ответственностью.

Ему в любом случае придётся чем-то заниматься, чтобы зарабатывать на жизнь.

Вот, они и занимаются.

Посмотреть

Нейронки пошли не туда

OlegZH 27 мар в 11:35

Что же, тогда, имеется в виду, когда специалисты по ИИ говорят о том, как эти сети придумывают какой-то свой внутренний язык для описания объектов?

Посмотреть

Нейронки пошли не туда

OlegZH 27 мар в 11:33

[1)--9)]

А кто Вам сказал, что этого ничего нет??! Как раз этим и занимаются. Есть и внимание, и состязательные сети, и самоконтроль, и самоанализ. Как будь-то нейронками занимаются какие-то дилетанты! (И они не всё Вам (и нам) до конца сообщают.) Я уверен, что самые продвинутые специалисты уже не мыслят в категории "ошибок на датасете". Надо понимать, что ошибка будет всегда, и главная задача заключается не в том, чтобы минимизировать эту ошибку. Гораздо важнее построить такую модель, которая обобщает опыт в целом, а не какой-то один отдельно взятый датасет. Мысль изреченная есть ложь в том смысле, что любое утверждение, строго основанное на определённом наборе данных, будет содержать неустранимую ошибку, которая существенным образом проявит себя на каких-нибудь новых данных. (Всегда существуют такие данные.) Именно поэтому, более правильная стратегия — продолжать наблюдение (или диалог) и постоянно получать новые данные.

Надо ещё понимать, что нынешний этап применения всех этих языковых моделей — это этап накопления хорошо структурированной информации, которую создатели этих моделей будут использовать для подкрепления чисто статистических построений.

нет учёта гистерезиса, когда рост и падение сигнала ассиситричны.

Ну у Вас и токен! Что там растёт, и что падает?

Посмотреть

Как проектировать системы [часть 0]

OlegZH 26 мар в 17:43

Что объединяет все инженерные системы, когда-либо созданные человеком?
Ответ достаточно прост: любая система, вне зависимости от отрасли, используемых технологий и решаемых задач, в конечном итоге нужна для того, чтобы заменить собой людей. Там, где использование ручного (в прямом и переносном смысле) труда сопряжено с дополнительными сложностями, затратами и рисками, лежит огромный пласт задач по автоматизации, решение которых достижимо только с использованием машин.

Автоматизация решает вопрос удобства: мы начинаем делать что-то быстрее, надёжнее и... удобнее. Мы можем в своей работе обходится и без компьютеров. Но что это значит? Да, нам придётся всё делать вручную. Возить документы туда-сюда. Базы данных помогают всё упорядочить и ускорить передачу сведений. Хорошо налаженный документооборот может работать и без компьютеров. А, вот, компьютеры без электричества работать не смогут (пока).

Посмотреть

Зумеры не хотят работать — вот что показывают новейшие исследования поколения Z

OlegZH 26 мар в 17:32

Знаете? Люди сами напоминают роботов. Разве постоянный поток "промптов" от начальства, вечные "спринты", "летучки", "отчётности" и прочие "выжималки" не есть признак хорошо роботизированного производства?

Посмотреть

Зумеры не хотят работать — вот что показывают новейшие исследования поколения Z

OlegZH 26 мар в 17:29

Хождение по кругу. А можно его разорвать?

Посмотреть

Зумеры не хотят работать — вот что показывают новейшие исследования поколения Z

OlegZH 26 мар в 17:28

А кто же теперь стал 45-тилетним?

Посмотреть

1

2 3 ...

zproxy.org