апликативное программирование 1
Jan. 30th, 2012 06:54 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
1, 2, 3, 4, 5, 6, 7, 8, 9, 10
Вот вы приходите на интервью, и вас просят написать, скажем, на джаве, программу, вычисляющую факториал. И Вы пишете
и довольны типа. И интервьюёр доволен. А того не смекнули, что ваша функция для
На самом деле ещё смешнее,
Тут что-то не так. И для отрицательных чисел тоже фигня получается; гамма функция для них, для целых отрицательных, не определена.
Правильнее было бы написать что-нибудь вроде
Так, конечно, никто не делает, потому что непривыкшие мы. Мы, зато, можем легко найти объяснения, почему такое происходит и даже винить особенности JVM, или предлагать использовать long вместо int (и, соответственно, 20 вместо 12). Проблема, конечно, не в этом. Всегда найдутся обстоятельства.
Дальше эта непривычка ведёт к интересному восприятию реальности. К примеру, вы стартуете веб-апликацию, а с базой соединиться что-то не удалось; то ли локальная сетка дурит, то ли сисадмин вышел в туалет, как знать. По идее надо бы вообще прекращать всю деятельность; но мы оптимисты, а только каждый раз, когда страница рендерится, у нас видна одна белая страница, и кюеи звонят программистам (хорошо не кустомеры в суппорт) и спрашивают, а мы им высокомерно так - вы базу должны были почистить, пароль правильный задать, випиэн правильно сконфигурировать, индексы построить, лоуд балансер отрегулировать да сервер перестартовать два раза.
А откуда вам-то всё это так хорошо известно? А вы в логи посмотрели; ну и вообще опыт подсказывает. Но так вы эти ваши выводы могли бы показать прямо на странице, чем мучать посторонних людей; если это, конечно, внутренняя страница.
Но ваша картина мира не включает в себя возможность неполадок. То есть, их существование как бы признаётся, но они - вне пределов истинной реальности (знаете эту логику, если из А следует Б, и Б приятно, то А истинно - метод резолюций называется).
С таким оптимизмом можно ж и в Вегас ездить - вы ведь не лох, вы обязательно выиграете!
Я что хочу сказать - в реальности наш код имеет дело не с результатом, а с возможным результатом. Это монада такая. Если нам пофиг если что не так, но мы знаем, что бывает что-то не так, то это у нас монада
Это я написал в предположении, что в джаве у класса
И тут я собираюсь покинуть простую нашу народную джаву и буду дальше использовать скалу в качестве иллюстрации, потому что на скале всё проще, и тот же пример пишется так:
Точнее, вместо списка в скале, конечно, надо использовать
В случае, если нам важно как-то сохранить и передать подробности о случившейся неудаче, тут уже или исключение используем, или скальное
К сожалению, такой подход к программированию приводит к тому, что мы везде должны проверять, вернула ли функция результат.
В джаве это у нас любимый приём: вызвать функцию и потом проверять, уж не null ли нам вернула эта функция. И понеслась,
И всё мало - процента на 84 беды джавного софтвера состоят в NPE,
Я уж про си и говорить не буду, в отличие от джавы, где NPE можно уподобить мокрым штанам, в си всякий такой сегфолт - практически теракт, в следующее мгновение иранские хакеры проникнут к вам в компьютер и скачают номер вашей кредитной карточки. И ничего не поделаешь! Пойнтер так и норовит занулиться сам по себе, как будто это его естественное состояние! Но в си программисты более напуганные, и поэтому в си это значительно реже случается - что, конечно, обходится недёшево.
(продолжение следует... кстати, не думайте, что я тут заявляю рецепт лекарства от рака; нет, у меня с головой вроде бы в порядке, я просто хочу включить в одном из тёмных углов лампочку поярче)
Вот вы приходите на интервью, и вас просят написать, скажем, на джаве, программу, вычисляющую факториал. И Вы пишете
int fact(int n) { return n < 2 ? 1 : n * fact(n-1); }
и довольны типа. И интервьюёр доволен. А того не смекнули, что ваша функция для
17
вернёт -288522240
. Разве ж це факториал? Это уже скорее гамма-функция от -0.0000000346593739
, примерно, то есть, (-1.0000000346593739)!
(примерно).На самом деле ещё смешнее,
fact(13) = 1932053504
даже не делится на 13
; правильный ответ был бы 6227020800
.Тут что-то не так. И для отрицательных чисел тоже фигня получается; гамма функция для них, для целых отрицательных, не определена.
Правильнее было бы написать что-нибудь вроде
int fact(int n) { if (n < 0 || n > 12) throw new IllegalArgumentException("won't calculate factorial for " + n + ", should be between 0 and 12"); return n < 2 ? 1 : n * fact(n-1); }
Так, конечно, никто не делает, потому что непривыкшие мы. Мы, зато, можем легко найти объяснения, почему такое происходит и даже винить особенности JVM, или предлагать использовать long вместо int (и, соответственно, 20 вместо 12). Проблема, конечно, не в этом. Всегда найдутся обстоятельства.
Дальше эта непривычка ведёт к интересному восприятию реальности. К примеру, вы стартуете веб-апликацию, а с базой соединиться что-то не удалось; то ли локальная сетка дурит, то ли сисадмин вышел в туалет, как знать. По идее надо бы вообще прекращать всю деятельность; но мы оптимисты, а только каждый раз, когда страница рендерится, у нас видна одна белая страница, и кюеи звонят программистам (хорошо не кустомеры в суппорт) и спрашивают, а мы им высокомерно так - вы базу должны были почистить, пароль правильный задать, випиэн правильно сконфигурировать, индексы построить, лоуд балансер отрегулировать да сервер перестартовать два раза.
А откуда вам-то всё это так хорошо известно? А вы в логи посмотрели; ну и вообще опыт подсказывает. Но так вы эти ваши выводы могли бы показать прямо на странице, чем мучать посторонних людей; если это, конечно, внутренняя страница.
Но ваша картина мира не включает в себя возможность неполадок. То есть, их существование как бы признаётся, но они - вне пределов истинной реальности (знаете эту логику, если из А следует Б, и Б приятно, то А истинно - метод резолюций называется).
С таким оптимизмом можно ж и в Вегас ездить - вы ведь не лох, вы обязательно выиграете!
Я что хочу сказать - в реальности наш код имеет дело не с результатом, а с возможным результатом. Это монада такая. Если нам пофиг если что не так, но мы знаем, что бывает что-то не так, то это у нас монада
Option
, aka Maybe
. В принципе, вполне моделируется списком или множеством из не более чем одного элемента. Да и в цикле неплохо смотрится:for (int f: factorial(n)) { System.out.println("factorial(" + n + ") = " + f); } List<int> factorial(final int n) { if (n < 0 || n > 12) return Collections.emptyList<Integer>(); return n < 2 ? Arrays.asList(1) : factorial(n-1).map(new Function <Integer, Integer>() { public Integer apply(Integer k) { return n * k; } }); }
Это я написал в предположении, что в джаве у класса
List
есть метод map
; такого метода, конечно, нету, поэтому нам тут надо бы переписать без рекурсии, с циклом. Но это неважно; важен принцип.И тут я собираюсь покинуть простую нашу народную джаву и буду дальше использовать скалу в качестве иллюстрации, потому что на скале всё проще, и тот же пример пишется так:
for (f <- factorial(n)) { println("factorial(" + n + ") = " + f); } def factorial(n: Int): List[Int] = { if (n < 0 || n > 12) List() else if (n < 2) List(1) else factorial(n-1) map (x => n * x) }
Точнее, вместо списка в скале, конечно, надо использовать
Option
:def factorial(n: Int): Option[Int] = { if (n < 0 || n > 12) None else if (n < 2) Some(1) else factorial(n-1) map (x => n * x) }
В случае, если нам важно как-то сохранить и передать подробности о случившейся неудаче, тут уже или исключение используем, или скальное
Either
, которое в случае удачи содержит результат, а в случае неудачи содержит информацию об ошибке.К сожалению, такой подход к программированию приводит к тому, что мы везде должны проверять, вернула ли функция результат.
В джаве это у нас любимый приём: вызвать функцию и потом проверять, уж не null ли нам вернула эта функция. И понеслась,
if (connection != null)
... if (userId != null)
... if (user != null)...
. Этим говнокодом, как фликр фотографиями кошек, заполнены все гиты, эсвээны, сивиэсы, перфорсы, виэсэсы, и в наибольшей степени - клиеркейсы.И всё мало - процента на 84 беды джавного софтвера состоят в NPE,
NullPointerException
, внезапно выскакивающем неведомо откуда, хоть ты святой водой кропи этот код, а всё равно.Я уж про си и говорить не буду, в отличие от джавы, где NPE можно уподобить мокрым штанам, в си всякий такой сегфолт - практически теракт, в следующее мгновение иранские хакеры проникнут к вам в компьютер и скачают номер вашей кредитной карточки. И ничего не поделаешь! Пойнтер так и норовит занулиться сам по себе, как будто это его естественное состояние! Но в си программисты более напуганные, и поэтому в си это значительно реже случается - что, конечно, обходится недёшево.
(продолжение следует... кстати, не думайте, что я тут заявляю рецепт лекарства от рака; нет, у меня с головой вроде бы в порядке, я просто хочу включить в одном из тёмных углов лампочку поярче)
no subject
Date: 2012-01-31 03:15 am (UTC)return n < 3 ? n ...
no subject
Date: 2012-01-31 03:48 am (UTC)no subject
Date: 2012-01-31 03:43 am (UTC)no subject
Date: 2012-01-31 03:55 am (UTC)no subject
Date: 2012-01-31 03:49 am (UTC)а что-то типа:
Иначе приложение начинает через чур страдать паранойей.
no subject
Date: 2012-01-31 03:53 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-02-03 05:10 pm (UTC)Так делать нельзя.
Лучше это делать как в Agda, попросту включив ограничения на аргументы функции в её тип. Факториал просто будет определён на int'ах от 0 до 12.
Или хотя бы сделать исключения эффектами и воспользоваться языком с системой эффектов и effect inference.
(no subject)
From:no subject
Date: 2012-01-31 04:06 am (UTC)У вас все правильно мыслят?
no subject
Date: 2012-01-31 04:43 am (UTC)(no subject)
From:no subject
Date: 2012-01-31 04:30 am (UTC)Интересно, что в питоне на моем маке до 1000! вычисляеся правильно, а потом наступает переполнение стека %)
no subject
Date: 2012-01-31 04:43 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-01-31 04:42 am (UTC)no subject
Date: 2012-01-31 06:05 am (UTC)no subject
Date: 2012-01-31 05:34 am (UTC)no subject
Date: 2012-01-31 06:05 am (UTC)no subject
Date: 2012-01-31 05:58 am (UTC)Кстати, с неущербными примерами всё даже в Хаскеле плохо: Во всех языках с тьюринг-полной рекурсией в качестве примитива, все функции на самом деле не функции, а частичные функции, так что с точки зрения пуриста там весь мир надо оборачивать в idiom brackets для Option и рассматривать композицию функций не как честную композицию функций, а “(f ∘ g) if g terminates, ⊥ otherwise”.
Вот не люблю вот это вот всей душой, но отчего-то никто не пишет на агде, а эпиграмма-2 вообще не готова.
P.S. От души не понимаю, почему Option[T] не назвали Optional[T]. Поскупились на два символа, а как испортили дело. Either тоже неудачное название; вполне удачное для типа Either[A, B], в котором A и B играют симметричные роли, и совершенно идиотское для монады, где роли уже вопиюще асимметричны. Уж не знаю, как это следовало назвать, может Alternate[T, AltT], хотя наверное можно и получше выдумать.
no subject
Date: 2012-01-31 06:07 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-01-31 06:17 am (UTC)И можно будет добавлять проверки прямо во время вычисления.
А чем вам не нравится perl style?
var = func() || die "cant do it\n";
no subject
Date: 2012-02-03 11:09 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-01-31 06:35 am (UTC)Вообще, NPE происходят когда нет ясности с object life time, ownership и initialization. В чем, собственно, и состоит сложность любой программы.
Это меня ведет к мысли о том, что на самом деле все это функциональное программирование, closures и прочие модности в жизни мне не очень помогают.
no subject
Date: 2012-01-31 08:54 am (UTC)Потому что все структуры данных — immutable. В этом-то и фича.
(no subject)
From:(no subject)
From:no subject
Date: 2012-01-31 06:52 am (UTC)Эксепшен, собственно, тоже проблему не совсем решает - кто-то его ещё ловить должен, причём правильно ловить, со смыслом - иначе в результате опять белая страничка или надпись "у нас проблемы, приходите вчера".
no subject
Date: 2012-01-31 08:13 am (UTC)Ошибку все равно надо обработать и как минимум выдать осмысленное сообщение.
То есть у нас все равно будут те же if-ы, только в другом месте - там где ловятся эксепшены.
(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-01-31 06:57 am (UTC)В примере на Scala всё-таки, наверное, if (n < 0 || n > 16) None, а не Option().
no subject
Date: 2012-01-31 06:35 pm (UTC)no subject
Date: 2012-01-31 07:19 am (UTC)no subject
Date: 2012-01-31 08:43 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-01-31 08:49 am (UTC)Но! Но теперь фор становится обязательным - это уменьшает количество NPE. Но NPE - это же только симптом. Уменьшает ли это количество ошибок?
Если раньше диагностика записывала стек-трейс в лог по NPE (прибор), то теперь нужно то же самое добавить в orElse. Ну, или смотреть на белую страничку.
Способ, конечно, вкусный, но является ли решением заявленных проблем?
no subject
Date: 2012-01-31 03:10 pm (UTC)no subject
Date: 2012-01-31 09:13 am (UTC)тока императивный джавист во мне говорит, что метод факториала должен иметь в сигнатуре ексцепшн и все эстетические страданя вроде как перестают быть: мы явно декларируем, что оно может и не посчитать.
no subject
Date: 2012-01-31 05:54 pm (UTC)Ну и в принципе NullObject тащемта про то же, если взять этот частный случай.
И да, этот подход противоположен erlang и php. Но мне он больше нравится, потому что он строг. Если я не жду тут null, то я не хочу пытаться делать вид, что я его ждал. Лучше честно упасть, записав в лог проблему.
Ну и ясное дело, что никаких белых страниц не будет, потому что в строгой модели, все такие exception в конечном итоге попадут в обработчик.
no subject
Date: 2012-01-31 10:05 pm (UTC)Как-то давно, ещё будучи студентом, на одном интервью для задания сделал защиту по входным параметрам и по выходным. Интервьюер сначало удивился, потом хмыкнул снисходительно. Жизнь без приключений - это не спортивно.
no subject
Date: 2012-02-02 04:44 am (UTC)Например, есть у нас x: Option[Double] и мы хотим посчитать от него синус, то пишем sin($x): Option[Double].
Или вот если есть xs: Set[Double], то можно получить множество синусов этих чисел sin($xs).
Если два аппликативных функтора коммутируют или конвертируются в коммутирующие функторы (например, если задана имплицитная конверсия обоих в некий общий), можно сделать даже $a + $b.
Особенно ценно это всё было в применении к стейт-монаде Var[T] (точнее, аппликативу Volatile[T], от которого Var[T] наследуется): вот есть у нас некая переменная a: Var[Double], а мы берём и пишем sin($a) и получаем (lazy) Volatile[Double].
Но функции ещё иногда комбинируют, а писать вещи типа 2 * $sin($b) или $square($sin($x)) слишком тяжеловесно. Поэтому пришлось придумать и idiom-brackets (правда тогда они так не назывались, статья про аппликативные функторы ещё не вышла).
До скального варианта for(x <- xs) {square(sin(x))} я тогда не догадался, поэтому там была несколько неказистая конструкция implicit(Volatile[Any]) {square(sin(x))}. Эта конструкция использовалась и для поддержки исключений на уровне системы типов: если метод пометить аннотацией @throws[SomeException], то его тип превращался из T в Either[T, SomeException], а контекст внутри него в implicit(Either(Any, SomeException, такой же контекст делался внутри блока catch(SomeException e), очень удобно.
А если в каком-то месте нужно было взять штуку типа подходящего под описание Volatile[Any], но _не_ эскейпить его, можно было использовать escape brackets <> (это придумал
Очень удобно было запихивать целые процедуры в implicit(Volatile[Any])-контекст и писать в императивном стиле функциональный код:
Если у нас x: Var[Double], то можно написать
val v = 2 * sin(x / 2)
и получить v: Double, а можно
val w = <2 * sin(x / 2)>
и получить w: Volatile[Double].
Потом дошло, что пурые функции это не совсем пурые функции, потому что они имеют ненулевое время выполнения, так что строго говоря каждое factorial(800) это не Integer, а Process[Integer], просто мы всегда работаем в implicit(Process[Any])-контексте. Соответственно всегда можно сделать вместо n = factorial(800) что-нибудь интересное вроде
p = <factorial(800)>
p.start
Log.info("Started!")
n = p // Evaluate
Log.info("Finished, duration was " + p.duration)
А можно и ещё хлеще: определить в методе public properties.
Ещё удобно, если глобальный контекст также содержит Logged[Any], позволяя в пурых на применении функциях писать в лог.
Несколько расширив понятие аппликативного контекста с использованием зависимых типов, можно сделать текущий синтаксис Cкалы этакой do-нотацией, которая после обработки макросами превращается в пурый код. Ставишь этак перед методом аннотации
@Reads(inRessourcesList), @Writes(outRessourcesList), @Suspends(blockersList)
и его тип T превращается в CPS(blockerList)[RW(inRessourceList, outRessourceList)[T], а тело в implicit packed do-notation для категории стрелок CPS+RW.
... я вот думаю, а не рассказать ли об этом синтаксисе скальщикам в EPFLе? Ведь стараниями
no subject
Date: 2012-02-02 05:45 am (UTC)А где-нибудь это изложено подробнее?
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-02-02 06:34 am (UTC)На это есть netflix chaos monkey.
no subject
Date: 2012-02-02 06:41 am (UTC)no subject
Date: 2012-06-23 06:49 pm (UTC)