Основы функционального программирования/Формализация функционального программирования на основе лямбда-исчисления

Объект изучения: множество определений функций.
Предположение: будет считаться, что любая функция может быть определена при помощи некоторого λ-выражения.
Цель исследования: установить по двум определениям функций $⟨ f_{1} ⟩$ и $⟨ f_{2} ⟩$ их тождество на всей области определения — $\forall x : f_{1} (x) = f_{2} (x)$ . (Здесь использована такая нотация: $f$ — некоторая функция, $⟨ f ⟩$ — определения этой функции в терминах λ-исчисления.)

Проблема заключается в том, что обычно при описании функций задаётся интенсионал этих функций, а потом требуется установить экстенсиональное равенство. Под экстенсионалом функции понимается её график (или таблица в виде множества пар 〈аргумент, значение〉). Под интенсионалом функции понимаются правила вычисления значения функции по заданному аргументу.

Возникает вопрос: как учесть семантику встроенных функций при сравнении их экстенсионалов (так как явно определения этих функций неизвестны)? Варианты ответов:

Можно попытаться выразить семантику встроенных функций при помощи механизма λ-исчисления. Этот процесс можно довести до случая, когда все встроенные функции не содержат непроинтерпретированных операций.
Говорят, что $⟨ f_{1} ⟩$ и $⟨ f_{2} ⟩$ семантически равны (этот факт обозначается как $⊨ f_{1} = f_{2}$ ), если $f_{1} (x) = f_{2} (x)$ при любой интерпретации непроинтерпретированных идентификаторов.

Понятие формальной системы

Формальная система представляет собой четвёрку:

$P = ⟨ V, Φ, A, R ⟩$ ,

где $V$ — алфавит;

$Φ$ — множество правильно построенных формул;

$A$ — аксиомы (при этом $A \subseteq Φ$ );

$R$ — правила вывода.

В рассматриваемой задаче формулы имеют вид $(t_{1} = t_{2})$ , где $t_{1}$ и $t_{2}$ — λ-выражения. Если некоторая формула выводима в формальной системе, то этот факт записывается как $(⊢ t_{1} = t_{2})$ .

Говорят, что формальная система корректна, если $(⊢ t_{1} = t_{2}) \Rightarrow (⊨ t_{1} = t_{2})$ .

Говорят, что формальная система полна, если $(⊨ t_{1} = t_{2}) \Rightarrow (⊢ t_{1} = t_{2})$ .

Семантическое определение понятия «конструкция» (обозначение — $E x p$ ):

1°. $v \in I d \Rightarrow v \in E x p$ .

2°. $v \in I d, E \in E x p \Rightarrow λ v . E \in E x p$

3°. $E, E^{'} \in E x p \Rightarrow (E E^{'}) \in E x p$

4°. $E \in E x p \Rightarrow (E) \in E x p$

5°. Никаких других $E x p$ нет.

Примечание: $I d$ — множество идентификаторов.

Говорят, что $v$ свободна в $M \in E x p$ , если:

1°. $M = v$ .

2°. $M = (M_{1} M_{2})$ , и $v$ свободна в $M_{1}$ или в $M_{2}$ .

3°. $M = λ v^{'} . M^{'}$ , и $v \neq v^{'}$ , и $v$ свободна в $M^{'}$ .

4°. $M = (M^{'})$ , и $v$ свободна в $M^{'}$ .

Множество идентификаторов $v$ , свободных в $M$ , обозначается как $F V (M)$ .

Говорят, что $v$ связана в $M \in E x p$ , если:

1°. $M = λ v^{'} . M^{'}$ , и $v = v^{'}$ .

2°. $M = (M_{1} M_{2})$ , и $v$ связана в $M_{1}$ или в $M_{2}$ (то есть один и тот же идентификатор может быть свободен и связан в $E x p$ ).

3°. $M = (M^{'})$ , и $v$ связана в $M^{'}$ .

Пример 26. Свободные и связанные идентификаторы.

$M = v$ . $v$ — свободна.
$M = λ x . x y$ . $x$ — связана, $y$ — свободна.
$M = (λ v . v) v$ . $v$ входит в это выражение как свободно, так и связанно.
$M = V W$ . $V$ и $W$ — свободны.

Правило подстановки: подстановка в выражение $E$ выражения $E^{'}$ вместо всех свободных вхождений переменной $x$ обозначается как $E [x \leftarrow E^{'}]$ . Во время подстановки иногда случается так, что получается конфликт имён, то есть коллизия переменных. Примеры коллизий:

$(λ x . y x) [y \leftarrow λ z . z] = λ x . (λ z . z) x = λ x . x$ — корректная подстановка;

$(λ x . y x) [y \leftarrow x x] = λ x . (x x) x$ — коллизия имён переменных;

$(λ z . y z) [y \leftarrow x x] = λ z . (x x) z$ — корректная подстановка.

Точное определение базисной подстановки:

1°. $x [x \leftarrow E^{'}] = E^{'}$ .

2°. $y [x \leftarrow E^{'}] = y$ .

3°. $(λ x . E) [x \leftarrow E^{'}] = λ x . E$ .

4°. $(λ y . E) [x \leftarrow E^{'}] = λ y . E [x \leftarrow E^{'}]$ , при условии, что $y \in̸ F V (E^{'})$ .

5°. $(λ y . E) [x \leftarrow E^{'}] = (λ z . E [y \leftarrow z]) [x \leftarrow E^{'}]$ , при условии, что $y \in F V (E^{'})$ .

6°. $(E_{1} E_{2}) [x \leftarrow E^{'}] = (E_{1} [x \leftarrow E^{'}] E_{2} [x \leftarrow E^{'}])$ .

Построение формальной системы

Таким образом, сейчас уже всё готово для того, чтобы перейти к построению формальной системы, определяющей функциональное программирование в терминах λ-исчисления.

Правильно построенные формулы выглядят так: $E x p = E x p$ .

Аксиомы:

$⊢ λ x . E = λ y . E [x \leftarrow y]$ ;	(α)
$⊢ (λ x . E) E^{'} = E [x \leftarrow E^{'}]$ ;	(β)
$⊢ t = t$ , в случае, если $t$ — идентификаторы.	(ρ)

Правила вывода:

$t_{1} = t_{2} \Rightarrow t_{1} t_{3} = t_{2} t_{3}$ ;	(μ)
$t_{1} = t_{2} \Rightarrow t_{3} t_{1} = t_{3} t_{2}$ ;	(ν)
$t_{1} = t_{2} \Rightarrow t_{2} = t_{1}$ ;	(σ)
$t_{1} = t_{2}, t_{2} = t_{3} \Rightarrow t_{1} = t_{3}$ ;	(τ)
$t_{1} = t_{2} \Rightarrow λ x . t_{1} = λ x . t_{2}$ .	(ξ)

Пример 27. Доказать выводимость формулы $(λ x . x y) (λ z . (λ u . z u)) v = (λ v . y v) v$

	$(λ x . x y) (λ z . (λ u . z u)) v = (λ v . y v) v$ ;
(μ):	$(λ x . x y) (λ z . (λ u . z u)) = (λ v . y v)$ ;
(β):	$(λ z . (λ u . z u)) y = (λ v . y v)$ ;
(α):	$λ u . y u = λ v . y v$ — выводима.

Во втором варианте формализации функционального программирования можно воспользоваться не свойством симметричности отношения « $=$ », а свойством несимметричности отношения « $\to$ ».

Во второй формальной системе правильно построенные формулы выглядят абсолютно так же, как и в первом варианте. Однако аксиомы принимают несколько иной вид:

$⊢ λ x . M \to λ y . M [x \leftarrow y]$	(α′)
$⊢ (λ x . M) N \to M [x \leftarrow N]$	(β′)
$⊢ M \to M$	(ρ′)

Правило вывода во втором варианте формальной системы одно:

t_{1} \to {t_{1}}^{'}, t_{2} \to {t_{2}}^{'} \Rightarrow t_{1} t_{2} \to {t_{1}}^{'} {t_{2}}^{'}

(π)

По существу это правило вывода гласит, что в любом выражении можно выделить вхождения подвыражения и заменить их все любой редукцией из этого подвыражения.

Определения:

Выражение вида $λ x . M$ называется α-редексом.
Выражение вида $(λ x . M) N$ называется β-редексом.
Выражения, не содержащие β-редексов, называются выражениями в нормальной форме.

Несколько теорем (без доказательств):

$⊢ E_{1} = E_{2} \Rightarrow E_{1} \to E_{2} \lor E_{2} \to E_{1}$ .
$E \to E_{1} \land E \to E_{2} \Rightarrow \exists F : E_{1} \to F \land E_{2} \to F$ . (Теорема Чёрча—Россера).
Если $E$ имеет нормальные формы $E_{1}$ и $E_{2}$ , то они эквивалентны с точностью до α-конверсии, то есть различаются только обозначением связанных переменных.

Стратегия редукции

1°. Нормальная редукционная стратегия (НРС). На каждом шаге редукции выбирается текстуально самый левый β-редекс. Доказано, что нормальная редукционная стратегия гарантирует получение нормальной формы выражения, если она существует.

2°. Аппликативная редукционная стратегия (АРС). На каждом шаге редукции выбирается β-редекс, не содержащий внутри себя других β-редексов. Далее будет показано, что аппликативная редукционная стратегия не всегда позволяет получить нормальную форму выражения.

Пример 28. Редукция выражения $M = (λ y . x) (E E)$ , где $E = λ x . x x$

1°. НРС: $\underline{(λ y . x)} (E E) = \underline{(λ y . x)} [y \leftarrow E E] = x$ .

2°. АРС: $(λ y . x) \underline{(E E)} = (λ y . x) \underline{((λ x . x x) (λ x . x x))} = (λ y . x) \underline{((λ x . x x) (λ x . x x))} = \dots$ .

В этом примере видно, как апликативная редукционная стратегия может привести к выпадению в дурную бесконечность. Получить нормальную форму выражения $M$ в случае применения аппликативной редукционной стратегии невозможно.

Примечание: подчёркиванием выделен β-редекс, редуцируемый следующим шагом.

Пример 29. Редукция выражения $M = (λ x . x y x x) ((λ z . z) w)$

1°. НРС: $\underline{(λ x . x y x x)} ((λ z . z) w) = \underline{((λ z . z) w)} y ((λ z . z) w) ((λ z . z) w) =$

$= w y \underline{((λ z . z) w)} ((λ z . z) w) = w y w \underline{((λ z . z) w)} = w y w w$ .

2°. АРС: $(λ x . x y x x) \underline{((λ z . z) w)} = \underline{(λ x . x y x x)} w = w y w w$ .

В программировании нормальная редукционная стратегия соответствует вызову по имени. То есть аргумент выражения не вычисляется до тех пор, пока к нему не возникнет обращения в теле выражения. Аппликативная редукционная стратегия соответствует вызову по значению.

Соответствие между вычислениями функциональных программ и редукцией

Работа интерпретатора описывается несколькими шагами:

В выражении необходимо выделить некоторое обращение к рекурсивной или встроенной функции с полностью означенными аргументами. Если выделенное обращение к встроенной функции существует, то происходит его выполнение и возврат к началу первого шага.
Если выделенное на первом шаге обращение к рекурсивной функции, то вместо него подставляется тело функции с фактическими параметрами (так как они уже означены). Далее происходит переход на начало первого шага.
Если больше обращений нет, то происходит остановка.

В принципе, вычисления в функциональной парадигме повторяют шаги редукции, но дополнительно содержат вычисления встроенных функций.

Представление определений функций в виде λ-выражений

Показано, что любое определение функции можно представить в виде λ-выражения, не содержащего рекурсии. Например:

fact = λn.if n == 0 then 1 else n * fact (n – 1)

То же самое определение можно описать при помощи использования некоторого функционала:

fact = (λf.λn.if n == 0 then 1 else n * f (n – 1)) fact

Жирным шрифтом в представленном выражении выделен функционал F. Таким образом, функцию вычисления факториала можно записать так: fact = F fact. Можно видеть, что любое рекурсивное определение некоторой функции f можно представить в таком виде:

f = F f

Это выражение можно трактовать как уравнение, в котором рекурсивная функция f является неподвижной точкой функционала F. Соответственно интерпретатор функционального языка можно в таком же ключе рассматривать как численный метод решения этого уравнения.

Можно сделать предположение, что этот численный метод (то есть интерпретатор) в свою очередь может быть реализован при помощи некоторой функции Y, которая для функционала F находит его неподвижную точку (соответственно определяя искомую функцию) — f = Y F.

Свойства функции Y определяются равенством:

Y F = F (Y F)

Теорема (без доказательства):

Любой λ-терм имеет неподвижную точку.

λ-исчисление позволяет выразить любую функцию через чистое λ-выражение без использования встроенных функций. Например:

1°.

prefix = λxyz.zxy
head = λp.p(λxy.x)
tail = λp.p(λxy.y)

2°. Моделирование условных выражений:

True = λxy.x
False = λxy.y
if B then M else N = BNM, где B = {True, False}.

Основы функционального программирования/Формализация функционального программирования на основе лямбда-исчисления

Содержание

Понятие формальной системы

Построение формальной системы

Стратегия редукции

Соответствие между вычислениями функциональных программ и редукцией

Представление определений функций в виде λ-выражений

Навигация

Основы функционального программирования/Формализация функционального программирования на основе лямбда-исчисления

Понятие формальной системы

Построение формальной системы

Стратегия редукции

Соответствие между вычислениями функциональных программ и редукцией

Представление определений функций в виде λ-выражений

Навигация

Поиск