Тема этого выпуска задание аффинного преобразования в матричной форме. Эта тема, по сути, является обобщением всего, что было сказано ранее.

Определение. Преобразование плоскости называется аффинным , если

оно взаимно однозначно;
образом любой прямой является прямая.

Преобразование называется взаимно однозначным , если

разные точки переходят в разные;
в каждую точку переходит какая-то точка.

Однородные координаты

Если рассмотреть параллельный перенос, то оказывается, что для его задания матрицы 2x2 уже недостаточно. Но его можно задать с помощью матрицы размера 3x3. Появляется вопрос, откуда взять третью координату у двумерной точки?

Определение. Однородные координаты - координаты, обладающие тем свойством, что определяемый ими объект не меняется при умножении всех координат на одно и то же число.

Однородными координатами вектора (х, у) является тройка чисел (x", y", h) , где х = х" / h, у = y"/h, а h - некоторое вещественное число (случай, когда h = 0 является особым).

Прим. Данные координаты не позволяют однозначно задать точку плоскости. Например, (1 , 1, 1) и (2, 2, 2) задают одну и ту же точку (1, 1) . Предлагается взять набор (x, y, 1) , который будет описывать все точки плоскости.

Матрица преобразования для однородных координат имеет размер 3х3. Рассмотрим некоторые преобразования в однородных координатах.

Сжатие/растяжение

Это преобразование умножает соответствующие координаты точек на коэффициенты масштабирования по осям: (x, y ) -> (a x * x , a y * y ) . Матрица преобразования запишется следующим образом:

[ a x 0 0 ]

Где a x – растяжение по оси x ,

a y – растяжение по оси y .

Прим. Можно заметить, что при отрицательных значениях коэффициентов сжатия/растяжения происходит отражение относительно соответствующих осей. Этот случай можно включить в данное преобразование, а можно вынести в отдельное, сказав, что коэффициенты масштабирования принимают только положительные значения.

Поворот

Матрица поворота 2x2 была подробно разобрана ранее. Теперь она дополняется строкой и столбцом:

[ -sin(phi)cos(phi) 0]

Прим. При угле phi = п эта матрица задает центральную симметрию относительно начала координат, которая является частным случаем поворота. Можно заметить, что такую симметрию можно задать с помощью преобразования сжатия/растяжения (допуская отрицательные коэффициенты масштабирования).

Параллельный перенос

Исходный вектор (x, y ) переходит в (x + t x, y + t y ) . Матрица преобразования запишется следующим образом:

[ 1 0 0]

[ t x t y 1]

Отражение

Как говорилось в примечании к преобразованию сжатия/растяжения, отражения получаются следующим образом:

[-10 0]

отражение относительно оси x

отражение относительно оси y

Общий вид аффинного преобразования

Матрица 3x3, последний столбец которой равен (0 0 1) T , задает аффинное преобразование плоскости:

[ * * 0]

[ * * 1]

По одному из свойств, аффинное преобразование можно записать в виде:

f (x ) = x * R + t ,

где R – обратимая матрица 2 x2, а t – произвольный вектор. В однородных координатах это запишется следующим образом:

[ R 1,1 R 1,2 0 ]

[ R 2,1 R 2,2 0 ]

[ t x t y 1 ]

Если умножить вектор-строку на эту матрицу получаем результат преобразования:

[ xy1 ] *[ R 1,1 R 1,2 0 ]

[ R 2,1 R 2,2 0 ]

[ t x t y 1 ]

[ x’y’1 ]+[ t x t y 1 ]

При этом [ x ’ y ’ ]= R *[ x y ]

Прим. Любопытный читатель уже задал себе вопрос: в чем смысл определителя матрицы R? При аффинном преобразовании площади всех фигур изменяются в | R|. (Можно строго доказать это с точки зрения математики, но здесь этот факт приводится без доказательства.)

Т.о. аффинное преобразование представляется в виде композиции некоторого преобразования, задаваемого матрицей R , и параллельного переноса. Разберем более подробно природу этой матрицы и возможности, которые она нам дает.

Матрица R определяет новый базис плоскости. Т.е. вектор (1, 0) переходит в (R 1,1, R 1,2 ), вектор (0, 1) переходит в (R 2,1, R 2,2 ). Новый базис это строки матрицы R .

Пример.

При отражении относительно оси y , базисный вектор по оси ординат сохраняется, а по оси абсцисс переходит в (-1, 0) . Т.о. матрица R будет выглядеть следующим образом:

Теперь становится ясно, что кроме вышеперечисленных преобразований, с помощью аффинного преобразования можно получить скос:

Выше приведены базовые сведения о таком мощном инструменте, как аффинное преобразование. Остается много вопросов: какой подкласс аффинных преобразований сохраняет углы между прямыми? Как можно представить аффинное преобразование в виде композиции нескольких подклассов? Как задавать более сложные преобразования, например, осевая симметрия относительно произвольной прямой?

Ответы на эти вопросы и более детальное рассмотрение аффинного преобразования будут приведены отдельно, в качестве раздела курса теоретической геометрии.

Остановимся на практической реализации аффинного преобразования в виде демонстрационной программы. К возможностям приложения, демонстрирующего поворот плоскости мышью, добавляются функции параллельного переноса при нажатой клавише CTRL .

Т.к. эта статья является завершающей в данном разделе, код демонстрационного приложения должен быть соответствующим. Давайте попробуем разобраться, какие блоки нужны в графическом приложении, параллельно рассматривая, как они реализованы в данной программе:

блок, в котором происходит создание окна и обрабатываются сообщения операционной системы, реализован в файл emain . cpp
графический движок, выполняющий отрисовку изображения, класс Engine
прослойка, необходимая для преобразования логических координат в оконные и обратно, класс Viewport
объект, отвечающий за реакцию на действия пользователя, класс Action

В приведенном примере реализованы эти функциональные блоки, с подробными комментариями.

Ниже $f$ обозначает аффинное преобразование, записываемое в декартовой системе координат $O, \boldsymbol{e}_{1}, \boldsymbol{e}_{2}$ формулами
$$
x^{*}=a_{1}x+b_{1}y+c_{1},\ y^{*}=a_{2}x+b_{2}y+c_{2}.\label{ref1}
$$
при условии
$$
\begin{vmatrix}
a_{1}& b_{1}\\
a_{2}& b_{2}
\end{vmatrix} \neq 0.\label{ref2}
$$

Рассмотрим на плоскости прямую линию с уравнением $\boldsymbol{r}=\boldsymbol{r}_{0}+\boldsymbol{a}t$ и найдем ее образ при преобразовании $f$. (Под образом прямой понимается множество образов ее точек.) Радиус-вектор образа $M^{*}$ произвольной точки $M$ можно вычислить так:
$$
\overrightarrow{OM^{*}}=\overrightarrow{Of(O)}+f\overrightarrow{(O)M^{*}}=\boldsymbol{c}+f(\boldsymbol{r}).\nonumber
$$

Здесь $\boldsymbol{c}$ - постоянный вектор $\overrightarrow{Of}(O)$, а $\boldsymbol{r}$ - радиус-вектор точки $M$. Согласно (11) §2 мы получаем
$$
\overrightarrow{OM^{*}}=\boldsymbol{c}+f(\boldsymbol{r}_{0})+f(\boldsymbol{a})t.\label{ref3}
$$
Так как $f$ - аффинное преобразование и $\boldsymbol{a} \neq \boldsymbol{0}$, то $\boldsymbol{a}$ перейдет в вектор $f(\boldsymbol{a}) \neq 0$, и уравнение \eqref{ref3} является уравнением прямой линии. Итак, образы всех точек прямой $\boldsymbol{r}=\boldsymbol{r}_{0}+\boldsymbol{a}t$ лежат на прямой \eqref{ref3}.

Более того, преобразование $f$ определяет взаимно однозначное отображение одной прямой на другую, так как при сделанном здесь выборе начальных точек и направляющих векторов точка $M^{*}$ имеет на прямой \eqref{ref3} то же значение параметра $t$, что и точка $M$ на исходной прямой. Отсюда мы получаем первое утверждение.

Утверждение 1.

При аффинном преобразовании:

прямая линия переходит в прямую линию;
отрезок переходит в отрезок;
параллельные прямые переходят в параллельные.

Доказательство.

Для доказательства второго утверждения достаточно заметить, что отрезок прямой состоит из таких точек, у которых значения параметра удовлетворяют неравенству вида $t_{1} \leq t \leq t_{2}$ Третье утверждение следует из того, что при аффинном преобразовании коллинеар-ные векторы переходят в коллинеарные.

Утверждение 2.

При аффинном преобразовании отношение длин параллельных отрезков не изменяется.

Доказательство.

Пусть отрезки $AB$ и $CD$ параллельны. Это значит, что существует такое число $\lambda$, что $\overrightarrow{AB}=\lambda \overrightarrow{CD}$. Образы векторов $\overrightarrow{AB}$ и $\overrightarrow{CD}$ связаны той же зависимостью $\overrightarrow{A^{*}B^{*}}=\lambda \overrightarrow{C^{*}D^{*}}$. Отсюда вытекает, что
$$
\frac{|\overrightarrow{AB}|}{|\overrightarrow{CD}|}=\frac{|\overrightarrow{A^{*}B^{*}}|}{|\overrightarrow{C^{*}D^{*}}|}=|\lambda|.\nonumber
$$

Следствие.

Если точка $C$ делит отрезок $AB$ в некотором отношении $\lambda$, то ее образ $C^{*}$ делит образ $A^{*}B^{*}$ отрезка $AB$ в том же отношении $\lambda$.

Изменение площадей при аффинном преобразовании.

Для начала рассмотрим . Выберем общую декартову систему координат $O, \boldsymbol{e}_{1}, \boldsymbol{e}_{2}$ и обозначим через $(p_{1}, p_{2})$ и $(q_{1}, q_{2})$ компоненты векторов $\boldsymbol{p}$ и $\boldsymbol{q}$, на которых он построен. Площадь параллелограмма мы можем вычислить, пользуясь :
$$
S_{\pm}=S_{\pm} (\boldsymbol{p}, \boldsymbol{q})=(p_{1}q_{2}-p_{2}q_{1}) S_{\pm} (\boldsymbol{e}_{1}, \boldsymbol{e}_{2}).\nonumber
$$

Пусть аффинное преобразование $f$ записывается в выбранной системе координат формулами \eqref{ref1}. Из ранее доказанного следует, что векторы $f(\boldsymbol{p})$ и $f(\boldsymbol{q})$ имеют в базисе $f(\boldsymbol{e}_{1}), f(\boldsymbol{e}_{2})$ те же компоненты $(p_{1}, p_{2})$ и $(q_{1}, q_{2})$, что и векторы $\boldsymbol{p}$ и $\boldsymbol{q}$ в базисе $\boldsymbol{e}_{1}, \boldsymbol{e}_{2}$. Образ параллелограмма построен на векторах $f(\boldsymbol{p})$ и $f(\boldsymbol{q})$, и площадь его равна
$$
S_{\pm}^{*}=S_{\pm} (f(\boldsymbol{p}), f(\boldsymbol{q}))=(p_{1}q_{2}-p_{2}q_{1}) S_{\pm} (f(\boldsymbol{e}_{1}), f(\boldsymbol{e}_{2})).\nonumber
$$

Вычислим последний множитель. Как мы знаем из уже доказанного , координаты векторов $f(\boldsymbol{e}_{1}), f(\boldsymbol{e}_{2})$ равны соответственно $(a_{1}, a_{2})$ и $(b_{1}, b_{2})$. Поэтому $S_{\pm} (f(\boldsymbol{e}_{1}), f(\boldsymbol{e}_{2}))=(a_{1}b_{2}-a_{2}b_{1}) S_{\pm} (\boldsymbol{e}_{1}, \boldsymbol{e}_{2})$ и
$$
S_{\pm}^{*}=(p_{1}q_{2}-p_{2}q_{1})(a_{1}b_{2}-a_{2}b_{1}) S_{\pm} (\boldsymbol{e}_{1}, \boldsymbol{e}_{2}).\nonumber
$$
Отсюда мы видим, что
$$
\frac{S_{\pm}^{*}}{S_{\pm}}=\begin{vmatrix}
a_{1}& b_{1}\\
a_{2}& b_{2}
\end{vmatrix}.\label{ref4}
$$

Таким образом, отношение площади образа ориентированного параллелограмма к площади этого параллелограмма одинаково для всех параллелограммов и равно $a_{1}b_{2}-a_{2}b_{1}$.

Отсюда следует, что данный детерминант не зависит от выбора системы координат, в которой записано преобразование, хотя он вычисляется по коэффициентам, зависящим от системы координат. Эта величина - инвариант, выражающий геометрическое свойство преобразования.

Из формулы \eqref{ref4} видно, что отношение площади образа неориентированного параллелограмма к его площади равно
$$
S^{*}/S=|a_{1}b_{2}-a_{2}b_{1}|.\label{ref5}
$$

Если $a_{1}b_{2}-a_{2}b_{1} > 0$, то ориентации всех ориентированных параллелограммов сохраняются при преобразовании, а если $a_{1}b_{2}-a_{2}b_{1} < 0$, то для каждого ориентированного параллелограмма ориентация образа противоположна его ориентации.

Займемся теперь площадями других фигур. Каждый треугольник может быть дополнен до параллелограмма, площадь которого равна удвоенной площади треугольника. Поэтому отношение площади образа треугольника к площади этого треугольника удовлетворяет равенству \eqref{ref5}.

Каждый многоугольник может быть разбит на треугольники. Следовательно, формула \eqref{ref5} справедлива и для произвольных многоугольников.

Мы не будем здесь касаться определения площади произвольной криволинейной фигуры. Скажем лишь, что в тех случаях, когда эта площадь определена, она равна пределу площадей некоторой последовательности многоугольников, вписанных в рассматриваемую фигуру. Из теории пределов известно следующее предположение: если последовательность $S_{n}$ стремится к пределу $S$, то последовательность $\delta S_{n}$, где $\delta$ постоянное, стремится к пределу $\delta S$. На основании этого предложения мы заключаем, что формула \eqref{ref5} справедлива в самом общем случае.

В качестве примера найдем выражение площади эллипса через его полуоси. Ранее мы , что эллипс с полуосями $a$ и $b$ может быть получен сжатием окружности радиуса $a$ к прямой, проходящей через ее центр. Коэффициент сжатия равен $b/a$. В одном из мы получили координатную запись сжатия к прямой $x^{*}=x$, $y^{*}=\lambda y$. Детерминант из коэффициентов в этих формулах равен $\lambda$, то есть в нашем случае $b/a$. Таким образом, отношение площади эллипса к площади окружности равно $b/a$, и эта площадь равна $S=(b/a)\pi a^{2}$. Окончательно имеем
$$
S=\pi ab.\nonumber
$$

Образы линий второго порядка.

Мы видели, что прямая линия переходит в прямую. Это частный случай следующего утверждения.

Утверждение 3.

Аффинное преобразование переводит алгебраическую линию в алгебраическую линию того же порядка.

Доказательство.

В самом деле, пусть линия $L$ в декартовой системе координат $O, \boldsymbol{e}_{1}, \boldsymbol{e}_{2}$ имеет алгебраическое уравнение порядка $p$. Мы уже , что образы всех точек линии $L$ при аффинном преобразовании $f$ имеют в системе координат $f(O), f(\boldsymbol{e}_{1}), f(\boldsymbol{e}_{2})$ те же координаты, что и их прообразы в системе координат $O, \boldsymbol{e}_{1}, \boldsymbol{e}_{2}$. Следовательно, координаты образов в системе $f(O), f(\boldsymbol{e}_{1}), f(\boldsymbol{e}_{2})$ связаны тем же алгебраическим уравнением порядка $p$. Этого достаточно, чтобы сделать нужное нам заключение.

Из доказанного выше утверждения, в частности, следует, что линия второго порядка при аффинном преобразовании перейдет в линию второго порядка. Мы докажем более сильное утверждение. Как мы уже знаем, линии второго порядка можно разделить на . Мы увидим, что класс линии сохраняется при аффинном преобразовании. На этом основании классы линий, перечисленные в указанной теореме, называются аффинными классами. Итак, докажем новое утверждение.

Утверждение 4.

Линия второго порядка, принадлежащая к одному из аффинных классов, при любом аффинном преобразовании может перейти только в линию того же класса. Каждую линию второго порядка подходящим аффинным преобразованием можно перевести в любую другую линию того же аффинного класса.

Доказательство.

Линию мы назовем ограниченной, если она лежит внутри некоторого параллелограмма. Легко видеть, что при аффинном преобразовании ограниченная линия должна перейти в ограниченную, а неограниченная - в неограниченную.

Эллипс - ограниченная линия второго порядка. Кроме эллипсов ограничены только линии, состоящие из одной точки, то есть пары мнимых пересекающихся прямых. Поскольку эллипс ограничен и состоит больше, чем из одной точки, он может перейти только в эллипс.
Гипербола состоит из двух отдельных ветвей. Это свойство можно сформулировать так, что будет ясна его неизменность при аффинных преобразованиях. Именно, существует прямая линия, не пересекающая гиперболу, но пересекающая некоторые ее хорды.Из всех линий второго порядка только гиперболы и пары параллельных прямых обладают этим свойством. У гиперболы ветви не прямые линии, и потому при аффинном преобразовании она может перейти только в гиперболу.
Парабола - неограниченная линия второго порядка, состоящая из одного непрямолинейного куска. Этим свойством не обладают никакие другие линии второго порядка, и потому парабола может перейти только в параболу.
Если линия второго порядка представляет собой точку (пару мнимых пересекающихся прямых), прямую (пару совпавших прямых), пару пересекающихся или пару параллельных прямых, то из доказанных ранее свойств аффинных преобразований следует, что эта линия не может перейти в линию никакого другого класса.

Докажем вторую часть предложения. В уже доказанной нами канонические уравнения линий второго порядка написаны в декартовой прямоугольной системе координат и содержат параметры $a, b, …$ Если мы откажемся от ортонормированности базиса, то сможем произвести дальнейшие упрощения канонических уравнений и привести их к виду, не содержащему параметров. Например, замена координат $x’=x/a$, $y’=y/b$ переводит уравнение эллипса $x^{2}a^{2}+y^{2}b^{2}=1$ в уравнение $x’^{2}+y’^{2}=1$, каковы бы ни были $a$ и $b$. (Последнее уравнение не есть уравнение окружности, так как новая система координат не декартова прямоугольная.)

Читатель без труда покажет, что канонические уравнения линий второго порядка переходом к подходящей системе координат могут быть преобразованы в уравнения:

$x^{2}+y^{2}=1$;
$x^{2}+y^{2}=0$;
$x^{2}-y^{2}=1$;
$x^{2}-y^{2}=0$;
$y^{2}=2x$;
$y^{2}-1=0$;
$y^{2}=0$.

Такую систему координат мы назовем аффинной канонической системой координат.

Из ранее следует, что аффинное преобразование, которое совмещает аффинные канонические системы координат двух линий одного аффинного класса, совмещает и эти линии. Это заканчивает доказательство.

Разложение ортогонального преобразования.

Теорема 1.

Каждое ортогональное преобразование раскладывается в произведение параллельного переноса, поворота и, возможно, осевой симметрии.

Доказательство.

Пусть $f$ - ортогональное преобразование и $\vartriangle ABC$ - равнобедренный прямоугольный треугольник с прямым углом $A$. При преобразовании $f$ он перейдет в равный ему треугольник $\vartriangle A^{*}B^{*}C^{*}$ с прямым углом при вершине $A^{*}$. Теорема будет доказана, если, производя последовательно параллельный перенос $p$, поворот $q$ и (в случае необходимости) осевую симметрию $r$, мы сможем совместить треугольники $ABC$ и $A^{*}B^{*}C^{*}$. Действительно, произведение $rqp$ - аффинное преобразование так же, как и $f$, а аффинное преобразование однозначно определяется образами трех точек, не лежащих на одной прямой. Поэтому $rqp$ совпадает с $f$.

Итак, переведем $A$ и $A^{*}$ параллельным переносом $p$ на вектор $\overrightarrow{AA^{*}}$ (если $A=A^{*}$, то $p$ - тождественное преобразование). Затем поворотом $q$ вокруг точки $A^{*}$ совместим $p(B)$ с $B^{*}$ (возможно, и это преобразование окажется тождественным). Точка $q(p(C))$ либо совпадает с $C^{*}$, либо симметрична ей относительно прямой $A^{*}B^{*}$. В первом случае цель уже достигнута, а во втором потребуется осевая симметрия относительно указанной прямой. Теорема доказана.

Следует иметь в виду, что полученное разложение ортогонального преобразования не однозначно. Более того, можно поворот или параллельный перенос разложить в произведение осевых симметрий, произведение параллельного переноса и поворота представить как один поворот и так далее. Мы не будем уточнять, как это сделать, а выясним следующее общее свойство всех таких разложений.

Утверждение 5.

При любом разложении ортогонального преобразования в произведение любого числа параллельных переносов, поворотов и осевых симметрий четность числа осевых симметрий, входящих в разложение, одна и та же.

Доказательство.

Для доказательства рассмотрим на плоскости произвольный базис и проследим за изменением его ориентации (направления кратчайшего поворота от $\boldsymbol{e}_{1}$ к $\boldsymbol{e}_{2}$) при осуществляемых преобразованиях. Заметим, что поворот и параллельный перенос не меняют ориентацию ни одного базиса, а осевая симметрия меняет ориентацию любого базиса. Поэтому, если данное ортогональное преобразование меняет ориентацию базиса, то в любое его разложение должно входить нечетное число осевых симметрий. Если же ориентация базиса не меняется, то число осевых симметрий, входящих в разложение, может быть только четным.

Определение.

Ортогональные преобразования, которые могут быть разложены в произведение параллельного переноса и поворота, называются ортогональными преобразованиями первого рода , а остальные - ортогональными преобразованиями второго рода .

Ортогональное преобразование в декартовой прямоугольной системе координат записывается :
$$
\begin{array}{cc}

\end{array}.\nonumber
$$
При верхних знаках коэффициентов у $y$ в этих формулах детерминант, составленный из коэффициентов, равен +1, а при нижних знаках он равен -1. Отсюда и из формулы \eqref{ref4} следует следующее утверждение.

Утверждение 6.

Ортогональное преобразование первого рода записывается в декартовой прямоугольной системе координат формулами
$$
\begin{array}{cc}
& x^{*}=x \cos \varphi \mp y \sin \varphi+c_{1},\\
& y^{*}=x \sin \varphi \pm y \cos \varphi+c_{2}.
\end{array}.\nonumber
$$
с верхними знаками у коэффициентов при $y$, а ортогональное преобразование второго рода - с нижними знаками.

Разложение аффинного преобразования.

Мы видели, насколько аффинное преобразование может изменить плоскость: окружность может перейти в эллипс, правильный треугольник - в совершенно произвольный. Казалось бы, никакие углы при этом сохраниться не могут. Однако имеет место следующее утверждение

Утверждение 7.

Для каждого аффинного преобразования существуют две взаимно перпендикулярные прямые, которые переходят во взаимно перпендикулярные прямые.

Доказательство.

Для доказательства рассмотрим какую-либо окружность. При данном аффинном преобразовании она перейдет в эллипс. Каждая ось эллипса - множество середин хорд, параллельных другой оси. При аффинном преобразовании хорда перейдет в хорду, параллельность должна сохраниться, а середина отрезка переходит в середину его образа. Поэтому прообразы осей эллипса - отрезки, обладающие тем же свойством: каждый из них есть множество середин хорд окружности, параллельных другому отрезку. Такие отрезки непременно являются двумя взаимно перпендикулярными диаметрами окружности. Это то, что нам требовалось: существуют два взаимно перпендикулярных диаметра окружности, которые переходят во взаимно перпендикулярные отрезки - оси эллипса.

Стоит отметить один особый случай: окружность при аффинном преобразовании может перейти в окружность. В этом случае то же рассуждение проходит с любыми двумя взаимно перпендикулярными диаметрами окружности-образа. Очевидно, что при этом любые два взаимно перпендикулярных направления остаются перпендикулярными.

Определение.

Два взаимно перпендикулярных направления называются главными или синугулярными направлениями аффинного преобразования $f$, если они переходят во взаимно перпендикулярные направления.

Теорема 2.

Каждое аффинное преобразование раскладывается в произведение ортогонального преобразования и двух сжатий к двум взаимно перпендикулярным прямым.

Доказательство.

Доказательство аналогично доказательству . Рассмотрим аффинное преобразование $f$ и выберем равнобедренный прямоугольный треугольник $ABC$ так, чтобы его катеты $AB$ и $AC$ были направлены вдоль главных направлений преобразования $f$. Обозначим через $A^{*}$, $B^{*}$ и $C^{*}$ образы его вершин. Сделаем такое ортогональное преобразование $g$, при котором $g(A)=A^{*}$, а точки $g(B)$ и $g(C)$ лежат соответственно на лучах $A^{*}B^{*}$ и $A^{*}C^{*}$. (Этого легко добиться, как и в теореме 1, параллельным переносом, поворотом и осевой симметрией.)

Пусть $\lambda=|A^{*}B^{*}|/|A^{*}g(B)|$, a $\mu=|A^{*}C^{*}|/|A^{*}g(C)|$. Тогда сжатие $p_{1}$ к прямой $A^{*}C^{*}$ в отношении $\lambda$ переведет $g(B)$ в $p_{1}g(B)=B^{*}$ и не сдвинет точек $A^{*}$ и $g(C)$. Аналогично, сжатие $p_{2}$ к прямой $A^{*}B^{*}$ переведет $g(C)$ в $p_{2}g(C)=C^{*}$ и не сдвинет точек прямой $A^{*}B^{*}$.

Это означает, что произведение $p_{2}p_{1}g$ переводит точки $A$, $B$ и $C$ в точки $A^{*}$, $B^{*}$ и $C^{*}$ так же, как и заданное нам преобразование $f$. Согласно ранее доказанному имеем $p_{2}p_{1}g=f$, как и требовалось.

Аффинное преобразование это такое преобразование, которое сохраняет параллельность линий, но не обязательно углы или длины.
В компьютерной графике все, что относится к двумерному случаю, принято обозначать символом 2D (2-dimension). Допустим, на плоскости введена прямолинейная координатная система. Тогда каждой точке М ставится в соответствие упорядоченная пара чисел (х, у) ее координат (рис. 1).

Указанные выше формулы можно рассматривать двояко: либо сохраняется точка и изменяется координатная система в этом случае произвольная точка М остается той же, изменяются лишь ее координаты (х, у) (х*, у*) , либо изменяется точка и сохраняется координатная система в этом случае формулы задают отображение, переводящее произвольную точку М(х, у) в точку М*(х*, у*), координаты которой определены в той же координатной системе. В дальнейшем будем интерпретировать формулы, как правило, что в заданной системе прямолинейных координат преобразуются точки плоскости.
В аффинных преобразованиях плоскости особую роль играют несколько важных частных случаев, имеющих хорошо прослеживаемые геометрические характеристики. При исследовании геометрического смысла числовых коэффициентов в формулах для этих случаев удобно считать, что заданная система координат является прямоугольной декартовой.
Наиболее часто применяются следующие приемы компьютерной графики: перенос, масштабирование, поворот, отражение. Алгебраические выражения и рисунки, поясняющие данные преобразования сведем в табл.1.

Аффинные преобразования на плоскости

Под переносом понимается смещение примитивов вывода на один и тот же вектор.
Масштабирование это увеличение или уменьшение всего изображения либо его части. При масштабировании координаты точек изображения умножаются на некоторое число.
Под поворотом понимается вращение примитивов вывода вокруг заданной оси. (В плоскости чертежа вращение происходит вокруг точки.)
Под отражением понимают получение зеркального отображения изображения относительно одной из осей (например X).
Выбор этих четырех частных случаев определяется двумя обстоятельствами:
1. Каждое из приведенных выше преобразований имеет простой и наглядный геометрический смысл (геометрическим смыслом наделены и постоянные числа, входящие в приведенные формулы).
2. Как доказывается в курсе аналитической геометрии, любое преобразование вида (*) всегда можно представить как последовательное исполнение (суперпозицию) простейших преобразований вида А, Б, В и Г (или части этих преобразований).
Таким образом, справедливо следующее важное свойство аффинных преобразований плоскости: любое отображение вида (*) можно описать при помощи отображений, задаваемых формулами А, Б, В и Г.
Для эффективного использования этих известных формул в задачах компьютерной графики более удобной является их матричная запись.
Для объединения этих преобразований вводят однородные координаты. Однородными координатами точки называется любая тройка одновременно не равных нулю чисел x1 , x2 , x3 , связанных с заданными числами x и y следующими соотношениями:

Тогда точка M(х, у) записывается как M(hX, hY, h), где h 0 является масштабным множителем. Двумерные декартовы координаты могут быть найдены как

В проективной геометрии эти координаты вводятся для устранения неопределенностей, возникающих при задании бесконечноудаленных (несобственных) элементов. Однородные координаты можно интерпретировать как вложение промасштабированной с коэффициентом h плоскости в плоскость Z= h в трехмерном пространстве.
Точки в однородных координатах записываются трехэлементными вектор-строками. Матрицы преобразования должны иметь размер 3х3.
При помощи троек однородных координат и матриц третьего порядка можно описать любое аффинное преобразование плоскости.
В самом деле, считая h = 1, сравним две записи: помеченную символом (*) и нижеследующую, матричную:

Теперь можно использовать композиции преобразований, применяя одно результирующее вместо ряда преобразований, следующих друг за другом. Можно, например, сложную задачу разбить на ряд простых. Поворот точки А около произвольной точки В можно разбить на три задачи:
перенос, при котором В= 0 (где 0-начало координат);
поворот;
обратный перенос, при котором точка В возвращается на место и т. д.
Композиция наиболее общего вида из операций Т, D, R, M имеет матрицу:

Верхняя часть размером 2х2 - объединенная матрица поворота и масштабирования, a tx и ty описывают суммарный перенос.
К изложенным фундаментальным преобразованиям сводятся следующие:
прокручивание перемещение окна на поверхности визуализации (если перемещение ограничено только направлениями вверх и вниз, то оно называется вертикальным прокручиванием);

трансфокация постепенное изменение масштаба изображения;
кувыркание динамическое изображение примитивов вывода, вращающихся вокруг некоторой оси, ориентация которой непрерывно изменяется в пространстве;
панорамирование постепенный перенос изображения с целью создания зрительного ощущения движения.

Глава I.Понятие о геометрическом преобразовании

1.1 Что такое геометрическое преобразование?

Осевая симметрия, центральная симметрия, поворот, параллельный перенос, гомотетия имеют то общее, что все они „преобразуют" каждую фигуру Fв некоторую новую фигуру F1. Поэтому их называют геометрическими преобразованиями.

Вообще, геометрическим преобразованием называют всякое правило, позволяющее для каждой точки А на плоскости указать новую точку A", в которую переводится точка А рассматриваемым преобразованием. Если на плоскости задана какая-либо фигура F, то множество всех точек, в которые переходят тонки фигуры Fпри рассматриваемом преобразовании, представляет собой новую фигуру F., В этом случае говорят, что F" получается из F при помощи рассматриваемого преобразования.

Пример. Симметрия относительно прямой l является геометрическим преобразованием. Правило, позволяющее по точке A найти соответствующую ей точку А", в этом случае заключается в следующем: из точки А опускается перпендикуляр АР на прямую lи на его продолжении за точку Р откладывается отрезок РА"=АР.

Сложение геометрических преобразований

Предположим, что мы рассматриваем два геометрических преобразования, одно из которых называем „первым", а другое - „вторым". Возьмем на плоскости произвольную точку А и обозначим через А" ту точку, в которую переходит А при первом преобразовании. В свою очередь точка А" переводится вторым преобразованием в некоторую новую точку А". Иначе говоря, точка А" получается из точки А при помощи последовательного применения двух преобразований - сначала первого, а затем второго.

Результат последовательного выполнения взятых двух преобразований также представляет собой геометрическое преобразование: оно переводит точку А в точку А". Это „результирующее" преобразование называется суммой первого и второго рассмотренных преобразований.

Пусть на плоскости задана какая-либо фигура F. Первое преобразование переводит ее в некоторую фигуру F" . Вторым преобразованием эта фигура F" переводится в некоторую новую фигуру F"". Сумма же первого и второго преобразований сразу переводит фигуру Fв фигуру F".

Пример. Пусть первое преобразование представляет собой симметрию относительно точки О1 а второе преобразование - симметрию относительно другой точки О2. Найдем сумму этих двух преобразований.

Пусть А - произвольная точка плоскости. Предположим сначала, что точка A не лежит на прямой O1O2. Обозначим через А" точку, симметричную точке А относительно О1, а через A" - точку, симметричную точке A" относительно О2 . Так как О1O2 - средняя линия треугольника АА"А"" то отрезок АА" параллелен отрезку О1O2 и имеет вдвое большую длину. Направление от точки А к точке А" совпадает с направлением от точки

О1 к точке О2. Обозначим теперь через МNтакой вектор, что отрезки MNи O1 O2 параллельны, отрезок МNв два раза длиннее отрезка O1О2 и лучи МNи O1O2 имеют одно и то же направление. Тогда АА" = МN, т. е. точка А" получается из точки А параллельным переносом на вектор МN.

То же справедливо и для точки, лежащей на прямой O1О2.

Окончательно мы получаем: сумма симметрии относительно точки O1 и симметрии относительно точки O2 представляет собой параллельный, перенос.

1.2 Движения

Осевая симметрия, поворот (в частности, центральная симметрия) и параллельный перенос имеют то общее, что каждое из этих преобразований переводит любую фигуру F на плоскости в равную ей фигуру F" . Преобразования, обладающие этим свойством, называются движениями. Гомотетия представляет собой пример преобразования, не являющегося движением. Действительно, каждое движение переводит любую фигуру в равную ей фигуру, т. е. изменяет лишь положение фигур на плоскости; гомотетия же изменяет и размеры фигур.

Роль движений в геометрии

Движения играют в геометрии чрезвычайно важную роль. Они не изменяют ни формы, ни размеров фигур, меняя лишь расположение фигуры. Но фигуры, отличающиеся лишь своим расположением на плоскости, с точки зрения геометрии совершенно одинаковы. Именно поэтому их и называют в геометрии «равными фигурами». Ни одно свойство геометрической фигуры не отличается от соответствующего свойства равной ей фигуры. Так, например, равные треугольники имеют не только одинаковые стороны, но и одинаковые углы, медианы, биссектрисы, площади, радиусы вписанной и описанной окружностей и так далее.

На уроках геометрии мы всегда считали равные фигуры (т. е. такие, которые можно совместить при помощи движения) одинаковыми или неразличимыми. Такие фигуры часто принимают за одну и ту же фигуру. Именно поэтому мы можем сказать, что, например, задача построения треугольника по двум сторонам а, bи заключенному между ними углу С имеет только одно решение. На самом деле, конечно, треугольников, имеющих данные стороны а и b и заключенный между ними угол С данной величины, можно найти бесконечно много. Однако все эти треугольники одинаковы, равны, поэтому их можно принять за «один» треугольник.

Таким образом, геометрия изучает те свойства фигур, которые одинаковы у равных фигур. Такие свойства можно назвать «геометрическими свойствами». Другими словами: геометрия изучает свойства фигур, не зависящие от их расположения. Но фигуры, отличающиеся только расположением (равные фигуры), - это те, которые можно совместить с помощью движения. Поэтому мы приходим к следующему определению предмета геометрии; геометрия изучает те свойства фигур, которые сохраняются при движениях.

Движения в геометрии и физике

Итак, понятие движения играет в геометрии первостепенную роль. Движения («наложения») использовались в VI классе для определения равных фигур, для доказательства признаков равенства треугольников; понятие движения, как мы видели выше, позволяет также дать описание предмета геометрии.

Между тем в определениях понятия равенства фигур и понятия движения имеется пробел. В самом деле, равные фигуры определялись (в VI классе) как такие фигуры, которые могут быть совмещены наложением (т. е. движением). Движения же были определены выше как такие преобразования, которые переводят два многоугольника F1 и Fтаковы, что существует многоугольник F", гомотетичный Fи равный F1 , то углы многоугольника Fсоответственно равны углам многоугольника F" и стороны многоугольника Fсоответственно, пропорциональны сторонам многоугольника F". Но у многоугольника F те же самые углы и стороны, что и у равного ему многоугольника F1. Следовательно, многоугольники F1и F подобны в том смысле, в каком это понималось в курсе геометрии VIII класса.

Обратно, пусть многоугольники F1 и F таковы, что их углы соответственно равны и стороны соответственно пропорциональны. Отношение сторон многоугольника F1 к соответствующим сторонам многоугольника Fобозначим через k. Далее, обозначим через F" многоугольник, получающийся из Fгомотетией с коэффициентом k (и каким угодно центром гомотетии. В таком случае в силу теоремы многоугольники F" и F1 будут иметь соответственно равные стороны и углы, т. е. эти многоугольники будут равны. Поэтому многоугольники F1 и Fбудут подобны и в смысле приведенного здесь определения подобия.

Глава II.Аффинные преобразования

2.1 Аффинные преобразования плоскости

Аффинным преобразованием α называется такое преобразование плоскости, которое всякую прямую переводит в прямую и сохраняет отношение, в котором точка делит отрезок.

На рис.1: L"= α(L), A"=α(A), B"=α(B), C"=α(C),

Преобразования - движение и подобие - являются частными случаями аффинных, так как в силу свойств движения и подобия для них выполнены все требования определения аффинных преобразований.

Приведем пример аффинного преобразования, не сводящегося к ранее рассмотренным. С этой целью сначала рассмотрим параллельное проектирование плоскости на плоскость.

Пусть даны плоскости: w и w1 прямая l(направление проектирования), не параллельная ни одной из этих плоскостей (рис.2). Точка Аєw называется проекцией точки А1єw1, если АА1||l , то прямая АА1 называется проектирующей прямой. Параллельное проектирование представляет собой отображение плоскости w1 на w.

Отметим следующие свойства параллельного проектирования.

1) Образом всякой прямой а1 является прямая.

В самом деле, прямые, проектирующие точки прямой а1, образуют плоскость (она проходит через а1 параллельно l), которая при пересечении с wдает образ прямой а1 – прямую а(рис.2).

2) Отношение, в котором точка делит отрезок, сохраняется, т.е.

(рис.2)

Сразу следует из теоремы о пересечении сторон угла параллельными прямыми.

Перейдем непосредственно к построению примера аффинного преобразования.

Возьмем два экземпляра плоскости w и один из них переместим в другое положение w1(рис.3). Новое положение какой-либо точки Аєwобозначим А1єw1. Теперь плоскость w1 спроектируем в каком-нибудь положении на w, проекцию точки А1 обозначим А".

Получилось преобразование плоскости w на себя, при котором

. В силу симметричных свойств параллельного проектирования для данного преобразования выполняются оба требования определенного аффинного преобразования, следовательно, построенное сейчас преобразование –перспективно- аффинное.

В этой статье я расскажу об одной необычной формуле, которая позволяет взглянуть под новым углом на аффинные преобразования, а особенно на обратные задачи, которые возникают в связи с этими преобразованиями. Обратными я буду называть задачи, требующие вычисления обратной матрицы: нахождение преобразования по точкам, решение системы линейных уравнений, преобразование координат при смене базиса и т.д. Сразу оговорюсь, что в статье не будет ни фундаментальных открытий, ни уменьшения алгоритмической сложности - я просто покажу симметричную и легко запоминающуюся формулу, с помощью которой можно решить неожиданно много ходовых задач. Для любителей математической строгости есть более формализованное изложение здесь (ориентированно на студентов) и небольшой задачник вот здесь .

Аффинное преобразование обычно задается матрицей и вектором трансляции и действует на вектор‑аргумент по формуле

Впрочем, можно обойтись и без , если воспользоваться аугментированной матрицей и однородными координатами для аргумента (как хорошо известно пользователям OpenGL). Однако оказывается, кроме этих форм записи можно ещё использовать детерминант особой матрицы, в которой содержатся как координаты аргумента, так и параметры, задающие преобразование. Дело в том, что детерминант обладает свойством линейности по элементам любой своей строки или столбца и это позволяет использовать его для представления аффинных преобразований. Вот, собственно, как можно выразить действие аффинного преобразования на произвольный вектор :

Не спешите убегать в ужасе - во‑первых, здесь записано преобразование, действующее на пространствах произвольной размерности (отсюда так много всего), а во‑вторых, хотя формула и выглядит громоздко, но просто запоминается и используется. Для начала, я выделю логически связанные элементы рамками и цветом

Итак, мы видим, что действие любого аффинного преобразования на вектор можно представить как отношение двух детерминантов, при чем вектор‑аргумент входит только в верхний, а нижний - это просто константа, зависящая только от параметров.

Выделенный синим цветом вектор - это аргумент, вектор на который действует аффинное преобразование . Здесь и далее нижние индексы обозначают компоненту вектора. В верхней матрице компоненты занимают почти весь первый столбец, кроме них в этом столбце только ноль (сверху) и единица (снизу). Все остальные элементы в матрице - это векторы‑параметры (нумеруются верхним индексом, взятым в скобки, чтобы не перепутать со степенью) и единицы в последней строке. Параметры выделяют среди множества всех аффинных преобразований то, которое нам нужно. Удобство и красота формулы в том, что смысл этих параметров очень прост: они задают аффинное преобразование, которое переводит векторы в . Поэтому векторы , мы будем называть «входными» (в матрице они обведены прямоугольниками) - каждый из них покомпонентно записан в своём столбце, снизу дописывается единица. Сверху же записываются «выходные» параметры (выделены красным цветом) , но теперь уже не покомпонентно, а как цельная сущность.

Если кого‑то удивляет такая запись, то вспомните о векторном произведении

Где была очень похожая структура и первую строку точно так же занимали векторы. При этом необязательно, чтобы размерности векторов и совпадали. Все детерминанты считаются как обычно и допускают обычные «трюки», например, к любому столбцу можно прибавить другой столбец.

С нижней матрицей всё предельно просто - она получается из верхней вычёркиванием первой строки и первого столбца. Недостаток в том, что приходится считать детерминанты, однако если эту рутинную задачу переложить на компьютер, то окажется, что человеку останется лишь правильно заполнить матрицы числами из его задачи. При этом с помощью одной формулы можно решить довольно много распространенных на практике задач:

Аффинное преобразование по трем точкам на плоскости

Под действием неизвестного аффинного преобразования три точки на плоскости перешли в другие три точки. Найдем это аффинное преобразование.

Для определенности, пусть наши входные точки

а результатом действия преобразования стали точки

Найдем аффинное преобразование .

На самом деле, решать эту задачу можно по‑разному: с помощью системы линейных уравнений, барицентрических координат… но мы пойдем своим путем. Думаю, по использованным обозначениям Вы догадываетесь к чему я клоню: берём уравнение для размерности и подставляем в качестве входных параметров, а - в качестве выходных

а дальше остается лишь посчитать детерминанты
Намётанный глаз легко обнаружит здесь поворот на и трансляцию на .

Когда формула применима?

Входные и выходные векторы могут иметь разную размерность - формула применима для аффинных преобразований, действующих на пространствах любой размерности. Впрочем, входных точек должно быть достаточно и они не должны «слипаться»: если аффинное преобразование действует из -мерного пространства - точки должны образовывать невырожденный симплекс из точки. Если это условие не выполнено, то однозначно восстановить преобразование невозможно (никаким методом вообще, не только этим) - формула предупредит об этом нулём в знаменателе.

Зачем восстанавливать аффинные преобразования программисту?

Часто нужно найти преобразование между двумя картинками (для расчёта положения камеры, например). Если у нас найдётся несколько надёжных особых точек (фич) на этих изображениях, ну или просто не хочется начинать сразу с ранзаков и борьбы с аутлаерами, то вполне можно использовать эту формулу.

Таким образом, формула прячет в себе обратную матрицу и умножение на еще одну матрицу в придачу. Это выражение и есть стандартное решение задачи нахождения линейного преобразования по точкам. Заметьте, что делая вторую матрицу в произведении единичной, мы получим просто обратную матрицу. С ее помощью решается система линейных уравнений и задачи, которые к ней сводятся: нахождение барицентрических координат, интерполяция полиномами Лагранжа, и т.д. Однако, представление в виде произведения двух матриц, не даёт нам получить те самые «два взгляда», связанные с разложением по первой строке и по первому столбцу.

Интерполяция Лагранжа и ее свойства

Напомню, что интерполяция Лагранжа - это нахождение полинома наименьшей степени проходящего через точки , , , . Не то чтобы это была распространённая в программистской практике задача, но всё равно давайте ее рассмотрим.

Как связаны полиномы и линейные преобразования?

Дело в том, что полином
можно рассматривать как линейное преобразование, которое отображает вектор в . Значит задача интерполяции точек , , , сводится к нахождению такого линейного преобразования, что

а это мы делать умеем. Подставим правильные буквы в правильные ячейки и получим формулу

Доказательство, что это будет именно полином Лагранжа (а не чей‑то другой), можно посмотреть в . Кстати, выражение в знаменателе - это определитель Вандермонда. Зная это и разложив детерминант в числителе по первой строке, придем к более привычной формуле для полинома Лагранжа.

Задача на полином Лагранжа

Сложно ли этим пользоваться? Давайте попробуем силы на задаче: найти полином Лагранжа, проходящий через точки , и .

Подставим эти точки в формулу

На графике всё будет выглядеть так.

Свойства полинома Лагранжа

Разложив верхний детерминант по первой строке и первому столбцу, мы взглянем на полином Лагранжа с двух разных сторон. В первом случае получим классическую формулу из Википедии, а во втором - запись полинома в виде суммы одночленов , где

А ещё мы теперь можем сравнительно просто доказывать довольно замысловатые утверждения. Например, в в одну строчку доказывается, что сумма базисных полиномов Лагранжа равна единице и что полином Лагранжа, интерполирующий , , , имеет в нуле значение . Ну и не Лагранжем единым - подобный подход можно применить к интерполяции синусами‑косинусами или какими‑то другими функциями.

Заключение

Спасибо всем, кто дочитал до конца. В этой статье мы решали стандартные задачи с помощью одной нестандартной формулы. Мне она понравилась тем, что, во‑первых, показывает, что аффинные(линейные) преобразования, барицентрические координаты, интерполяция и даже полиномы Лагранжа тесно связаны. Ведь когда решения задач записываются единообразно, мысль об их сродстве возникает сама собой. Во‑вторых, большую часть времени мы просто расставляли входные данные в правильные ячейки без дополнительных преобразований.

Задачи, которые мы рассматривали, можно решить и вполне привычными методами. Однако, для задач небольшой размерности или учебных задач формула может быть полезной. Кроме того, мне она кажется красивой.