Уцелевшая запись анонса Perl 6

1 февраля 2015 года на конференции FOSDEM в Брюсселе Ларри Уолл объявил о том, что язык программирования Perl 6 будет готов к промышленному использованию к Рождеству 2015 года (декабрь).

К сожалению, видеозапись этого исторического доклада не сохранилась. То ли не получилось ее записать, то ли что-то еще, но организаторы не смогли опубликовать ее.

Я присутствовал на этом выступлении и по его следам подготовил статью для Pragmatic Perl.

Сегодня я публикую аудиозапись, которую я сделал из аудитории, находясь где-то ближе к ее дальним рядам. Запись шумная, с заметным эхом от помещения, но тем не менее, это единственная сохранившаяся и опубликованная запись историчесго события.

Сам анонс с датой — на 39:53.

В октябре 2019 Perl 6 переименован в Raku. В июне 2020-го анонсирован Perl 7.

Программистская разминка

На английском сайте начал нерегулярную серию Raku challenges, где буду время от времени решать задачи, предлагаемые в конкурсе Perl Weekly Challenge.

Основная идея — делать разминку и не тратить на решение вместе с описанием более получаса (ну может чуть побольше). Решение иногда может оказаться не вполне идеальным, а то и немного неверным, но главное — быстро придумать вариант, который будет еще и интересным.

Одним словом, приглашаю к чтению, первые четыре выпуска уже в эфире:

72. Опция -p командной строки Perl 6

Опция -p выполняет код для каждой строки входных данных и печатает переменную $_ в конце каждого цикла.

Следующая программа печатает все строки файла задом наперед:

$ perl6 -npe'.=flip' data.txt

Сама программа использует присваивающий вызов метода: .=flip. Это краткая запись, эквивалентная полному вызову: $_.=flip или $_ = $_.flip.

Такой вызов изменяет значение переменной по умолчанию, поэтому она будет напечатана с уже перевернутой строкой. Эквивалентная программа без использования опции -p выглядит так:

$ perl6 -ne'.flip.say' data.txt

71. Опция -n командной строки Perl 6

Опция -n командной строки Rakudo Perl 6 повторяет программу для каждой строки входного текста, что удобно, например, при обработке текстовых файлов.

Например, вот однострочник, который для каждой строки таблицы из файла печатает сумму всех столбцов:

$ perl6 -ne'say [+] .split(" ")' data.txt 

Предположим, файл data.txt содержит следующее:

10 20 30 40
1 2 3 4
5 6 7 8

В таком случае, на выходе мы получим следующий результат:

100
10
26

Обратите внимание, что можно использовать и перенаправление входного потока средствами командной оболочки:

$ perl6 -ne'say [+] .split(" ")' < data.txt 

Также обратите внимание, что при совместном использовании с опцией -e, ключи должны либо быть указаны вместе, но в порядке perl6 -ne'...', либо отдельно: perl6 -n -e'...'.

70. Опция -e командной строки Perl 6

При пользовании компилятором Rakudo Perl 6 полезно знать несколько опций командной строки, которые могут быть удобны, в частности, при написании однострочников.

Опция -e принимает стоку, в которой, собственно, и содержится вся программа, которая тут же будет выполнена.

Например, вот как можно напечатать текущую версию спецификации Perl 6:

$ perl6 -e'$*PERL.version.say'

Не путайте эту опцию с опцией -E в Perl 5.10+: в Perl 6 нет -E, а есть только -e.

69. Степени как индексы в Perl 6

В Perl 6 вы можете использовать юникодные символы цифр в суперскрипте, чтобы записать возведение в степень.

Например:

say 2⁵; # 32

С той же легкостью степень может быть больше девятой, то есть содержать больше одной цифры:

say 1.01¹³; 1.13809328043329

Более того, допустимы и отрицательные степени:

say 4⁻³; # 0.015625

Все это работает и с переменными. Например, проверим теорему Пифагора:

my $a = 3;
my $b = 4;
my $c = 5;

say $c² == $a² + $b²; # True

 

68. Типизированные хеши в Perl 6

Сегодня мы разберемся с типизированными хешами, но сначала позвольте напомнить, как указать тип простой скалярной переменной:

my Int $i;

Аналогично можно указать тип данных, который вы назначаете допустимым для элементов массива:

> my Int @i;
[]

> @i.push(42);
[42]

Если попытаться в этот массив добавить строку, произойдет ошибка:

> @i.push('Hello');
Type check failed in assignment to @i;
expected Int but got Str ("Hello")
  in block <unit> at <unknown file> line 1

А вот с хешами чуть сложнее, потому что у каждого элемента хеша два элемента: ключ и значение.

Чтобы указать тип значений, используется вот такой синтаксис:

my Str %s;

Теперь мы можем хранить строки:

> %s<Hello> = 'World'
World

> %s<42> = 'Fourty-two'
Fourty-two

Но не числа:

> %s<x> = 100
Type check failed in assignment to %s;
expected Str but got Int (100)
  in block <unit> at <unknown file> line 1

(Обратите внимание, что ключом в %s<42> тоже является строка, а не число.)

А чтобы указать тип ключей, поставьте его имя в фигурных скобках:

my %r{Rat};

У нас получился типизированный, или объектный хеш.

Например, создадим хеш, где ключами будут работать значения типа Rat:

> %r<22/7> = pi
3.14159265358979

> %r
{22/7 => 3.14159265358979}

Теперь уже невозможно использовать ни целые числа, ни строки:

> %r<Hello> = 1
Type check failed in binding to parameter 'key';
expected Rat but got Str ("Hello")
  in block <unit> at <unknown file> line 1

> %r{23} = 32
Type check failed in binding to parameter 'key';
expected Rat but got Int (23)
  in block <unit> at <unknown file> line 1

И, наконец, еще более ограничим элементы хеша, указав одновременно и тип ключей, и тип значений:

my Str %m{Int};

Ключи здесь — целые числа, а значения — строки. Например, в этом хеше теперь можно хранить соответствие номеров месяцев их названиям, но не наоборот:

> %m{3} = 'March'
March

> %m<March> = 3
Type check failed in binding to parameter 'key';
expected Int but got Str ("March")
  in block <unit> at <unknown file> line 1

 

67. Модификаторы (adverbs) в регексах Perl 6, часть 3

Осталось рассмотреть три модификатора: :r:ov и :ex.

:r или :ratchet

Запрет на бектрекинг. Сравните две попытки:

> 123 ~~ / \d+ 3/
「123」

> 123 ~~ m:r/ \d+ 3/
False

Несмотря на то, что сам по себе регекс подходит к числу 123, во втором случае класс \d+ захватил все цифры и отказывается уступать. Более реалистичный случай использования :r вы можете встретить в конструкциях с альтернативами |.

:ov или :overlap

Разрешает поиск с пересечениями. Если в одной позиции начинается более чем одна подходящая последовательность, то выбирается самая длинная. Например, найти все строки, начинающиеся с 1 и заканчивающиеся 2:

> 12345678913234 ~~ m:ov/ 1 .* 2 /
(「123456789132」 「132」)

> 12345678913234 ~~ m:ov/ 1 .*? 2 /
(「12」 「132」)

:ex или :exhaustive

Работает как :ov, но снимает ограничения на поиск самых длинных последовательностей. То есть этот модификатор найдет все:

> 12345678913234 ~~ m:ex/ 1 .* 2 /
(「123456789132」 「12」 「132」)

> 12345678913234 ~~ m:ex/ 1 .*? 2 /
(「12」 「123456789132」 「132」)

66. Модификаторы (adverbs) в регексах Perl 6, часть 2

Сегодня — продолжение обзора модификаторов регексов в Perl 6.

:p(N) или :pos(N)

Начать поиск с указанной позиции. Важно обратить внимание на то, что при использовании этого адверба (как их называть по-русски? наречия вроде не оч в тему, а название модификаторы было в Perl 5) регекс привязывается к этой позиции и не может пропустить другие символы перед тем, как совпасть.

> 'hello world' ~~ /l./
「ll」

> 'hello world' ~~ m:p(0)/l./
False

> 'hello world' ~~ m:p(1)/l./
False

> 'hello world' ~~ m:p(2)/l./
「ll」

Попробуем найти третье вхождение буквы l:

> 'hello world' ~~ m:p(8)/l./
False

> 'hello world' ~~ m:p(9)/l./
「ld」

:c или :continue

Продолжить с места предыдущего совпадения. Рассмотрим на примере с той же строкой:

> 'hello world' ~~ /l./
「ll」

> 'hello world' ~~ /l./
「ll」

> 'hello world' ~~ m:c/l./
「ld」

Аналогично :p, к :c можно добавить целочисленный аргумент, чтобы сместить начало матча в нужную позицию.

65. Модификаторы (adverbs) в регексах Perl 6, часть 1

В регексах Perl 6 по-прежнему есть модификаторы, однако они теперь выглядят и называются иначе. Называются они теперь adverbs (наречия) и ставятся после двоеточия не после, а до регекса.

Adverbs имеют короткое и длинное имена. Давайте посмотрим на имеющиеся предложения. Все приведенные ниже примеры показаны как часть диалога в режиме REPL.

:i или :ignorecase

Игнорирование регистра букв.

> 'Moscow' ~~ m:i/moscow/
「Moscow」
> 'Moscow' ~~ m/moscow/
False

:s или :sigspace

Включение режима значимости пробелов. В целом этот флаг противоположен по действию модификатору /x из Perl 5. По умолчанию пробелы в регексе считаются незначимыми.

> 'alpha beta' ~~ / a\S+ b\S+ /
Nil

> 'alpha beta' ~~ / a\S+ ' ' b\S+ /
「alpha beta」

> 'alpha beta' ~~ m:s/ a\S+ b\S+ /
「alpha beta」

:g или :global

Искать глобально (но без пересечения) и возвращать несколько результатов.

> 'text' ~~ /\w/
「t」

> 'text' ~~ m:g/\w/
(「t」 「e」 「x」 「t」)