Raku 中的引号
— 焉知非鱼Quote in Raku
除了 q 和 qq 之外,现在还有一种基本形式的 Q,它不会进行插值,除非显式地修改它那样做。所以,q 实际上是 Q:q 的简称,qq 实际上是 Q:qq
的简称。实际上所有的 quote-like 形式都派生自带有副词的 Q 形式:
S02-literals/quoting.t lines 95–116 S02-literals/quoting.t lines 132–139
q// Q :q //
qq// Q :qq //
rx// Q :regex //
s/// Q :subst ///
tr/// Q :trans ///
诸如 :regex
的副词通过转换到不同的解析器改变了语言的解析。这能完全改变任何之后的副词还有所引起的东西自身的解释。
q:s// Q :q :scalar
rx:s// Q :regex :scalar //
就像 q[...]
拥有简写形式的 ‘…’, 并且 qq[...]
拥有简写形式的 “…” 一样,完整的 Q[...]
引用也有一种使用半角括号 「…」 的短形式。
引号上的副词
广义上的引号现在可以接收副词了:
- S02-literals/quoting.t lines 210–223
- S02-literals/quoting.t lines 55–69
- S02-literals/quoting.t lines 427–501
Short Long Meaning
===== ==== =======
:x :exec 作为命令执行并返回结果
:w :words 按单词分割结果(没有引号保护)
:ww :quotewords 按单词分割结果 (带有引号保护)
:v :val Evaluate word or words for value literals
:q :single 插值 \\, \q 和 \' (or whatever)
:qq :double 使用 :s, :a, :h, :f, :c, :b 进行插值
:s :scalar 插值 $ vars
:a :array 插值 @ vars
:h :hash 插值 % vars
:f :function 插值 & 调用
:c :closure 插值 {...} 表达式
:b :backslash 插值 \n, \t, 等. (至少暗示了 :q )
:to :heredoc 把结果解析为 heredoc 终止符
:regex 解析为正则表达式
:subst 解析为置换 (substitution)
:trans 解析为转换 (transliteration)
:code Quasiquoting
:p :path 返回一个 Path 对象 (查看 S16 获取更多选项)
通过在开头加入一个带有短形式的单个副词的 Q,q,或 qq,你可以省略掉第一个冒号,这产生了如下形式:
qw /a b c; # P5-esque qw// meaning q:w
Qc '...{$x}...; # Q:c//, interpolate only closures
qqx/$cmd @args[] # equivalent to P5's qx//
(注意 qx//
不插值)
如果你想进一步缩写,那么定义一个宏:
macro qx { 'qq:x ' } # equivalent to P5's qx//
macro qTO { 'qq❌w:to ' } # qq❌w:to//
macro quote:<❰ ❱> ($text) { quasi { {{{$text}}}.quoteharder } }
所有大写的副词被保留用作用户定义的引号。所有在 Latin-1 上面的 Unicode 分隔符被保留用作用户定义的引号。 S02-literals/quoting.t lines 352–426
关于上面我们现在有了一个推论,我们现在能说:
%hash = qw:c/a b c d {@array} {%hash};
或:
%hash = qq:w/a b c d {@array} {%hash};
把东西(items)插值到 qw 中。默认地,数组和散列在插值时只带有空格分隔符,所以之后的按空格分割仍旧能工作。(但是内置的 «…» 引号自动进行了等价于 qq:ww:v/.../
的插值)。 内置的 <...>
等价于 q:w:v/.../
。
The Q Lang #
在 Raku 中, 字符串通常使用一些引号结构来表示。这些引号结构中,最简单的就是 Q
, 通过便捷方式 「…」
或 Q
后跟着由任意一对儿分隔符包围着的文本。大多数时候, 你需要的只是 '…'
或 "…"
.
Literal strings: Q #
Q[A literal string]
「More plainly.」
Q ^Almost any non-word character can be a delimiter!^
Q 「「Delimiters can be repeated/nested if they are adjacent.」」
分隔符能够嵌套, 但是在普通的 Q 形式中, 反斜线转义是不允许的。换种说法就是, Q 字符串尽可能被作为字面量。
在 Q
、q
或 qq
之后不允许立即使用一些分隔符。标识符中允许的任何字符都不允许使用,因为在这种情况下,引号结构和这些字符一起被解释为标识符。此外,( )
是不允许的,因为它被解释为函数调用。如果你仍然希望使用这些字符作为分隔符,请用空格将它们与 Q
、q
或 qq
分隔开。请注意,一些自然语言在字符串的右侧使用左分隔引号。Q
不支持这些,因为它依赖 unicode 属性来区分左分隔符和右分隔符。
Q'this will not work!'
Q(this won't work either!)
上面对例子会产生错误。然而,下面这个能起作用:
Q (this is fine, because of space after Q)
Q 'and so is this'
Q<Make sure you <match> opening and closing delimiters>
Q{This is still a closing curly brace → \}
这些例子产生:
this is fine, because of space after Q
and so is this
Make sure you <match> opening and closing delimiters
This is still a closing curly brace → \
引号结构的行为可以用副词修改,后面的章节会详细解释。
Short | Long | Meaning |
---|---|---|
:x | :exec | Execute as command and return results |
:w | :words | Split result on words (no quote protection) |
:ww | :quotewords | Split result on words (with quote protection) |
:q | :single | Interpolate \, \qq[…] and escaping the delimiter with \ |
:double | Interpolate with :s, :a, :h, :f, :c, :b | |
:s | :scalar | Interpolate $ vars |
:a | :array | Interpolate @ vars |
:h | :hash | Interpolate % vars |
:f | :function | Interpolate & calls |
:c | :closure | Interpolate {…} expressions |
:b | :backslash | Enable backslash escapes (\n, \qq, $foo, etc) |
:to | :heredoc | Parse result as heredoc terminator |
:v | :val | Convert to allomorph if possible |
Escaping: q #
'Very plain';
q[This back\slash stays];
q[This back\\slash stays]; # Identical output
q{This is not a closing curly brace → \}, but this is → };
Q :q $There are no backslashes here, only lots of \$\$\$>!$;
'(Just kidding. There\'s no money in that string)';
'No $interpolation {here}!';
Q:q!Just a literal "\n" here!;
q
形式的引号结构允许使用反斜线转义可能会结束字符串的字符. 反斜线自身也能被转义, 就像上面的第三个例子那样. 通常的形式是 '...'
或 q
后跟着分隔符, 但是它也能作为 Q 上的副词使用, 就像上面的第五个和最后一个例子那样.
这些例子产生:
Very plain
This back\slash stays
This back\slash stays
This is not a closing brace → } but this is →
There are no backslashes here, only lots of $$$!
(Just kidding. There's no money in that string)
No $interpolation {here}!
Just a literal "\n" here
\qq[...]
转义序列允许 qq 插值 的一部分字符串。当字符串中有 HTML 标记时,使用这个转义序列非常方便,可以避免将尖括号解释为散列键:
my $var = 'foo';
say '<code>$var</code> is <var>\qq[$var.uc()]</var>';
# OUTPUT: «<code>$var</code> is <var>FOO</var>»
Interpolation: qq #
my $color = 'blue';
say "My favorite color is $color!"; # My favorite color is blue!
qq
形式 - 通常使用双引号写成 - 允许变量的插值, 例如字符串中能写入变量, 以使变量的内容能插入到字符串中. 在 qq
引起字符串中, 也能转义变量.
say "The \$color variable contains the value '$color'";
# The $color variable contatins the value 'blue'
qq
的另外一种功能是使用花括号在字符串中插值 Raku 代码:
my ($x, $y, $z) = 4, 3.5, 3;
say "This room is $x m by $y m by $z m.";
say "Therefore its volume should be { $x * $y * $z } m³!";
输出:
This room is 4 m by 3.5 m by 3 m.
Therefore its volume should be 42 m³!
默认情况下, 只有带有 $
符号的变量才能正常插值. 这时, "documentation@raku.org"
不会插值 @raku
变量。如果你确实想那么做, 在变量名后面添加一个 []
:
my @neighbors = "Felix", "Danielle", "Lucinda";
say "@neighbors[] and I try our best to coexist peacefully.";
输出:
Felix Danielle Lucinda and I try our best to coexist peacefully.
通常使用一个方法调用会更合适. 只有在 qq
引号中, 方法调用后面有圆括号, 就能进行插值:
say "@neighbors.join(', ') and I try our best to coexist peacefully.";
输出:
Felix, Danielle, Lucinda and I try our best to coexist peacefully.
而 "@example.com"
产生 @example.com
.
要调用子例程请使用 &
符号。
say "abc&uc("def")ghi";
# OUTPUT: «abcDEFghi»
后环缀操作符和 subscripts 也会被插值。
my %h = :1st; say "abc%h<st>ghi";
# OUTPUT: «abc1ghi»
要输入 unicode 序列,请使用 \x
或 \x[]
加上字符的十六进制编码或字符列表。
my $s = "I \x2665 Raku!";
say $s;
# OUTPUT: «I ♥ Raku!»
$s = "I really \x[2661,2665,2764,1f495] Raku!";
say $s;
# OUTPUT: «I really ♡♥❤💕 Raku!»
您还可以在 \c[] 中使用 unicode 名称、命名序列和名称别名。
my $s = "Camelia \c[BROKEN HEART] my \c[HEAVY BLACK HEART]!";
say $s;
# OUTPUT: «Camelia 💔 my ❤!»
对未定义值进行插值将引发控件异常,该异常可以在当前控件块中使用 CONTROL 捕获。
sub niler {Nil};
my Str $a = niler;
say("$a.html", "sometext");
say "alive"; # this line is dead code
CONTROL { .die };
Word quoting: qw #
qw|! @ # $ % ^ & * \| < > | eqv '! @ # $ % ^ & * | < >'.words.list
q:w { [ ] \{ \} } eqv ('[', ']', '{', '}')
Q:w | [ ] { } | eqv ('[', ']', '{', '}')
:w
通常写作 qw
, 把字符串分割为 “words” (单词). 在这种情景下, 单词被定义为由空格分割的一串非空白字符. q:w
和 qw
继承了 q
的插值和转义语法, 还有单引号字符串分割符, 而 Qw
和 Q:w
继承了 Q
的非转义语法.
my @directions = 'left', 'right,', 'up', 'down';
这样读和写都更容易:
my @directions = qw|left right up down;
Word quoting: <> #
say <a b c> eqv ('a', 'b', 'c'); # OUTPUT: «True»
say <a b 42> eqv ('a', 'b', '42'); # OUTPUT: «False», the 42 became an IntStr allomorph
say < 42 > ~~ Int; # OUTPUT: «True»
say < 42 > ~~ Str; # OUTPUT: «True»
尖括号的引号类似于 qw
,但有一个额外的特性,可以让你构造特定数字的同质异形体或字面量:
say <42 4/2 1e6 1+1i abc>.raku;
# OUTPUT: «(IntStr.new(42, "42"), RatStr.new(2.0, "4/2"), NumStr.new(1000000e0, "1e6"), ComplexStr.new(<1+1i>, "1+1i"), "abc")»
要构造 Rat 或 Complex 字面量,请在数字周围使用尖括号,不带任何额外的空格:
say <42/10>.^name; # OUTPUT: «Rat»
say <1+42i>.^name; # OUTPUT: «Complex»
say < 42/10 >.^name; # OUTPUT: «RatStr»
say < 1+42i >.^name; # OUTPUT: «ComplexStr»
与 42/10
和 1+42i
相比,不涉及除法(或加法)运算。这对于例程签名中的字面量很有用,例如:
sub close-enough-π (<355/113>) {
say "Your π is close enough!"
}
close-enough-π 710/226; # OUTPUT: «Your π is close enough!»
# WRONG: can't do this, since it's a division operation
sub compilation-failure (355/113) {}
Word quoting with quote protection: qww #
单词引用的 qw
格式将按字面意思处理引用字符,将它们保留在结果单词中:
say qw{"a b" c}.raku; # OUTPUT: «("\"a", "b\"", "c")»
因此,如果您希望在结果单词中保留引用的子字符串作为单个项,则需要使用 qww
变体:
say qww{"a b" c}.raku; # OUTPUT: «("a b", "c")»
Word quoting with interpolation: qqw #
qw
形式的 word quoting 不会进行变量插值:
my $a = 42; say qw{$a b c}; # $a b c
因此, 如果你想在引号字符串中进行变量插值, 你需要使用 qqw
变体:
my $a = 42;
my @list = qqw{$a b c};
say @list; # 42 b c
注意,变量插值发生在单词分割之前:
my $a = "a b";
my @list = qqw{$a c};
.say for @list; # OUTPUT: «abc»
Word quoting with interpolation and quote protection: qqww #
qqw
形式的单词引用会把引起的字符当作字面量,将引起的字符留在结果单词中:
my $a = 42; say qqw{"$a b" c}.raku; # OUTPUT: «("\"42", "b\"", "c")»
因此,如果希望在结果单词中保留引起的子字符串为单个项,则需要使用 qqww
变体:
my $a = 42; say qqww{"$a b" c}.raku; # OUTPUT: «("42 b", "c")»
引号保护发生在插值之前,插值发生在分词之前,所以来自插值变量内部的引号只是字面引号字符:
my $a = "1 2";
say qqww{"$a" $a}.raku; # OUTPUT: «("1 2", "1", "2")»
my $b = "1 \"2 3\"";
say qqww{"$b" $b}.raku; # OUTPUT: «("1 \"2 3\"", "1", "\"2", "3\"")»
Word quoting with interpolation and quote protection: « » #
这种引用方式类似于 qqww
,但它具有构造 allomorphs 的额外好处(使其功能相当于 qq:ww:v)。与 «»
等价的 ASCII 是双尖括号 << >>
。
# Allomorph Construction
my $a = 42; say « $a b c ».raku; # OUTPUT: «(IntStr.new(42, "42"), "b", "c")»
my $a = 42; say << $a b c >>.raku; # OUTPUT: «(IntStr.new(42, "42"), "b", "c")»
# Quote Protection
my $a = 42; say « "$a b" c ».raku; # OUTPUT: «("42 b", "c")»
my $a = 42; say << "$a b" c >>.raku; # OUTPUT: «("42 b", "c")»
Shell quoting: qx #
要将字符串作为外部程序运行,不仅可以将字符串传递给 shell
或 run
函数,还可以执行 shell 引用。然而,有一些微妙之处需要考虑。qx
引号不插入变量。因此
my $world = "there";
say qx{echo "hello $world"}
仅仅打印 hello
. 然而, 如果你在调用 raku
之前声明了一个环境变量, 这在 qx
里是可用的, 例如:
WORLD="there" raku
> say qx{echo "hello $WORLD"}
现在会打印 hello there
.
调用 qx
会返回结果, 所以这个结果能被赋值给一个变量以便后来使用:
my $output = qx{echo "hello!"};
say $output; # hello!
Shell quoting with interpolation: qqx #
如果希望在外部命令中使用 Raku 变量的内容,那么应该使用 qqx
shell 引用结构:
my $world = "there";
say qqx{echo "hello $world"}; # hello there
再一次, 外部命令的输出结果可以保存在一个变量中:
my $word = "cool";
my $option = "-i";
my $file = "/usr/share/dict/words";
my $output = qqx{grep $option $word $file};
# runs the command: grep -i cool /usr/share/dict/words
say $output; # CooleyCooley'sCoolidgeCoolidge'scool ...
有关执行外部命令的更好方法,请参见 run 和 Proc::Async。
Heredocs: :to #
一种方便的写多行字符串字面量的方式是 heredocs,它让你选择自己的分隔符:
say q:to/END/;
Here is
some multi-line
string
END
heredoc 的内容总是从下一行开始,所以你可以(也应该)完成这一行。
my $escaped = my-escaping-function(q:to/TERMINATOR/, language => 'html');
Here are the contents of the heredoc.
Potentially multiple lines.
TERMINATOR
如果终止分隔符缩进了, 同等数量的缩进会从字符串字面量上移除. 因此下面这个 heredoc
say q:to/END/;
Here is
some multi line
string
END
输出:
Here is
some multi line
string
heredoc 包含了终止符之前的换行符。
要允许对变量进行插值,可以使用 qq
形式,但如果不是已定义变量的标识符,则必须转义元字符 {\
和 $
。例如:
my $f = 'db.7.3.8';
my $s = qq:to/END/;
option \{
file "$f";
};
END
say $s;
会产生:
option {
file "db.7.3.8";
};
您可以在同一行开始多个 heredoc。
my ($first, $second) = qq:to/END1/, qq:to/END2/;
FIRST
MULTILINE
STRING
END1
SECOND
MULTILINE
STRING
END2
Unquoting #
字面量字符串允许使用转义序列插入内嵌的引用结构,例如:
my $animal="quaggas";
say 'These animals look like \qq[$animal]'; # OUTPUT: «These animals look like quaggas»
say 'These animals are \qqw[$animal or zebras]'; # OUTPUT: «These animals are quaggas or zebras»
在本例中,\qq
将做双引号内插,\qqw
文字内插。如上所述,转义任何其他引用结构都将以相同的方式进行,从而允许在字面量字符串中进行插值。
Regexes #
有关在 regexes 中应用的引用的信息,请参阅正则表达式文档。