rotor: 列表操作之王
— 焉知非鱼The King of List Manipulation
对于 Raku 程序员, .rotor
是一个强大的列表操作工具。
分段 #
最简单的, .rotor
接收一个整数 $number 并把列表分成多个子列表, 每个子列表含有 $number 个元素:
say <a b c d e f g h>.rotor: 3
# ((a b c) (d e f))
我们有一个含有 8 个元素的列表, 我们在该列表上调用接收参数 3 的 .rotor
方法, 它返回 2 个列表, 每个列表中含有 3 个元素。不包括原列表中的最后 2 个元素, 因为它们没有组成一个完整的3个元素的列表。然而它们可以被包含进来, 使用 :partial
具名参数设置为 True:
say <a b c d e f g h>.rotor: 3, :partial
# ((a b c) (d e f) (g h))
say <a b c d e f g h>.rotor: 3, :partial(True)
# ((a b c) (d e f) (g h))
say <a b c d e f g h>.rotor: 3, :partial(False)
# ((a b c) (d e f))
下面应用一下我们刚刚学到的。把字符串分成列宽相等的几段:
"foobarberboorboozebazmeow".comb.rotor(10, :partial)».join».say;
# foobarberb
# oorboozeba
# zmeow
分行然后每行前面添加 4 个空格:
"foobarberboorboozebazmeow".comb.rotor(10, :partial)».join».indent(4)».say;
# foobarberb
# oorboozeba
# zmeow
但是这最好被写为:
"foobarberboorboozebazmeow".comb(10)».say
注意缝隙 #
假设你正在接受输入: 你得到一个单词, 它的法语翻译和它的西班牙语翻译, 等一堆单词。你只想输出特定语言, 所以我们需要在我们的列表中跳过某些项。 .rotor
来拯救来了!
指定一对儿(Pair)整数作为 rotor 的参数会让每个列表中含有 $key 个元素, 每个列表之间有 $value 个空隙。看例子更简单一些:
say ^10 .rotor: 3 => 1, :partial;
# OUTPUT: ((0 1 2) (4 5 6) (8 9))
say ^10 .rotor: 2 => 2, :partial;
# OUTPUT: ((0 1) (4 5) (8 9))
第一个例子我们把缝隙设置为 1, 第二个例子我们把缝隙增加为 2。
enum <English French Spanish>;
say join " ", <Good Bon Buenos morning matin días>[French..*].rotor: 1 => 2;
# OUTPUT: Bon matin
其中 [French..*]
意思为 [1..*]
, 例子中 French 被枚举化为整数 1。
重叠 #
当我们让缝隙变为负数的时候, 分段的列表中就会有元素重叠:
say <a a b c c c d>.rotor: 2 => -1
# OUTPUT: ((a a) (a b) (b c) (c c) (c c) (c d))
say <a a b c c c d>.rotor(2 => -1).map: {$_[0] eq $_[1] ?? "same" !! "different"}
# OUTPUT: (same different different same same different)
全力以赴 #
.rotor
不单单只能接受单个 Int 值或 Pair, 你可以指定额外的 Int 或 Pairs 位置参数来把列表分成不同尺寸大小的子列表, 列表之间的缝隙也不同。下面以一个日志文件为例:
IP: 198.0.1.22
Login: suser
Time: 1454017107
Resource: /report/accounting/x23gs
Input: x=42,y=32
Output: success
===================================================
IP: 198.0.1.23
Login: nanom
Time: 1454027106
Resource: /report/systems/boot
Input: mode=standard
Output: success
每段之间有一行双划线。
我们想这样输出: Header 里包含 IP, Login, Time, Resource; Operation 里包含 Resource, Input, Output。
for 'report.txt'.IO.lines».indent(4).rotor( 4 => -1, 3 => 1 ) -> $head, $op {
.say for "Header:", |$head,
"Operation:", |$op, '';
}
输出:
Header:
IP: 198.0.1.22
Login: suser
Time: 1454017107
Resource: /report/accounting/x23gs
Operation:
Resource: /report/accounting/x23gs
Input: x=42,y=32
Output: success
Header:
IP: 198.0.1.23
Login: nanom
Time: 1454027106
Resource: /report/systems/boot
Operation:
Resource: /report/systems/boot
Input: mode=standard
Output: success
先是 4 个元素一块, 缝隙为 -1(有重叠), 然后是 3 个元素一块, 缝隙为 1。这就在每个分段的列表中包含了 Resource 字段。因为 $op
和 $head
是列表, 我们使用管道符号 |
来展平列表。
记住, 你提供给 .rotor
方法的模式可以动态地生成! 这儿我们使用 sin
函数来生成:
say ^92 .rotor(
(0.2, 0.4 ... 3).map: (10 * *.sin).Int # pattern we supply to .rotor
).join: "\n"'
输出:
0
1 2 3
4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22 23
24 25 26 27 28 29 30 31 32
33 34 35 36 37 38 39 40 41
42 43 44 45 46 47 48 49 50
51 52 53 54 55 56 57 58 59
60 61 62 63 64 65 66 67 68
69 70 71 72 73 74 75 76
77 78 79 80 81 82
83 84 85 86 87
88 89 90
91
再举个例子:
我现在想要将同类的序列(字符串)进行合并,比如有这样一个文件:
>seq-1A
GACACAGTCACCCGAGCCT
>seq-1B
TCAATCAATACTGAAGCGA
>seq-1C
AAAACTAGTCGAGAAGAGAG
>seq-1D
CGTGGAAAACTCCAG
>seq-2A
TAAAAGGCGTTCATTGGATATTTC
>seq-2B
ACTGGCAGTGCATCC
我想要进行合并 得到这样的结果:
>seq-1
GACACAGTCACCCGAGCCTTCAATCAATACTGAAGCGAAAAACTAGTCGAGAAGAGAGCGTGGAAAACTCCAG
>seq-2
TAAAAGGCGTTCATTGGATATTTCACTGGCAGTGCATCC
使用 rotor
来实现:
my %re;
for 'input.txt'.IO.lines».rotor(2, :partial) -> $header, $data {
my $key = $header;
$key ~~ s/<upper>$//;
%re{$key} ~= $data;
}
for %re.kv -> $key, $value {
say "$key\n$value";
}
官网的例子 #
method rotor(*@cycle, Bool() :$partial)
rotor 返回一个 list, 这个 list 的元素也是 list, 其中每个子列表由调用者中的元素组成. 在最简单的情况下, @cycle
只包含一个整数, 这时调用者列表被分割为多个子列表, 每个子列表中的元素尽可能多的为那个整数指定的个数. 如果 :$partial
为 True, 不够分的最后那部分也会被包括进去, 即使它不满足长度的要求:
say ('a'..'h').rotor(3).join('|'); # a b c|d e f
say ('a'..'h').rotor(3, :partial).join('|'); # a b c|d e f|g h
如果 @cycle
的元素是一个 /type/Pair, 则 Pair 的键指定了所返回子列表的长度(即每个子列表中含有的元素数), Pair 的键值指定两个列表之间的间隙; 负的间隙会产生重叠:
say ('a'..'h').rotor(2 => 1).join('|'); # a b|d e|g h
say ('a'..'h').rotor(3 => -1).join('|'); # a b c|c d e|e f g
my $pair = 2 => 1;
my $key = $pair.key;
my $value = $pair.value;
say ('a'..'h').rotor($key => $value).join('|') # a b|d e|g h
如果 @cycle
的元素个数大于 1 时, rotor 会按 @cycle
中的元素依次循环调用者列表, 得到每个子列表:
say ('a'..'h').rotor(2, 3).join('|'); # a b|c d e|f g
say ('a'..'h').rotor(1 => 1, 3).join('|'); # a|c d e|f
组合多个循环周期和 :partial
也有效:
say ('a'..'h').rotor(1 => 1, 3 => -1, :partial).join('|'); # a|c d e|e|g h
注意, 从 rotor
函数返回的一列列表们赋值给一个变量时会展开为一个数组:
my @maybe_lol = ('a'..'h').rotor(2 => 1);
@maybe_lol.raku.say; # ["a", "b", "d", "e", "g", "h"]<>
这可能不是你想要的, 因为 rotor 之后的输出看起来是这样的:
say ('a'..'h').rotor(2 => 1).raku; # (("a", "b"), ("d", "e"), ("g", "h"))
要强制返回列表的列表, 使用绑定而非赋值:
my @really_lol := ('a'..'h').rotor(2 => 1);
@really_lol.raku.say; # (("a", "b"), ("d", "e"), ("g", "h"))