INDEX
Negative Logits
л
0.96
м
0.80
῎
0.73
ل
0.67
в
0.67
၇
0.66
9
0.66
доро
0.66
⁹
0.66
цию
0.65
POSITIVE LOGITS
前面的
0.70
-
0.70
前
0.64
分析
0.63
od
0.62
主
0.61
组织
0.61
前面
0.60
přip
0.59
主题
0.57
Activations Density 0.004%
л
м
῎
ل
в
၇
9
доро
⁹
цию
前面的
-
前
分析
od
主
组织
前面
přip
主题