INDEX
Negative Logits
トレ
-0.09
זאת
-0.08
kształ
-0.07
рай
-0.07
工作总结
-0.07
补齐
-0.07
Fé
-0.07
vượt
-0.07
转变
-0.07
Nam
-0.06
POSITIVE LOGITS
作った
0.08
مشاكل
0.07
Agents
0.07
delaying
0.07
汞
0.07
旴
0.07
ทำการ
0.07
_micro
0.07
ха
0.07
沟
0.07
Activations Density 0.011%