INDEX
Negative Logits
qi
-0.08
Mant
-0.08
urnal
-0.08
상당
-0.08
сод
-0.08
Zam
-0.08
Ад
-0.07
申し
-0.07
Рас
-0.07
agric
-0.07
POSITIVE LOGITS
时候
0.11
কোন
0.10
/how
0.09
именно
0.08
excited
0.08
луч
0.08
लोग
0.08
саме
0.08
UVA
0.07
dintre
0.07
Activations Density 0.031%