INDEX
Negative Logits
पठ
-0.09
टिक
-0.08
バー
-0.07
-level
-0.07
અભ
-0.07
compartment
-0.07
Panther
-0.07
verification
-0.07
-ca
-0.07
Steel
-0.07
POSITIVE LOGITS
betr
0.08
年前
0.08
。有
0.08
骗子
0.08
anecd
0.08
gefragt
0.08
0.08
alles
0.08
�
0.08
freut
0.07
Activations Density 0.027%