INDEX
Negative Logits
מקר
-0.08
Ma
-0.08
demonstrate
-0.08
feature
-0.08
indy
-0.08
feature
-0.07
다
-0.07
Protestant
-0.07
Ma
-0.07
anson
-0.07
POSITIVE LOGITS
Hopefully
0.09
引
0.08
飛
0.08
Slee
0.08
Hopefully
0.08
lunga
0.08
frutos
0.08
कोशिश
0.08
飞
0.08
下降
0.08
Activations Density 0.002%