INDEX
Negative Logits
заря
0.52
tır
0.48
voř
0.48
शुर
0.47
вироб
0.47
جين
0.46
напа
0.46
塁
0.46
ອ
0.46
составляют
0.46
POSITIVE LOGITS
context
0.52
role
0.51
vicinity
0.50
civilian
0.49
or
0.49
ח
0.49
Q
0.48
direction
0.47
perspectives
0.46
cluster
0.46
Activations Density 0.002%