INDEX
Negative Logits
퓱
-0.08
economy
-0.07
∉
-0.07
ㅤ
-0.07
Illegal
-0.07
tube
-0.07
ASTE
-0.07
omorphic
-0.07
üzü
-0.07
Cannot
-0.07
POSITIVE LOGITS
[[
0.07
皛
0.07
もらう
0.07
.[
0.07
предлаг
0.06
딛
0.06
when
0.06
Gir
0.06
นา
0.06
オススメ
0.06
Activations Density 0.007%