INDEX
Negative Logits
ul
-0.08
Map
-0.08
Loki
-0.08
ultras
-0.08
wel
-0.07
bl
-0.07
dilution
-0.07
Map
-0.07
prof
-0.07
bal
-0.07
POSITIVE LOGITS
stimulant
0.09
abilecek
0.08
િયર
0.08
筋
0.07
Ital
0.07
าร
0.07
rut
0.07
_dyn
0.07
叶
0.07
תוך
0.07
Activations Density 0.001%