INDEX
Negative Logits
mắt
-0.07
gos
-0.06
Rita
-0.06
frau
-0.06
-lat
-0.06
Nun
-0.06
_strategy
-0.06
ract
-0.06
单
-0.06
сент
-0.06
POSITIVE LOGITS
Pou
0.07
comply
0.07
внутріш
0.06
puntos
0.06
λού
0.06
lığa
0.06
ρκε
0.06
_pro
0.06
έα
0.06
кому
0.06
Activations Density 0.001%