INDEX
Negative Logits
vamos
-0.09
루
-0.08
deserved
-0.08
털
-0.08
tà
-0.08
friendship
-0.07
unlikely
-0.07
ю
-0.07
underestimated
-0.07
tubes
-0.07
POSITIVE LOGITS
에서는
0.10
zeichnet
0.10
では
0.10
通常
0.10
强调
0.09
uuden
0.09
主要
0.08
hallmark
0.08
verfol
0.08
核心
0.08
Activations Density 0.091%