INDEX
Negative Logits
ınd
-0.08
_EOL
-0.08
narration
-0.08
iles
-0.07
narr
-0.07
vu
-0.07
vật
-0.07
abgeschlossen
-0.07
Vaj
-0.07
racont
-0.07
POSITIVE LOGITS
stric
0.12
enforcement
0.11
compliance
0.11
Compliance
0.11
looph
0.10
监管
0.10
künftig
0.10
imposed
0.10
Enforcement
0.10
规定
0.10
Activations Density 0.091%