INDEX
Negative Logits
уш
-0.08
Hoover
-0.07
alloc
-0.07
avelength
-0.07
vah
-0.07
vern
-0.07
машин
-0.07
verno
-0.07
krieg
-0.07
.machine
-0.07
POSITIVE LOGITS
darb
0.08
culin
0.08
bi
0.08
culturales
0.08
pensé
0.07
fete
0.07
طب
0.07
တွေ
0.07
uniqu
0.07
skjer
0.07
Activations Density 0.594%