INDEX
Negative Logits
Č
-0.08
endor
-0.08
occo
-0.07
eon
-0.07
agli
-0.07
ikip
-0.07
zers
-0.07
ENU
-0.07
ummings
-0.07
unken
-0.07
POSITIVE LOGITS
WG
0.06
egin
0.06
utsche
0.06
twice
0.05
-neutral
0.05
ulumi
0.05
ÄĻ
0.05
à¸²à¸Ł
0.05
Ñİдж
0.05
Turk
0.05
Activations Density 0.000%