INDEX
Negative Logits
том
-0.08
finir
-0.07
Sob
-0.07
theme
-0.07
TING
-0.07
skid
-0.07
rov
-0.07
規
-0.07
Sob
-0.07
’imm
-0.07
POSITIVE LOGITS
UL
0.08
Sultan
0.07
侣
0.07
electrom
0.07
日起
0.07
Klaus
0.07
sek
0.07
wax
0.07
Biel
0.07
ikorwa
0.07
Activations Density 0.015%