INDEX
Negative Logits
Shirley
-0.08
Hall
-0.08
_fold
-0.08
装修
-0.07
ruime
-0.07
Conde
-0.07
Stanley
-0.07
Prag
-0.07
dealt
-0.07
-fold
-0.07
POSITIVE LOGITS
Cyril
0.10
unicode
0.10
Unicode
0.10
Unicode
0.10
invisible
0.10
русский
0.09
Arabic
0.09
中文
0.09
accents
0.09
_unicode
0.09
Activations Density 0.012%