INDEX
Negative Logits
jing
-0.09
�
-0.08
Tong
-0.08
-0.08
offspring
-0.08
Dos
-0.08
mangas
-0.08
-bearing
-0.07
beaut
-0.07
Tang
-0.07
POSITIVE LOGITS
Hodg
0.11
尔
0.08
斯
0.08
姆
0.08
john
0.08
Thompson
0.07
Franklin
0.07
రుగ
0.07
عدين
0.07
沃
0.07
Activations Density 0.037%