INDEX
Negative Logits
olocation
-0.08
LOCATION
-0.08
orium
-0.08
ivil
-0.07
tayi
-0.07
uden
-0.07
ophagus
-0.07
φων
-0.07
eliness
-0.07
frey
-0.07
POSITIVE LOGITS
يم
0.08
یم
0.08
启动
0.08
ဲ့
0.08
Paren
0.08
思想
0.07
ેમ
0.07
,两
0.07
�
0.07
表达
0.07
Activations Density 0.001%