INDEX
Negative Logits
.wikipedia
-0.08
withdraw
-0.07
.dequeue
-0.07
Naturally
-0.07
foliage
-0.07
Nile
-0.07
退役军人
-0.07
elderly
-0.07
.poly
-0.06
Dart
-0.06
POSITIVE LOGITS
","
0.07
Facing
0.07
طلب
0.06
" ↵
0.06
あ
0.06
альной
0.06
أسل
0.06
ᥣ
0.06
_th
0.06
ừa
0.06
Activations Density 0.016%