INDEX
Negative Logits
Kor
-0.09
ಯಾವುದೇ
-0.08
कुनै
-0.08
dan
-0.08
рад
-0.08
한국
-0.08
\">\
-0.08
नेपाल
-0.08
любого
-0.07
Nelson
-0.07
POSITIVE LOGITS
etc
0.14
...),
0.11
,etc
0.11
等等
0.10
וכו
0.10
વગેરે
0.10
usw
0.10
...↵↵
0.10
vs
0.10
....↵↵
0.10
Activations Density 0.058%