INDEX
Negative Logits
tim
-0.08
جائزة
-0.07
直到
-0.07
поверх
-0.07
vulnerabilities
-0.07
metropolitan
-0.07
demonstrate
-0.07
.VALUE
-0.07
と思いました
-0.07
的局面
-0.07
POSITIVE LOGITS
𝓁
0.09
Esp
0.07
url
0.07
帡
0.07
♢
0.07
In
0.07
służ
0.07
凘
0.07
tattoo
0.07
🤙
0.07
Activations Density 0.021%