INDEX
Explanations
numerical values or numeric expressions
New Auto-Interp
Negative Logits
ویکیپدی
-0.70
autorytatywna
-0.70
<bos>
-0.66
CloseOperation
-0.62
تقاوى
-0.60
存于互联网档案馆
-0.59
eşofman
-0.57
ikusbot
-0.57
orianCalendar
-0.56
avelength
-0.56
POSITIVE LOGITS
2
1.41
3
0.66
2
0.63
4
0.60
deux
0.52
২
0.50
۲
0.50
two
0.50
TWO
0.49
২
0.49
Activations Density 1.058%