INDEX
Explanations
numeric data or values
`<start_of_turn>`user
New Auto-Interp
Negative Logits
io
-0.43
bo
-0.40
SpringRunner
-0.39
is
-0.38
po
-0.38
lo
-0.38
ambilan
-0.38
Hauses
-0.37
vo
-0.37
za
-0.37
POSITIVE LOGITS
שוליים
0.62
مشين
0.58
surla
0.56
OGND
0.54
незавершена
0.53
osoba
0.51
autorytatywna
0.51
دانشنامهٔ
0.50
كومونز
0.50
الرياضيه
0.49
Activations Density 0.000%