INDEX
Explanations
start of action or instruction
New Auto-Interp
Negative Logits
есть
0.51
있
0.48
υπάρχει
0.46
références
0.45
좋습니다
0.45
není
0.44
floats
0.44
είναι
0.43
gana
0.42
আছে
0.42
POSITIVE LOGITS
efectuar
0.50
加以
0.47
analisar
0.46
embarked
0.43
reinterpret
0.43
aplicar
0.43
aprovechar
0.42
mettre
0.42
realizar
0.41
Dar
0.41
Activations Density 0.007%