INDEX
Explanations
groups followed by statements
New Auto-Interp
Negative Logits
заключается
0.57
entspricht
0.51
ergibt
0.51
получается
0.49
ொருள்
0.47
يدل
0.46
Config
0.46
标识
0.44
与其
0.44
具体的な
0.44
POSITIVE LOGITS
complained
0.85
смогут
0.85
perceive
0.84
podrán
0.76
have
0.75
complain
0.75
mogą
0.75
pourront
0.74
можуть
0.72
terão
0.72
Activations Density 0.014%