INDEX
Explanations
self introductions and greetings
New Auto-Interp
Negative Logits
ufficient
0.44
लाइजेशन
0.44
Quadrup
0.43
شرطونو
0.42
ഉരു
0.41
methodological
0.41
அவருக்கு
0.41
vassals
0.40
उपलब्
0.40
পাবে
0.39
POSITIVE LOGITS
我是
0.70
👋
0.59
merupakan
0.51
こんばんは
0.49
hello
0.49
hello
0.48
จาก
0.48
大家好
0.48
這裡是
0.47
зовут
0.46
Activations Density 0.090%