Ответы нейронки портят ее следующие ответы (теория)

- Если вывод нейронки отправляется к ней вместе с вводом пользователя, то ее же собственный вывод начинает влиять на ее ответы. Длинный чат вырождается, так как объем ответов нейронки (как правило или не удачных, или не соотвествующих текущему вопросу в сверхдлинном чате) начинает перебивать влияние текстов юзера. Это объяснение - теория, но похожая на правду.
Для оптимального чата нужны настройки
** игнорируй отправку некоторых или всех собственных ответов нейронки на сервер
** отправляй на сервер только избранные, лучшие комментарии
Такая "ручная коробка передач" сильно бы улучшила качество чатов, но я понимаю, что это слишком специфический механизм и проще начинать чаты сначала, чем программировать новые фичи подобного рода, которые усложнят интерфейс.
Но для программирования агентов или каких-то не чатных клиентов - это следовало бы взять на вооружение.