中央値というか、まともな意見を複数並べて要旨を作る
まともなとはAIが学習しやすい文章構造がある元データのこと

最初期には元データを人間が整えてからAIに学習させていた
AIは飛び飛びや矛盾がある文章が苦手でうまく学習しない
理由は
各語句の重要性や関連性等を数学処理→文節を数学処理
→文章を数学処理→多数の文章を比較
と段階的に学ぶので
数値化したときに飛躍や矛盾があると困り学習成果が低い

逆に言うとウィキのような要約文、説明文、論文や業務文書は学習しやすい
この結果、生成データもこれらの学習成果が多くなる