0748ウィズコロナの名無しさん垢版2023/04/21(金) 13:16:54.19ID:kgXTnmEP0 中央値というか、まともな意見を複数並べて要旨を作る まともなとはAIが学習しやすい文章構造がある元データのこと 最初期には元データを人間が整えてからAIに学習させていた AIは飛び飛びや矛盾がある文章が苦手でうまく学習しない 理由は 各語句の重要性や関連性等を数学処理→文節を数学処理 →文章を数学処理→多数の文章を比較 と段階的に学ぶので 数値化したときに飛躍や矛盾があると困り学習成果が低い 逆に言うとウィキのような要約文、説明文、論文や業務文書は学習しやすい この結果、生成データもこれらの学習成果が多くなる