0001アルヨ ★
2020/06/02(火) 15:47:07.85ID:P/idpm6k9人工知能(AI)の重要分野であるNLP(自然言語処理)。その活用分野として最も大きな潜在力を秘めているのがAIライティング(自動作文)だ。中国でも2015〜16年にかけてテンセント、新華社、バイトダンス傘下のニュースアプリ「今日頭条(Toutiao)」が報道分野でこの技術を活用するようになったが、ここでの競争のカギを握ったのが、AIライティングの独創性と読みやすさだった。こうした中で注目されるのがコンテンツ制作ロボットを開発する「深圳市智搜信息技術(GIISO)」。膨大なデータ蓄積と、独自のアルゴリズムという強みを生かして、5秒で10本の記事を自動作成する高性能なシステムを開発、政府やメディア、マーケティング会社など多くの顧客にAIによる文書などのコンテンツの作成サービスを提供している。
キーワードなどを入力するだけで自動で記事を作成してくれる(GIISO提供)
AIによるNLPは現在、主に検索、質問応答システム、そしてAIライティングの3分野で活用されている。このうち検索はほとんどグーグルやバイドゥ(百度)という世界的な検索エンジン運営企業が握っている。質問応答システムは応用範囲が広いことに加え、マンマシンインターフェース技術の洗練や製品標準化などの面で問題があるため、実用化はもう少し先になりそうだ。それに対し、AIライティングの可能性は大きく、特に書面文書の処理能力はすでに円熟の域に達している。2007年に試用が始まり、2014年には米国連邦準備制度(FRS)が自然言語生成エンジン「Wordsmith」で財務関連ニュースを作成。同年にはWordsmithの開発元「Automated Insights」社が作成した文書が10億件に達した。
こうした中、2013年に設立されたGIISOはその後わずか5年で製品を世に送り出した。メディア、マーケティング、広報、政治、経済関連の企業サービスと個人ユーザーを対象にコンテンツ制作をSaaS(必要なソフトウェアを必要とされる分だけ提供するサービス)の形で提供している。
独創的で読みやすいコンテンツを制作するには、大量の素材を蓄積することと、的確なアルゴリズムという中核技術が必要となる。GIISOはマーケティング、情報、金融分野のナレッジグラフを作成し、ノード数は億に上る。またこれら三分野に関する文章、段落、文、情報などの素材に絶えずアノテーション(データを分類しやすくする属性タグをつける作業)を行っており、中でもマーケティング関連の素材はすでに50億を超えた。アルゴリズムは、WikiAnswers、Quora、TCNPlatform、LCQMC(Large-scale Chinese Question Matching Corpus)など専門の訓練用データセットを利用し、人間の監修なしで言語を生成するモデルを開発、100億以上の文章による訓練を重ねて、独創的な記事を生み出している。5秒以内に1000〜2000文字から成る10本のオリジナル記事が作成でき、読みやすさを示す「可読性」の比率は80%ほどになる。
↓続き
https://r.nikkei.com/article/DGXMZO59730420Z20C20A5FFE000