NIKKEI TECHNOLOGY AND CAREER

人工知能学会全国大会の優秀賞受賞&IEEE HMData 2021論文採択

研究開発部署「日経イノベーション・ラボ」の石原です。

このたび、今年6月の研究発表が2021年度人工知能学会全国大会の優秀賞を受賞しました。 そしてほぼ同時期に、この研究を発展させた論文が国際会議ワークショップ「The 5th IEEE Workshop on Human-in-the-Loop Methods and Future of Work in BigData (IEEE HMData 2021)」に採択されました。 本記事では、これらの研究について概要を紹介します。

研究の概要

日本経済新聞社では機械学習や自然言語処理と呼ばれる情報技術の領域を探求しつつ、積極的な事業活用に挑戦しています。 情報技術を活用できる場面は数多くありますが、分かりやすい応用例の一つに「ニュース記事の要約」が挙げられます。 たとえば、ニュース記事の本文を入力として与えた際に、出力として見出しを生成するシステムなどが考えられるでしょう。

事業会社の中でこうした情報技術を活用していく上で個人的に大切だと思っているのが、利用者となる人間との関わり方です。 具体的には「機械が人間からどのような入力を受け付け、どのような出力を返すのか」「機械に人間がどの程度の性能の出力を期待するのか」「意図通りの出力ではない場合にどのように機械の出力を調整するのか」などの観点があります。

これらの背景を受けて今回の研究では、編集者が記事要約のために情報技術を活用していく枠組みを提案しました。 発表タイトルや学会名は以下の通りです。

後者の論文で提案した枠組みを以下の図に示しました。 詳細の説明は論文に譲りますが「文の選択」「文の圧縮」「編集者による活用とフィードバック」で構成されています。 編集者が利活用しやすくフィードバックを反映しやすい枠組みを提案した点や、考案した枠組みによる出力を実際の編集者の要約と比較・考察した点などが研究の貢献だと考えています。

image.png

研究の経緯

本論文は「Project-in-progress papers」というセクションで採択されました。 その名の通りまだまだ発展途上の研究ですが、この採択に至るまで、数多くの方々との議論に支えられています。

今回の研究の発端は2020年、当時は北海道大学大学院の修士課程生だった松田祐汰さんの約2週間のインターンでの取り組みでした。 私や共著者の澤を中心に、多くの関係者で議論を重ねながら研究の方向性を見定めていきました。

2021年6月の人工知能学会全国大会の発表でも、たくさんの有益な質問・コメントを頂きました。 ここでは、オーガナイズドセッション「ニュースメディアのデータサイエンス」という、関心領域の近い参加者が集まる場で発表できたことが大きかったと考えています。 運営に携わった方々に、改めてお礼申し上げます。

編集者と機械が連携する枠組みに焦点を当てて論文をまとめ直そうと考えたのは、2021年8月のNLP若手の会 (YANS) 第16回シンポジウム (2021)でのチュートリアルがきっかけでした。 ちょうど人工知能学会全国大会での議論を受けて方向性を検討している時期で、今回の研究は「human in the loop」という切り口で考えられるかもしれないと思い立ちました。

IEEE HMData 2021は12月15日にオンラインで開催され、採択された論文について質疑応答を含む12分の発表を予定しています。 基調講演や研究発表、参加者との議論などから、さらなる学びが得られるのが今から楽しみです。

終わりに

本記事では、人工知能学会全国大会の優秀賞を受賞し、IEEE HMData 2021に論文採択された研究を紹介しました。 日本経済新聞社はウェブやメディアに関連する先端技術を探究しつつ、積極的な事業活用に挑戦しています。 メディアの未来を作る仕事に興味のある方は、ぜひお気軽にご連絡ください。

石原祥太郎
DATA SCIENTIST石原祥太郎

Entry

各種エントリーはこちらから

キャリア採用
Entry
新卒採用
Entry
短期インターン
Entry