NIKKEI TECHNOLOGY AND CAREER

第14回データ工学と情報マネジメントに関するフォーラム(DEIM2022)で2件発表します

研究開発部署「日経イノベーション・ラボ」の石原です。

2月27日〜3月2日にオンライン開催される第14回データ工学と情報マネジメントに関するフォーラム(DEIM2022)で、日本経済新聞社から2件発表します。 当日の議論や懇親会などを通じて、多くの皆さまと交流できる機会を楽しみにしています。

企業の業界分類予測における共変量シフト問題の抑制

  • 口頭発表:G24 機械学習(推定・生成・予測)
  • 2022年2月28日(月)15:15~17:45
  • 増田太郎 (株式会社日本経済新聞社), 石原祥太郎 (株式会社日本経済新聞社), 吉田勇太 (株式会社ブレインパッド)

本研究では、企業の属性情報や概要説明文のテキスト情報を利用して業界分類を機械学習で予測する際に、学習時と予測時のデータの性質の違いによる影響を抑制する手法を提案します。 具体的には学習用データセットには上場企業、評価用データセットには非上場企業を扱い、(i)属性情報の人為的な欠損、(ii)学習データと予測データの間の分布の違いを考慮した特徴選択、(iii)入力テキストのトークン長の調整ーーという3つの手法を利用してこれらの特徴量の性質の違いに対応します。 実験を通じて、上場企業に対して58.5%、非上場企業に対して56.1%の正答率を達成し、上述の3つの対策を講じない場合と比較して約2ポイントほどの性能向上を確認しました。

FVF\sqrt{V}:オンラインニュースメディアにおける解約予測指標の開発と活用

  • インタラクティブ発表:day4 p25
  • 2022年3月2日(木)15:15~16:15
  • 山田健太 (株式会社日本経済新聞社), 山本真吾 (株式会社日本経済新聞社), 石原祥太郎 (株式会社日本経済新聞社), 澤紀彦 (株式会社日本経済新聞社)

本研究では、日本経済新聞社で開発され5年以上にわたり運用されている解約予測指標「FVF\sqrt{V}」について説明します。 この指標は訪問頻度(Frequency)と閲覧量(Volume)からなり、将来的な解約率を目的変数として、機械学習を用いて開発されました。 実データを用いた実験を通じて、単純な2要素からなる指標が開発から数年を経た段階でも一定程度の予測性能を持ち、複雑な要素を組み合わせた指標と比較する中で有用な選択肢となり得ると示唆されました。 セグメンテーション・施策の効果測定など、具体的な活用事例についても報告します。

石原祥太郎
DATA SCIENTIST石原祥太郎

Entry

各種エントリーはこちらから

キャリア採用
Entry
新卒採用
Entry
短期インターン
Entry