研究開発部署「日経イノベーション・ラボ」の石原です。 自然言語処理や機械学習を用いたデータ分析やサービス開発に従事しています。
本記事では、私が参加・発表した国際学会「9th International Conference on Computational Social Science (IC2S2 2023)」について報告します。 IC2S2 は「計算社会科学」と呼ばれる分野の国際会議で、今年は 7 月 17〜20 日にデンマーク・コペンハーゲンで開催されました。
計算社会科学
計算社会科学とは、以下のような学問領域です(計算社会科学会のサイトから引用)。
大規模社会データを情報技術によって取得・処理し,分析・モデル化して,人間行動や社会現象を定量的・理論的に理解しようとする学問
たとえばソーシャルメディア分析やフェイクニュース研究といった応用があり、ニュースメディアとの親和性が高いと考えています。 日経としては、2023 年に国内学会で以下の研究成果を発表しました。 光栄なことに、CSSJ 2023 での私の発表は「大会優秀賞」を受賞しました。
- 単語分散表現による言語の通時変化の定量化:11 年分の日英ニュース記事を用いた社会的事象の分析(石原祥太郎、高橋寛武、白井穂乃)、第2回計算社会科学会大会(CSSJ 2023)、2023 年 2 月
- 政治資金収支報告書のOCRによる政治資金データベースへの試み(山田健太、青田雅輝、並木亮、横山源太朗)、2023年度人工知能学会全国大会(第37回)OS-3 計算社会科学、2023 年 6 月
IC2S2 2023
IC2S2 は、計算社会科学に関わる幅広い領域の研究者が世界中から集まる交流の場です。 開催地は欧州と米国が中心で、9 回目となる今年は 728 人がコペンハーゲンに集いました。 日本からは約 30 人程度が参加した模様です。

発表に向けては、最大 2 ページ(ただし表を除く)で提出した概要の査読がありました。 なお IC2S2 では予稿集が出版されないため、既発表の研究成果の投稿も受け付けています。 私は CSSJ 2023 の発表をもとに概要を作成し、ポスター発表として採択されました。
1 日目はチュートリアルで、2〜4 日目に本会議という日程でした。 本会議では 10 のキーノートに加えて、16 の単体口頭発表、289 の並列口頭発表、406 のポスター発表がありました。 午前 9 時ごろから午後 7 時ごろまで、発表が盛りだくさんでした。
私たちの発表
私は最終日に、以下の内容でポスター発表を行いました。
Shotaro Ishihara, Hiromu Takahashi, and Hono Shirai (2023). Quantifying Diachronic Language Change via Word Embeddings: Analysis of Social Events using 11 Years News Articles in Japanese and English. [ポスター]
この研究では、日本語と英語の 11 年間のニュース記事を題材に、単語分散表現を用いて単語の意味変化の時系列変化を定量化し分析しました。 取り組みとしては、自然言語処理の主要な国際学会「AACL 2022」に採択された論文の派生の位置づけです。 日本語と英語に共通して、2019 年と 2020 年に新型コロナウイルス感染症による単語の意味変化が生じている現象が確認できました。
印象的だった発表
個人的に最も関心を持ったのは、DeepMind の Lisa Anne Hendriks さんによる "Measuring and Mitigating Harm in AI Generated Language" と題したキーノートでした。 大規模言語モデルの危険性の側面について、どう備え・測り・対策するかという観点で全体像を俯瞰できる発表だったと思います。
私自身、日経での業務として独自の大規模言語モデルの構築に取り組んでいます(ブログ記事)。 大規模言語モデルを実用化する上での課題についても関心を持っており、自然言語処理の国際学会「ACL 2023」のワークショップに、訓練データ抽出に関する総説論文が採択されました。 実は今回の渡航の直前(日本時間 7 月 15 日未明)も、この論文について日本からオンラインでポスター発表をしていました。
その他、ニュース記事に対して専門家が限られた時間で効率的に分類器を訓練する方法を示すチュートリアルや、偽情報の拡散に関するキーノートなど、ニュースメディアに関連する話題が豊富で勉強になりました。
おわりに
本記事では、私が参加・発表した IC2S2 2023 について報告しました。 ACL 2023 ワークショップでの深夜発表を経ての時差ボケ突入で大変な面もありましたが、コペンハーゲンの素敵な街並みにも癒やされ、とても有意義な時間を過ごせたと感じています。
日本経済新聞社ではさまざまな形で、データサイエンスの業務活用や研究発表に取り組んでいます。 カジュアル面談、学生向けインターン、キャリア採用などの機会もご用意しているので、ご関心あればぜひお気軽にご連絡ください。