国際会議・ワークショップ(査読あり、予稿集あり)
- Shotaro Ishihara (2023). Training Data Extraction From Pre-trained Language Models: A Survey. Proceedings of Third Workshop on Trustworthy Natural Language Processing. (to appear)
- Shotaro Ishihara, and Yasufumi Nakama (2022). Analysis and Estimation of News Article Reading Time with Multimodal Machine Learning. Proceedings of 2022 IEEE International Conference on Big Data (Industrial & Government Track), pp. 2265-2268.
- Atom Sonoda, Fujio Toriumi, and Hiroto Nakajima (2022). Improving Recommendation Diversity by Maximizing Semantic Volume. Proceedings of the 7th International Workshop on Application of Big Data for Computational Social Science in conjunction with 2022 IEEE/WIC/ACM International Joint Conference on Web Intelligence and Intelligent Agent Technology (WI-IAT), Niagara Falls, ON, Canada, pp. 496-503.
- Shotaro Ishihara*, Hiromu Takahashi*, and Hono Shirai (2022). Semantic Shift Stability: Efficient Way to Detect Performance Degradation of Word Embeddings and Pre-trained Language Models. Proceedings of the 2nd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 12th International Joint Conference on Natural Language Processing, pp. 205–216, Online only. Association for Computational Linguistics. (*equal contribution)
- Shotaro Ishihara, and Hono Shirai. (2022). Nikkei at SemEval-2022 Task 8: Exploring BERT-based Bi-Encoder Approach for Pairwise Multilingual News Article Similarity. Proceedings of the 16th International Workshop on Semantic Evaluation (SemEval-2022), pp. 1208–1214, Seattle, United States. Association for Computational Linguistics.
- Shotaro Ishihara, and Yasufumi Nakama (2022). Generating a Pairwise Dataset for Click-through Rate Prediction of News Articles Considering Positions and Contents. Proceedings of Computation + Journalism Conference 2022. New York, NY, USA, 5 pages.
- Shotaro Ishihara, Yuta Matsuda, and Norihiko Sawa. (2021). Editors-in-the-loop News Article Summarization Framework with Sentence Selection and Compression. Proceedings of The 5th IEEE Workshop on Human-in-the-Loop Methods and Future of Work in BigData, pp. 3522-3524.
- Shotaro Ishihara, Shuhei Goda, and Hidehisa Arai. (2021). Adversarial Validation to Select Validation Data for Evaluating Performance in E-commerce Purchase Intent Prediction. Proceedings of ACM SIGIR Workshop on eCommerce (SIGIR eCom’21). ACM, New York, NY, USA, 5 pages.
- Shotaro Ishihara, Shuhei Goda, and Yuya Matsumura (2021). Weighted Averaging of Various LSTM Models for Next Destination Recommendation, Proceedings of the Workshop on Web Tourism co-located with the 14th ACM International WSDM Conference (WSDM 2021), pp. 46-49, Jerusalem, Israel.
- Atom Sonoda, Fujio Toriumi, and Hiroto Nakajima, Miyabi Goji (2018). Analysis and Modeling of Behavioral Changes in a News Service, Proceedings of 2018 IEEE/WIC/ACM International Conference on Web Intelligence (WI), Santiago, Chile, 2018, pp. 73-80.
国際会議・ワークショップ(査読あり、予稿集なし)
- Shotaro Ishihara, Hiromu Takahashi, and Hono Shirai (2023). Quantifying Diachronic Language Change via Word Embeddings: Analysis of Social Events using 11 Years News Articles in Japanese and English. 9th International Conference on Computational Social Science. Copenhagen, Denmark.
- Ryo Namiki (2023). How can a newsroom collaborate with generative AI? Two examples: science communication through visual journalism; AI as an assistant for data journalists. The Joint Computation + Journalism European Data & Computational Journalism Conference 2023. Zurich, Switzerland.
- Norihiko Sawa, and Masaki Aota (2022). OCR Optimized for Images Created by Typesetting. Computation + Journalism Conference 2022. New York, NY, USA.
- Shotaro Ishihara, and Norihiko Sawa (2021). Proposal for Extractive Summarization Method of News Articles and Collaboration with Editors in Newsroom. Computation + Journalism Symposium 2021. Online.
- Shotaro Ishihara, and Norihiko Sawa (2020). Age Prediction of News Subscribers Using Machine Learning: Case Study of Hosting Worldwide Data Analysis Competition “Kaggle”. Computation + Journalism Symposium 2020. Boston, MA, USA.
- Norihiko Sawa (2020). Test headlines on News Media by Multi-Armed Bandit: Case Study of Multi-Armed Bandit to raise CTR of Articles. Computation + Journalism Symposium 2020. Boston, MA, USA.
国内会議
- 石原祥太郎, 中間康文 (2023). マルチモーダル機械学習によるニュース記事の閲覧時間予測. 2023年度人工知能学会全国大会(第37回)論文集.
- 山田健太, 青田雅輝, 並木亮, 横山源太朗 (2023). 政治資金収支報告書のOCRによる政治資金データベースへの試み. 2023年度人工知能学会全国大会(第37回)論文集.
- 浅原正幸, 高松純子, 若狭絢, 大村舞 (2023). 日本経済新聞記事オープンコーパス:新聞記事コーパスと形態・統語情報アノテーション. 言語処理学会第29回年次大会併設ワークショップ日本語言語資源の構築と利用性の向上.
- 石原祥太郎 (2023). 事前学習済み言語モデルからの訓練データ抽出:新聞記事の特性を用いた評価セットの構築と分析. 言語処理学会第29回年次大会発表論文集.
- 大村和正, 白井穂乃, 石原祥太郎, 澤紀彦 (2023). 極性と重要度を考慮した決算短信からの業績要因文の抽出. 言語処理学会第29回年次大会発表論文集.
- 石原祥太郎, 高橋寛武, 白井穂乃 (2023). 単語分散表現による言語の通時変化の定量化:11年分の日英ニュース記事を用いた社会的事象の分析. 第2回計算社会科学会大会(CSSJ2023).(大会優秀賞)
- 石原祥太郎 (2022). 国際会議参加報告 AACL-IJCNLP 2022. 第24回音声言語シンポジウム・第9回自然言語処理シンポジウム.
- 木内美波, 中島寛人, 澤紀彦, 工藤和恵 (2022). 量子アニーリングを用いた機械学習によるユーザーの年代推定. 第25回情報論的学習理論ワークショップ.
- 木内美波, 中島寛人, 澤紀彦, 工藤和恵 (2022). 量子アニーリングによる記事の組み合わせ最適化. 日本物理学会2022年秋季大会.
- 馬嶋海斗, 石原祥太郎 (2022). ニュース用語を含むヒント付きクロスワードパズルの自動生成. NLP若手の会 (YANS) 第17回シンポジウム.(奨励賞)
- 青田雅輝, 澤紀彦 (2022). 新聞紙面の電子画像を提供するアプリにおけるコピー機能のための文字領域検出と文字割当. 第199回ヒューマンコンピュータインタラクション研究会.
- 石原祥太郎, 中間康文 (2022). 新聞記事のクリック率予測に向けたペアワイズ学習用データセットの構築手法の検討. 2022年度人工知能学会全国大会(第36回)論文集.
- 高橋寛武, 石原祥太郎, 白井穂乃 (2022). 単語分散表現を用いた新型コロナウイルスによる意味変化検出. 言語処理学会第28回年次大会発表論文集.
- 大村和正, 白井穂乃, 石原祥太郎, 澤紀彦 (2022). 決算短信からの業績要因文の抽出に向けた業績発表記事からの訓練データの生成. 言語処理学会第28回年次大会発表論文集.
- 木内美波, 工藤和恵, 中島寛人, 澤紀彦 (2022). 量子コンピューティングによる記事の組み合わせ最適化. 情報処理学会第84回全国大会講演論文集.
- 増田太郎, 石原祥太郎, 吉田勇太 (2022). 企業の業界分類予測における共変量シフト問題の抑制. 第14回データ工学と情報マネジメントに関するフォーラム.
- 山田健太, 山本真吾, 石原祥太郎, 澤紀彦 (2022). F√V:オンラインニュースメディアにおける解約予測指標の開発と活用. 第14回データ工学と情報マネジメントに関するフォーラム.
- 園田亜斗夢, 中島寛人, 鳥海不二夫 (2021). ニュースサービスにおけるコンテンツの多様性とタイトルに着目したユーザーエンゲージメントの分析. 2021年度人工知能学会全国大会(第35回)論文集.
- 石原慧人, 石原祥太郎, 白井穂乃 (2021). BertSumを用いた日本語ニュース記事の抽象型要約手法の検討. 2021年度人工知能学会全国大会(第35回)論文集.
- 石原祥太郎, 澤紀彦 (2021). MMRによる文選択とTF-IDFによる文圧縮を用いたニュース記事要約. 2021年度人工知能学会全国大会(第35回)論文集.(2021年度人工知能学会全国大会優秀賞)
- 石原祥太郎 (2020). 新聞記事での共起回数を用いた関連企業の抽出. NLP若手の会 (YANS) 第15回シンポジウム, 2020年9月23日.
- 園田亜斗夢, 中島寛人, 鳥海不二夫 (2020). 人気度に着目したニュース閲覧行動の変容分析. 2020年度人工知能学会全国大会(第34回)論文集.
- 中島寛人, 山田剛 (2018). 誤り文の自動生成による校正エンジンの学習. 言語処理学会第24回年次大会発表論文集.
- 園田亜斗夢, 鳥海不二夫, 中島寛人, 郷治雅 (2018). ネットワーク構造に基づく新聞記事の分類による読者の行動分析. 2018年度人工知能学会全国大会(第32回)論文集.
- 園田亜斗夢, 鳥海不二夫, 中島寛人, 郷治雅 (2018). ネットワーク構造に基づく新聞記事の分類. 第15回社会システム部会&第59回システム工学部会合同研究会.
- 藤本凌太朗, 網頭翔真, 星野崇宏, 丹羽亮人 (2018). メディアの閲覧内容を利用したCRMモデリング. 日本行動計量学会大会抄録集.
書籍
- 小嵜耕平, 秋葉拓哉, 林孝紀, 石原祥太郎 (2023). Kaggleに挑む深層学習プログラミングの極意, 講談社, 2023年1月31日.
- Abhishek Thakur (著), 石原祥太郎 (翻訳) (2021). Kaggle Grandmasterに学ぶ 機械学習 実践アプローチ, マイナビ出版, 2021年8月24日.
- 石原祥太郎, 村田秀樹 (2020). PythonではじめるKaggleスタートブック, 講談社, 2020年3月17日.
受賞