この記事はNikkei Advent Calendar 2022の 11 日目の記事です。
目次
1. はじめに
こんにちは。編集データビジュアルセンター戦略コンテンツグループの千﨑です。戦略コンテンツグループはニュースをわかりやすくビジュアルに伝える日経ビジュアルデータの制作部署です。この部署に 2022 年 6 月に配属されました。入社時点で Web の知識は全くありませんでした。研修や研鑽を続け入社半年で「最年少三冠王 村上宗隆どれだけすごい?」の制作に関わることができました。
この記事では、フロントエンドの新人エンジニアが入社後に学んだことを振り返りながら業務の内容を紹介していきます。
2. 記者としての研修を受ける
編集に配属されるため記者の研修を受けることになります。エンジニアとして入社したのになぜ記者の研修を受けるのでしょうか。ビジュアルデータは読者が読む「記事」でありその記事の作成に関わる者は全員「記者」と言えるからです。実際、入社後から戦略コンテンツグループに配属されるまでの間、名刺の肩書きはエンジニアではなく記者でした。
記者の研修は記者塾と呼ばれ、入社 3 年目まで続く記者育成の場です。ここで学んだことは新聞社で働く上でとても大切なことばかりでした。特に重要な内容を紹介します。
2.1 記事は大事なことから書く
記事は見出しと本文で構成されています。特に本文の第 1 段落はリードと呼ばれ記事の肝になります。この見出しとリードだけで記事が成立するように 5W1H を適切に盛り込むように指導されます。これは記事を短くする必要が生じた時に後半の段落から文章が削除されるためです。電子版と異なり紙面の大きさは有限のため、文章が削られても困らないように大事なことから書いていきます。
さらに、わかりやすい文章を書くために
- 1 文は 40 字以内で短く
- 主語と述語、修飾語と被修飾語の位置を近づける
- 漢字や専門用語を使い過ぎない
- 図や表をつけてイメージを湧かせる
ことが大切です。
これらは日本語の文章を書くことの基本です。しかし、意識しないと忘れてしまう部分でもあります。この注意を少しでも意識すれば文章は格段に読みやすくなります。
2.2 正確に書くことの大切さ
記者は誤報とならないように裏取りを行い、誤字脱字がないかどうか一字一句調べます。記者にとって裏を取るとは
- 想像ではなく確実なこと ( 事実 ) だけを書く
- 「知っている」ことを疑う。つまり、無知の自覚を行う
- 記者にとって都合の悪い証拠がないか探す
上記のようなことを行っています。記者はミスをしないように細心の注意を払いながら記事の確認をしています。戦略コンテンツグループではエンジニアもミスがないかどうかビジュアルデータの確認を丁寧に行っています。
3. ビジュアルデータ制作
3 ヶ月弱に及ぶ記者塾を終え Web エンジニアとしての学習が始まります。プログラミング経験は科学技術計算でよく用いられるFortranを用いた数値シミュレーションのみでした。数値シミュレーションとはスパコン「富岳」などの計算機上で対象とする現象のモデルを模擬実験することです。Fortran は変数・関数の型や定義、ファイルの読み込み設定などを細かく記載します。このような厳密性がシミュレーションとは相性が良かったと言えます。
Web 制作は HTML や CSS 、JavaScript を用いて文章の構成、デザイン、動きのある処理などを調整します。特に JavaScript は Fortran と比較すると詳細な設定が不要なものが多いです。この違いに最初は戸惑うことが多くありました。
学習の基本は自分の手で動かすことです。プログラムを書いては動きを確認することを繰り返し徐々に慣れていきました。 Web の基本技術を習得するとコンテンツ制作が始まります。
3.1 村上選手三冠王ビジュアルデータ
エンジニアは記事の概要をよく理解します。記者が考える機能が実装できるかどうか調べるためにプロトタイプを作ります。「最年少三冠王 村上宗隆どれだけすごい?」の制作ではアメリカ・大リーグ( MLB )で公開されているさまざまなデータを利用します。 2022 年シーズンの大谷選手のホームラン着弾点をプロットするプロトタイプを作成しました。
大谷選手は右方向の打球が多いイメージがあります。この可視化を見るとホームランを広角に打ち分けているのがよくわかります。ホームランの着弾点を描くだけのシンプルなものですが、目新しい表現になりました。
ニュース性が高いコンテンツではいつ公開するのかも大切な要素になります。シーズン終了後からクライマックスシリーズ (CS) 開幕までの間に公開を目指すことになりました。実質的な作業期間は 2 週間でした。その期間でできること、できないことをチームできっちりと定めます。
本番コンテンツに向けてアニメーションの起動タイミングやボタンで選手の切り替えを行うなどの機能のブラッシュアップを行います。デザイナーが作成した野球場の上にホームラン分布のアニメーションを載せて完成となります。
公開初日のアクセス数はおよそ 9000 アクセスありました。日経の Twitter アカウントのツイートでも 300 を超えるリツイートがあり反響の大きいコンテンツとなりました。この場を借りて見てくださった全ての方に、新人の私をサポートしていただいたプロジェクトメンバーに感謝したいと思います。
村上選手、三冠王獲得おめでとうございます!今後のさらなる活躍に期待し三冠王以上の記録を達成することを祈念しております。そのような記録を達成されたときには再び日経ビジュアルデータで村上選手の凄さを伝えられたらなと思います。
3.2 参議院選挙比例マップ
戦略コンテンツグループのエンジニアは 3.1 節のような Web ページの制作だけでなくデータ集計も行います。「政党得票率あなたのまちは? 参議院選挙比例マップ」は 2022 年 7 月 10 日投開票の参議院選挙の比例代表の政党得票率を市区町村ごとに地図に表したものです。都道府県の選挙管理委員会が公開する開票結果をもとにエンジニアがデータを集計して作成しています。
この集計作業は手間と時間を要しました。理由は 2 点あります。一つ目は自治体ごとに PDF やエクセル、 HTML など複数の形式で公開されていた点です。二つ目は後述する指針に沿った適切な形式ではなかった点です。そこで、どの自治体がどのような形式で公開したのかについて 2022 年 7 月 10 日投開票の参議院選挙のデータを形式ごとに集計しました。この図は集計した結果を日本地図に表したものです。
※はセルが結合されるなど、総務省の指針に従っていないものを指す。
バージョンの違いこそありましたがエクセルで公開したのは 28 都府県、 PDF 公開は 15 県でした。また、セル結合や小数点が別セルに格納するなどしたものが 6 県、 HTML 形式が 3 県、紙をスキャンしたものを公開した自治体もありました。
データの公開形式に関して調べてみると、総務省のホームページには「統計表における機械判読可能なデータの表記方法の統一ルールの策定」という指針があることがわかりました。これは国の省庁に対して
- PDF ではなくエクセルや CSV で公開する
- セル結合をしない
などのように扱いやすいデータで公開するように求めています。しかし、半数ほどの自治体で指針通りに公開されていません。指針が浸透していないことがわかります。
各自治体がデータをインターネットで公開するようになりオープンデータ化が進んでいます。現状では統一された形式でないため記者や一般の方が分析しにくい状況です。デジタルトランスフォーメーション (DX) を進めるためには誰もが使いやすい形で公開する「真のオープンデータ」が必要だと考えます。政府には積極的な対策をしてほしいと思います。
4. まとめ
この記事では新卒 1 年目のエンジニアの振り返りとして、研修で学んだことやビジュアルデータの制作の裏側を紹介しました。自分が関わったコンテンツの公開日は無事に公開されるかどうかドキドキします。公開後にわかりやすい、面白いという声をもらい取り組んだ甲斐がありました。今よりもさらにわかりやすい、面白いコンテンツを作ることができるようにこれからも努力していきます。
正確でわかりやすいコンテンツを読者に届けることは報道機関ならではのものです。その Web 開発に情報系出身ではない私が携わることができ面白さを体感しました。この記事を通して報道に携わるエンジニアに興味を持っていただけると幸いです。
明日は 12 日目、林さんによる「Edge Proxy OVER THE EDGE」です。お楽しみに!